Skip to content

juyipeng/rumorclassification

Repository files navigation

juyipeng523031910733

interface of RumourDetectClass

RumourDetectClass 是一个用于谣言检测的工具类,基于预训练模型cardiffnlp/twitter-roberta-base,能够对输入文本进行分类,判断其是否为谣言。

init(self)

初始化 RumourDetectClass 类时,会自动加载谣言检测模型和相应的分词器(tokenizer)。

classify(self, text: str) -> int

参数

  • text :需要进行谣言检测的文本内容,类型为字符串(str) 返回值 返回一个整数(int),表示分类结果。通常,返回值可能有以下含义(具体需根据实际模型训练时的标签设定来确定):
  • 0 :表示该文本是谣言
  • 1 :表示该文本不是谣言

call(self, text: str) -> int

该方法允许实例对象像函数一样被调用。其功能与 classify 方法相同,都是对输入文本进行谣言检测并返回分类结果。例如,创建一个 RumourDetectClass 实例 detector 后,可以通过 detector("要检测的文本") 的方式直接调用该方法进行谣言检测。

example

具体见classify.py下给出的直接示例

if __name__ == "__main__":
    import pandas as pd
    csv_file = 'data/test.csv'
    data = pd.read_csv(csv_file)
    texts = data['text'].tolist()
    labels = data['label'].tolist()

    test_idx = 0

    classifier = RumourDetectClass()

    pred = classifier(texts[test_idx])
    print(f"predict\t{pred}\nlabel\t{labels[test_idx]}")

result

predict 1
label   1

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages