本模型是针对实际场景中常见的社交媒体文本情感分析需求所提供的一个模型。模型使用TweetEval社交媒体情感分析文本数据,在BERT预训练模型上进行微调,贴合下游社交媒体领域的情感分类能力。
针对实际场景中常见的社交媒体文本情感分析需求,达摩院提供了本情感分类模型。该模型通过在BERT预训练模型上使用社交媒体tweet文本情感分类数据微调得到,可用于社交媒体领域的文本情感分类。模型特点如下:
输入自然语言文本,模型会给出该文本的情感分类标签(0, 1, 2),即(Negative, Neutral, Positive)以及相应的概率。具体调用方式请参考代码示例。
在安装完成ModelScope-lib之后,即可在ModelScope框架上通过Pipeline调用来使用。
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
input = 'Good night.'
semantic_cls = pipeline(Tasks.text_classification, 'damo/nlp_bert_sentiment-analysis_english-base')
result = semantic_cls(input)
print('输入文本:\n{}\n'.format(input))
print('分类结果:\n{}'.format(result))
模型在TweetEval情感分类数据集上训练,在其他非社交媒体垂直领域效果可能会有所下降。
训练数据采用TweetEval情感分类数据集,数据来源于https://github.com/cardiffnlp/tweeteval
在TweetEval的测试集上的f1为69.18。
@article{barbieri2020tweeteval,
title={Tweeteval: Unified benchmark and comparative evaluation for tweet classification},
author={Barbieri, Francesco and Camacho-Collados, Jose and Neves, Leonardo and Espinosa-Anke, Luis},
journal={arXiv preprint arXiv:2010.12421},
year={2020}
}