StructBERT情绪分类-中文-七分类-large
  • 模型资讯
  • 模型资料

StructBERT中文情绪分类模型介绍

情绪分类任务,通常为输入一段句子或一段话,识别该句话情绪类别的模型。 在用户评价、观点抽取、意图识别中往往起到重要作用。

模型描述

模型基于Structbert-large-chinese,在情绪分类的数据集上fine-tune得到。 模型可识别的情绪包含(恐惧、愤怒、厌恶、喜好、悲伤、高兴、惊讶)七种类别。

模型结构

期望模型使用方式以及适用范围

你可以使用StructBERT中文情绪分类模型,对通用领域的中文情绪分类任务进行推理。 输入自然语言文本,模型会给出该文本的情绪分类标签以及相应的概率。

如何使用

在安装完成ModelScope之后即可使用

推理代码范例

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

semantic_cls = pipeline(Tasks.text_classification, 'damo/nlp_structbert_emotion-classification_chinese-large', model_revision='v1.0.0')
semantic_cls(input='新年快乐!')

模型局限性以及可能的偏差

模型训练数据有限,效果可能存在一定偏差。

训练数据介绍

使用数据集分布情况如下:

高兴 悲伤 厌恶 喜好 恐惧 惊讶 愤怒 无明显情绪
训练集 10610 13418 6909 8236 820 1664 5312 32071
验证集 1326 1677 863 1029 102 207 663 4008

数据评估及结果

该模型在验证集上的f1为0.5784。

数据评估及结果

@article{wang2019structbert,
  title={Structbert: Incorporating language structures into pre-training for deep language understanding},
  author={Wang, Wei and Bi, Bin and Yan, Ming and Wu, Chen and Bao, Zuyi and Xia, Jiangnan and Peng, Liwei and Si, Luo},
  journal={arXiv preprint arXiv:1908.04577},
  year={2019}
}