Speaker Turn Detectio任务判断说话人转换的位置,我们的模型基于文本模态,预测说话人转换点位置。此信息将帮助到speaker diarization模型。
我们的模型基于BERT训练得到,核心为一个二分类的Token Classification任务,需要注意的是,本模型只考察标点之后是否存在转换点,后续会更新更加精细化的模型。
关于此模型的细节以及如何后续应用,请参考我们的论文:
我们的模型基于如下的数据集训练:
我们使用一个滑动窗策略来构造训练和测试数据。
测试集 | Precision | Recall | F1 | Acc |
---|---|---|---|---|
ALIMEETING Test | 0.7945 | 0.8779 | 0.8341 | 0.9146 |
AISHELL-4 Test | 0.8814 | 0.7317 | 0.7996 | 0.925 |
待开发
待开发
如果您觉得这个该模型有所帮助,请引用下面的相关的论文
@article{Cheng2023ExploringSI,
title={Exploring Speaker-Related Information in Spoken Language Understanding for Better Speaker Diarization},
author={Luyao Cheng and Siqi Zheng and Zhang Qinglin and Haibo Wang and Yafeng Chen and Qian Chen},
journal={ArXiv},
year={2023},
volume={abs/2305.12927}
}