图谱的自杀倾向检测问答系统构建》CSCD"/>
《基于知识图谱的自杀倾向检测问答系统构建》CSCD
分词技术:HanLp
自杀倾向文本分类技术:BILSTM
词向量转换:BERT
数据库:Neo4j
本文的数据获取和图谱构造都是较为常规的方法,系统的设计点主要在问题理解部分。
问题理解层次的输入时用户的问句。
- 分词处理 这里对比了Jieba、HanLP、中科院分词NLPIR这三个工具,选择了准确率最高的HanLP工具。
- 问题分类 将用户的提问分为5类,使用分词,构造出每个类别的词云,然后计算分词后的单词的CHI值,排序选择每类CHI最大的150词,构造出1000多维的特征列表。这样就可以给输入的数据形成对应的特征向量。
- 自杀倾向分类包括:自杀倾向、自残倾向、伤害倾向、正常倾向
这里使用BILSTM来对用户意图进行分类
- 问题模板匹配 如果问题中的实体能够通过AC算法找到就可以直接通过数据库来返回答案。如果问题模糊,在AC匹配不成功时就采用问题模板匹配来对用户的意图进行分析。
相关查询:
AC算法 Aho-Corasick自动机算法(AC算法解读)_Technology DNA-CSDN博客
总结:这个文章做的问答系统,通过对数据库中的数据进行分类关联,以及对问题的分类,利用分词技术,可以对用户的问题进行结果返回。文章增添了对自杀倾向的一个识别,对心理问答系统来说整个系统更加符合心理这方面,而不是而其他问答系统没有什么差别,同时模板匹配也让问答系统更加灵活,没有那么死板。在这篇文章中,我看到了同样是问答系统,但是针对的领域不同是有不同的需求的,而且通过一些针对性对的设计能够让系统更加丰富。
更多推荐
《基于知识图谱的自杀倾向检测问答系统构建》CSCD
发布评论