admin管理员组

文章数量:1567000


2024年6月17日发(作者:)

基于改良SO-PMI算法的在线评论情感倾向性分析研究

情感是人类所具有的一种特殊的属性。本文研究的内容就是电子商务环境下用户评论

文本中的情感分析。评论可以反映出用户使用商品的感受,用户可以表达赞赏也可以宣泄不

满。因此,评论是其他用户购买同产品的一种主要参考。但是由于购物者数量众多且文化水

平各异,难以对大量的在线评论准确分类,给用户的浏览造成不便。因此引入情感分析方法从

情感倾向性入手,对评论进行分类优化,提高用户通过评论判断产品好坏的效率,以便用户高

效准确的确定所需商品。本文以用户购买手机的评论作为研究范例,使用情感分析方法判断

评论的情感倾向。第一步构造面向手机领域准确全面的情感词典,使用改良后的SO-PMI

算法扩充情感词典,进一步,基于情感词典,对情感词及其他类别的词进行相应的计算,判断出

评论的情感倾向性,并对其进行分类。主要研究内容总结如下:(1)基础情感词典合并以及修

饰性词典整理。在基于情感词典的情感分析中,由于传统单个情感词典在词汇量、版本等方

面的限制,对特定领域评论的情感分析效果较差,因此通过搜集整理,选择了知网情感词典、

台湾大学情感词典和清华大学李军中文褒贬义词典进行合并,这样就得到了通用基础情感

词典,由于本文的特定对象为手机,还添加了手机相关情感词典。并且搜集整理了修饰性词典,

具体包括否定词词典、程度副词词典和关联词词典。(2)情感词典扩充。手机评论中还包含

着基础情感词典中未添加的词,影响情感分析的效果,要对含有新词的手机评论进行情感倾

向性判断,还需要对情感词典进行扩充。为此,本文使用了改良的SO-PMI算法对情感词典

进行了扩充。主要改良工作包括:1.使用TF-IDF算法对基准词的选择进行了优化。2.基于多

项式贝叶斯(MultinomiaNB)分类器确定出最佳分类维度,然后使用卡方统计量进行候选情

感词的提取。(3)手机在线评论情感分类实验。在综合考虑购物平台数据量、口碑、产品的

质量后,选择爬取京东网上商城手机版块的评论数据。在对评论进行去重、格式转换等处理

后,就得到了带有标注的评论,然后基于情感词典对其进行分类测试,结果显示情感分类方法

能够有效的对手机在线评论进行倾向性分类。用实验证明了基于改良SO-PMI算法的词典

扩充方法的有效性,为情感词典的扩充提供了一种新的思路,经过验证分类的查准率、召回率

以及F1值达到了较高水平。最后,根据改良SO-PMI算法的评论分类结果,设计了情感倾向

程度对比实验进行二次分类,进一步对正向评论和负向评论进行细分,其中情感倾向性最高

的正向评论和负向评论分类准确度最高。


本文标签: 情感评论词典进行分类