1 / 13

多策略中文微博细粒度情绪分析研究

南华大学 计算机科学与技术学院. 多策略中文微博细粒度情绪分析研究. 南华大学 欧阳纯萍 2013 年 11 月 18 日. 任务概述 技术要点 实验结果 总结. 评测任务. 微博情绪识别与分类( C lose 测试 ) : 对于输入的整条微博,本任务要求判断出该微博是否包含情绪。 对包含情绪的微博,要求判别其情绪分类输出为 anger 愤怒、 disgust 厌恶、 fear 恐惧、 happiness 高兴、 like 喜好、 sadness 悲伤、 surprise 惊讶中的一种,即单分类输出。. 任务概述 技术要点 实验结果

Télécharger la présentation

多策略中文微博细粒度情绪分析研究

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 南华大学 计算机科学与技术学院 多策略中文微博细粒度情绪分析研究 南华大学 欧阳纯萍 2013年11月18日

  2. 任务概述 • 技术要点 • 实验结果 • 总结

  3. 评测任务 微博情绪识别与分类(Close测试): • 对于输入的整条微博,本任务要求判断出该微博是否包含情绪。 • 对包含情绪的微博,要求判别其情绪分类输出为anger 愤怒、disgust 厌恶、fear 恐惧、happiness 高兴、like 喜好、sadness 悲伤、surprise 惊讶中的一种,即单分类输出。

  4. 任务概述 技术要点 实验结果 总结

  5. 技术要点

  6. 技术要点一 朴素贝叶斯分类的特征词选择 i=0,判断某词在有情绪微博中的表征作用。 i=1,判断某词在无情绪微博中的表征作用。 对有无情绪微博中的词性特征进行分析,筛选出表征能力强的词性特征。 最终,经试验取k=4,n=20,得到了796个特征词和19种词性,组成了815个特征集合。

  7. 技术要点二 面向细粒度情绪的微博向量化 α=0.9,β=0.1, w表示属于第m维情感类的总词数,intension表示情感强度,polarity表示情感极性。 对卡方检验的特征词进行情感强度和极性人工标注。(参考大连理工本体库) 根据计算得到的特征词权重值,对分词后的微博进行向量化。

  8. 任务概述 技术要点 实验结果 总结

  9. 实验结果 情绪判别实验结果 • 情绪分类宏平均实验结果

  10. 实验结果 • 情绪分类微平均实验结果

  11. 任务概述 技术要点 实验结果 总结

  12. 总结 分阶段进行微博情绪分析的方案比较理想。 无论是情绪分类还是情绪判别,特征词的选择,微博的特征化都是非常重要的环节。 本次实验并未对分类算法进行改进,将是下一步工作的重点。

  13. 南华大学 计算机科学与技术学院 谢 谢!

More Related