1 / 24

微博实体与百科条目链接的多策略研究

微博实体与百科条目链接的多策略研究. 西南大学计算机系 郭云龙 徐潇 向宇 曾维刚 李莉. 微博实体与百科条目链接的多策略研究. 2012 年数据. 微博实体与百科条目链接的多策略研究. 2012 年数据. 微博实体与百科条目链接的多策略研究. 新浪微博用户的最新数据,截至2012年12月底,新浪微博注册用户数已超过 5 亿,同比增长74%。日活跃用户数达到4620万,微博用户数与活跃用户数保持稳定增长。. 2013 年数据. 微博实体与百科条目链接的多策略研究. 对于海量微博数据进行挖掘. 微博实体与百科条目链接的多策略研究.

cosima
Télécharger la présentation

微博实体与百科条目链接的多策略研究

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 微博实体与百科条目链接的多策略研究 西南大学计算机系 郭云龙 徐潇 向宇 曾维刚 李莉

  2. 微博实体与百科条目链接的多策略研究 2012年数据

  3. 微博实体与百科条目链接的多策略研究 2012年数据

  4. 微博实体与百科条目链接的多策略研究 • 新浪微博用户的最新数据,截至2012年12月底,新浪微博注册用户数已超过5亿,同比增长74%。日活跃用户数达到4620万,微博用户数与活跃用户数保持稳定增长。 2013年数据

  5. 微博实体与百科条目链接的多策略研究 • 对于海量微博数据进行挖掘

  6. 微博实体与百科条目链接的多策略研究 • “微博实体与百科条目链接”的应用: 有助于利用社交媒体内容进行知识库的构建与扩展; 帮助用户阅读; 广告;市场; · · ·

  7. 微博实体与百科条目链接的多策略研究 • “微博实体与百科条目链接”的难点: 一对多消歧 一对零消歧 · · ·

  8. TTT Model 微博实体与百科条目链接的多策略研究 Term crawler lexicon Tweet context + tags corpus Tweets Machine Learning Statistics

  9. Term Level 微博实体与百科条目链接的多策略研究

  10. Term Level 微博实体与百科条目链接的多策略研究

  11. Term Level 微博实体与百科条目链接的多策略研究

  12. Term Level 微博实体与百科条目链接的多策略研究

  13. Term Level 微博实体与百科条目链接的多策略研究

  14. Tweet Level 微博实体与百科条目链接的多策略研究

  15. Tweet Level 微博实体与百科条目链接的多策略研究 Polysemy page of Target Key on baike.baidu.com

  16. Tweet Level 微博实体与百科条目链接的多策略研究 Each target entry and labels

  17. Tweet Level 微博实体与百科条目链接的多策略研究 Build label lists for target entry

  18. Tweet Level 微博实体与百科条目链接的多策略研究 Calculating label list’s weight by basal list. The entry whose label list is the most weight is the real entry that target key map to.

  19. Tweets Level 微博实体与百科条目链接的多策略研究

  20. Tweets Level 微博实体与百科条目链接的多策略研究

  21. Tweets Level 微博实体与百科条目链接的多策略研究 (4) Computing the similarity of two words based on Mi. (2) Constructing a word-matrix for each “Key Term” Matrix Matrix Matrix Matrix “Key Terms” related tweets (5) Clustering similarity- matrix M* Similarity based on the co-occurrences in the same paragraph Dividing tweets for each “Key Term” 1)Extracting words from each tweet (3) Computing the co-occurrences of two words that appear in the same tweet (6) Analyzing and Tagging in each cluster Cip

  22. Tweets Level 微博实体与百科条目链接的多策略研究

  23. Tweets Level 微博实体与百科条目链接的多策略研究 评测结果:我们评测结过为84.99%,改进后为88.38%。

  24. Thank You ! 西南大学 计算机系 郭云龙 Email:zqlong@swu.edu.cn

More Related