1 / 37

Use of Library Loan Records for Book Recommendation

Use of Library Loan Records for Book Recommendation. 汇报人:刘汉清 2013/6/28. 2012 IIAI International Conference on Advanced Applied Informatics Use of Library Loan Records for Book Recommendation Keita Tsuji 1 , Erika Kuroo 2 , Sho Sato 3 , Ui Ikeuchi 4 , Atsushi Ikeuchi 5 ,

draco
Télécharger la présentation

Use of Library Loan Records for Book Recommendation

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Use of Library Loan Records for Book Recommendation 汇报人:刘汉清 2013/6/28

  2. 2012 IIAI International Conference on Advanced Applied Informatics Use of Library Loan Records for Book Recommendation Keita Tsuji1, Erika Kuroo2, Sho Sato3, Ui Ikeuchi4, Atsushi Ikeuchi5, Fuyuki Yoshikane6 and Hiroshi Itsumura7 Faculty of Library, Information and Media Science1,5,6,7 Graduate School of Library, Information and Media Studies3,4 College of Knowledge and Library Sciences, School of Informatics2 University of Tsukuba 1-2 Kasuga, Tsukuba-city, Ibaraki-ken 305-8550, Japan {keita1, min2fly3, oui4, atsushi5, fuyuki6, hits7}@slis.tsukuba.ac.jp s0811586@u.tsukuba.ac.jp

  3. 提纲

  4. 论文主要工作 通过 基于图书馆借阅记录的协同过滤 借阅相同数据的关联规则挖掘 亚马逊系统 进行了推荐对比实验,来确定最有效的图书馆中产生图书推荐的方式

  5. 协同过滤 • 协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。

  6. 关联规则挖掘 • 关联规则:指给定数据中项集之间有意义的关联或关系,属于知识发现任务中的相关性分析。时间关联、空间关联 • 关联规则挖掘:从数据库中发现所有满足用户要求的关联规则。 • http://www.csdn.net/article/a/2011-07-11/301462

  7. 亚马逊图书系统 Amazon's book recommendation system is popular. Amazon provides a widespread service and its application programming interface (API) is available. If we submit information about a book that a user found interesting to Amazon’s API, it returns information about other books as "Customers who bought this book also bought these books."

  8. 相关研究1 • 协同过滤已被应用到各个领域。然而,在将协同过滤用于图书馆的图书推荐方面的研究却很少,This may be because usage of loan records used to be almost taboo in the library world。

  9. 相关研究2 Vogoo PHP Pro v2.2(一种协同过滤软件) 文献[3]使用该软件基于某所大学的图书馆的960,078条借阅记录为8,808个用户推荐图书。 [3] T. Harada, “The book recommendation system using library loan records,” Digital Libraries, no. 36, 2009, pp. 22-31 (text in Japanese)

  10. 相关研究3 • 文献[4] 把基于图书馆借书记录的协同过滤与亚马逊的推荐系统进行比较。然而,只有四个测试者参与到实验中,并没有和关联规则挖掘方法进行比较。 • [4] K. Tsuji et al., “Use of library loan records for book recommendation,” Proceedings of the International Conference on Integrated Information (IC-ININFO 2011), 2011. (No Pagination).

  11. 相关研究4 • 文献[5]提出了一种使用类似关联规则方法的加权图模型的推荐方法。但并没有进行实验,以评估其有效性。 • [5] C. Whitney and L. Schiff, “Melvil Recommender Project: developing library recommendation services,” D-Lib Magazine, vol. 12, no. 2, 2006. <http://www.dlib.org/dlib/december06/whitney/12whitney.html>. [Accessed: May 5, 2012]

  12. 提纲

  13. 数据1 • A.图书馆借书记录 • T大学图书馆1,990,797条借阅记录,其中有864,704条是本科学生借阅记录,989,641条是研究生和教师借阅记录,136,452条是其他用户借阅记录。书篮的数量为708,951。 • 被借图书的种类数是435,817。 • 借书的用户数是39,442。

  14. 数据2 • B.测试者 • T大学图书馆和信息科学专业的33名学生,他们由7个研究生、17个本科四年级学生和9个本科二年级的学生组成。将这些学生分为3个组(每个组的年级不一样)。

  15. 数据3 • C.测试者目前想借的图书 • 受试者被要求给出一个“book that I would like to borrow from T University library at present, for research or study purposes”的标题(如果必要的话也给出其它书目信息)。基于关联规则的挖掘以及亚马逊推荐系统用此信息来产生推荐。

  16. 协同过滤 • 结合文献[2]给出的方法和文献[1]使用协同过滤加权的方法。 • [1] T. Harada and K. Masuda, “A trial approach of weighting for library loan records for developing a book recommendation system,” Digital Libraries, no. 38, 2010, pp. 54-66 (text in Japanese). • [2] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom and J. Riedl, “GroupLens: an open architecture for collaborative filtering of netnews,” Proceedings of ACM 1994 Conference on Computer Supported Cooperative Work, 1994, pp.175-186.

  17. 活跃用户a与样本用户i之间的相关系数 向活跃用户a推荐项目j的推荐指数

  18. 关联规则挖掘

  19. 亚马逊图书系统 1)向Amazon API提供“book that I would like to borrow from T University library at present, for research or study purposes”的信息 2 )得到“the customer who purchased this book also purchased these books”形式的推荐图书信息 3 )从T大学图书馆拥有的图书中选出亚马逊推荐的图书推荐给测试者

  20. 评估方法 • 2:非常感兴趣; • 1:感兴趣; • 0:不感兴趣; • X:不知道; • A:之前已经购买或阅读。

  21. 讨论 • A)由于协同过滤缺点: • (1)即稀疏性问题; • (2)随着用户和商品的增多,系统的性能会越来越低; • (3)即最初评价问题; • (4)由于每个用户的借阅记录必须被保存起来,用户的隐私就存在被侵犯的风险; • (5)计算消耗(即确定哪本书应该被推荐所消耗的时间)相对于关联规则挖掘较高。 • 如果我们基于图书馆借阅记录推荐图书,关联规则挖掘比协同过滤更应该被采用 • B)由于亚马逊: • (1)推荐好评最高 • (2)对图书馆借阅记录的使用不存在侵犯用户隐私的风险 • 亚马逊的推荐系统也应该被考虑用作图书推荐。然而也应该留意,亚马逊的推荐系统就像一个黑盒,并且其公司有可能停止提供API。 测试者的Positive Evaluation由高到低

  22. 总结 • 通过基于图书馆借阅记录的协同过滤、借阅相同数据的关联规则挖掘、亚马逊系统进行了推荐对比实验,来确定最有效的图书馆中产生图书推荐的方式。 • 结果表明,通过协同过滤推荐图书是好评最少的,接着是通过关联规则挖掘的推荐和亚马逊系统。 • 下一步工作包括以下:(a)用协同过滤使用大量的其他参数来产生推荐;(b)在协同过滤系统上结合基于内容过滤方法;(c)在推荐系统上考虑学生兴趣层次周期性变化;(d)与其他大学图书馆合作,利用多个高校的借阅记录信息进行图书推荐。

More Related