您现在的位置:首页 > >

基于Mahout与协同过滤算法推荐系统的设计与实现_论文

发布时间:

2018年 9月 第 37卷第 3期 内蒙古科技大学学报 JournalofInnerMongoliaUniversityofScienceandTechnology September,2018 Vol.37,No.3   文章编号:2095-2295(2018)03-0260-04     DOI:10.16559/j.cnki.2095-2295.2018.03.012 基于 Mahout与协同过滤算法推荐系统的设计与实现? 李海荣,方中纯 (内蒙古科技大学 工程训练中心,内蒙古 包头 014010) 关键词:Mahout;协同过滤;推荐系统;基于用户 中图分类号:TP391   文献标识码:A 摘 要:信息过载的时代,推荐系统在电子商务、医疗等领域发挥了重要作用,实现了企业与用户的双赢 ?介绍了 推荐系统的相关知识,并应用 Mahout这一开源的 Java框架构建了基于协同过滤算法的电影推荐系统 ? Designandimplementationofrecommendationsystem basedonMahoutandcollaborativefilteringalgorithm LIHai?rong,FANGZhong?chun (EngineeringandTrainingCenter,InnerMongoliaUniversityofScienceandTechnology,Baotou014010,China) Keywords:Mahout,collaborativefiltering,recommendationsystem,user?based Abstract:Intheageofinformationoverload,recommendationsystemsplayanimportantroleinthefieldsofE?commerce,medicalcare andetc.,achievingawin?winsituationbetweenenterprisesandusers.Therelevantknowledgeofrecommendationsystem wasintro? duced,andMahout’sopensourceJavaframeworkwasappliedtobuildamovierecommendationsystembasedoncollaborativefiltering algorithm.Inaddition,twoindexesofaccuracyandrecallwereusedtoevaluatetherecommendationsystem.   随着信息技术与互联网的发展,人们逐渐从信 息匮乏的时代走向了信息过载的时代 ?用户需要从 繁多的数据中选择自己感兴趣的信息或者物品,这 势必需要花费大量的时间与精力 ?因此,为了解决 这一问题,推荐系统应运而生 ?其核心任务就是联 系用户与产品,解决信息过载,提高用户体验度,实 现企业与用户的双赢[1]? 目前,推荐系统广泛地应用在电子商务、音乐视 频网站、社交网络、新闻推荐、医疗等领域,为广大用 户带来很多便利,从而取得了巨大的成功 ?据亚马 逊科学家 GregLinden称,亚马逊 20%的销售归功 于其堪*炭剖槭降耐萍鱿低 ?毫无疑问,推荐系 统将在大数据时代扮演越来越重要的角色 ? 针对电影评分数据,应用协同过滤算法,实现了 一个基于 Mahout的电影推荐系统 ?选择推荐算法 前,首先对数据进行预分析,根据数据特点,进行算 法的选择 ? 1 相关知识介绍 1.1  推荐系统 (RecommendationSystem)概 述 推荐系统[2]被提出是在上个世纪 90年代 ?经 过几十年的发展,逐渐成为一门融计算机科学、统计 ? 收稿日期:2018-06-12 基金项目:国家自然科学基金资助项目(61462069);内蒙古自然科学基金资助项目(2017MS0604,2017MS(LH)0603);内蒙古科技大 学教改重点资助项目(JY2016003) 作者简介:李海荣(1976-),女,内蒙古包头人,内蒙古科技大学副教授,北京科技大学博士研究生,主要研究方向为云存储. 李海荣,等:基于 Mahout与协同过滤算法推荐系统的设计与实现 261 学、信息学为一体的交叉学科 ?*十几年来,对推荐 系统的研究主要是在推荐算法与其工程应用这两个 领域 ?采用的主要推荐方法有以下 3个: (1)基于内容的推荐(Content?basedRecommen? dation:CR):是建 立 在 项 目 的 内 容 信 息 上 作 出 推 荐 的,而不需要依据用户对项目的评价意见 ?如用户 输入自己喜欢的演员名,推荐系统会推荐该演员出 演的相关电影 ?其优点是:已有比较好的技术,如关 于分类学*方面的技术已经相当成熟 ?缺点是:构 造分类器需要具备足够多的数据 ? (2)基于协同过滤的推荐(CollaborativeFiltering Recommendation:CFR):是推荐系统中 应 用 最 早 和 最为成功 的 技 术 之 一,一 般 用 在 数 据 量 较 小 的 场 合 ?其中,基于项目(Item Based)和基于用户(User Based)的算法是协同过滤推荐方法中的主要通用算 法 ?其做法是:计算用户或者项目之间的相似度,将 内容推荐给用户 ?选择哪种算法,跟具体的应用场 景有很大关系 ? (3)基 于 关 联 规 则 的 推 荐 (AssociationRule? basedRecommendation:ARR):是 以 关 联 规 则 为 基 础,挖掘不同商品的相关性 ?比如购买牛奶的同时 会购买面包 ?其优点是可以离线进行 ? 推荐系统的评价指标有:新颖度、预测准确度、 用户满意度、惊喜度、信任度、透明度等 ?其中预测 准确度是推荐系统最重要


热文推荐
猜你喜欢
友情链接: 医学资料大全 农林牧渔 幼儿教育心得 小学教育 中学 高中 职业教育 成人教育 大学资料 求职职场 职场文档 总结汇报