关联规则推荐的高效分布式计算框架

作者:李昌盛; 伍之昂; 张璐; 曹杰

摘要:关联规则推荐模型是在电子商务网站应用最广泛的商用推荐引擎之一,目前已有的工作大多聚焦于如何挑选高质量规则,以提升推荐精度.然而,关联规则数量庞大,且用户并发访问量通常极大,如何快速匹配用户浏览记录和关联规则库,为海量在线用户产生近实时推荐,成为制约关联规则推荐能否胜任真实电子商务网站推荐的重要因素.为此,本文研究关联规则推荐的效率问题,提出服务于高效关联规则推荐的分布式计算框架,将规则挖掘与推荐计算无缝衔接.具体而言,本文首先设计有序模式森林,用于压缩存储频繁模式;然后将候选规则挖掘转化为森林上的路径搜索计算,并提出高效的单机路径搜索算法;最后提出负载均衡的数据分割策略,同时降低分布式规则挖掘与推荐计算中的任务最迟完成时间.在3个公开数据集的实验结果表明基于有序模式森林的推荐计算比传统穷举匹配策略降低6倍以上时间,同时所提出的分布式计算框架可随计算节点数量达到近线性扩展.

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 数学文摘
  • 上海图书馆馆藏
  • 维普收录(中)
  • 知网收录(中)
  • 万方收录(中)
  • 剑桥科学文摘
  • 北大期刊(中国人文社会科学期刊)
  • 国家图书馆馆藏
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
  • 文摘与引文数据库
  • SA 科学文摘(英)
  • JST 日本科学技术振兴机构数据库(日)
  • EI 工程索引(美)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 推荐系统
  • 关联规则
  • 频繁模式
  • spark
  • 负载均衡

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机学报

期刊级别:北大期刊

期刊人气:11664

杂志介绍:
主管单位:中国科学院
主办单位:中国计算机学会;中国科学院计算技术研究所
出版地方:北京
快捷分类:计算机
国际刊号:0254-4164
国内刊号:11-1826/TP
邮发代号:2-833
创刊时间:1978
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:3.18
综合影响因子:3.08