摘要:《大数据互联网大规模数据挖掘与分布式处理》源自作者在斯坦福大学教授多年的“web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前web应用的许多重要话题。主要内容包括分布式文件系统以及Map—Reduce工具:相似性搜索:数据流处理以及针对易丢失数据等特殊情况的专用处理算法等。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
相关期刊
相关论文
期刊名称:中国科技信息
期刊级别:部级期刊
期刊人气:17594