期刊家
学术期刊
科普期刊
出版社
图书
会议
我的购物车 0

第9章 啤酒与尿布——MapReduce连接与数据挖掘初步 王晓华

章节快照
对于大型数据处理来说,单个数据集之间的处理是相对简单的。但是如果涉及到多个数据集之间的整合,则编程就不是那么容易的事了。一般来说,对多个数据集协同处理的具体实现要取决于数据集的大小以及相对规模和分区模式。如果一个待处理的数据集很大,即包含的数据很多,而另外需要连接处理的数据集却很小,那么在程序进行时,可以通过Map将不同的数据读入后使用同一个Reduce进行处理。9.1对于同样格式数据进行MapReduce连接 对于MapReduce数据的连接来说,就是使用程序对不同的输入数据库进行处理,而不同的数据可以认为是一个数据库里行列式...
作者简介
王晓华,高校资深计算机专业讲师,给研究生和本科生讲授面向对象程序设计、数据结构、Hadoop程序设计等相关课程。主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题,独立完成一项科研成果获省级成果认定,发表过多篇论文,申请一项专利。
基本信息
  • 版次: 1
  • 页数: 307
  • 字数: 363
  • 出版时间: 2014-01
  • 正文语种: 中文
  • 文件大小: 69.60
  • 印数: 1
  • 国际标准书号ISBN: 978-7-115-33237-0
  • 免费
    咨询
  • 订阅咨询
  • 期刊推荐
  • 联系电话
    发表咨询:023-6549-4411
    订阅咨询:023-6033-8768