第9章 啤酒与尿布——MapReduce连接与数据挖掘初步
章节快照
对于大型数据处理来说,单个数据集之间的处理是相对简单的。但是如果涉及到多个数据集之间的整合,则编程就不是那么容易的事了。一般来说,对多个数据集协同处理的具体实现要取决于数据集的大小以及相对规模和分区模式。如果一个待处理的数据集很大,即包含的数据很多,而另外需要连接处理的数据集却很小,那么在程序进行时,可以通过Map将不同的数据读入后使用同一个Reduce进行处理。9.1对于同样格式数据进行MapReduce连接
对于MapReduce数据的连接来说,就是使用程序对不同的输入数据库进行处理,而不同的数据可以认为是一个数据库里行列式...
基本信息
- 版次: 1
- 页数: 307
- 字数: 363
- 出版时间: 2014-01
- 正文语种: 中文
- 文件大小: 69.60
- 印数: 1
- 国际标准书号ISBN: 978-7-115-33237-0
在线咨询
或致电023-6033-8768