第9章啤酒与尿布——MapReduce连接与数据挖掘初步 _MapReduce 2.0源码分析与编程实战

章节快照
作者简介
基本信息

第9章啤酒与尿布——MapReduce连接与数据挖掘初步王晓华

章节快照

对于大型数据处理来说,单个数据集之间的处理是相对简单的。但是如果涉及到多个数据集之间的整合,则编程就不是那么容易的事了。一般来说,对多个数据集协同处理的具体实现要取决于数据集的大小以及相对规模和分区模式。如果一个待处理的数据集很大,即包含的数据很多,而另外需要连接处理的数据集却很小,那么在程序进行时,可以通过Map将不同的数据读入后使用同一个Reduce进行处理。9.1对于同样格式数据进行MapReduce连接对于MapReduce数据的连接来说,就是使用程序对不同的输入数据库进行处理,而不同的数据可以认为是一个数据库里行列式...

作者简介

王晓华，高校资深计算机专业讲师，给研究生和本科生讲授面向对象程序设计、数据结构、Hadoop程序设计等相关课程。主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题，独立完成一项科研成果获省级成果认定，发表过多篇论文，申请一项专利。

基本信息

版次: 1
页数: 307
字数: 363
出版时间: 2014-01
正文语种: 中文
文件大小: 69.60
印数: 1
国际标准书号ISBN: 978-7-115-33237-0

在线咨询

或致电023-6033-8768

推荐图书

人力资源管理研究

21.28 M

￥32.48

非诉讼纠纷解决机制研究

47.92 M

￥42.56

政治学

14.32 M

￥25.76

互联网上的侵权问题研究

30.96 M

￥42.56

尼各马科伦理学

16.48 M

￥21.28

第9章 啤酒与尿布——MapReduce连接与数据挖掘初步 王晓华

人力资源管理研究

非诉讼纠纷解决机制研究

政治学

互联网上的侵权问题研究

尼各马科伦理学

第9章啤酒与尿布——MapReduce连接与数据挖掘初步王晓华