第3章 “吃下去吐出来”——Hadoop文件I/O系统详解 _MapReduce 2.0源码分析与编程实战

章节快照
作者简介
基本信息

第3章 “吃下去吐出来”——Hadoop文件I/O系统详解王晓华

章节快照

在对数据进行处理之前,需要将数据转化成Hadoop能够辨识的格式,其后才能开始处理。但大规模数据的数据转换与传输本身就是一项极艰难的任务,同时又要符合Hadoop数据处理的要求。在已有的格式不能够满足Hadoop分布式存储和传输需要的基础上,Hadoop自定义了一套特有的文件I/O系统。3.1Hadoop的压缩类型介绍我们知道,Hadoop的数据交换是基于宽带连接的一种数据连接方式,因此在数据处理时推荐使用压缩的方式对数据进行预处理。其好处也是不言而喻的,第一是节省了大量带宽;第二则是由于Hadoop的任务处理机制,可以更方便地进行数据传输。这...

作者简介

王晓华，高校资深计算机专业讲师，给研究生和本科生讲授面向对象程序设计、数据结构、Hadoop程序设计等相关课程。主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题，独立完成一项科研成果获省级成果认定，发表过多篇论文，申请一项专利。

基本信息

版次: 1
页数: 307
字数: 363
出版时间: 2014-01
正文语种: 中文
文件大小: 69.60
印数: 1
国际标准书号ISBN: 978-7-115-33237-0

在线咨询

或致电023-6033-8768

推荐图书

人力资源管理研究

21.28 M

￥32.48

非诉讼纠纷解决机制研究

47.92 M

￥42.56

政治学

14.32 M

￥25.76

互联网上的侵权问题研究

30.96 M

￥42.56

尼各马科伦理学

16.48 M

￥21.28

第3章 “吃下去吐出来”——Hadoop文件I/O系统详解 王晓华

人力资源管理研究

非诉讼纠纷解决机制研究

政治学

互联网上的侵权问题研究

尼各马科伦理学

第3章 “吃下去吐出来”——Hadoop文件I/O系统详解王晓华