期刊家
学术期刊
科普期刊
出版社
图书
会议
我的购物车 0

第3章 “吃下去吐出来”——Hadoop文件I/O系统详解 王晓华

章节快照
在对数据进行处理之前,需要将数据转化成Hadoop能够辨识的格式,其后才能开始处理。但大规模数据的数据转换与传输本身就是一项极艰难的任务,同时又要符合Hadoop数据处理的要求。在已有的格式不能够满足Hadoop分布式存储和传输需要的基础上,Hadoop自定义了一套特有的文件I/O系统。3.1Hadoop的压缩类型介绍 我们知道,Hadoop的数据交换是基于宽带连接的一种数据连接方式,因此在数据处理时推荐使用压缩的方式对数据进行预处理。其好处也是不言而喻的,第一是节省了大量带宽;第二则是由于Hadoop的任务处理机制,可以更方便地进行数据传输。这...
作者简介
王晓华,高校资深计算机专业讲师,给研究生和本科生讲授面向对象程序设计、数据结构、Hadoop程序设计等相关课程。主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题,独立完成一项科研成果获省级成果认定,发表过多篇论文,申请一项专利。
基本信息
  • 版次: 1
  • 页数: 307
  • 字数: 363
  • 出版时间: 2014-01
  • 正文语种: 中文
  • 文件大小: 69.60
  • 印数: 1
  • 国际标准书号ISBN: 978-7-115-33237-0
  • 免费
    咨询
  • 订阅咨询
  • 期刊推荐
  • 联系电话
    发表咨询:023-6549-4411
    订阅咨询:023-6033-8768