博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
好程序员大数据教程分享之Hadoop优缺点
阅读量:5890 次
发布时间:2019-06-19

本文共 1130 字,大约阅读时间需要 3 分钟。

好程序员大数据教程分享之Hadoop优缺点,大数据成为时代主流,开启时代的大门,全球43亿部电话、20亿位互联网用户每秒都在不断地产生大量数据,人们发送短信给朋友、上传视频、用手机拍照、更新社交网站的信息、转发微博、点击广告等,使得机器产生和保留了越来越多的数据。我们被数据所包围,我们源源不断地制造新的数据。数据指数级地增长,对于各大互联网公司提出了新得挑战!

我们需要对TB级别和PB级别的数据进行分析处理,以发现哪些网站更受欢迎,哪些商品更具有吸引力,哪些广告更吸引用户。传统的工具对于处理如此规模的数据集越来越无能为力。而Hadoop的出现将弥补这一技术空白。

我们说Hadoop应运而生,有了它,庞大的信息流有了新的处理平台。它被我们誉为神奇的存在,帮助我们在挑战中制造新的机遇!简要分享Hadoop优缺点,方便大家学习和分享!

1、Hadoop的优点

(1)Hadoop具有按位存储和处理数据能力的高可靠性。

(2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。

(3)Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。

(4)Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错性。

2、Hadoop的缺点

(1)Hadoop不适用于低延迟数据访问。

(2)Hadoop不能高效存储大量小文件。

(3)Hadoop不支持多用户写入并任意修改文件。

Hadoop的核心组件

3、Hadoop版本简介:

Hadoop自诞生以来,主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。

HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的很多组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1之后出现了Hadoop2,Hadoop2在Hadoop1的基础上做了改进。相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2。

Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下:

(1)Hadoop Common:为其他Hadoop模块提供基础设施。

(2)HDFS:具有高可靠性、高吞吐量的分布式文件系统。

(3)MapReduce:基于Yarn系统,分布式离线并行计算框架。

(4)Yarn:负责作业调度与集群资源管理的框架。

转载于:https://juejin.im/post/5cff675a6fb9a07ef06f8aa7

你可能感兴趣的文章
python---__getattr__\__setattr_重载'.'操作
查看>>
谈谈javascript中的prototype与继承
查看>>
时序约束优先级_Vivado工程经验与各种时序约束技巧分享
查看>>
nginx win 启动关闭_windows下nginx启动与关闭的批处理脚本
查看>>
python中实参包括哪些_第50p,形参与实参,Python中函数的参数详解
查看>>
minio 并发数_MinIO 参数解析与限制
查看>>
eap wifi 证书_用openssl为EAP-TLS生成证书(CA证书,服务器证书,用户证书)
查看>>
mysql 应用程序是哪个文件夹_Mysql 数据库文件存储在哪个目录?
查看>>
mysql半同步和无损复制_MySQL半同步复制你可能没有注意的点
查看>>
mysql能看见表显示表不存在_遇到mysql数据表不存在的问题
查看>>
使用mysql实现宿舍管理_JSP+Struts2+JDBC+Mysql实现的校园宿舍管理系统
查看>>
mysql alter 修改字段类型_MySQL ALTER命令:删除,添加或修改表字段、修改字段类型及名称等...
查看>>
mysql中的事务和锁_MySQL - 事务和锁中的互斥?
查看>>
mysql statement讲解_Statement接口详解
查看>>
mysql_print_default_知识点:MySQL常用工具介绍(十 二)——实用程序my_print_defaults、perror...
查看>>
mysql怎么会报错_MySQL启动报错怎么办?
查看>>
python编译exe用于别的电脑上_Python安装教程(推荐一款不错的Python编辑器)
查看>>
flash back mysql_mysqlbinlog flashback 使用最佳实践
查看>>
hive中如何把13位转化为时间_sqoop1 导入 hive parquet 表中 时间戳调整为日期
查看>>
mysql书外键_[转] mysql 外键(Foreign Key)的详解和实例
查看>>