扣丁學堂大數(shù)據(jù)培訓課程之Hadoop技術(shù)優(yōu)缺點詳解
2018-09-18 09:44:50
1237瀏覽
今天扣丁學堂大數(shù)據(jù)培訓給大家介紹一下關(guān)于Hadoop技術(shù)的優(yōu)缺點,目前我們正被數(shù)據(jù)包圍,全球43億部電話、20億位互聯(lián)網(wǎng)用戶每秒都在不斷地產(chǎn)生大量數(shù)據(jù),人們發(fā)送短信給朋友、上傳視頻、用手機拍照、更新社交網(wǎng)站的信息、轉(zhuǎn)發(fā)微博、點擊廣告等,使得機器產(chǎn)生和保留了越來越多的數(shù)據(jù)。數(shù)據(jù)的指數(shù)級增長對處于市場領(lǐng)導(dǎo)地位的互聯(lián)網(wǎng)公司,如Facebook、谷歌、雅虎、亞馬遜、騰訊等提出了挑戰(zhàn)。它們需要對TB級別和PB級別的數(shù)據(jù)進行分析處理,以發(fā)現(xiàn)哪些網(wǎng)站更受歡迎,哪些商品更具有吸引力,哪些廣告更吸引用戶。傳統(tǒng)的工具對于處理如此規(guī)模的數(shù)據(jù)集越來越無能為力。
現(xiàn)在,Hadoop應(yīng)運而生,龐大的信息流有了新的處理平臺。今天千鋒老師給大家分享的大數(shù)據(jù)培訓課程是:Hadoop技術(shù)的優(yōu)缺點。
1、Hadoop的優(yōu)點
(1)Hadoop具有按位存儲和處理數(shù)據(jù)能力的高可靠性。
(2)Hadoop通過可用的計算機集群分配數(shù)據(jù),完成存儲和計算任務(wù),這些集群可以方便地擴展到數(shù)以千計的節(jié)點中,具有高擴展性。
(3)Hadoop能夠在節(jié)點之間進行動態(tài)地移動數(shù)據(jù),并保證各個節(jié)點的動態(tài)平衡,處理速度非??欤哂懈咝?。
(4)Hadoop能夠自動保存數(shù)據(jù)的多個副本,并且能夠自動將失敗的任務(wù)重新分配,具有高容錯性。
2、Hadoop的缺點
(1)Hadoop不適用于低延遲數(shù)據(jù)訪問。
(2)Hadoop不能高效存儲大量小文件。
(3)Hadoop不支持多用戶寫入并任意修改文件。
Hadoop的核心組件
3、Hadoop版本簡介:
Hadoop自誕生以來,主要出現(xiàn)了Hadoop1、Hadoop2、Hadoop3三個系列多個版本。
HDFS和MapReduce是Hadoop1的核心組件,Hadoop生態(tài)圈里的很多組件都是基于HDFS和MapReduce發(fā)展出來的。在繼Hadoop1之后出現(xiàn)了Hadoop2,Hadoop2在Hadoop1的基礎(chǔ)上做了改進。相比Hadoop1,Hadoop2的三大核心組件分別是HDFS、MapReduce、Yarn。目前市面上絕大部分企業(yè)使用的是Hadoop2。
Hadoop2的一個公共模塊和三大核心組件組成了四個模塊,簡介如下:
(1)HadoopCommon:為其他Hadoop模塊提供基礎(chǔ)設(shè)施。
(2)HDFS:具有高可靠性、高吞吐量的分布式文件系統(tǒng)。
(3)MapReduce:基于Yarn系統(tǒng),分布式離線并行計算框架。
(4)Yarn:負責作業(yè)調(diào)度與集群資源管理的框架。
Hadoop技術(shù)儼然成為大數(shù)據(jù)的關(guān)鍵點,也是大數(shù)據(jù)開發(fā)課程的重中之重。
以上就是關(guān)于扣丁學堂大數(shù)據(jù)培訓課程之Hadoop技術(shù)優(yōu)缺點的詳細介紹,扣丁學堂提供完整大數(shù)據(jù)學習路線內(nèi)容包含Linux&&Hadoop生態(tài)體系、大數(shù)據(jù)計算框架體系、云計算體系、機器學習&&深度學習等大數(shù)據(jù)視頻教程內(nèi)容,根據(jù)大數(shù)據(jù)學習路線圖可以讓你對學習大數(shù)據(jù)需要掌握的知識有個清晰的了解,并快速入門大數(shù)據(jù)開發(fā)。
【關(guān)注微信公眾號獲取更多學習資料】
查看更多關(guān)于“大數(shù)據(jù)培訓資訊”的相關(guān)文章>
標簽:
大數(shù)據(jù)培訓
大數(shù)據(jù)視頻教程
大數(shù)據(jù)分析培訓
大數(shù)據(jù)學習視頻
Hadoop生態(tài)圈