2018-08-14 13:26:57 1362瀏覽
在如今這個信息高速發(fā)展的今天,hadoop也越來越火了。有很多參加大數(shù)據(jù)培訓的同學都會問到Hadoop,那今天扣丁學堂的小編就來給大家講一下吧。
hadoop思想起源:Google
小編注意到了Google搜索引擎,安卓,翻譯等等,有很多的先進技術(shù),但是現(xiàn)在國內(nèi)的用戶是訪問不到谷歌搜索引擎的,其實谷歌給我們的生活帶來很大的影響的,從我們用到的智能手機安卓系統(tǒng)到谷歌翻譯,谷歌學術(shù),Google+等等有很多新的知識等著我們?nèi)W習。
Google的低成本之道
Google的強大搜索引擎源于不使用超級計算機,不使用存儲。采用的是使用大量的PC服務器,因為互聯(lián)網(wǎng)中的數(shù)據(jù)是很龐大的,有好的架構(gòu)能夠提供數(shù)據(jù)存儲和數(shù)據(jù)訪問,提供冗余的集群服務。像淘寶以前使用的存儲是oracle由于數(shù)據(jù)量的增大,淘寶在走去Ieo模式,不使用存儲。
google在全世界有多個數(shù)據(jù)中心,有些還是帶有發(fā)電廠的,能夠滿足全球用戶的搜索需求。同時還有一個重要的一點就是運營商向Google倒付費。
小編發(fā)現(xiàn)了Hadoop是一個開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺,是Appach的一個用最流行的java語言實現(xiàn)開源軟件框架,同時實現(xiàn)在大量計算機組成的集群中對海量數(shù)據(jù)進行分布式計算。
Hadoop框架中最核心設(shè)計就是:HDFS和MapReduce.HDFS提供了海量數(shù)據(jù)的存儲,MapReduce提供了對數(shù)據(jù)的計算。
HDFS(Hadoop Distributed File System,Hadoop分布式文件系統(tǒng)),它是一個高度容錯性的系統(tǒng),適合部署在廉價的機器上。HDFS能提供高吞吐量的數(shù)據(jù)訪問,適合那些有著超大數(shù)據(jù)集(large data set)的應用程序。
MapReduce是一套從海量源數(shù)據(jù)提取分析元素最后返回結(jié)果集的編程模型,將文件分布式存儲到硬盤是第一步,而從海量數(shù)據(jù)中提取分析我們需要的內(nèi)容就是MapReduce做的事了。
在現(xiàn)實的應用中Hadoop非常適合應用于大數(shù)據(jù)存儲和大數(shù)據(jù)分析的應用,適合于服務器幾千臺到幾萬臺的集群運行,支持PB級的存儲容量。這是傳統(tǒng)數(shù)據(jù)庫不能超越的一點也是最有優(yōu)勢的一點。
以上就是扣丁學堂大數(shù)據(jù)在線學習小編給大家分享的文章,希望對小伙伴們有所幫助,想要了解更多關(guān)于大數(shù)據(jù)方面內(nèi)容的小伙伴可以登錄扣丁學堂官網(wǎng)咨詢,扣丁學堂有專業(yè)的大數(shù)據(jù)培訓班邀請有理想的你加入??鄱W堂不僅有專業(yè)的大數(shù)據(jù)培訓班供大家學習,還有與時俱進的課程體系和大量的大數(shù)據(jù)在線視頻教程讓學員免費觀看學習,想要學好大數(shù)據(jù)的小伙伴快到扣丁學堂來了解詳情吧??鄱W堂大數(shù)據(jù)學習群:209080834。
【關(guān)注微信公眾號獲取更多學習資料】
查看更多關(guān)于“大數(shù)據(jù)培訓資訊”的相關(guān)文章>>