2019-05-28 14:26:26 4026瀏覽
Hadoop的使用相信只要是對此感興趣的小伙伴們或多或少都會知道一些,那么具體知道多少就說不好了,就算是不知道的小伙伴也沒有關(guān)系,下面是扣丁學(xué)堂大數(shù)據(jù)培訓(xùn)小編給大家整理的用好Hadoop的問答詳解,希望對小伙伴們有幫助。
1、以后想從事大數(shù)據(jù)方面工作,算法要掌握到什么程度,算法占主要部分嗎?
首先,如果要從事大數(shù)據(jù)相關(guān)領(lǐng)域的話,hadoop是作為工具來使用的,首先需要掌握使用方法??梢圆挥蒙钊氲絟adoop源碼級別細節(jié)。
然后就是對算法的理解,往往需要設(shè)計到數(shù)據(jù)挖掘算法的分布式實現(xiàn),而算法本身你還是需要理解的,例如常用的k-means聚類等。
2、大數(shù)據(jù)處理都是服務(wù)器上安裝相關(guān)軟件嗎,對程序有什么影響呢,集群、大數(shù)據(jù)是屬于運維的工作內(nèi)容還是攻城獅的呢?
傳統(tǒng)的程序只能運行在單機上,而大數(shù)據(jù)處理這往往使用分布式編程框架編寫,例如hadoopmapreduce,只能運行在hadoop集群平臺上。
運維的責(zé)任:保證集群,機器的穩(wěn)定性和可靠性
hadoop系統(tǒng)本身研發(fā):提高Hadoop集群的性能,增加新功能。
大數(shù)據(jù)應(yīng)用:把hadoop作為工具,去實現(xiàn)海量數(shù)據(jù)處理或者相關(guān)需求。
3、100個以上hadoop節(jié)點,一般怎么開發(fā),運維?任務(wù)很多的情況下任務(wù)資源怎么分配,任務(wù)執(zhí)行順序是定時腳本還是別的什么方式控制?
a.首先大數(shù)據(jù)的應(yīng)用開發(fā)和hadoop集群的規(guī)模是沒有關(guān)系,你指的是集群的搭建和運維嗎,對于商用的hadoop系統(tǒng)來說涉及到很多東西。
b.任務(wù)的分配是有hadoop的調(diào)度器的調(diào)度策略決定的,默認為FIFO調(diào)度,商業(yè)集群一般使用多隊列多用戶調(diào)度器。
c.任務(wù)的執(zhí)行順序是有用戶控制的,你自然可以定時啟動,也可以手動啟動。
想要了解更多關(guān)于大數(shù)據(jù)開發(fā)方面內(nèi)容的小伙伴,請關(guān)注扣丁學(xué)堂大數(shù)據(jù)培訓(xùn)官網(wǎng)、微信等平臺,扣丁學(xué)堂IT職業(yè)在線學(xué)習(xí)教育有專業(yè)的大數(shù)據(jù)講師為您指導(dǎo),此外扣丁學(xué)堂老師精心推出的大數(shù)據(jù)視頻教程定能讓你快速掌握大數(shù)據(jù)從入門到精通開發(fā)實戰(zhàn)技能。扣丁學(xué)堂大數(shù)據(jù)學(xué)習(xí)群:209080834。
【關(guān)注微信公眾號獲取更多學(xué)習(xí)資料】 【掃碼進入Python全棧開發(fā)免費公開課】
查看更多關(guān)于“大數(shù)據(jù)培訓(xùn)資訊”的相關(guān)文章>