2017-08-17 15:30:26 1296瀏覽
看到在扣丁學堂剛開始學習大數(shù)據(jù)的一位同學記錄的大數(shù)據(jù)學習筆記,小編把這份大數(shù)據(jù)學習筆記整理出來分享給正在學習或者是正在猶豫要不要學習的同學們,希望這份大數(shù)據(jù)學習筆記能方便你日后的學習。
1、數(shù)據(jù)挖掘:一種通過數(shù)理模式來分析企業(yè)內(nèi)存儲的大量資料,以找出不同客戶和市場劃分,分析出消費者喜好和行為的方法。也就是從存放在數(shù)據(jù)庫、數(shù)據(jù)倉庫和其他信息庫中的數(shù)據(jù)中獲取有效的、有潛在價值的、最終可被理解的模式的非平凡過程。
如:像我在當當網(wǎng)買書時,當當網(wǎng)的系統(tǒng)會根據(jù)我近期所購買的書的記錄進行分析,然后在我下次登錄當當網(wǎng)時,該系統(tǒng)會自行向我推薦其他類似的書籍。這個過程我想應該是用到數(shù)據(jù)挖掘的理論和方法。
2、數(shù)據(jù)挖掘在人工智能領域(AI)習慣上被稱為數(shù)據(jù)中的知識發(fā)現(xiàn),因此有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個基本步驟。
知識發(fā)現(xiàn)過程分為3個階段:1、數(shù)據(jù)準備;2、數(shù)據(jù)挖掘;3、結果表達和解釋。
3、數(shù)據(jù)挖掘的起源
數(shù)據(jù)挖掘來自這些領域的思想:1、來自統(tǒng)計學的抽樣、估計和假設檢驗;2、人工智能、模式識別、機器學習的搜索算法、建模理論和學習理論;3、其他領域的思想:最優(yōu)化、進化計算、信號處理、可視化和信息檢索。
4、數(shù)據(jù)挖掘的用途:
(1)、分類
(2)、估值
(3)、預言
(4)、相關性分組或關聯(lián)規(guī)則
(5)、聚集
(6)、描述和可視化
(7)、復雜數(shù)據(jù)類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
5、數(shù)據(jù)挖掘的第一步是描述數(shù)據(jù)、計算統(tǒng)計變量(如均值、方差等),再用圖表或圖片的形式直觀地演示出來,就可以看出一些變量之間的相關性。因此為了挖掘工作提供足夠的證據(jù),必須為歷史數(shù)據(jù)建立一個預言模型,然后用另外一些數(shù)據(jù)對這個模型進行測試,最后驗證這個模型。
以上就是剛開始學習大數(shù)據(jù)的同學整理的大數(shù)據(jù)學習筆記,也許不完善,但是很清晰,希望正在學習的你或者是準備學習的你能在學習過程中這么用心。想要觀看大數(shù)據(jù)視頻教程的同學可以直接登陸扣丁學堂的官網(wǎng),那里的大數(shù)據(jù)視頻教程免費提供給學員觀看。
查看更多關于“大數(shù)據(jù)開發(fā)資訊”的相關文章>>