數(shù)據(jù)挖掘是近幾年來一個在IT領域非?;钴S的實用性技術學科,由于其廣泛的應用,極為出彩的實際應用效果,對于各行業(yè)幾乎都可以無門檻地進行分析和挖掘部署,受到了越來越多的關注。數(shù)據(jù)挖掘是一門綜合學科,它包括了數(shù)據(jù)庫技術、統(tǒng)計學、信息科學、機器學習、可視化、以及其他學科的部分內(nèi)容。
在互聯(lián)網(wǎng)行業(yè)大行其道的今天,越來越多的傳統(tǒng)行業(yè)受到了沖擊,而在這一切競爭的背后,數(shù)據(jù)都被認為是能夠戰(zhàn)勝對手使企業(yè)脫穎而出的利器,從數(shù)據(jù)中學習知識已經(jīng)是眾多大型企業(yè)的共識,而在各行業(yè)中的領頭羊企業(yè)的數(shù)據(jù)挖掘水平也常被稱道,如阿里巴巴的大數(shù)據(jù)挖掘,百度的深度學習等等
數(shù)據(jù)挖掘工程師作為一個職業(yè),有著非常好的前景和巨大的職位缺口,有志向職位發(fā)展的同學急不可急于求成,要扎實地打好基礎,學習數(shù)據(jù)挖掘算法,有一定的行業(yè)知識了解,清楚各行業(yè)分析過程中更為看重的目標是什么。
第一部份 數(shù)據(jù)挖掘算法體系與常用挖掘軟件
第二部份 K-NN算法與建立模型
第三部份 樸素貝葉斯算法與交叉驗證
第四部份 零售行業(yè)的客戶挖掘
第五部份 教育行業(yè)的關聯(lián)推薦算法
第六部份 醫(yī)療主題的聚類算法學習
第七部份 文本挖掘:垃圾郵件檢測
第八部份 文本挖掘:語言識別與客戶反饋分析
第九部份 基于天體物理學和醫(yī)療行業(yè)的特征選擇和分類學習
第十部份 基于生物醫(yī)療行業(yè)的建模學習
第十一部份 異常檢測和實例選擇
第十二部份 元建模學習和特征選擇以及參數(shù)優(yōu)化