第一部份 Spark ML基礎(chǔ)入門
1、Spark介紹
2、Spark ML介紹
3、部份程的基礎(chǔ)環(huán)境
4、Spark SparkSession
5、Spark Datasets操作
6、Datasets操作的代碼實(shí)操
第二部份 Spark ML Pipelines(ML管道)
1、Pipelines的主要概念
2、Pipelines實(shí)例講解
3、ML操作的代碼實(shí)操
4、使用 ML Pipeline 構(gòu)建機(jī)器學(xué)習(xí)工作流案例展示
5、實(shí)例的代碼實(shí)操
第三部份 Spark ML數(shù)學(xué)基礎(chǔ)
1、ML矩陣向量計(jì)算
2、分類效果評估指標(biāo)及ML實(shí)現(xiàn)詳解
3、交叉-驗(yàn)證方法及ML實(shí)現(xiàn)詳解
4、實(shí)例的代碼實(shí)操
第四部份 Spark ML特征的提取、轉(zhuǎn)換和選擇
1、特征的提取及ML實(shí)現(xiàn)詳解
2、特征的轉(zhuǎn)換及ML實(shí)現(xiàn)詳解
3、特征的選擇及ML實(shí)現(xiàn)詳解
4、實(shí)例的代碼實(shí)操
第五部份 Spark ML線性回歸/邏輯回歸算法
1、線性回歸算法
2、邏輯回歸算法
3、ML回歸算法參數(shù)詳解
4、ML實(shí)例
5、實(shí)例的代碼實(shí)操
第六部份 Spark ML決策樹/隨機(jī)森林/GBDT算法
1、決策樹算法
2、隨機(jī)森林算法
3、GDBT算法
4、ML樹模型參數(shù)詳解
5、ML實(shí)例
6、實(shí)例的代碼實(shí)操
第七部份 Spark ML KMeans聚類算法
1、KMeans聚類算法
2、ML KMeans模型參數(shù)詳解
3、ML實(shí)例
4、實(shí)例的代碼實(shí)操
第八部份 Spark ML LDA主題聚類算法
1、LDA主題聚類算法
2、ML LDA主題聚類模型參數(shù)詳解
3、ML實(shí)例
4、實(shí)例的代碼實(shí)操
第九部份 Spark ML協(xié)同過濾推薦算法
1、協(xié)同過濾推薦算法
2、ML協(xié)同過濾分布式實(shí)現(xiàn)邏輯
3、ML協(xié)同過濾源碼開發(fā)
4、實(shí)現(xiàn)實(shí)例
5、實(shí)例的代碼實(shí)操
第十部份 大型案例:基于Spark的推薦模型開發(fā)
1、案例背景
2、架構(gòu)設(shè)計(jì)
3、數(shù)據(jù)準(zhǔn)備
4、模型訓(xùn)練
5、模型預(yù)測
6、腳本封裝 |