互聯(lián)網(wǎng)數(shù)據(jù)挖掘概覽 |
- 互聯(lián)網(wǎng)的數(shù)據(jù)挖掘典型需求
- 互聯(lián)網(wǎng)數(shù)據(jù)采集的典型渠道
- 互聯(lián)網(wǎng)數(shù)據(jù)存儲特征
- 數(shù)據(jù)挖掘技術(shù)與工具
- 數(shù)據(jù)分析的工作模式
- 示例:數(shù)據(jù)挖掘在互聯(lián)網(wǎng)行業(yè)中的應(yīng)用
|
互聯(lián)網(wǎng)相關(guān)的數(shù)據(jù)挖掘典型應(yīng)用場景 |
- 數(shù)據(jù)流挖掘分析
- 文本挖掘分析
- 示例:文本數(shù)據(jù)流分析
- 位置分析
- 社交關(guān)系分析
- 互聯(lián)網(wǎng)應(yīng)用識別
- 個性化推薦介紹
|
數(shù)據(jù)分析與挖掘的流程 |
- 確定數(shù)據(jù)需求
- 設(shè)計數(shù)據(jù)挖掘模型
- 確定數(shù)據(jù)來源
- 收集并整理數(shù)據(jù)
- 選擇數(shù)據(jù)挖掘算法
- 執(zhí)行數(shù)據(jù)挖掘算法
- 數(shù)據(jù)分析結(jié)果評估與算法+數(shù)據(jù)優(yōu)化
- 報告數(shù)據(jù)分析結(jié)果
|
數(shù)據(jù)需求分析 |
- 確定數(shù)據(jù)分析目標(biāo)
- 圍繞目標(biāo)分解指標(biāo)
- 把指標(biāo)映射到已有的數(shù)據(jù)
- 確定對數(shù)據(jù)的要求
|
設(shè)計數(shù)據(jù)挖掘模型 |
- 確定數(shù)據(jù)源模型
- 確定數(shù)據(jù)挖掘結(jié)果模型
- 確定數(shù)據(jù)分析算法容器模型
- 建立從數(shù)據(jù)源到數(shù)據(jù)分析結(jié)果映射圖
|
確定數(shù)據(jù)源 |
- 數(shù)據(jù)源存儲空間標(biāo)定
- 數(shù)據(jù)源邏輯模型分析
- 數(shù)據(jù)源抽取方法列表
- 數(shù)據(jù)源備份機(jī)制選擇
- 數(shù)據(jù)源質(zhì)量分析
|
收集并整理數(shù)據(jù) |
- 數(shù)據(jù)整理需求明確
- 采用自動化方法整理數(shù)據(jù)
- 對不合規(guī)數(shù)據(jù)的特殊處理
- 間隙數(shù)據(jù)的補(bǔ)充
|
選擇數(shù)據(jù)挖掘算法 |
- 典型數(shù)據(jù)挖掘算法列表
- 關(guān)聯(lián)和相關(guān)分析
- 相關(guān)分析
- 關(guān)聯(lián)規(guī)則分析
- 實(shí)例:使用相關(guān)及關(guān)聯(lián)進(jìn)行分析
- 聚類分析算法及應(yīng)用
- 分類算法
- 用決策樹進(jìn)行分類
- 神經(jīng)網(wǎng)絡(luò)
- 實(shí)例:使用分類方法進(jìn)行客戶流失分析
- 回歸分析與預(yù)測
- 示例:使用時間序列分析進(jìn)行網(wǎng)絡(luò)流量預(yù)測
|
數(shù)據(jù)挖掘工具原理與實(shí)踐 |
- 典型數(shù)據(jù)挖掘工具列表
- 統(tǒng)計分析工具SPSS介紹(簡要)
- 數(shù)據(jù)挖掘?qū)S霉ぞ逽PSS Clementine介紹
- 建模及模型評價過程
- 應(yīng)用SPSS Clementine工具進(jìn)行數(shù)據(jù)挖掘與分析
|
數(shù)據(jù)挖掘效果評估與優(yōu)化 |
- 數(shù)據(jù)挖掘結(jié)果差異分析
- 差異原因定位
- 優(yōu)化數(shù)據(jù)與算法
- 重新處理數(shù)據(jù)、算法分析
- 結(jié)果比對與確認(rèn)
- 數(shù)據(jù)分析結(jié)果報告?
|