統(tǒng)計(jì)學(xué)基本原理 |
- 何謂研究
- 常見(jiàn)的研究名詞:概念性架構(gòu)、模型、操作型定義、變量、命題與假設(shè)
- 問(wèn)卷設(shè)計(jì)原則與操作
- 研究中常見(jiàn)的變量:自變量、依變量、中介變量、干擾變量及控制變量
- 統(tǒng)計(jì)分析常用的名詞:平均數(shù)、眾數(shù)、方差、協(xié)方差、標(biāo)準(zhǔn)偏差、標(biāo)準(zhǔn)誤
- 測(cè)量尺度的應(yīng)用:名目尺度、順序尺度、區(qū)間尺度及比例尺度
- 估計(jì)(Confidence Interval, CI)與檢定(P-value)
- 自由度 9. 統(tǒng)計(jì)的假設(shè):常態(tài)、同質(zhì)、獨(dú)立 10. 信度
- 效度:表面效度、內(nèi)容效度、效標(biāo)效度、建構(gòu)效度(收斂效度及區(qū)別效度
|
R語(yǔ)言基礎(chǔ) |
- R簡(jiǎn)介、數(shù)據(jù)類型介紹、R的數(shù)據(jù)可視化、常用R包介紹。R集成開(kāi)發(fā)環(huán)境
- 數(shù)據(jù)整理:數(shù)據(jù)的讀入輸出、控制流、各種圖表,常用統(tǒng)計(jì)量計(jì)算
- 數(shù)據(jù)展現(xiàn)1:基本制圖函數(shù)綜述、理解關(guān)鍵制圖參數(shù)
|
R語(yǔ)言數(shù)據(jù)可視化 |
- 數(shù)據(jù)展現(xiàn)2:散點(diǎn)圖、線圖與時(shí)間序列譜圖,案例:股價(jià)走勢(shì)可視化展現(xiàn)
- 數(shù)據(jù)展現(xiàn)3:柱形圖,點(diǎn)圖,餅圖,直方圖,案例:銷售數(shù)據(jù)可視化展現(xiàn)
- 數(shù)據(jù)展現(xiàn)4:箱線圖,熱力圖,等高線,地圖,案例:Facebook好友聯(lián)系圖
|
Logistic回歸與商業(yè)大數(shù)據(jù)建模 |
- Logistic回歸是商業(yè)建模的常用重要數(shù)據(jù)挖掘方法,本講要講清楚Logistic回歸的建模原理、與多元線性模型的區(qū)別、R語(yǔ)言實(shí)現(xiàn)過(guò)程及回歸診斷注意事項(xiàng)、預(yù)測(cè)方法和結(jié)果解釋,讓學(xué)員徹底地掌握Logistic回歸解決問(wèn)題的R語(yǔ)言方法。
- 主要案例:
- 案例2:利用Logistic回歸分析網(wǎng)頁(yè)點(diǎn)擊流量
- 案例3:利用Logistic回歸分析婚外情
|
關(guān)聯(lián)規(guī)則和R語(yǔ)言實(shí)現(xiàn) |
- 關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法和eclat算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語(yǔ)言快速完成關(guān)聯(lián)規(guī)則分析。
- 主要案例:
- 案例1:使用R語(yǔ)言關(guān)聯(lián)規(guī)則方法幫助各個(gè)超市實(shí)現(xiàn)商品的最佳捆綁銷售方案(即“購(gòu)物籃”分析);
|
決策樹(shù)(回歸樹(shù))分析和隨機(jī)森林R語(yǔ)言實(shí)現(xiàn) |
- 決策樹(shù)是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹(shù)算法:CART和C4.5算法,使用rpart和J48函數(shù)進(jìn)行R語(yǔ)言分析。
- 主要案例:
- 案例1:對(duì)汽車(chē)銷量走勢(shì)預(yù)測(cè)
|
R語(yǔ)言聚類算法
|
- 在機(jī)器學(xué)習(xí)中,聚類算法包括,層次聚類法,譜系圖,k平均值法,k中心法
- 是非常重要的算法模塊
- 主要案例:
- 案例1:推薦系統(tǒng)?
|