R語(yǔ)言分析實(shí)戰(zhàn)培訓(xùn)課程大綱
培訓(xùn)對(duì)象:
-
數(shù)據(jù)分析師/數(shù)據(jù)挖掘工程師
-
統(tǒng)計(jì)學(xué)、數(shù)學(xué)、計(jì)算機(jī)相關(guān)專業(yè)學(xué)生及教師
-
金融、經(jīng)濟(jì)、管理等需要數(shù)據(jù)分析的從業(yè)者
-
對(duì)數(shù)據(jù)可視化、統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)感興趣的職場(chǎng)人士
培訓(xùn)目標(biāo):
使學(xué)員系統(tǒng)掌握R語(yǔ)言的核心語(yǔ)法與數(shù)據(jù)結(jié)構(gòu),熟練使用R進(jìn)行數(shù)據(jù)清洗、整理與可視化;深入理解統(tǒng)計(jì)分析基本方法(描述統(tǒng)計(jì)、假設(shè)檢驗(yàn)、方差分析、回歸分析);掌握主流數(shù)據(jù)挖掘算法(聚類、分類、關(guān)聯(lián)規(guī)則)的R語(yǔ)言實(shí)現(xiàn);通過真實(shí)項(xiàng)目案例,培養(yǎng)學(xué)員從數(shù)據(jù)獲取到分析建模再到結(jié)果解讀的全流程實(shí)戰(zhàn)能力,能夠運(yùn)用R語(yǔ)言獨(dú)立解決實(shí)際業(yè)務(wù)中的數(shù)據(jù)分析和挖掘問題。
培訓(xùn)內(nèi)容介紹:
-
R語(yǔ)言開發(fā)環(huán)境與基礎(chǔ)語(yǔ)法
R語(yǔ)言特點(diǎn)與應(yīng)用領(lǐng)域;R與RStudio安裝配置;R包管理與加載;R語(yǔ)言編碼規(guī)則與基礎(chǔ)語(yǔ)法;變量與基本數(shù)據(jù)類型(數(shù)值/字符/邏輯);運(yùn)算符(算術(shù)/比較/邏輯);常用內(nèi)置函數(shù);第一個(gè)R程序?qū)崙?zhàn)。
-
R語(yǔ)言數(shù)據(jù)結(jié)構(gòu)核心
向量創(chuàng)建與操作(數(shù)值型/字符型/邏輯型/因子型);矩陣與數(shù)組的定義與運(yùn)算;數(shù)據(jù)框的創(chuàng)建、引用與修改;列表的靈活應(yīng)用;數(shù)據(jù)結(jié)構(gòu)的類型轉(zhuǎn)換與相互操作;缺失值處理基礎(chǔ)。
-
數(shù)據(jù)讀寫與外部數(shù)據(jù)導(dǎo)入
工作空間管理;文本文件(CSV/TXT)的導(dǎo)入導(dǎo)出;Excel文件讀寫;SPSS/SAS/Stata等統(tǒng)計(jì)軟件數(shù)據(jù)導(dǎo)入;數(shù)據(jù)庫(kù)數(shù)據(jù)連接(ODBC/DBI);RStudio菜單導(dǎo)入數(shù)據(jù)操作;網(wǎng)絡(luò)數(shù)據(jù)抓取基礎(chǔ)(rvest包)。
-
數(shù)據(jù)清洗與預(yù)處理技術(shù)
缺失值識(shí)別、分布可視化與處理方法(刪除/填補(bǔ));異常值檢測(cè)與處理;數(shù)據(jù)去重與排序;數(shù)據(jù)變換(標(biāo)準(zhǔn)化/歸一化);dplyr包數(shù)據(jù)操作:管道%>%、選擇/過濾/修改/分組/匯總;tidyr包長(zhǎng)寬數(shù)據(jù)轉(zhuǎn)換;字符串處理與正則表達(dá)式基礎(chǔ)。
-
流程控制與函數(shù)編程
條件判斷語(yǔ)句(if/else/ifelse);循環(huán)語(yǔ)句(for/while/repeat);自編函數(shù)定義與調(diào)試;向量化計(jì)算與apply函數(shù)族(apply/lapply/sapply/tapply/mapply);R代碼調(diào)試技巧。
-
R語(yǔ)言基礎(chǔ)繪圖系統(tǒng)
圖形參數(shù)設(shè)置(顏色/線條/文本/坐標(biāo)軸/圖例);基礎(chǔ)圖形繪制:散點(diǎn)圖、折線圖、條形圖、餅圖、直方圖、箱線圖、核密度圖;圖形組合與布局;圖形保存與輸出。
-
ggplot2高級(jí)數(shù)據(jù)可視化
ggplot2圖形語(yǔ)法與圖層概念;qplot快速繪圖;幾何對(duì)象(散點(diǎn)/平滑/箱線/直方/條形);統(tǒng)計(jì)變換;分面系統(tǒng)(facet_wrap/facet_grid);主題系統(tǒng)與顏色自定義;ggplot2擴(kuò)展包(ggthemes/ggrepel)應(yīng)用;可交互圖形(plotly)基礎(chǔ)。
-
描述性統(tǒng)計(jì)分析
數(shù)據(jù)集中趨勢(shì)度量(均值/中位數(shù)/眾數(shù));離散程度度量(方差/標(biāo)準(zhǔn)差/極差/四分位距);數(shù)據(jù)分布形態(tài)分析(偏度/峰度);分組計(jì)算描述統(tǒng)計(jì)量;頻數(shù)分布表與列聯(lián)表生成;相關(guān)性度量與可視化(散點(diǎn)圖矩陣/相關(guān)系數(shù))。
-
參數(shù)估計(jì)與假設(shè)檢驗(yàn)
正態(tài)分布與抽樣分布;置信區(qū)間估計(jì)(總體均值/比例/方差);假設(shè)檢驗(yàn)基本原理;單樣本t檢驗(yàn);獨(dú)立樣本t檢驗(yàn);配對(duì)樣本t檢驗(yàn);單因素方差分析;卡方檢驗(yàn);非參數(shù)檢驗(yàn)方法(Wilcoxon/Mann-Whitney/Kruskal-Wallis)。
-
回歸分析建模
線性回歸基本原理;一元線性回歸(模型擬合/顯著性檢驗(yàn)/預(yù)測(cè));多元線性回歸(變量選擇/共線性診斷);回歸診斷(殘差分析/異常值識(shí)別/強(qiáng)影響點(diǎn));逐步回歸;非線性回歸(多項(xiàng)式回歸);邏輯回歸(二分類)原理與應(yīng)用。
-
聚類分析算法
聚類分析基本概念與步驟;距離計(jì)算方法;K-means聚類(肘部法則/輪廓系數(shù));層次聚類(凝聚式/分裂式);密度聚類(DBSCAN);聚類結(jié)果可視化;聚類結(jié)果解讀與評(píng)估。
-
分類算法與模型評(píng)估
分類問題基本概念;KNN最近鄰算法;樸素貝葉斯分類器;決策樹算法(rpart包);隨機(jī)森林集成學(xué)習(xí);支持向量機(jī)(SVM)基礎(chǔ);模型評(píng)估指標(biāo)(混淆矩陣/準(zhǔn)確率/召回率/F1值/ROC曲線);交叉驗(yàn)證方法。
-
關(guān)聯(lián)規(guī)則挖掘
關(guān)聯(lián)規(guī)則基本概念(支持度/置信度/提升度);Apriori算法原理;arules包關(guān)聯(lián)規(guī)則挖掘;規(guī)則篩選與排序;關(guān)聯(lián)規(guī)則可視化;購(gòu)物籃分析案例實(shí)戰(zhàn)。
-
文本挖掘與網(wǎng)絡(luò)爬蟲基礎(chǔ)
中文文本預(yù)處理(分詞/停用詞過濾);詞頻統(tǒng)計(jì)與詞云圖;情感分析基礎(chǔ);rvest包網(wǎng)頁(yè)數(shù)據(jù)抓;API數(shù)據(jù)獲取(httr包);社交媒體數(shù)據(jù)獲取基礎(chǔ)。
-
動(dòng)態(tài)報(bào)告與R Markdown
R Markdown工作流程與框架結(jié)構(gòu);文檔編譯與輸出格式(HTML/PDF/Word);代碼塊選項(xiàng)設(shè)置;表格與圖形嵌入;幻燈片制作基礎(chǔ);自動(dòng)化報(bào)告生成。
-
綜合實(shí)戰(zhàn):電商客戶價(jià)值分析與智能推薦
以電商真實(shí)數(shù)據(jù)集為背景,完成完整數(shù)據(jù)分析與挖掘項(xiàng)目:數(shù)據(jù)導(dǎo)入與清洗→客戶描述性統(tǒng)計(jì)分析→RFM模型構(gòu)建→客戶價(jià)值分群(K-means聚類)→商品關(guān)聯(lián)規(guī)則挖掘(Apriori)→客戶流失預(yù)測(cè)模型(決策樹/邏輯回歸)→模型評(píng)估與結(jié)果解讀→可視化報(bào)告生成,形成完整的商業(yè)數(shù)據(jù)分析解決方案
如果您想學(xué)習(xí)本課程,請(qǐng)
預(yù)約報(bào)名
如果沒找到合適的課程或有特殊培訓(xùn)需求,請(qǐng)
訂制培訓(xùn)
除培訓(xùn)外,同時(shí)提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請(qǐng)發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表點(diǎn)擊在線申請(qǐng)
服務(wù)特點(diǎn):
海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項(xiàng)目專家,針對(duì)實(shí)際需求,顧問式咨詢,互動(dòng)式授課,案例教學(xué),小班授課,實(shí)際項(xiàng)目演示,快捷高效,省時(shí)省力省錢。
專家力量:
中國(guó)科學(xué)院軟件研究所,計(jì)算研究所高級(jí)研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級(jí)工程師,項(xiàng)目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富
多年實(shí)際項(xiàng)目經(jīng)歷,大型項(xiàng)目實(shí)戰(zhàn)案例,熱情,樂于技術(shù)分享
針對(duì)客戶實(shí)際需求,案例教學(xué),互動(dòng)式溝通,學(xué)有所獲