課程描述INTRODUCTION
Python數(shù)據(jù)分析
日程安排SCHEDULE
課程大綱Syllabus
Python數(shù)據(jù)分析
【課程目標】
本課程為基礎課程,主要講解如何利用Python進行數(shù)據(jù)分析,以及數(shù)據(jù)可視化。假定學員已經(jīng)基本掌握Python語言的使用。
通過本課程的學習,達到如下目的:
1、掌握數(shù)據(jù)分析的基本步驟和過程(數(shù)據(jù)分析六步曲)
2、掌握搭建數(shù)據(jù)分析框架的基本思想(數(shù)據(jù)分析框架)
3、熟悉Pandas常用數(shù)據(jù)結構,掌握用Python訪問、操作數(shù)據(jù)集
4、掌握Pandas常用的統(tǒng)計功能(函數(shù)和方法)
5、理解統(tǒng)計分析原理,掌握統(tǒng)計分析常用的分析方法
6、熟練掌握matplotlib模塊,熟練畫圖函數(shù)
7、學會解讀圖形,形成業(yè)務結論和業(yè)務策略。
【授課對象】
業(yè)務支持部、IT系統(tǒng)部、系統(tǒng)開發(fā)部、網(wǎng)絡運維部等相關技術人員。
【課程大綱】
一、數(shù)據(jù)分析基礎
目的:掌握數(shù)據(jù)分析基本步驟和過程,學會如何構造數(shù)據(jù)分析框架
1、數(shù)據(jù)分析 VS 數(shù)據(jù)挖掘
2、數(shù)據(jù)分析的六步曲
-步驟1:明確目的--理清思路
-步驟2:數(shù)據(jù)收集—理清思路
-步驟3:數(shù)據(jù)預處理—尋找答案
-步驟4:數(shù)據(jù)分析--尋找答案
-步驟5:數(shù)據(jù)展示--觀點表達
-步驟6:報表撰寫--觀點表達
3、搭建精準營銷分析框架
演練:如何用大數(shù)據(jù)來支撐手機精準營銷項目
二、數(shù)據(jù)操作基礎
1、簡化的Python操作過程
2、常用擴展包
-Numpy數(shù)組處理支持
-Pandas數(shù)據(jù)分析和探索工具
-Matplotlib可視化工具庫
3、數(shù)據(jù)集讀寫
-讀取文件(CSV文件、Excel文件)
-數(shù)據(jù)集保存(CSV、Excel)
4、數(shù)據(jù)集結構
-數(shù)據(jù)集基本屬性
-Index:位置索引、標簽索引
-Series:一維結構
-DataFrame:二維結構
5、數(shù)據(jù)集基本操作
-數(shù)據(jù)訪問:行訪問/列訪問/值訪問
-字段類型
-類型檢查
-類型轉換
-定義有序類別變量
-排序
-按值排序
-按索引排序
-數(shù)據(jù)篩選
-數(shù)據(jù)修改
-數(shù)據(jù)刪除
三、統(tǒng)計分析方法篇
1、統(tǒng)計分析基礎
-統(tǒng)計分析的關鍵要素
-統(tǒng)計分析三個步驟
2、六種統(tǒng)計操作
-描述統(tǒng)計describe
-分類計數(shù)value_counts
-分段計數(shù)/分箱計數(shù)value_counts(bins)
-分類匯總(groupby, count/sum/mean/…)
-透視表(多維統(tǒng)計分析)pivot_table
-按日期匯總resample/to_period
案例實戰(zhàn):掌握常用的Python統(tǒng)計函數(shù)/方法
3、五種統(tǒng)計分析方法
-對比分析法(不同用戶的消費水平差異)
-結構分析法(用戶的學歷結構、收入結構分析、動態(tài)結構分析)
-分布分析法(用戶的年齡分布、用戶消費層次)
-交叉分析法(產(chǎn)品偏好分析)
-趨勢分析法(銷售淡旺季節(jié)、用戶活躍時間)
案例實戰(zhàn):掌握常用的統(tǒng)計分析方法
四、數(shù)據(jù)可視化
目的:掌握作圖擴展庫,實現(xiàn)數(shù)據(jù)可視化
1、中文顯示的問題解決
2、了解圖形元素及其函數(shù)
-標題、坐標軸、刻度
-數(shù)據(jù)標簽、文本、注釋
-圖例、網(wǎng)格線、邊框
3、簡單圖形的畫法
-柱狀圖(簡單/復式/堆積/堆積百分比柱狀圖)
-直方圖(分布分析,查看分布特征)
-箱圖(判斷離群值)
-餅圖(結構分析)
-折線圖(趨勢分析)
4、復雜圖形的畫法
-多子圖
-多坐標系作圖
-多區(qū)域作圖
5、圖形保存
五、數(shù)據(jù)預處理
1、數(shù)據(jù)預處理四大任務
-數(shù)據(jù)清洗
-數(shù)據(jù)集成
-樣本處理
-變量處理
2、數(shù)據(jù)集成
-數(shù)據(jù)追回
-變量合并
-拼接
演練:樣本追加與變量合并
3、數(shù)據(jù)清洗
-四大異常數(shù)據(jù)
-重復值檢查與處理
-無效值檢查與處理
-離群值檢查與處理
-缺失值檢查與處理
演練:異常值查找、刪除、填充
4、樣本處理
5、變量處理
六、實戰(zhàn)篇(上述知識點都融入下面分析實戰(zhàn)中)
1、零售商用戶消費行為分析
-用戶行為分析框架:5W2H
-用戶的典型特征
-用戶的消費能力
-用戶的消費水平
2、運營商用戶購買行為分析
-用戶維度
-用戶地域分布
-用戶學歷結構
-用戶消費能力/消費層次
-用戶流量分布/層次
-用戶流失分析
-產(chǎn)品維度
-套餐銷量分析
-套餐貢獻分析
-服務滿意度分析
-套餐偏好分析
-時間維度
-產(chǎn)品淡旺季分析
-用戶活躍度分析
-重購周期分析
-金額維度
-收入結構(用戶、產(chǎn)品、區(qū)域)
-價格偏好分析
-成本/利潤分析
3、金融風險數(shù)據(jù)分析
-用戶維度
-違約用戶的典型特征
-違約用戶的消費水平
-違約的影響因素分析
-違約與學歷/崗位的關系
-違約與行業(yè)/職業(yè)的關系
注:會根據(jù)學員所在行業(yè)選擇合適的實戰(zhàn)案例。
結束:課程總結與問題答疑。
Python數(shù)據(jù)分析
轉載:http://www.jkyingpanluxiangji.com/gkk_detail/265678.html
已開課時間Have start time
- 傅一航