學Python大數據有“錢”途

進一步了解Python大數據師就業趨勢

學Python大數據,可以勝任更多“高鑫”崗位

了解更多高薪職位

為什么在華信智原可以成為Python大數據高手?

01領先行業的華信智原Python大數據專業體系

教學主題 教學內容
第一章:
Scikit-Learn
機器學習

1.1什么是機器學習; 1.2機器學習的類型; 1.3機器學習的流程; 1.4機器學習中的基本問題分類; 1.5機器學習中的數據預處理; 1.6一元線性回歸; 1.7模型的過擬合與欠擬合; 1.8嶺回歸; 1.9多項式回歸; 1.10決策樹原理、構建過程及API; 1.11自適應增強算法和隨機森林算法原理及API; 1.12邏輯分類算法及API; 1.13樸素貝葉斯算法原理及API; 1.14評估分類效果-交叉驗證; 1.15評估分類效果-混淆矩陣; 1.16評估分類效果-分類報告; 1.17超參數優選-驗證曲線; 1.18超參數優選-學習曲線; 1.19超參數優選-網格搜索; 1.20支持向量機算法原理及API; 1.21K-Means算法原理及API; 1.22DBSCAN算法原理及API; 1.23均值漂移算法原理及API; 1.24凝聚層次算法原理及API;

第二章:
深度學習

2.1深度學習框架Tensorflow介紹; 2.2Tensorflow的特點; 2.3Tensorflow安裝; 2.4Tensorflow的結構; 2.5Tensorflow數據流; 2.6圖; 2.7OP; 2.8會話; 2.9張量介紹; 2.10張量操作; 2.11Tensorflow變量; 2.12可視化Tensorboard; 2.13Tensorflow實現線性回歸; 2.14Tensorflow隊列; 2.15Tensorflow線程; 2.16Tensorflow文件讀取流程; 2.17Tensorflow文件讀取API; 2.18Tensorflow讀取CSV文件; 2.19Tensorflow讀取圖片; 2.20Tensorflow讀取二進制文件; 2.21神經網絡基礎; 2.22神經網絡的發展; 2.23神經網絡的特點; 2.24神經網絡的組成; 2.25淺層人工神經網絡模型; 2.26卷積神經網絡; 2.27Tensorflow分布式

第三章:
階段項目

3.1基于用戶相似度的推薦引擎; 3.2手寫體數字識別; 3.3汽車質量評估;

第四章:
綜合項目實戰

"4.1爬取豆瓣電影數據,利用Python數據分析工具分析電影評分、用戶數據并可視化,基于推薦引擎進行電影推薦"; "4.2爬取房價數據,進行數據清洗、數據預處理、數據分析以及數據可視化,利用機器學習建模,進行房價預測"

教學目標

可掌握的核心能力:1)掌握機器學習常用回歸、分類以及聚類算法原理及API使用; 2)掌握機器學習算法超參數優選方法,并訓練模型; 3)掌握深度學習框架Tensorflow的原理及常用API的使用; 4)掌握神經網絡的特點及原理; 5)在數據分析師的基礎之上進一步增加核心競爭力; 6)邁進數據挖掘和人工智能大門,掌握必備的入門條件

教學主題 教學內容
第一章:
Excel數據分析

1.1Excel基礎操作; 1.2Excel公式介紹; 1.3Excel邏輯函數; 1.4Excel統計函數; 1.5Excel查找函數; 1.6Excel引用函數; 1.7Excel數學函數; 1.8Excel日期時間函數; 1.9Excel文本函數; 1.10Excel信息函數; 1.11Excel數組; 1.12Excel圖表; 1.13Excel數據透視表; 1.14Excel訂單表; 1.15Excel游戲數據; 1.16Excel日報分析; 1.17Excel留存分析;

第二章:
數據分析工具
Numpy

2.1Numpy介紹; 2.2Numpy的特點; 2.3Numpy的核心多維數組; 2.4數組的索引; 2.5數組的切片切片; 2.6數組的屬性; 2.7Numpy基本數據類型; 2.8Numpy自定義數據類型; 2.9改變數組的維度; 2.10常用統計學指標介紹; 2.11讀取文件; 2.13移動均線; 2.14線性擬合; 2.15多項式擬合; 2.16矩陣運算; 2.17Numpy數組的多種運算; 2.18矢量操作

第三章:
數據分析工具
Pandas

3.1Pandas介紹; 3.2Pandas核心數據結構Series; 3.3Pandas核心數據結構DataFrame; 3.4Pandas時間序列; 3.5查看DataFrame數據; 3.6修改DataFrame數據; 3.7增加DataFrame數據; 3.8刪除DataFrame數據; 3.9描述分析數據; 3.10Pandas讀取CSV文件; 3.11Pandas讀取Excel文件; 3.12Pandas讀取其他格式文件; 3.13Pandas分組聚合; 3.14Pandas透視表; 3.15Pandas交叉表; 3.16Pandas合并數據; 3.17Pandas清洗數據; 3.18Pandas標準化數據; 3.19Pandas轉換數據; 3.20Jupyter的使用;

第四章:
數據可視化工具
matplotlib

4.1繪圖入門; 4.2設置線條樣式; 4.3設置坐標刻度; 4.4設置坐標軸顯示以及位置; 4.5設置圖例; 4.6創建figure; 4.7設置主次刻度; 4.8繪制網格; 4.9為圖面添加注釋; 4.10設置子圖; 4.11條形圖; 4.12餅圖; 4.13填充顏色; 4.14散點圖; 4.15等高線圖; 4.16直方圖;

第五章:
數據分析工具
Tableau

5.1Tableau介紹; 5.2Tableau新手上路; 5.3數據源基本操作; 5.4數據連接方式; 5.5多表數據連接; 5.6異構數據混合; 5.7提取數據; 5.8工作表-常規操作; 5.9工作表-編輯元數據; 5.10工作表-字段操作; 5.11工作表-演示集成員對總額的貢獻程度; 5.12Tableau函數與計算; 5.13Tableau排序與篩選器; 5.14Tableau參數; 5.15Tableau圖表分析; 5.16Tableau地圖繪制與圖像; 5.17Tableau高級圖表類型;

第六章:
階段項目

6.1泰坦尼克號生存分析; 6.2租房信息分析; 6.3金融量化分析

教學目標

可掌握的核心能力:1)熟練掌握大數據常用工具; 2)熟練掌握常用數據可視化工具; 3)掌握數據清洗、數據預處理技術; 4)可基于業務對各種指標進行分析并將結果可視化; 5)成為一個合格的數據分析師

教學主題 教學內容
第一章:
網絡爬蟲基礎

1.1爬蟲課程的介紹和概念; 1.2爬蟲的流程; 1.3搜索引擎的工作原理和局限以及robots協議; 1.4http和http的概念; 1.5瀏覽器發送請求的流程; 1.6url的形式和http的內容和請求頭以及get請求和post請求; 1.7requests模塊發送請求和獲取網頁的字符串; 1.8requests保存圖片; 1.9requests模塊發送帶headers的請求和帶參數的請求; 1.10requests模塊發送post請求; 1.11requests模塊使用代理; 1.12requests模擬登陸的三種方式; 1.13尋找post的地址; 1.14尋找js和分析js; 1.15數據的分類; 1.16json模塊的學習; 1.17正則和原始字符串; 1.18xml的了解; 1.19xpath的語法; 1.20lxml模塊; 1.21selenium的入門使用; 1.22瀏覽器驅動的安裝; 1.23模擬登陸; 1.24網絡水軍的操作; 1.25打碼平臺的使用; 1.26驗證碼識別總結; 1.27元素定位的方法和iframe的切換和selenium使用的注意點;

第二章:
Scrapy框架

2.1scrapy的介紹; 2.2scrapy的流程; 2.3sacrapy的入門使用; 2.4pipeline的介紹; 2.5logging模塊的使用; 2.6構造請求; 2.7item的介紹和使用; 2.8debug信息的認識; 2.9scrapy shell的使用; 2.10scrapy ettings和管道的深入; 2.11crawlspider爬蟲案例; 2.12crawlspdier爬蟲介紹; 2.13下載中間件的學習; 2.14攜帶cookie登錄; 2.15發送post請求登錄;

第三章:
MySQL數據庫

3.1什么是數據庫; 3.2常見數據庫軟件; 3.3MySQL數據庫安裝和卸載; 3.4MySQL數據庫登錄; 3.5SQL的概念; 3.6SQL的語法和分類; 3.7DDL操作數據庫; 3.8DDL操作數據表; 3.9MySQL常用數據類型; 3.10DML操作數據表; 3.11基本查詢; 3.12條件查詢; 3.13聚合函數; 3.14分組查詢; 3.15非空約束; 3.16唯一約束; 3.17主鍵約束; 3.18外鍵約束; 3.19多表關系(一對一); 3.20多表關系(一對多); 3.21多表關系(多對多); 3.22數據庫設計三范式; 3.23數據庫的備份和還原; 3.24內連接查詢; 3.25外連接查詢; 3.26子查詢; 3.27DCL; 3.28MySQL事務操作; 3.29MySQL存儲引擎; 3.30MySQL調優; 3.31MySQL與Python交互; 3.32模擬用戶登錄操作案例

第四章:
階段項目

4.1爬取小說; 4.2Scrapy框架爬取LOL皮膚

教學目標

可掌握的核心能力:1)認識爬蟲; 2)了解爬蟲原理; 3)可從各種網頁、媒體文件爬取數據; 4) 應對各種反爬; 5)能拿到自己想要的各種數據; 6)掌握數據庫存儲、查詢技術

教學主題 教學內容
第一章:
Python基礎

1.1Python介紹; 1.2Python數字; 1.3運算符與表達式; 1.4變量及其本質; 1.5垃圾回收機制; 1.6if語句; 1.7條件表達式; 1.8字符串及其常用操作; 1.9Python的編碼; 1.10索引和切片; 1.11while語句; 1.12for語句; 1.13列表; 1.14元組; 1.15字典及其常用操作; 1.16字典的實現原理; 1.17集合; 1.18函數; 1.19Python作用域

第二章:
Python高級

2.1函數式編程; 2.2遞歸; 2.3裝飾器; 2.4模塊 2.5常用模塊API介紹; 2.6包; 2.7文件讀寫; 2.8異常處理;

第三章:
Python面向對象

3.1類; 3.2對象; 3.3構造函數; 3.4實例方法; 3.5實例變量; 3.6類方法; 3.7類變量; 3.9靜態方法; 3.10繼承; 3.11封裝; 3.12多態; 3.13函數重寫; 3.14迭代器原理及實現;

第四章:
Linux基本操作

4.1Linux的安裝; 4.2操作系統介紹,常用操作系統; 4.3Linu的發行版本; 4.4Linux用戶命令; 4.5Linux的路徑; 4.6Linu目錄操作命令; 4.7Linux文件操作命令; 4.8vi文本編輯器; 4.9Linux文件查看與查找命令; 4.10Linux文件權限管理命令;

第五章:
代碼協同
管理工具Git

5.1Git介紹; 5.2Git的安裝; 5.3Git的配置; 5.4Git倉庫及命令; 5.5版本控制命令; 5.6標簽管理; 5.7Git分支操作; 5.8Git遠程倉庫;

第六章:
階段項目

6.1 飛機大戰; 6.2 2048游戲; 6.3 學生信息管理系統;

教學目標

可掌握的核心能力:1)快速融入企業的能力; 2)具備基本的Python開發能力; 3)全面了解IT行業情況; 4) 可基于Python進行簡單項目的研發

咨詢完整版課程大綱

024大專業優勢,讓你一技多能,融會貫通

了解更多專業優勢

03行業精英教學團隊,讓你所學即所用

大咖導師等你來撩

04不一樣的行業實力,原來你是這樣的華信智原

了解更多品牌實力

05產學結合的項目化教學

金融量化分析

項目簡介

基于Python數據分析工具Numpy、Pandas對多支股票進行各項指標分析,包括股票k線圖、移動平均線、布林帶、股票波動、股票相關性分析、股票趨勢性分析、股票交易風險評估。利用Sciki-Learn機器學習建立模型,進行股票價格預測、股票交易策略模擬、股票交易時機分析。利用數據可視化工具matplotlib、seabron對結果予以圖形化展示

所用技術

Numpy、Pandas、機器學習、matplotlib、seabron

基于Sciki-Learn機器學習框架的房價影響因素深度揭秘以及房價預測

項目簡介

使用Scrapy框架爬取各大網站房屋數據,利用Python數據分析工具分析各城市房屋均價、房屋總價、房價走勢、房源數量、房屋面積分布、樓層、裝修等。利用機器學習建立模型,對房價影響因素進行深度揭秘、并對房屋價格進行預測。

所用技術

Python爬蟲、Numpy、Pandas、機器學習、可視化工具matplotlib、seabron、pyecharts

基于用戶畫像的商品推薦系統

項目簡介

收集用戶基本信息、用戶交易信息,構建用戶畫像。構建模型并進行訓練,基于K-Means算法對用戶進行聚類分析,用戶相似度分析,基于用戶相似度進行商品推薦,對不同用戶實現精準營銷。

分布式爬蟲項目

項目簡介

大型門戶網站和大型婚戀網站積累了海量信息,提取有用的價值,應用于數據挖掘、海量數據分析、市場分析(包括熱點資訊、關鍵詞點擊、輿情分析、全國婚戀市場、個人信息分析等情況),掌握爬蟲技術顯得尤為重要。

項目特色

1、Python 多線程爬蟲及其機制
2、使用Python、requests等網絡模塊
3、使用Python lxml、BeautifulSoup、re、json模塊進行數據提取
4、XPath語法規則和各CSS Selector的使用
5、使用Selenium+Chrome實施動態HTML抓取
6、掌握Scrapy框架,以及編寫各類中間件
7、掌握scrapy-redis分布式框架,了解各組件工作機制

華信商品推薦系統

項目簡介

使用Lambda架構整合實時計算和離線計算,借助分布式環境提升計算能力;使用Flume收集用戶的點擊、瀏覽、收藏等行為,建立用戶畫像和文章畫像,并存儲于HDFS集群;通過離線Spark SQL計算建立HIVE特征中心,存儲到HBase集群;通過ALS、LR、Wide&Deep等機器學習與深度學習、推薦算法進行智能推薦,達到千人千面的用戶推薦效果。

項目特色

1、ABTest實驗平臺
2、用戶反饋收集
3、實時計算平臺
4、離線計算分析平臺

咨詢獲取完整項目信息

06合作企業:合作領域廣泛,與眾多知名企業/機構達成深度合作

更多品牌榮譽

直播試聽 免費預約

立即預約

*溫馨提示:華信智原尊重并保護您的隱私*

江苏11选5投注