渴望技術轉型
轉換行業的IT小白
增長經驗
搭建完善的項目
接觸廣泛技術面
渴望了解新技術、新行業
有興趣了解數據分析
學習前沿技術
突破職業瓶頸
掌握核心技能
Linux、Hadoop
Java、Hive
Flume、Kafka
等基礎框架
全面了解廣告行業運營流程
充分熟悉廣告行業指標體系
熟練掌握異常流量清洗過程
熟悉掌握數據倉庫技術框架
充分掌握FineBI數據分析工具
充分調研各大廠數倉建模體系,以阿里巴巴的數據倉庫建模理論為最終藍本,搭建實用且貼近生產實際的數倉建模體系;
應用建模理論,提出可實踐性強的數倉搭建理論過程,數據調研→明確數據域→構建業務總線矩陣→維度模型設計→明確統計指標→匯總模型設計→分層構建數倉;
多方參考大廠數倉分層體系,合理數據分層,降低數據耦合度,提高數據分析效率,降低數據計算成本;
實戰式數據模擬策略,真實廣告流量監測業務場景,模擬生成全面的原始數據,針對真實數據進行分析統計;
采用Flume采集廣告監測日志,適配組件全面調研,給出詳細貼近實戰的配置文件,自定義采集組件,解決時間戳零點漂移,優化小文件存儲帶來問題,提供更多實戰經驗;
采用流行數據采集框架DataX采集業務數據,提供詳細配置文件及腳本解讀,掌握更多腳本編寫技巧;
真實數據ETL實操,結合Hive自定義函數,涵蓋對原始廣告日志數據的清洗、轉換以及遺產廣告流量的識別;
使用高性能OLAP數據庫ClickHouse實現低延時即席查詢;
使用FineBI工具實現自助報表分析,具備鉆取、聯動、篩選等交互功能。
安裝部署受各大廠歡迎的DolphinScheduler工作流調度系統,實現數據倉庫搭建全流程定時自動化調度以及故障自動郵件告警;