曙海教學優勢
本課程以項目實現為導向,面向企事業項目實際需要,秉承二十一年積累的教學品質,老師將會與您分享設計的全流程以及工具的綜合使用經驗、技巧。線上/線下/上門皆可,課程可定制,熱線:4008699035。
曙海培訓的課程培養了大批受企業歡迎的工程師。曙海培訓的課程在業內有著響亮的知名度。大批企業和曙海
建立了良好的合作關系,合作企業30萬+。
?培訓對象:需要使用Hadoop來進行數據分析的數據分析員,商業分析
教學大綱:
Hadoop基礎
Pig基礎
使用Pig進行簡單數據分析
使用Pig處理復雜數據
使用Pig分析處理多數據集
Pig排錯和優化
Hive與Impala基礎
使用Hive與Impala進行數據分析
數據管理
數據存儲與性能
使用Hive與Impala進行數據分析
Impala如何執行查詢/擴展及改善性能
使用Hive分析處理文本數據
Hive優化
擴展Hive
如何選取數據分析工具
?
課程大綱:
Hadoop?Fundamentals?
?
??????Hadoop?Overview?
?
??????Data?Storage:?HDFS?
?
??????Distributed?Data?Processing:?YARN,?MapReduce,?and?Spark?
?
??????Data?Processing?and?Analysis:?Pig,?Hive,?and?Impala?
?
??????Data?Integration:?Sqoop?
?
??????Other?Hadoop?Data?Tools?
?
??????Exercise?Scenarios?Explanation?
?
?
?
Introduction?to?Pig?
?
??????What?Is?Pig??
?
??????Pig’s?Features?
?
??????Pig?Use?Cases?
?
??????Interacting?with?Pig?
?
Basic?Data?Analysis?with?Pig?
?
??????Pig?Latin?Syntax?
?
??????Loading?Data?
?
??????Simple?Data?Types?
?
??????Field?Definitions?
?
??????Data?Output?
?
??????Viewing?the?Schema?
?
??????Filtering?and?Sorting?Data?
?
??????Commonly-Used?Functions?
?
Processing?Complex?Data?with?Pig?
?
??????S?torage?Formats?
?
??????Complex/Nested?Data?Types?
?
??????G?rouping?
?
??????Built-In?Functions?for?Complex?Data?
?
??????Iterating?Grouped?Data?
?
Multi-Dataset?Operations?with?Pig?
?
??????Techniques?for?Combining?Data?Sets?
?
??????Joining?Data?Sets?in?Pig?
?
??????Set?Operations?
?
??????Splitting?Data?Sets?
?
Pig?Troubleshooting?and?Optimization?
?
??????Troubleshooting?Pig?
?
??????Logging?
?
??????Using?Hadoop’s?Web?UI?
?
??????Data?Sampling?and?Debugging?
?
??????Performance?Overview?