曙海教學優勢
本課程以項目實現為導向,面向企事業項目實際需要,秉承二十一年積累的教學品質,老師將會與您分享設計的全流程以及工具的綜合使用經驗、技巧。線上/線下/上門皆可,課程可定制,熱線:4008699035。
曙海培訓的課程培養了大批受企業歡迎的工程師。曙海培訓的課程在業內有著響亮的知名度。大批企業和曙海
建立了良好的合作關系,合作企業30萬+。
?
各類 IT/軟件企業和研發機構的軟件架構師、軟件設計師、程序員。對于懷有設計疑問和問題,需要梳理解答的團隊和個人,效果最佳。
了解Java語言、Linux系統;
?
主題 | 內容 |
大數據架構概述 |
1.1 大數據層級架構及各層軟件設計要求,包括數據收集、存儲、計算框、應用 |
數據收集系統Flume與Sqoop |
2. 使用flume和sqoop兩個系統將外部流式數據(比如網站日志,用戶行為數據等)、關系型數據庫(比如MySQL、Oracle等)中的數據導入Hadoop中進行分析和挖掘 |
大數據存儲系統HDFS與HBase |
3.1與HDFS 1.0進行對比介紹2.0原理、特性與基本架構(快照、緩存、異構存儲)。 |
集群資源管理與調度系統 |
4. 介紹 YARN應用場景、基本架構與資源調度 |
Zookeeper部署及典型應用 |
5. 介紹Zookeeper是什么,基本原理及在應用 |
大數據計算平臺 |
介紹主流的三大類大數據計算框架,分別是批處理、交互式計算和流式計算框架,并選取當下主流的開源實現進行介紹。 |
數據挖掘與機器學習庫 |
7. Mahout與MLlib兩個主流的分布式數據挖掘與機器學習庫的實現以及應用案例。 |