曙海教學優勢
本課程以項目實現為導向,面向企事業項目實際需要,秉承二十一年積累的教學品質,老師將會與您分享設計的全流程以及工具的綜合使用經驗、技巧。線上/線下/上門皆可,課程可定制,熱線:4008699035。
曙海培訓的課程培養了大批受企業歡迎的工程師。曙海培訓的課程在業內有著響亮的知名度。大批企業和曙海
建立了良好的合作關系,合作企業30萬+。
?Spark培訓——提高云計算大數據速度
培訓內容:
第一部分:
1、Spark的架構設計
1.1?Spark的速度為什么如此的快?
1.2?Spark的架構設計剖析
1.3?RDD計算流程解析
1.4?Spark的出色容錯機制
2、實戰使用三種語言開發Spark
2.1?Scala簡介、為什么Spark會使用Scala作為開發語言?
2.2?在Spark中使用Scala
2.3?使用Java開發Spark程序
2.4?使用Python開發Spark程序
2.5?深入使用Spark?Shell
3、快速掌握Scala
3.1?Scala變量聲明、操作符、函數的使用實戰
3.2?apply方法
3.3?Scal的控制結構和函數
3.4?Scala數組的操作、Map的操作
3.5?Scala中的類
3.6?Scala中對象的使用;
3.7?Scala中的繼承
3.8?Scala中的特質
3.9?Scala中集合操作
4、Spark集群的安裝和設置
4.1?在一臺機器上運行Spark
4.2?在EC2上運行Spark
4.3?在Mesos上部署Spark
4.4?在YARN上部署Spark
4.5?通過SSH在眾多機器上部署Spark
4.6?Spark集群設置
5、編寫Spark程序
5.1?程序數據的來源:File、HDFS、HBase、S3等
5.2?IDE環境構建
5.3?Maven
5.4?sbt.
5.5?編寫并部署Spark程序的實例
第二部分
6、SparkContext解析和數據加載以及存儲
6.1?源碼剖析SparkContext
6.2?Scala、Java、Python使用SparkContext
6.4?加載數據成為RDD
6.5?把數據物化
7、深入實戰RDD
7.1?DAG
7.2?深入實戰各種Scala?RDD?Function?
7.3?Spark?Java?RDD?Function
7.4?RDD的優化問題
8、Shark的原理和使用
8.1?Shark與Hive
8.2?安裝和配置Shark
8.3?使用Shark處理數據
8.4?在Spark程序中使用Shark?Queries
8.5?SharkServer
8.6?思考Shark架構
9、Spark程序的測試
9.1?編寫可測試的Spark程序
9.2?Spark測試框架解析
9.3?Spark測試代碼實戰
10、Spark的優化
10.1?Logs
10.2?并發
10.3?內存
10.4?垃圾回收
10.5?序列化
10.6?安全
第三部分
11、Spark的機器學習
11.1?LinearRegression
11.2?K-Means
11.3?Collaborative?Filtering
12、Spark的圖計算GraphX
12.1?Table?Operators
12.2?Graph?Operators
12.3?GraphX
13、Spark?SQL
13.1?Parquet支持
13.2?DSL
13.3?SQL?on?RDD
14、Spark實時流處理
14.1?DStream
14.2?transformation
14.3?checkpoint
14.4?性能優化