大數據內存計算技術介紹(深入理解Spark Core實現原理) |
1、Spark應用現狀
2、Spark應用優勢
3、Spark應用案例
4、Scala介紹
5、Mesos介紹
6、Spark介紹
7、Spark基本概念介紹
8、Spark架構剖析
9、Spark RDD計算模型解析
10、Spark RDD操作剖析
11、DAG有向無環圖介紹
12、Spark編程
a)Java編寫Spark程序
b)Scala編寫Spark程序
c)Python編寫Spark程序
d)R編寫Spark程序
13、Spark可訪問的數據源介紹
a)文件系統
b)HDFS
c)HBase
d)Hive
e)Cassandra
f)Tachyon
14、Spark編程技巧分享
15、Spark開發分析
16、Spark的執行機制解析
17、Spark運行原理剖析
18、Spark的調試與任務分配
19、Spark的性能調優
20、Spark與MapReduce對比分析
21、Spark生態體系剖析
22、Spark監控管理
23、Spark的容錯機制剖析
24、Spark集群部署
25、Spark集群部署經驗分享
26、Spark大規模集群運維經驗分享
27、 Spark實戰案例:Spark與HBase整合分析數據 |
大數據內存計算技術實戰分享(深入理解Spark Core使用實戰操作) |
1、Spark Shell
2、PySpark
3、構建與運行Spark應用
4、Spark的性能調優
5、Spark實戰案例:預測國際經濟危機實戰案例開發 |
Shark數據倉庫工具實戰(深入理解Shark實現原理及開發實戰) |
1、Spark Shark概述
2、Hive與Shark
3、Spark Shark原理剖析
4、Spark Shark框架介紹
5、Spark Shark編程
6、Spark Shark分布式文件HDFS讀寫
7、Spark Shark APIs全面介紹
8、Shark UDFs
9、Shark UADFs
10、Shark HiveQL
11、Shark基于Spark的綜合應用
12、Spark Shark實戰案例:運營商話務數據分析案例剖析 |
Spark SQL技術實戰(深入理解Spark SQL實現原理及開發實戰) |
1、Spark SQL概述
2、Spark SQL原理剖析
3、Spark SQL架構介紹
4、SparkSQL CLI
5、Tree和Rule
6、sqlContext和hiveContext的運行過程
7、Load/Save函數
8、Parquet文件讀寫
9、Spark SQL連接JDBC
10、Spark SQL連接ODBC
11、Spark SQL分布式文件HDFS讀寫
12、JSON數據集
13、Hive表
14、數據類型
15、Spark SQL與 Cassandra集成
16、Spark SQL APIs全面介紹
17、Spark SQL and DataFrames
18、Spark SQL and DataSets
19、Spark SQL HiveQL
20、Spark SQL編程
21、運行Spark SQL程序
22、在內存中緩存數據
23、Spark SQL UDFs
24、Spark SQL UADFs
25、Spark SQL SerDes
26、Spark SQL BI Tools
27、Spark SQL實戰案例:數據分析案例剖析
?
|
Spark Streaming流計算技術實戰(深入理解Spark Streaming實現原理及開發實戰) |
1、Spark Streaming概述
2、Spark Streaming原理剖析
3、Spark Streaming流數據處理框架介紹
4、Spark Streaming編程剖析
5、初始化StreamingContext
6、Discretized Streams (DStreams)
7、輸入DStreams與Receivers
8、基于DStreams的Transformations
9、基于DStreams的輸出操作
10、Accumulators和Broadcast Variables
11、DataFrame和SQL操作
12、MLlib操作
13、Caching與Persistence
14、Checkpointing
15、運行Spark Streaming程序
16、性能調優:減少批處理時間
17、性能調優:設置正確的批處理間隔時間
18、內存調優
19、容錯元語
實戰案例:Spark Streaming與Kafka整合實現數據實時數據分析處理設計與分析 |
Spark GraphX圖計算框架實戰(深入理解Spark GraphX實現原理及開發實戰) |
1、Spark GraphX概述
2、Spark GraphX圖計算理論剖析
3、Spark GraphX框架剖析
4、Spark GraphX的圖屬性
5、Spark GraphX的圖操作
6、操作列表
7、屬性操作
8、結構操作
9、連接操作
10、近鄰集合操作
11、Caching and Uncaching
12、Pregel APIs
13、Graph Builders
14、Vertex與Edge RDDs
15、Optimized Representation
16、Graph Algorithms
17、PageRank
18、Connected Components
19、Triangle Counting
20、Spark GraphX編程剖析
21、Spark GraphX APIs介紹
22、實戰案例:Spark GraphX實現社交網絡關系分析 |
spark MLlib機器學習庫實戰(深入理解Spark MLlib實現原理及開發實戰) |
- Spark MLlib概述
- Spark MLlib算法庫介紹
- Spark MLlib架構剖析
- Spark MLlib機器學習算法剖析
- 數據類型
- 基本統計算法
- 分類與回歸
- 協同過濾
- 聚類
- 降維
- 特征提取與轉換
- 頻繁模式挖掘
- 評價指標
- Spark MLlib編程
- Spark MLlib APIs介紹
- Spark MLlib機器學習算法應用實戰
- Spark MLlib實戰案例:數據聚類分析案例剖析
|
Spark集成R語言SparkR(R語言與大數據內存計算框架Spark集成) |
- R語言概述
- R語言語法介紹
- R語言繪圖函數
- R語言高級繪圖函數
- SparkR集群部署
- SparkR原理剖析
- SparkR框架介紹
- SparkR DataFrames
- DataFrame的操作
- 選擇行和列
- Grouping和Aggregation
- SparkContext和SQLContext
- 在SparkR中運行SQL查詢
- SparkR編程
- 在YARN上SparkR運行
- SparkR機器學習
- SparkR實戰案例:運營商話務數據繪圖
|
大數據推薦實戰(深入理解大數據推薦技術以及推薦技術編程) |
1、個性化推薦的理論依據
2、個性化推薦的價值
3、個性化推薦能達到的目的
4、個性化推薦的原則
5、個性化推薦技術發展史
6、個性化推薦的相關技術
7、基于用戶的常用推薦算法
8、基于用戶的協同過濾推薦 |