曙海教學優勢
本課程以項目實現為導向,面向企事業項目實際需要,秉承二十一年積累的教學品質,老師將會與您分享設計的全流程以及工具的綜合使用經驗、技巧。線上/線下/上門皆可,課程可定制,熱線:4008699035。
曙海培訓的課程培養了大批受企業歡迎的工程師。曙海培訓的課程在業內有著響亮的知名度。大批企業和曙海
建立了良好的合作關系,合作企業30萬+。
Spark及其在機器學習中的應用
?
課程目標:
?
通過該課程的學習,學員應能夠熟練掌握 Spark 并能利用 Spark 解決機器學習的相關問題;?具體的,學員將了解: 1.Spark在Ubuntu虛擬機上的分布式集群環境搭建; 2.基于Python的Spark編程基礎; 3.Spark MLlib的使用(.py文件)包括回歸預測、聚類、關聯規則、神經網絡預測; 4.Spark在阿里云的使用(.py文件) ; 5.Spark在AWS亞馬遜云的使用。
?
課程大綱:
?
時間 |
主題 |
內容 |
|
第一天 ? |
上午 |
? ? Spark簡介及環境搭建 |
? l?Spark 簡介 l?Spark 環境搭建(Ubuntu , 分布式集群).使用的是 Hadoop 2.7.3 和 Spark 2.0.1 版本 ? |
下午 |
? ? ? 基于Python的Spark 編程 ? |
? l?基于 Python 的 Spark 常用函數及其使用方法。map/reduce/groupByKey/reduceByKey/filter/ flatMap/saveAsTextFile/join 等 l?基于 Python 的 Spark 編程樣例。通過基本的統計分析和數據處理樣例說明該怎樣進行基于 Python 的 Spark 編程 ? |
|
? ? 第二天 ? |
上午 |
? ? Spark 和機器學習 ? |
? l?MLLib 全方位介紹 。MLLib 包含的各種算法函數的介紹。個別算法根據情況可以講解源代碼 l?MLLib 編程樣例 (回歸預測 , 聚類 , 關聯規則, ?神經網絡預測等) ? |
下午 |
? 云環境下的 Spark 以及預測的簡介 |
? l?Spark 在阿里云的使用 l?Spark 在 AWS 亞馬遜云的使用 l?預測方法簡介:包括時間序列預測,機器學習方法進行預測(GBDT, 邏輯回歸等) ? |
?