曙海教學優勢
本課程以項目實現為導向,面向企事業項目實際需要,秉承二十一年積累的教學品質,老師將會與您分享設計的全流程以及工具的綜合使用經驗、技巧。線上/線下/上門皆可,課程可定制,熱線:4008699035。
曙海培訓的課程培養了大批受企業歡迎的工程師。曙海培訓的課程在業內有著響亮的知名度。大批企業和曙海
建立了良好的合作關系,合作企業30萬+。
?大數據分析-?基于Hadoop/Mahout的大數據挖掘培訓
培訓內容:
第一講大數據挖掘及其背景
1)數據挖掘定義
2)Hadoop相關技術
3)大數據挖掘知識點
第二講MapReduce計算模式
1)分布式文件系統
2)MapReduce
3)使用MR的算法設計
第三講Hadoop中的云挖掘工具Mahout
1)Mahout介紹
2)推薦系統
3)信息聚類
4)分類技術
5)其它挖掘
第四講推薦系統及其應用開發
1)一個推薦系統的模型
2)基于內容的推薦
3)協同過濾
4)電影推薦案例
第五講分類技術及其應用
1)分類的定義
2)分類主要算法
3)Mahout分類過程
4)評估指標以及評測
5)貝葉斯算法新聞分類實例
第六講聚類技術及其應用
1)聚類的定義
2)聚類的主要算法
3)K-Means、Canopy及其應用示例
4)FuzzyK-Means、Dirichlet及其應用示例
5)路透新聞聚類實例
第七講關聯規則和相似項發現
1)購物籃模型
2)Apriori算法
3)抄襲文檔發現
4)近鄰搜索的應用
第八講流數據挖掘相關技術
1)流數據挖掘及分析
2)流數據模型
3)數據抽樣
4)流過濾
第九講大數據挖掘應用前景
1)與Hadoop集群應用的協作
2)與RHadoop等其它云挖掘工具配合
3)大數據挖掘行業應用展望