?
大數據應用中的算法如何創造商業價值培訓課程
培訓特色
本次培訓主要結合電商的實際應用,闡述了自然語言處理(NLP),數據挖掘(DM)和機器學習(ML)算法的落地和產出過程
目標收益
對于在大數據處理方面的技巧和變現能力會有很大的提升。
課程大綱
?
主題 |
內容 |
關聯規則(Apriori)算法在實際應用中的優化
該單元介紹基本關聯規則算法在電商實際訂單數據中的問題,以及對于問題空間預估保證提升空間的前提下,優化關聯規則模型的過程。
|
1、 傳統關聯規則算法
2、“最佳拍檔”中的關聯規則
講述了基本的關聯規則算法
3、問題發現與分析
(1)訂單數據反作弊
(2)數據+算法融合的角度
(3)badcase實例印證
4、效果空間預估
5、算法改進
6、效果的衡量
(1)上線前:Debug工具
(2)上線:ABtest系統
7、ROI分析
8、案例啟示&下一步嘗試
|
第二單元
商品評論排序對于用戶購買的影響
該單元介紹了如何處理用戶產生的商品評論,將其按照價值由大到小進行排序,評論的價值取決于影響用戶快速決策購買商品的信息量。
|
1、背景介紹
2、評論排序因素
3、內容相關性計算
(1)商品內容表示
(2)評論內容表示
(3)商品和評論的相似性計算
4、排序模型
5、效果評估
(1)測試方法
(2)衡量指標
(3)效果對比及分析
6、作弊與反作弊
7、評論智能排序-ROI分析
|
第三單元
商品“冷啟動” -基于語義主題的新品推薦
該單元以電商商品推薦為例,講述了在沒有用戶行為的情況下,如何將小眾或新上市的商品進行準確的展現,提高用戶體驗的同時帶來更多的流量。
|
1、馬太效應
2、商品的冷啟動
3、基于內容的主題特征抽取
(1)語義主題特征
(2)特征關聯
4、正負樣本形成
5、CTR預估模型
6、效果衡量與分析
|
第四單元
用戶行為分析
根據不同場景的用戶行為,挖掘潛在有價值信息或者用戶意圖。
|
1、商品互補類識別?
1、 優質用戶挖掘?
2、 品牌相似性計算?
3、 用戶點擊商品行為建模?
4、 用戶新聞興趣建模
5、 長尾query的智能糾錯?
|