曙海教學優勢
本課程以項目實現為導向,面向企事業項目實際需要,秉承二十一年積累的教學品質,老師將會與您分享設計的全流程以及工具的綜合使用經驗、技巧。線上/線下/上門皆可,課程可定制,熱線:4008699035。
曙海培訓的課程培養了大批受企業歡迎的工程師。曙海培訓的課程在業內有著響亮的知名度。大批企業和曙海
建立了良好的合作關系,合作企業30萬+。
Big Data on AWS_v2.0培訓課程
課程介紹?
Big Data on AWS 課程將向您介紹基于云的大數據解決方案,例如 Amazon Elastic MapReduce (EMR)、Amazon Redshift、Amazon Kinesis 和其余 AWS 大數據平臺。在 本課程中,我們將向您介紹如何使用 Amazon EMR 來利用諸如 Hive 和 Hue 等廣泛 Hadoop 工具體系處理數據。講授內容還包括如何創建大數據環境、使用 Amazon DynamoDB、Amazon Redshift 和Amazon Kinesis,利用最佳實踐來設計大數據環境, 從而實現安全性和經濟性。
?學員基礎?
我們建議參加學習本課程的人員符合以下先決條件:
? ? 基本熟悉大數據技術,包括 Apache Hadoop、MapReduce、HDFS 和 SQL/NoSQL 查詢
? ? 學員應完成 Big Data Technology Fundamentals 網絡培訓或具備同等經驗
? ? 具有核心 AWS 服務和公有云實施工作經驗
? ? 學員應完成 AWS Technical Essentials 課程或具備同等經驗
? ? 了解數據倉庫、關系數據庫系統和數據庫設計基礎
?
?課程目標?
本課程中您將學習:
? ?適用大數據體系內的 AWS 解決方案
? ?在 Amazon EMR 環境中使用 Apache Hadoop
? ?確定 Amazon EMR 集群的組件
? ?啟動并配置 Amazon EMR 集群
? ?利用 Amazon EMR 的常用編程框架,包括 Hive、Pig 和 Streaming
? ?利用 Hue 提高 Amazon EMR 的易用性
? ?在 Amazon EMR 上搭配使用內存分析及 Spark 和 Spark SQL
? ?選擇適當的 AWS 數據存儲選項
? ?確定使用 Amazon Kinesis 以近乎實時的速度處理大數據的優勢
? ?定義數據倉庫和列式數據庫的概念
? ?利用 Amazon Redshift 有效地存儲和分析數據
? ?了解和管理 Amazon EMR 及 Amazon Redshift 部署的成本和安全性
? ?確定用于獲取、傳輸和壓縮數據的選項
? ?使用可視化軟件描述數據和查詢
? ?利用 AWS Data Pipeline 編排大數據工作流 目標人群
?
?課程大綱?
注意:課程大綱可能不盡相同,具體取決于授課的地區位置和 / 或語言。
本課程將在各天中講解下列概念:
? ?大數據概述
? ?獲取、傳輸和壓縮
? ?存儲解決方案
? ?在 DynamoDB 中存儲和查詢數據
? ?大數據處理和 Amazon Kinesis
? ?Apache Hadoop 及 Amazon EMR 簡介
? ?使用 Amazon Elastic MapReduce
? ?Hadoop 編程框架
? ?在 Amazon EMR 上利用 Hive 處理服務器日志
? ?在 Amazon EMR 上利用 Hadoop 流處理化學數據
? ?利用 Hue 簡化您的 Amazon EMR 體驗
? ?在 Amazon EMR 上的 Hue 中運行 Pig 腳本
? ?Amazon EMR 上的 Spark
? ?利用 Amazon EMR 上的 Spark 和 Spark SQL 以互動方式創建和查詢表
? ?管理 Amazon EMR 成本
? ?保護您的 Amazon EMR 部署
? ?數據倉庫和列式數據存儲
? ?Amazon Redshift 和大數據
? ?優化您的 Amazon Redshift 環境
? ?大數據設計模式 ? ? 大數據的可視化及編制
? ?使用 Tibco Spotfire 可視化大數據
?