趙衛(wèi)東,趙衛(wèi)東講師,趙衛(wèi)東聯(lián)系方式,趙衛(wèi)東培訓師-【中華講師網(wǎng)】
大數(shù)據(jù)及人工智能培訓專家、副教授
42
鮮花排名
0
鮮花數(shù)量
趙衛(wèi)東:Hadoop關鍵技術與Spark內(nèi)存計算框架
2017-09-18 3721
對象
研發(fā)技術人員
目的
介紹目前大數(shù)據(jù)的核心技術和應用實例,并以實踐操作和項目式教學的方式著重講解Hadoop和Spark的基本原理和應用。
內(nèi)容

一、Hadoop關鍵技術

學習如何安裝運行各種大數(shù)據(jù)軟件以及如何進行初級編程實踐,包括Hadoop、HDFS、MapReduce等安裝、操作和編程。其中會介紹一些Hadoop的應用案例,并通過一些實驗初步了解Hadoop的操作。

第1章 Hadoop概論

1.1 緣于搜索的Hadoop

1.1.1 Hadoop簡介

1.1.2 Hadoop發(fā)展

1.2 大數(shù)據(jù)、Hadoop的關系

1.3 Hadoop設計思想與架構

1.3.1 數(shù)據(jù)存儲與切分

1.3.2 MapReduce模型

1.3.3 MPI和MapReduce

第2章 Hadoop存儲系統(tǒng)

2.1 基本概念

2.1.1 NameNode

2.1.2 DateNode

2.1.3 客戶端

2.1.4 塊

2.2 HDFS的特性和目標

2.2.1 HDFS的特性

2.2.2 HDFS的目標

2.3 HDFS架構

2.3.1 Master/Slave架構

2.3.2 NameNode和Secondary   NameNode通信模型

2.3.3 文件存取機制

2.4 HDFS核心設計

2.5 HDFS權限管理

第3章 HDFS的使用

3.1    HDFS環(huán)境準備

3.2 HDFS命令的使用

3.3 HDFS Java API的使用方法

第4章 MapReduce計算框架

4.1 Hadoop MapReduce簡介

4.2 MapReduce模型

4.2.1 MapReduce編程模型

4.2.2 MapReduce實現(xiàn)原理

第5章 Hadoop命令系統(tǒng)

5.1 Hadoop命令系統(tǒng)的組成

5.2 用戶命令

第6章 Hadoop作業(yè)調(diào)度系統(tǒng)

6.1 作業(yè)調(diào)度概述

6.1.1 相關概念

6.1.2 作業(yè)調(diào)度流程

6.1.3 集群資源組織與管理

6.1.4 隊列控制和權限管理

6.1.5 插件式調(diào)度框架

第7章 Hadoop集群搭建

7.1 Hadoop版本的選擇

7.2 集群基礎硬件需求

7.3 安裝Hadoop

實驗

實驗一:熟悉常用的 Linux 操作和 Hadoop 操作

實驗二:熟悉常用的 HDFS 操作

實驗三:熟悉常用的 HBase 操作

實驗四:NoSQL 和關系數(shù)據(jù)庫的操作比較

實驗五:MapReduce 初級編程實踐

二、Spark內(nèi)存計算框架

介紹為什么會出現(xiàn)Spark?Spark是什么?Spark能做什么?還有Spark安裝、使用以及編程基礎,并初步了解Spark SQL等核心技術。其中穿插一些Spark的典型應用案例,并通過動手實驗初步體驗Spark的應用。

第8章 Spark概述

8.3.1 Spark的出現(xiàn)與發(fā)展

8.3.2 Spark協(xié)議族

8.3.3 Spark的應用及優(yōu)勢

第9章 Spark原理

9.1 Spark工作原理

9.2 Spark架構及運行機制

9.2.1 Spark系統(tǒng)架構與節(jié)點角色

9.2.2 Spark作業(yè)執(zhí)行過程

9.2.3 應用初始化

9.2.4 構建RDD有向無環(huán)圖

9.2.5RDD有向無環(huán)圖拆分

第10章 RDD算子

10.1 創(chuàng)建算子

10.1.1 基于集合類型數(shù)據(jù)創(chuàng)建RDD

10.1.2 基于外部數(shù)據(jù)創(chuàng)建RDD

10.2 transformation變換算子

10.2.1對Value型RDD進行變換

10.2.2對Key/Value型RDD進行變換

10.3 action行動算子

10.3.1 數(shù)據(jù)運算類行動算子

10.3.2 存儲型行動算子

第11章 安裝和使用Spark

11.1 安裝Spark

11.2 編寫和運行Spark程序

實驗:

實驗1:Linux系統(tǒng)基本命令和Hadoop使用方法

實驗2:RDD基本操作

實驗3:迭代式算法編程實踐

實驗4:自定義分匙、排序、合并

實驗5:利用DataFrame實現(xiàn)數(shù)據(jù)庫的讀寫

實驗 6:利用 Spark Streaming 實現(xiàn)流數(shù)據(jù)處理


上一篇 智能機器人
上一篇
全部評論 (0)

Copyright©2008-2025 版權所有 浙ICP備06026258號-1 浙公網(wǎng)安備 33010802003509號 杭州講師網(wǎng)絡科技有限公司
講師網(wǎng) www.3969a.com 直接對接10000多名優(yōu)秀講師-省時省力省錢
講師網(wǎng)常年法律顧問:浙江麥迪律師事務所 梁俊景律師 李小平律師