趙衛(wèi)東,趙衛(wèi)東講師,趙衛(wèi)東聯(lián)系方式,趙衛(wèi)東培訓(xùn)師-【中華講師網(wǎng)】
大數(shù)據(jù)及人工智能培訓(xùn)專(zhuān)家、副教授
52
鮮花排名
0
鮮花數(shù)量
趙衛(wèi)東:Hadoop關(guān)鍵技術(shù)與Spark內(nèi)存計(jì)算框架
2017-09-18 3816
對(duì)象
研發(fā)技術(shù)人員
目的
介紹目前大數(shù)據(jù)的核心技術(shù)和應(yīng)用實(shí)例,并以實(shí)踐操作和項(xiàng)目式教學(xué)的方式著重講解Hadoop和Spark的基本原理和應(yīng)用。
內(nèi)容

一、Hadoop關(guān)鍵技術(shù)

學(xué)習(xí)如何安裝運(yùn)行各種大數(shù)據(jù)軟件以及如何進(jìn)行初級(jí)編程實(shí)踐,包括Hadoop、HDFS、MapReduce等安裝、操作和編程。其中會(huì)介紹一些Hadoop的應(yīng)用案例,并通過(guò)一些實(shí)驗(yàn)初步了解Hadoop的操作。

第1章 Hadoop概論

1.1 緣于搜索的Hadoop

1.1.1 Hadoop簡(jiǎn)介

1.1.2 Hadoop發(fā)展

1.2 大數(shù)據(jù)、Hadoop的關(guān)系

1.3 Hadoop設(shè)計(jì)思想與架構(gòu)

1.3.1 數(shù)據(jù)存儲(chǔ)與切分

1.3.2 MapReduce模型

1.3.3 MPI和MapReduce

第2章 Hadoop存儲(chǔ)系統(tǒng)

2.1 基本概念

2.1.1 NameNode

2.1.2 DateNode

2.1.3 客戶端

2.1.4 塊

2.2 HDFS的特性和目標(biāo)

2.2.1 HDFS的特性

2.2.2 HDFS的目標(biāo)

2.3 HDFS架構(gòu)

2.3.1 Master/Slave架構(gòu)

2.3.2 NameNode和Secondary   NameNode通信模型

2.3.3 文件存取機(jī)制

2.4 HDFS核心設(shè)計(jì)

2.5 HDFS權(quán)限管理

第3章 HDFS的使用

3.1    HDFS環(huán)境準(zhǔn)備

3.2 HDFS命令的使用

3.3 HDFS Java API的使用方法

第4章 MapReduce計(jì)算框架

4.1 Hadoop MapReduce簡(jiǎn)介

4.2 MapReduce模型

4.2.1 MapReduce編程模型

4.2.2 MapReduce實(shí)現(xiàn)原理

第5章 Hadoop命令系統(tǒng)

5.1 Hadoop命令系統(tǒng)的組成

5.2 用戶命令

第6章 Hadoop作業(yè)調(diào)度系統(tǒng)

6.1 作業(yè)調(diào)度概述

6.1.1 相關(guān)概念

6.1.2 作業(yè)調(diào)度流程

6.1.3 集群資源組織與管理

6.1.4 隊(duì)列控制和權(quán)限管理

6.1.5 插件式調(diào)度框架

第7章 Hadoop集群搭建

7.1 Hadoop版本的選擇

7.2 集群基礎(chǔ)硬件需求

7.3 安裝Hadoop

實(shí)驗(yàn)

實(shí)驗(yàn)一:熟悉常用的 Linux 操作和 Hadoop 操作

實(shí)驗(yàn)二:熟悉常用的 HDFS 操作

實(shí)驗(yàn)三:熟悉常用的 HBase 操作

實(shí)驗(yàn)四:NoSQL 和關(guān)系數(shù)據(jù)庫(kù)的操作比較

實(shí)驗(yàn)五:MapReduce 初級(jí)編程實(shí)踐

二、Spark內(nèi)存計(jì)算框架

介紹為什么會(huì)出現(xiàn)Spark?Spark是什么?Spark能做什么?還有Spark安裝、使用以及編程基礎(chǔ),并初步了解Spark SQL等核心技術(shù)。其中穿插一些Spark的典型應(yīng)用案例,并通過(guò)動(dòng)手實(shí)驗(yàn)初步體驗(yàn)Spark的應(yīng)用。

第8章 Spark概述

8.3.1 Spark的出現(xiàn)與發(fā)展

8.3.2 Spark協(xié)議族

8.3.3 Spark的應(yīng)用及優(yōu)勢(shì)

第9章 Spark原理

9.1 Spark工作原理

9.2 Spark架構(gòu)及運(yùn)行機(jī)制

9.2.1 Spark系統(tǒng)架構(gòu)與節(jié)點(diǎn)角色

9.2.2 Spark作業(yè)執(zhí)行過(guò)程

9.2.3 應(yīng)用初始化

9.2.4 構(gòu)建RDD有向無(wú)環(huán)圖

9.2.5RDD有向無(wú)環(huán)圖拆分

第10章 RDD算子

10.1 創(chuàng)建算子

10.1.1 基于集合類(lèi)型數(shù)據(jù)創(chuàng)建RDD

10.1.2 基于外部數(shù)據(jù)創(chuàng)建RDD

10.2 transformation變換算子

10.2.1對(duì)Value型RDD進(jìn)行變換

10.2.2對(duì)Key/Value型RDD進(jìn)行變換

10.3 action行動(dòng)算子

10.3.1 數(shù)據(jù)運(yùn)算類(lèi)行動(dòng)算子

10.3.2 存儲(chǔ)型行動(dòng)算子

第11章 安裝和使用Spark

11.1 安裝Spark

11.2 編寫(xiě)和運(yùn)行Spark程序

實(shí)驗(yàn):

實(shí)驗(yàn)1:Linux系統(tǒng)基本命令和Hadoop使用方法

實(shí)驗(yàn)2:RDD基本操作

實(shí)驗(yàn)3:迭代式算法編程實(shí)踐

實(shí)驗(yàn)4:自定義分匙、排序、合并

實(shí)驗(yàn)5:利用DataFrame實(shí)現(xiàn)數(shù)據(jù)庫(kù)的讀寫(xiě)

實(shí)驗(yàn) 6:利用 Spark Streaming 實(shí)現(xiàn)流數(shù)據(jù)處理


上一篇 無(wú)
全部評(píng)論 (0)
熱門(mén)領(lǐng)域講師
互聯(lián)網(wǎng)營(yíng)銷(xiāo) 互聯(lián)網(wǎng) 新媒體運(yùn)營(yíng) 短視頻 電子商務(wù) 社群營(yíng)銷(xiāo) 抖音快手 新零售 網(wǎng)絡(luò)推廣 領(lǐng)導(dǎo)力 管理技能 中高層管理 中層管理 團(tuán)隊(duì)建設(shè) 團(tuán)隊(duì)管理 高績(jī)效團(tuán)隊(duì) 創(chuàng)新管理 溝通技巧 執(zhí)行力 阿米巴 MTP 銷(xiāo)售技巧 品牌營(yíng)銷(xiāo) 銷(xiāo)售 大客戶營(yíng)銷(xiāo) 經(jīng)銷(xiāo)商管理 銷(xiāo)講 門(mén)店管理 商務(wù)談判 經(jīng)濟(jì)形勢(shì) 宏觀經(jīng)濟(jì) 商業(yè)模式 私董會(huì) 轉(zhuǎn)型升級(jí) 股權(quán)激勵(lì) 納稅籌劃 非財(cái)管理 培訓(xùn)師培訓(xùn) TTT 公眾演說(shuō) 招聘面試 人力資源 非人管理 服裝行業(yè) 績(jī)效管理 商務(wù)禮儀 形象禮儀 職業(yè)素養(yǎng) 新員工培訓(xùn) 班組長(zhǎng)管理 生產(chǎn)管理 精益生產(chǎn) 采購(gòu)管理 易經(jīng)風(fēng)水 供應(yīng)鏈管理 國(guó)學(xué) 國(guó)學(xué)文化 國(guó)學(xué)管理 國(guó)學(xué)經(jīng)典 易經(jīng) 易經(jīng)與管理 易經(jīng)智慧 家居風(fēng)水 國(guó)際貿(mào)易
鮮花榜
頭像
+6107朵
頭像
+6098朵
頭像
+6087朵
頭像
+6087朵
頭像
+6065朵
頭像
+6059朵
頭像
+6054朵
頭像
+6049朵
頭像
+6019朵

Copyright©2008-2025 版權(quán)所有 浙ICP備06026258號(hào)-1 浙公網(wǎng)安備 33010802003509號(hào) 杭州講師網(wǎng)絡(luò)科技有限公司
講師網(wǎng) www.3969a.com 直接對(duì)接10000多名優(yōu)秀講師-省時(shí)省力省錢(qián)
講師網(wǎng)常年法律顧問(wèn):浙江麥迪律師事務(wù)所 梁俊景律師 李小平律師