董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站)
時(shí)間:2017-04-22 08:00 至 2017-04-23 18:00
地點(diǎn):北京

- 參會(huì)報(bào)名
- 課程介紹
- 課程大綱
- 講師介紹
- 課程費(fèi)用
-
手機(jī)下單
首頁(yè) > 商務(wù)會(huì)議 > IT互聯(lián)網(wǎng)會(huì)議 > 董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站) 更新時(shí)間:2017-06-24T16:52:20
![]() |
![]() 董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站) 已截止報(bào)名會(huì)議時(shí)間: 2017-04-22 08:00至 2017-04-23 18:00結(jié)束 會(huì)議地點(diǎn): 北京 詳細(xì)地址會(huì)前通知 周邊酒店預(yù)訂 主辦單位: 麥思博軟件技術(shù)有限公司
|
課程介紹
課程內(nèi)容 主辦方介紹

董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站)宣傳圖
培訓(xùn)特色
當(dāng)下是大數(shù)據(jù)時(shí)代,為構(gòu)建大數(shù)據(jù)平臺(tái),需要對(duì)分布式數(shù)據(jù)收集,大數(shù)據(jù)存儲(chǔ),分布式計(jì)算,資源管理等系統(tǒng)有全面而又深入的理解。眾所周知,大數(shù)據(jù)源自于互聯(lián)網(wǎng)行業(yè),目前互聯(lián)網(wǎng)公司已有一套完善的大數(shù)據(jù)平臺(tái)建設(shè)方案,大部分選用開源的Hadoop和Spark兩大生態(tài)系統(tǒng),本課程正是以這兩套系統(tǒng)為主介紹大數(shù)據(jù)平臺(tái)及架構(gòu)的構(gòu)建策略及經(jīng)驗(yàn)。
目標(biāo)收益
本課程將為大家全面而又深入的介紹大數(shù)據(jù)平臺(tái)的構(gòu)建流程,涉及分布式數(shù)據(jù)收集,大數(shù)據(jù)存儲(chǔ),資源管理及分布式計(jì)算框架等。本課程重點(diǎn)以Hadoop和Spark兩大生態(tài)系統(tǒng)作為基準(zhǔn)進(jìn)行介紹,涉及Flume, HDFS, Hbase,YARN,MapReduce,Hive, Zookeeper, Spark,Storm,Spark Streaming等主流的大數(shù)據(jù)開源系統(tǒng)架構(gòu)及應(yīng)用經(jīng)驗(yàn)。
?
培訓(xùn)對(duì)象:各類 IT/軟件企業(yè)和研發(fā)機(jī)構(gòu)的軟件架構(gòu)師、軟件設(shè)計(jì)師、程序員。對(duì)于懷有設(shè)計(jì)疑問和問題,需要梳理解答的團(tuán)隊(duì)和個(gè)人,效果最佳。
學(xué)員基礎(chǔ):了解Java語(yǔ)言、Linux系統(tǒng);
課程時(shí)長(zhǎng):2天
查看更多

麥思博(msup)有限公司發(fā)源美國(guó)西雅圖,2007年創(chuàng)辦,是一家面向技術(shù)型組織的培訓(xùn)咨詢機(jī)構(gòu),服務(wù)于技術(shù)團(tuán)隊(duì)的技能提升、軟件工程的實(shí)際應(yīng)用和產(chǎn)品品質(zhì)的創(chuàng)新與超越。強(qiáng)調(diào)人員、技術(shù)、流程和管理的有機(jī)結(jié)合,注重角色崗位的技能提升與職業(yè)發(fā)展,以及技術(shù)團(tuán)隊(duì)復(fù)合管理與協(xié)作。每年超過1000家企業(yè)續(xù)單參與msup旗下公開課、工作坊、案例研究、國(guó)際游學(xué)等培訓(xùn)項(xiàng)目。
課程大綱
主題 |
內(nèi)容 |
大數(shù)據(jù)架構(gòu)概述 |
1.1 大數(shù)據(jù)層級(jí)架構(gòu)及各層軟件設(shè)計(jì)要求,包括數(shù)據(jù)收集、存儲(chǔ)、計(jì)算框、應(yīng)用 |
數(shù)據(jù)收集系統(tǒng)Flume與Sqoop |
2. 使用flume和sqoop兩個(gè)系統(tǒng)將外部流式數(shù)據(jù)(比如網(wǎng)站日志,用戶行為數(shù)據(jù)等)、關(guān)系型數(shù)據(jù)庫(kù)(比如MySQL、Oracle等)中的數(shù)據(jù)導(dǎo)入Hadoop中進(jìn)行分析和挖掘 |
大數(shù)據(jù)存儲(chǔ)系統(tǒng)HDFS與HBase |
3.1與HDFS 1.0進(jìn)行對(duì)比介紹2.0原理、特性與基本架構(gòu)(快照、緩存、異構(gòu)存儲(chǔ))。 |
集群資源管理與調(diào)度系統(tǒng) |
4. 介紹 YARN應(yīng)用場(chǎng)景、基本架構(gòu)與資源調(diào)度 |
Zookeeper部署及典型應(yīng)用 |
5. 介紹Zookeeper是什么,基本原理及在應(yīng)用 |
大數(shù)據(jù)計(jì)算平臺(tái) |
介紹主流的三大類大數(shù)據(jù)計(jì)算框架,分別是批處理、交互式計(jì)算和流式計(jì)算框架,并選取當(dāng)下主流的開源實(shí)現(xiàn)進(jìn)行介紹。 |
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)庫(kù) |
7. Mahout與MLlib兩個(gè)主流的分布式數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)庫(kù)的實(shí)現(xiàn)以及應(yīng)用案例。 |
查看更多
講師介紹
HULU
架構(gòu)師
資深Hadoop技術(shù)實(shí)踐者和研究者,擁有超過5年的Hadoop平臺(tái)研發(fā)經(jīng)驗(yàn),曾參與商用Hadoop原型研發(fā),以及分布式日志系統(tǒng)、全網(wǎng)圖片搜索引擎、Hadoop調(diào)度器等項(xiàng)目的設(shè)計(jì)與研發(fā);Spark On Yarn優(yōu)化與性能增強(qiáng);曾在中國(guó)云計(jì)算大會(huì)(CieCloud),世界軟件大會(huì)(WOT)等擔(dān)任主持人和培訓(xùn)講師;目前就職于美國(guó)某著名視頻公司,從事Hadoop及Spark平臺(tái)相關(guān)的研發(fā)工作。
查看更多
課程費(fèi)用
課程費(fèi)用
課程費(fèi)用:5800元/人
查看更多
溫馨提示
酒店與住宿:
為防止極端情況下活動(dòng)延期或取消,建議“異地客戶”與活動(dòng)家客服確認(rèn)參會(huì)信息后,再安排出行與住宿。
退款規(guī)則:
活動(dòng)各項(xiàng)資源需提前采購(gòu),購(gòu)票后不支持退款,可以換人參加。
您可能還會(huì)關(guān)注
-
2025第12屆 GIAC 全球互聯(lián)網(wǎng)架構(gòu)大會(huì)·深圳
2025-06-13 深圳
-
DAMS2025中國(guó)數(shù)據(jù)智能管理峰會(huì)(上海)
2025-09-12 上海
-
QCon上海2025|全球軟件開發(fā)大會(huì)
2025-10-23 上海
-
GOPS 全球運(yùn)維大會(huì) 2025 · 北京站 暨研運(yùn)數(shù)智化技術(shù)峰會(huì)
2025-06-27 北京