国产精品女人一区二区三区|久久国产精品湿香蕉网|日韩欧美高清在线|国产精学生成a品人v在线播放

<ul id="zocbx"><legend id="zocbx"></legend></ul>
<i id="zocbx"></i>
<cite id="zocbx"><table id="zocbx"></table></cite>
    <dl id="zocbx"><label id="zocbx"></label></dl>
    <noscript id="zocbx"><ins id="zocbx"><ol id="zocbx"></ol></ins></noscript>

    1. <cite id="zocbx"><option id="zocbx"><em id="zocbx"></em></option></cite>
      <ul id="zocbx"><th id="zocbx"></th></ul><cite id="zocbx"><label id="zocbx"></label></cite>
      88 優(yōu)惠券
      2020年3月1日到期。滿 200 元可用
      立即使用
      立即使用
      • 參會報名
      • 會議介紹
      • 會議日程
      • 會議嘉賓
      • 參會指南
      • 手機下單 手機掃碼下單

      首頁 > 商務(wù)會議 > IT互聯(lián)網(wǎng)會議 > 2018Spark大數(shù)據(jù)處理與案例分析高級工程師實戰(zhàn)培訓班(12月北京班) 更新時間:2018-11-01T15:42:51

      大會站點分布:
      (點擊可切換)
      2018Spark大數(shù)據(jù)處理與案例分析高級工程師實戰(zhàn)培訓班(12月北京班)
      收藏4人
      分享到
      官方合作

      2018Spark大數(shù)據(jù)處理與案例分析高級工程師實戰(zhàn)培訓班(12月北京班) 已截止報名

      會議時間: 2018-12-18 08:00至 2018-12-22 18:00結(jié)束

      會議地點: 北京  詳細地址會前通知   周邊酒店預訂

      主辦單位: 中國軟件產(chǎn)業(yè)培訓網(wǎng)

      行業(yè)熱銷熱門關(guān)注看了又看 換一換

            會議介紹

            會議內(nèi)容 主辦方介紹


            2018Spark大數(shù)據(jù)處理與案例分析高級工程師實戰(zhàn)培訓班(12月北京班)

            2018Spark大數(shù)據(jù)處理與案例分析高級工程師實戰(zhàn)培訓班(12月北京班)宣傳圖

            各有關(guān)單位:

            當下是大數(shù)據(jù)時代,為構(gòu)建大數(shù)據(jù)平臺,技術(shù)人員需要對分布式計算平臺有一定深入的理解和應(yīng)用。MapReduce作為一個經(jīng)典的分布式計算框架,已經(jīng)廣為人知,且得到了廣泛的應(yīng)用,但MapReduce自身存在很多問題,包括迭代式計算和DAG計算等類型的數(shù)據(jù)挖掘與機器學習算法性能低下,不能很好地利用內(nèi)存資源,編程復雜度較高等。為了克服MapReduce的眾多問題,新型計算框架出現(xiàn)了。Spark已經(jīng)被不少互聯(lián)網(wǎng)公司采用,大部分數(shù)據(jù)挖掘算法和迭代式算法在逐步MapReduce平臺遷移到Spark平臺中,包括阿里巴巴,騰訊,百度,優(yōu)酷土豆,360,支付寶等互聯(lián)網(wǎng)公司已經(jīng)在線上產(chǎn)品中使用spark,且取得了令人滿意的效果,另外,部分省份的運營商也正在嘗試使用spark解決數(shù)據(jù)挖掘和分析問題,部分銀行,如工商銀行,也正在嘗試spark平臺。因此中國軟件產(chǎn)業(yè)培訓網(wǎng)決定開展“Spark大數(shù)據(jù)處理與案例分析高級工程師”實戰(zhàn)培訓班,本次培訓由北京天博信通科技有限公司具體承辦,望相關(guān)單位收到通知后積極參加。相關(guān)培訓事宜如下:

            培訓時間及地點

            2018年12月18日---12月22日 ??北京(18日全天報到)

            課程目標

            1、 深入理解Spark計算原理和編程模型,掌握Spark Core和SparkSql、SparkStreaming等上層系統(tǒng)的結(jié)合方式

            2、深入掌握SparkCore、SparkSql使用調(diào)優(yōu)技巧

            3、深入掌握SparkStreaming和SparkMllib使用和調(diào)優(yōu)技巧

            4、 深入掌握Spark和其他組件的結(jié)合使用

            5、 了解Spark與MapReduce分布式計算模型的區(qū)別和各自適合的使用場景。

            6、 能夠使用java、python和scala進行spark應(yīng)用開發(fā)(如果要講解三種語言開發(fā)spark,工作量會非常大,建議只講解一種(可以根據(jù)企業(yè)的要求來定,)

            7、熟練使用spark、spark streaming、spark SQL、spark mllib

            8、深入了解spark在大型互聯(lián)網(wǎng)的架構(gòu)和使用場景

            培訓對象

            各地企事業(yè)單位大數(shù)據(jù)產(chǎn)業(yè)相關(guān)人員,運營商 IT信息化和運維工程師相關(guān)人員,金融業(yè)信息化相關(guān)人員,或?qū)Υ髷?shù)據(jù)spark感興趣的相關(guān)人員。

            頒發(fā)證書

            參加相關(guān)培訓并通過考試的學員,可以獲得:

            1.工業(yè)和信息化部全國網(wǎng)絡(luò)與信息技術(shù)項目管理中心頒發(fā)的-大數(shù)據(jù)高級工程師職業(yè)技能證書。該證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級和晉升職務(wù)的重要依據(jù)。

            注:請學員帶一寸彩照2張(背面注明姓名)、身份證復印件一張。

            培訓特色

            本課程基于最新的spark 2講解,內(nèi)容涵蓋了企業(yè)中大數(shù)據(jù)處理的四大場景:

            離線批處理、流式計算、SQL處理、機器學習。Spark是一個廣泛應(yīng)用的分布式內(nèi)存計算模型,旨在大幅提升的迭代算法和交互低延遲數(shù)據(jù)挖掘的性能。Spark更適合于迭代運算比較多的ML和DM運算,one stack rule them all!Spark號稱一個平臺可以適合所有的應(yīng)用,如SparkSql可以處理結(jié)構(gòu)化數(shù)據(jù),SparkStreaming旨在提供實時的計算能力,而SparkMllib則提供了豐富機器學習算法庫。

            查看更多

            中國軟件產(chǎn)業(yè)培訓網(wǎng)

            為響應(yīng)國家“人才興國、科教興國”戰(zhàn)略,緩解中國軟件技術(shù)人才需求日益緊張的現(xiàn)狀,推動中國軟件業(yè)的發(fā)展,培養(yǎng)一批高素質(zhì)的軟件專業(yè)人才,在工信部以及相關(guān)領(lǐng)導的大力支持下2008年成立了中國軟件產(chǎn)業(yè)培訓網(wǎng)(簡稱“軟博教育”),軟博教育自成立以來即定位于軟件技術(shù)專業(yè)人才培養(yǎng)實訓機構(gòu),專注致力于軟件技術(shù)人才的培養(yǎng),是中國科學院計算技術(shù)研究所教育中心合作培訓機構(gòu),也是工信部人才交流中心唯一指定的全國計算機專業(yè)技術(shù)人才培訓基地”,“國家人力資源和社會保障部——全國信息化人才培養(yǎng)工程項目(即國家“653工程”)指定培養(yǎng)機構(gòu)”, 中國軟件產(chǎn)業(yè)培訓網(wǎng)(中聯(lián)軟博(北京)科技有限公司)--率先在國內(nèi)開展高級軟件架構(gòu)等IT高端培訓的公開課。多年來持續(xù)不斷的投入精力創(chuàng)新課程體系,至今已在國內(nèi)開展公開課培訓的課程達十幾門,分別涵蓋軟件架構(gòu)、軟件設(shè)計、項目管理、質(zhì)量管理、需求工程、運營管理等領(lǐng)域,也根據(jù)企事業(yè)單位的實用需求, 通過定制培訓方案,培訓后的技術(shù)服務(wù),將企業(yè)單位的信息化投資的效益發(fā)揮到最高點。目前中心已經(jīng)與幾百家企事業(yè)單位建立了長期的培訓合作關(guān)系, 深得用戶信賴和好評。

            會議日程 (最終日程以會議現(xiàn)場為準)


            課程模塊

            課程主題

            主要內(nèi)容

            模塊一

            Spark 2.1概述

            ?1、Spark產(chǎn)生背景,包括mapreduce缺陷,多計算框架并存等

            2、Spark 基本特點

            3、Spark版本演化

            4、Spark核心概念,包括RDD, transformation, action, cache等

            5、Spark生態(tài)系統(tǒng),包括Spark生態(tài)系統(tǒng)構(gòu)成,以及與Hadoop生態(tài)系統(tǒng)關(guān)系

            6、Spark在互聯(lián)網(wǎng)公司中的地位與應(yīng)用

            7、介紹當前互聯(lián)網(wǎng)公司的Spark應(yīng)用案例

            ?8、Spark集群搭建,包括測試集群搭建和生產(chǎn)環(huán)境中集群搭建方法,并親手演示整個過程

            ?9、背景知識補充介紹

            模塊二


            Spark Core?

            ?Spark 程序設(shè)計與企業(yè)級應(yīng)用案例

            ?1、Spark運行模式介紹

            Spark運行組件構(gòu)成,spark運行模式(local、standalone、mesos/yarn等)

            2、Spark開發(fā)環(huán)境構(gòu)建

            集成開發(fā)環(huán)境選擇,親手演示spark程序開發(fā)與調(diào)試,spark運行

            3、常見transformation與action用法

            介紹常見transformation與action使用方法,以及代碼片段剖析

            4、常見控制函數(shù)介紹

            包括cache、broadcast、accumulator等

            5、Spark 應(yīng)用案例:點擊流日志分析

            包括:背景介紹,數(shù)據(jù)導入,數(shù)據(jù)分析,常見Spark transformation和action用法在線演示

            模塊三

            ???Spark

            內(nèi)部原理剖析與源碼閱讀

            ?1、Spark運行模式剖析

            ?深入分析spark運行模式,包括local,standalone以及spark on yarn

            ?2、Spark運行流程剖析

            ?包括spark邏輯查詢計劃,物理查詢計劃以及分布式執(zhí)行

            ?3、Spark shuffle剖析

            ?深入介紹spark shuffle的實現(xiàn),主要介紹hash-based和sort-based兩種實現(xiàn)

            ?4、Spark 源碼閱讀

            ?Spark源碼構(gòu)成以及閱讀方法

            模塊三

            ?????Spark ?

            程序調(diào)優(yōu)技巧

            ?1、數(shù)據(jù)存儲格式調(diào)優(yōu)數(shù)據(jù)存儲格式選擇,數(shù)據(jù)壓縮算法選擇等

            ?2、資源調(diào)優(yōu)

            如何設(shè)置合理的executor、cpu和內(nèi)存數(shù)目,YARN多租戶調(diào)度器合理設(shè)置,啟用YARN的標簽調(diào)度策略等

            ?3、程序參數(shù)調(diào)優(yōu)

            介紹常見的調(diào)優(yōu)參數(shù),包括避免不必要的文件分發(fā),調(diào)整任務(wù)并發(fā)度,提高數(shù)據(jù)本地性,JVM參數(shù)調(diào)優(yōu),序列化等

            4、程序?qū)崿F(xiàn)調(diào)優(yōu)

            如何選擇最合適的transformation與action函數(shù)

            5、調(diào)優(yōu)案例分享與演示

            演示一個調(diào)優(yōu)案例,如何將一個spark程序的性能逐步優(yōu)化20倍以上。

            模塊四

            ?Spark sql 2.1

            ??Spark SQL基本原理

            ??1、Spark SQL是什么

            ??2、Spark SQL基本原理

            ??3、Spark ?Dataframe與DataSet

            ??4、Spark SQL與Spark Core的關(guān)系

            模塊五

            ???Spark SQL

            程序設(shè)計與企業(yè)級應(yīng)用案例

            ??1、Spark SQL程序設(shè)計

            ??a. ?如何訪問MySQL、HDFS等數(shù)據(jù)源,如何處理parquet格式數(shù)據(jù)

            ??b. ?常用的DSL語法有哪些,如何使用

            ??c. ?Spark SQL調(diào)優(yōu)技巧

            ??d. ?數(shù)據(jù)傾斜解決方案

            模塊六

            ???Spark Streaming程序設(shè)計及應(yīng)用案例

            ?1、Spark ?Streaming基本原理

            ??a. ?Spark Streaming是什么

            b. ?Spark Streaming基本原理

            c. ?Structured Streaming

            ?d. ?Spark ?Streaming 編程接口介紹

            e. ?Spark Streaming應(yīng)用案例

            ??2、Spark ?Streaming程序設(shè)計與企業(yè)級應(yīng)用案例

            ??a. ?常見流式數(shù)據(jù)處理模式

            ?b. ?Spark Streaming與Kafka 交互

            ?c. ?Spark Streaming與Redis交互

            ?d. ?Spark Streaming部署與運行

            ?e. ?Spark Streaming企業(yè)級案例:用戶行為實時分析系統(tǒng)

            模塊七

            Spark Mllib

            Spark MLlib

            企業(yè)級案例

            1. ?Spark MLlib簡介

            2. ?數(shù)據(jù)表示方式

            3. ?MLlib中的聚類、分類和推薦算法

            4. ?如何使用MLlib的算法

            5. ?Spark MLLib企業(yè)級案例:用戶畫像之性別預測

            模塊八

            Spark綜合案例

            信用評分實時分析系統(tǒng)

            1. ?背景介紹

            2. ?什么是Lambda architecture

            3. ?利用Spark Core+MLlib+構(gòu)建離線處理

            4. ?利用flume+Spark Streaming+Redis構(gòu)建實時處理線

            5. ?整合批處理和實時處理線

            模塊八

            Spark綜合案例

            信用評分實時分析系統(tǒng)

            1. ?背景介紹

            2. ?什么是Lambda architecture

            3. ?利用Spark Core+MLlib+構(gòu)建離線處理

            4. ?利用flume+Spark Streaming+Redis構(gòu)建實時處理線

            5. ?整合批處理和實時處理線

            模塊九

            典型項目
            案例實戰(zhàn)

            ? 基于spark日志分析
            ? 個性化推薦系統(tǒng):帶你揭開其神秘面紗
            ? 在線投放引擎
            ? 揭開淘寶點擊推薦系統(tǒng)的神秘面紗
            ? 淘寶數(shù)據(jù)服務(wù)架構(gòu)—實時計算平臺

            查看更多

            會議嘉賓 (最終出席嘉賓以會議現(xiàn)場為準)


            張老師:阿里大數(shù)據(jù)高級專家,國內(nèi)資深的Spark、Hadoop技術(shù)專家、虛擬化專家,對HDFS、MapReduce、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生態(tài)系統(tǒng)中的技術(shù)進行了多年的深入的研究,更主要的是這些技術(shù)在大量的實際項目中得到廣泛的應(yīng)用,因此在Hadoop開發(fā)和運維方面積累了豐富的項目實施經(jīng)驗。近年主要典型的項目有:某電信集團網(wǎng)絡(luò)優(yōu)化、中國移動某省移動公司請賬單系統(tǒng)和某省移動詳單實時查詢系統(tǒng)、中國銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺、某大型銀行大數(shù)據(jù)記錄系統(tǒng)、某大型通信運營商全國用戶上網(wǎng)記錄、某省交通部門違章系統(tǒng)、某區(qū)域醫(yī)療大數(shù)據(jù)應(yīng)用項目、互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)和構(gòu)建游戲云(Web Game Daas)平臺項目等?!?br/>

            查看更多

            參會指南

            會議門票


            培訓費6800元。(含培訓費、資料費、考試費、證書費、講義光盤費等)。需要住宿學員請?zhí)崆巴ㄖ山y(tǒng)一安排,費用自理。

            10月貴陽班

            11月珠海班???????

            2019年1月杭州班

            查看更多

            溫馨提示
            酒店與住宿: 為防止極端情況下活動延期或取消,建議“異地客戶”與活動家客服確認參會信息后,再安排出行與住宿。
            退款規(guī)則: 活動各項資源需提前采購,購票后不支持退款,可以換人參加。

            還有若干場即將舉行的 Spark大會

            猜你喜歡

            部分參會單位

            主辦方?jīng)]有公開參會單位
            活動家_小程序快捷下單

            微信掃一掃
            分享給朋友

            郵件提醒通知

            分享到微信 ×

            打開微信,點擊底部的“發(fā)現(xiàn)”,
            使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

            錄入信息

            請錄入信息,方便生成邀請函