閱讀571 返回首頁    go 阿裏雲 go 技術社區[雲棲]


開源大數據周刊-第49期

資訊

技術

  • Apache Spark & Apache Zeppelin的安全狀態
    本講義出自Vinay Shukla在Hadoop Summit Tokyo 2016上的演講,主要介紹了 Spark的安全體係、以及YARN AM上的Spark驅動以及Kerberos身份驗證等相關內容,最後還介紹了SparkSQL的相關內容。

  • Apache Spark常見的三大誤解
    Apache Spark常見的三大誤解:Spark是一種內存技術、Spark要比Hadoop快10x-100x、Spark在數據處理方麵引入了全新的技術。

  • Hadoop NameNode元數據相關文件目錄解析
    在第一次部署好Hadoop集群的時候,我們需要在NameNode(NN)節點上格式化磁盤:$HADOOP_HOME/bin/hdfs namenode -format,格式化完成之後,將會在$dfs.namenode.name.dir/current目錄下如下的文件...

  • Spark Standalone架構設計要點分析
    Apache Spark是一個開源的通用集群計算係統,它提供了High-level編程API,支持Scala、Java和Python三種編程語言。Spark內核使用Scala語言編寫,通過基於Scala的函數式編程特性,在不同的計算層麵進行抽象,代碼設計非常優秀。

  • Apache Spark 內存管理詳解
    Spark 作為一個基於內存的分布式計算引擎,其內存管理模塊在整個係統中扮演著非常重要的角色。理解 Spark 內存管理的基本原理,有助於更好地開發 Spark 應用程序和進行性能調優。本文旨在梳理出 Spark 內存管理的脈絡,拋磚引玉,引出讀者對這個話題的深入探討。本文中闡述的原理基於 Spark 2.1 版本,閱讀本文需要讀者有一定的 Spark 和 Java 基礎,了解 RDD、Shuffle、JVM 等相關概念。

歡迎加入阿裏雲開源大數據交流釘釘群

screenshot

國內大數據相關會議

| 會議 | 地點 | 時間 | 費用 |

版權聲明

信息都是來自互聯網,都給出了原文的鏈接,如果侵權,請聯係我們,我們負責刪除。

阿裏雲E-Mapreduce團隊 出品

最後更新:2017-04-21 10:30:30

  上一篇:go 姿勢多且很實用——看完這些內容你就能玩轉雲計算!
  下一篇:go RDS SQL Server死鎖(Deadlock)係列之二使用Profiler捕獲死鎖