開源大數據周刊-第59期

資訊

2017年SaaS、Relational和大數據連接趨勢

上周，Progress發布了一項調查，該調查顯示，越來越多的企業采用了大數據，SaaS數據源呈現出了爆炸式的增長，關係型數據庫正在持續被使用，以及NoSQL也正在逐漸被采用。那些接受調查的回答者們稱，他們麵臨的最大挑戰就是持續增長的數據源、數據類型、以及如何將雲數據與本地數據集成在一起。
如何利用數據賺錢？大數據價值變現的10種商業模式及利弊分析

當大數據應用在不同的領域和不同的場景下，所產生的意義及其所代表的意義也都不一樣，你沒有辦法用一句話完全概況。大數據是互聯網時代不可或缺的產物，不管你願不願意，大數據就在那裏，你我都是大數據的製造者同時也是受惠者，這個生態圈的閉環已經形成，而且還在不斷的延伸到各行各業，為不同的行業創造著更新、更大的價值。
深度解密今日頭條的個性化資訊推薦技術

資訊產品近幾年持續火爆，賺足了人們的眼球。以今日頭條披露的數據為例：日活躍用戶超過一億，單用戶日均使用時長超過 76分鍾，資訊類產品的火爆程度可見一斑。資訊類產品的火爆讓BAT巨頭坐臥不安，紛紛站出來反擊。手機百度除了搜索框之外，大部分已經被一條條新聞占據。阿裏則是依托UC瀏覽器上線了自己的頭條。騰訊在騰訊新聞之外，從頭搞起了天天快報。
聚焦雲業務微軟擬全球裁員3000人

本周四，微軟宣布將啟動包括裁員在內的重大組織調整，裁員主要影響美國以外地區，裁員比例不超過全公司銷售人員的10%，這意味著裁員將多達3000人。

技術

HBase原理－遲到的‘數據讀取流程’部分細節

常說HBase數據讀取要讀Memstore、HFile和Blockcache，為什麼上麵Scanner隻有StoreFileScanner和MemstoreScanner兩種？沒有BlockcacheScanner?
基於Spark的大規模機器學習在微博的應用

一直以來，微博都嚐試通過機器學習來解決業務場景中遇到的各種挑戰。本文為新浪微博吳磊在CCTC 2017雲計算大會Spark峰會所做分享《基於Spark的大規模機器學習在微博的應用》主題的一部分
人工智能在線特征係統中的數據存取技術

開源的分布式KV存儲或緩存方案很多，比如我們用到的就有Redis/Memcache，HBase，Tair等，這些開源方案有大量的貢獻者在為它們的功能、性能做出不斷努力，本文就不更多著墨了。
Livy：基於Apache Spark的REST服務

Apache Spark提供的兩種基於命令行的處理交互方式雖然足夠靈活，但在企業應用中麵臨諸如部署、安全等問題。為此本文引入Livy這樣一個基於Apache Spark的REST服務，它不僅以REST的方式代替了Spark傳統的處理交互方式，同時也提供企業應用中不可忽視的多用戶，安全，以及容錯的支持。

歡迎入群技術交流！

雲HBase微信交流群請加：g418615

信息都是來自互聯網，如果侵權，請聯係我們，我們負責刪除。

阿裏雲E-Mapreduce團隊出品

最後更新：2017-07-07 18:32:11

開源大數據周刊-第59期

資訊

2017年SaaS、Relational和大數據連接趨勢

如何利用數據賺錢？大數據價值變現的10種商業模式及利弊分析

深度解密今日頭條的個性化資訊推薦技術

聚焦雲業務微軟擬全球裁員3000人

技術

HBase原理－遲到的‘數據讀取流程’部分細節

基於Spark的大規模機器學習在微博的應用

人工智能在線特征係統中的數據存取技術

Livy：基於Apache Spark的REST服務

上一篇： 2016.1.6~2017.7.7，袋鼠雲一歲半啦

下一篇：開源大數據周刊-第58期

相關內容

熱門內容

最新內容

開源大數據周刊-第59期

資訊

技術

上一篇： 2016.1.6~2017.7.7，袋鼠雲一歲半啦

下一篇： 開源大數據周刊-第58期

相關內容

熱門內容

最新內容

下一篇：開源大數據周刊-第58期