開源大數據周刊-第59期
資訊
-
2017年SaaS、Relational和大數據連接趨勢
上周,Progress發布了一項調查,該調查顯示,越來越多的企業采用了大數據,SaaS數據源呈現出了爆炸式的增長,關係型數據庫正在持續被使用,以及NoSQL也正在逐漸被采用。那些接受調查的回答者們稱,他們麵臨的最大挑戰就是持續增長的數據源、數據類型、以及如何將雲數據與本地數據集成在一起。
-
如何利用數據賺錢?大數據價值變現的10種商業模式及利弊分析
當大數據應用在不同的領域和不同的場景下,所產生的意義及其所代表的意義也都不一樣,你沒有辦法用一句話完全概況。大數據是互聯網時代不可或缺的產物,不管你願不願意,大數據就在那裏,你我都是大數據的製造者同時也是受惠者,這個生態圈的閉環已經形成,而且還在不斷的延伸到各行各業,為不同的行業創造著更新、更大的價值。
-
深度解密今日頭條的個性化資訊推薦技術
資訊產品近幾年持續火爆,賺足了人們的眼球。以今日頭條披露的數據為例:日活躍用戶超過一億,單用戶日均使用時長超過 76分鍾,資訊類產品的火爆程度可見一斑。資訊類產品的火爆讓BAT巨頭坐臥不安,紛紛站出來反擊。手機百度除了搜索框之外,大部分已經被一條條新聞占據。阿裏則是依托UC瀏覽器上線了自己的頭條。騰訊在騰訊新聞之外,從頭搞起了天天快報。
-
聚焦雲業務 微軟擬全球裁員3000人
本周四,微軟宣布將啟動包括裁員在內的重大組織調整,裁員主要影響美國以外地區,裁員比例不超過全公司銷售人員的10%,這意味著裁員將多達3000人。
技術
-
HBase原理-遲到的‘數據讀取流程’部分細節
常說HBase數據讀取要讀Memstore、HFile和Blockcache,為什麼上麵Scanner隻有StoreFileScanner和MemstoreScanner兩種?沒有BlockcacheScanner?
-
基於Spark的大規模機器學習在微博的應用
一直以來,微博都嚐試通過機器學習來解決業務場景中遇到的各種挑戰。本文為新浪微博吳磊在CCTC 2017雲計算大會Spark峰會所做分享《基於Spark的大規模機器學習在微博的應用》主題的一部分
-
人工智能在線特征係統中的數據存取技術
開源的分布式KV存儲或緩存方案很多,比如我們用到的就有Redis/Memcache,HBase,Tair等,這些開源方案有大量的貢獻者在為它們的功能、性能做出不斷努力,本文就不更多著墨了。
-
Livy:基於Apache Spark的REST服務
Apache Spark提供的兩種基於命令行的處理交互方式雖然足夠靈活,但在企業應用中麵臨諸如部署、安全等問題。為此本文引入Livy這樣一個基於Apache Spark的REST服務,它不僅以REST的方式代替了Spark傳統的處理交互方式,同時也提供企業應用中不可忽視的多用戶,安全,以及容錯的支持。
歡迎入群技術交流!
雲HBase微信交流群請加:g418615
版權聲明:
信息都是來自互聯網,如果侵權,請聯係我們,我們負責刪除。
阿裏雲E-Mapreduce團隊出品
最後更新:2017-07-07 18:32:11