2017年關於數據科學六大預言

今天,數據正在以前所未有的方式創造和促進著企業成長和商業利潤。在過去的十年間,先進的數據科技和高級分析工具的出現,已經使商界精英們從他們的數據中收獲無數的利益,然而,對大多數人而言,他們隻是觸及了數據潛能的最表麵。數據科學正在開天辟地的讓企業成功地撬動這個巨大的潛能。
麥肯錫2013年出版了一份特別的報告,預言全球商業界將會感覺到下一個十年數據科學專業人士的緊缺,尤其是善於從大量靜態和動態(實時)數據中發現有價值的情報的數據分析師,缺口達150萬。這個預言現已成真,人們更加關注向企業和高等教育機構推銷數據管理的重要性,從而使得整個業界都能應對幾年之前還不完全理解的人才短缺問題。
數據科學領域的動蕩要持續到2017年,伴隨著更多的增長和更大的可能。
◆ ◆ ◆
數據科學的力量
要理解為什麼數據科學對商業為何如此關鍵,有幾個前提需要理解:
-
在商業界需要它的時候,在需要它的領域,數據科學總能提供最精準的解決方案。
-
數據科學幫助做出更好的商業決策,並對這些決策的影響進行精確的研究。一份過去的哈佛商業評論研究指出,依賴數據進行決策的大生意一般比同行的利潤高出6%。
-
當人的直覺和經驗都失敗時,數據科學對未來可以做出更加準確的預測。有了數據科學,商業不再靠猜。
-
有了高效、智能的設備和現代化的分析平台,客戶追蹤已經成為現實。實時獲取客戶信息有助於精確響應。
鑒於以上各點,可以理解為什麼在這個特定的時刻,數據科學正在經曆全球化的革命。一直以來限製數據科學發揮作用的科學和技術問題都已逐步解決,2017年數據管理業界將在全球迎來一些主要的改變。明年,哪些地方可以見到數據科學的引領,請看下麵這張精準計算的預言清單:
2017 數據科學預言1:機器學習大行其道
問答網站Quara對機器學習將如何影響數據科學業界的變革做了專題問答。為了回答這個問題,克勞迪婭•珀立弛(Claudia Perlich),Dstillery公司的首席科學家,紐約大學的客座教授,肯定地認為,由於數據科學與機器學習的密切關係,在將來的商業分析界,不懂機器學習是無法生存的。
她覺得隨著機器學習與數據科學家們關係越來越緊密,掌握機器學習的基礎技能對數據科學領域的職業發展而言將成為一種必須。完整的解釋發表在福布斯的博客上: https://www.forbes.com/sites/quora/2016/09/08/machine-learning-will-bring-some-big-changes-to-data-science-as-we-know-it/#16a5cc073b12
2017年機器學習的火熱仍會繼續籠罩著數據科學家們。各種機構為了將擁有可靠機器學習技能的數據科學家招入麾下,擴充其數據科學部門,不惜付出額外的努力。
2017數據科學預言2:物聯網數據流戰勝傳統商業智能
Gartner幾年前就做出了這樣的預言,而在2017年,這樣的預言會比以往更可信。由於帶有傳感器的裝置日益席卷人類社會的方方麵麵,大約50%的商業智能(BI)平台會投資事件數據流。這樣的趨勢,會導致一個新的商業智能分支浮出水麵:捕獲來自附著裝置的實時數據寶庫,在天氣預報,製造業,電力,語音識別和健康檢測係統,以及其他等等領域,都將得到廣泛應用。由於自助式分析的興起,商業智能服務商所和那些軟件即服務(SaaS)供應商所提供的分析能力將不再有差距。
根據通用電氣《工業網絡見解報告》,物聯網(Internet of Things (IoT))市場在未來20年,將為全球GDP貢獻10-15萬億美元,從數據科學人才市場物聯網技術的流行度驟升也可證實這一點。IBM、英特爾,Verizon和微軟都在廣招具有物聯網技術的數據科學家。參見文章:https://www.dataversity.net/life-data-scientist/
2017數據科學預言3:大數據技術支出大增
Gartner預言過到2016年,大數據商業影響的迷惑和不確定性將大大降低,變得可預見。這個預言也應驗了。很多圍繞大數據“實際價值 vs 感覺價值”的爭論已經偃旗息鼓,而大數據技術已經從早期的“萌芽”期走向成熟。今天,對成功的數據科學項目而言,大數據技術比以往更加主流化,更加必備化。
迄今為止,大約隻有30%的商業界經曆了大數據革命,但是2017年,肯定會看到一個大數據投資的持續增長,尤其是處理“大容量,高速度和多樣性的數據”的成本大幅下降以後。根據Information Week,大數據分析的銷售額2019年會達到1870億美元。
2017數據科學預言4:Hadoop市場的持續增長
長,已經證明,企業的IT預算裏,Hadoop是有正麵回報的。Hadoop不僅繼續為海量數據的清洗,存儲,和處理提供一個集中的平台,它也解決了標準IT解決方案的費用過高的問題。Hadoop為很多類型的應用,如預測性分析,ETL,數據可視化,數據挖掘,數據倉庫,物聯網,或者點擊流分析提供了傑出的解決方案。今天,Hadoop被認為是最受喜愛的單一、可縮放並且費用相對低廉的商業大數據管理係統的替代方案;2017年它的流行度會增加。
在2015-16年度,唯一限製Hadoop增長的是創收能力。但最終大數據技術的廣泛性會打開Hadoop的利潤市場,《2017-2022 Hadoop市場預測》(https://www.marketanalysis.com/?p=229)預測到2020年這個正在擴增的市場將超過160億美元。
也可以參閱這個《Hadoop和大數據分析市場》的報告(https://www.marketsandmarkets.com/Market-Reports/hadoop-market-766.html),其中指明,這兩個互相依賴的市場在2017年底將價值139億美元。
2017數據科學預言5:數據科學在行動——健康產業商業智能和分析
富有洞見的《德勤研究報告》繪製了一副2020年基於高科技和數字化的病人照顧藍圖。由於科學技術如視頻會議和可穿戴設備越來越普遍,未來精通科技的病人會逐步將他們的日常醫療需求訴諸數字平台。到2020年,醫院和臨床中心隻會為重症病人和監護病人保留。
總體而言,將來的醫療健康產業會朝著數字化平台發展,而2017年,這種趨勢將很明顯。
2017年,消費者可以期待:
-
醫生們參考數據驅動的方案為病人做決策
-
健康服務業逐步邁向“4P”模式——“預防,預測,個體化,參與”( preventative, predictive, personalized, and participatory)。在這種模式下,病人成為全麵知悉、共同參與評價和選擇合適的治療方法的夥伴。
2017數據預言6:到2017年底,25%的企業將招募首席數據官
《2016大數據7大趨勢》文章(https://www.edvancer.in/7-big-data-trends-2016/)的讀者會發現,Gartner已經做出了上述預言。一個首席數據官,應該負責數據戰略,數據治理,政策管理,也負責數據質量,隱私和安全,生命周期管理。這個趨勢表明,要來的一年全球經濟將經曆完整的數據驅動的文化。首席數據官是推動部門內數據科學應用的主要力量,他們理解先進的分析之必須以及數據科學為企業所帶來的諸多利益。
Readers may also find the article Predictions for Data Science over the Coming Years of interest.
感興趣的讀者可以參閱: https://www.dataversity.net/predictions-for-data-science-over-the-coming-years/
◆ ◆ ◆
這一切意味著什麼?
斯科特•克拉克,一位Yelp的數據科學家,感受到了由於數據科學, Yelp網站所做出的些微改變將對“上百萬的人”產生巨大影響。數據科學的這種高速性和準確性,隻有在高速增長和聯合使用相關技術,如大數據,Hadoop,物聯網才成為可能,這些技術在2017年將繼續發展。全球的商業人士終將理解來自互聯網,手機,社交媒體和物聯網的數據洪流的意義,2017年以至更遠的將來,數據科學將有助於更好的理解這些趨勢,助力數據管理業界整體的持續增長。
原文發布時間為:2016-11-07
本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號
最後更新:2017-06-01 12:02:44