502
京東網上商城
《Hadoop與大數據挖掘》一1.1 大數據概述
本節書摘來華章計算機《Hadoop與大數據挖掘》一書中的第1章 ,第1.1節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。
1.1 大數據概述
來看看所謂官網定義的大數據:大數據(Big data)或稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過人工或者計算機,在合理的時間內達到截取、管理、處理並整理成為人類所能解讀的形式的信息。
看得懂嗎?好像也不是那麼難以理解。首先,這些數據要夠多,即規模巨大;第二,這些數據不能夠在合理的時間內被處理並分析,也就意味著,對於一個人來說,如果讓他在1天內看完1萬本書,並寫相應的書評,那麼這1萬本書對於這個人來說就是大數據;但是,如果讓1萬個人在1天內看1萬本書,並寫對應書評,那麼其實是可以完成的任務,這樣這1萬本書對於這1萬個人來說就不是大數據了。
大數據有哪些特點呢?
首先,可以肯定的是數據量比較大,它才能被稱為大數據,所以其第一個特點就是數據體量巨大。其次,數據的類型多樣也是大數據的一個特征,數據類型不僅指文本形式,更多指的是圖片、視頻、音頻、地理位置信息等多類型的數據,個性化數據占絕大多數。第三,處理速度快也是大數據的一個特征,數據處理遵循“1秒定律”,可從各種類型的數據中快速獲得高價值的信息。最後,大數據具有價值密度低的特點,以視頻為例,1小時的監控視頻,在不間斷的監控過程中,可能有用的數據僅僅隻有一兩秒。
生活中大數據有哪些應用呢?
隨著大數據的應用越來越廣泛,應用的行業也越來越多,我們每天都可以看到大數據的一些新奇的應用,從而幫助人們從中獲取到真正有用的價值信息。
(1)理解客戶,滿足客戶服務需求
大數據的應用目前在這個領域是最廣為人知的。重點是如何應用大數據更好地了解客戶以及他們的愛好和行為。企業非常喜歡搜集社交方麵的數據、瀏覽器的日誌、分析文本和傳感器的數據,從而更加全麵地了解客戶。在一般情況下,企業會采用建立數據模型的方式進行預測。
比如美國的著名零售商Target就是通過大數據分析得到有價值的信息,精準地預測到客戶在什麼時候想要小孩。再比如,通過大數據應用,電信公司可以更好地預測出流失的客戶,沃爾瑪則更加精準地預測出哪個產品會大賣,汽車保險行業會更加了解客戶的需求和駕駛水平,外國候選政黨也能了解到選民的偏好。
(2)提高醫療水平和研發效率
大數據分析應用的計算能力可以讓我們能夠在幾分鍾內解碼整個DNA,並且製定出最新的治療方案,同時更好地了解和預測疾病。大數據技術目前已經在醫療中應用,如監視早產嬰兒和患病嬰兒的情況,通過記錄和分析嬰兒的心跳,對嬰兒的身體可能出現的不適症狀做出預測,從而更好地救治嬰兒。
(3)改善安全和執法
目前來說,大數據已經廣泛應用到安全執法的過程當中。想必大家都知道美國安全局已經開始利用大數據打擊恐怖主義,甚至監控可疑人的日常生活。而企業則應用大數據技術防禦網絡攻擊,警察應用大數據工具捕捉罪犯,信用卡公司應用大數據工具來檢測欺詐性交易等。
(4)改善我們的城市
大數據還被用來改善我們所生活的城市。例如基於城市實時交通信息、利用社交網絡和天氣數據來優化最新的交通情況。目前很多城市都在進行相關的大數據分析和試點。
(5)金融交易
大數據在金融行業主要是用於金融交易。高頻交易(HFT)是大數據應用比較多的領域,其中大數據算法被應用於交易決定。現在很多股權的交易都是利用大數據算法進行的,這些算法越來越多地考慮了社交媒體和網站新聞來決定在未來幾秒內是買入還是賣出。
通過上麵的描述也可以看出,大數據不隻是適用於企業和政府,同樣也適用於我們生活當中的每個人。我們可以利用可穿戴裝備(如智能手表或者智能手環)生成最新的數據,對熱量的消耗以及睡眠模式進行追蹤;還可以利用大數據分析來尋找屬於我們的愛情,大多數的交友網站就是應用大數據工具來幫助需要的人匹配合適的對象。
最後更新:2017-06-23 23:02:39
上一篇:
Vim??????????????????(1) - ??????vundle????????????-??????-????????????-?????????
下一篇:
???Hadoop???????????????????????????1???-??????-????????????-?????????
XMLSpy編輯工具中設置XML的DTD/XSD校驗指向本地,而不要直接指向網絡去
《JAVA8開發指南》使用流式操作
網絡犯罪組織正在伺機而動,我們該如何保護雲端安全?
『0015』 - Solidity Types - 動態字節數組(Dynamically-sized byte array)、固定大小字節數組(Fixed-size byte arrays)、string之間的轉換關係
mysql常用show status查詢狀態
簡析共享單車物聯網生態入口之爭
支付寶兼職刷單被騙了怎麼辦(報警電話:053-2869-99151)
lame音頻壓縮解碼(二)之編譯事例Demo
HPE報告揭示全球安全運營中心(SOC)成熟度
《實施Cisco統一通信VoIP和QoS(CVOICE)學習指南(第4版)》一導讀