閱讀394 返回首頁    go 微軟 go windows


數據挖掘——概述

2a8a912e9b37d4177aa55fd0b635f2316dba3ccb


數據挖掘:運用基於計算機的方法(包括新技術)從數據中獲得有用知識的整個過程,這就叫做數據挖掘。

在當今競爭的世界中,數據挖掘所扮演的角色越來越重要。

數據挖掘是一個迭代的過程。它從大量數據中搜尋有價值,非同尋常的新信息。這是人和計算機合作的結果。


數據挖掘的基本目標為:預測 和 描述。

    預測性數據挖掘:生成給定數據集所描述的係統模型

    描述性數據挖掘: 在可用的數據基礎上生成新的,非同尋常的信息。


數據挖掘的基本任務:

     分類——發現某個預測學習功能,將一個數據項分類到幾個預定義類中的一個

     回歸——發現某個預測學習功能,講一個數據項映射到一個真實值預測變量上

     聚類——一個常見的描述性任務,用於確定有限的一組類別或聚類,來描述數據

     總結概括——一項附加的描述性任務,涉及尋找數據集與子集的簡單描述的方法。

     關聯建模——發現一個本地模型,來描述變量之間或者數據集貨其一部分的特征值之間的重要相關性能

     變化和偏差監測——發現數據集中最重要的變化。


要成為數據挖掘過程的分析者和設計者,除了具備全麵的專業知識外,還要有創新思維和從不同角度看待問題的主動性。





 

最後更新:2017-04-01 16:41:01

  上一篇:go Spring3+Hibernate3升級為Spring4+Hibernate4
  下一篇:go 大規模深度學習優化技術在PAI平台中的應用及實踐