閱讀235 返回首頁    go 阿裏雲 go 技術社區[雲棲]


從政府統計到政府大數據統計


在互聯網大數據發展中,要把各種各樣的數據鏈接到具有統計思想、統計標準、統計流程、統計方法的科學過程上,形成互聯網雲技術狀態的大數據統計,從而為創造新的大數據生態提供統計科學理論方法,也為與外部無縫連接成大係統數據體係、推動全社會產業分工合作、創造更大的生產力,提供統計工具。因此,統計學本身的發展,也要求政府統計成為政府大數據統計。

統計形式主要表現為統計數據和統計分析,統計數據是統計分析的基礎,但在政府統計形式上,則主要從數據出發。統計設計、統計調查及數據搜集整理追求的是一個能夠描述一個國家全部經濟社會活動的數據體係,科學簡潔、充分有效,為社會各界直接認知和直接管理服務,也為專門機構的統計分析研究提供數據支持。

如果政府統計從統計分析出發,那麼因為重心的移動,雖然其也包括統計調查和數據搜集整理,但因統計工作的層次增加,統計分析體係的決定作用就比較大。如此一來,統計調查、統計數據搜集整理可能就會以統計分析為主要目標,而做出一些相對重點的安排。與主要從統計數據出發的政府統計相比,因統計分析重心變化,統計數據體係的完整性可能會被削弱,曆史數據的一致性也會受到影響,即降低時間序列可比有效數據的係列長度。

客觀性與科學性的矛盾統一

政府統計內容是統計發展的實質,即客觀性與科學性的統一。客觀性是指如何把統計體係按照客觀存在的最優細節設計出來,科學性往往受學科的核心理論影響,而核心理論則來自對現實的抽象,二者在統計發展中是矛盾統一的過程。從科學性來講,如何把多學科交叉的優化作用反映到客觀存在對象(包括活動)的最優量化解析之中,是統計數據滿足各方麵需要的根本點。

政府統計範圍原則上是公共統計數據,是公共服務的組成部分,目的是滿足全社會各種數據需求。縱橫的統計範圍是很難界定清楚的,而且借助互聯網大數據,其無論在廣度和深度上都不斷擴張發展。強化核心不限範圍可能是政府統計逐步收編業務數據、技術數據、行政記錄、活動記錄、政策數據、專業數據、價值記錄、社會數據、環境數據、自然數據等數據信息,並形成標準化統計數據信息,實現政府大數據統計,為政府統計數據實現更強大的公共服務功能提供科學數據支撐的新思維,這將是人類社會發展巨大變革的一個潛在趨勢,也是統計學科與統計工作發展的重大機遇和挑戰。

“數據+模型”助力政府大數據統計

“數據+模型”對政府大數據統計變革具有重要作用。在互聯網大數據雲技術的時代,統計學本身要按照“數據+模型”的要求,重新開發統計應用價值。其中,大數據與統計數據的鏈接,包含著雙方的互相推動與抱團裂變新能量。抱團裂變新能量是指完全按照客觀存在,把所有量,包括任何一個經濟活動、一個部門活動、一個社會活動中所包含的自然、業務、專業、實驗、技術、政策、行政中的各種數據,按照統計思維、邏輯與方法整理成互聯網雲技術狀態的大數據統計,以此為各方麵開展複雜係統全麵的研究提供數據資源的能量。有了這個基礎,才可能產生大數據生態的內生智能化研究。在互聯網大數據發展中,要把各種各樣的數據鏈接到具有統計思想、統計標準、統計流程、統計方法的科學過程上,形成互聯網雲技術狀態的大數據統計,從而為創造新的大數據生態提供統計科學理論方法,也為與外部無縫連接成大係統數據體係、推動全社會產業分工合作、創造更大的生產力,提供統計工具。因此,統計學本身的發展,也要求政府統計成為政府大數據統計。

搶占互聯網大數據領域的核心地位

聯係互聯網大數據,重新認識統計學家族的作用,有利於統計學科發展上的戰略選擇。麵對互聯網大數據,有必要把統計科學概括成“統計數據+統計模型”。盡管許多人將統計學稱為數據的科學,但實際上,主要還是指如何用統計模型分析數據。當前,需要把統計科學中的“統計數據”獨立出來,其深遠意義是探索如何直接對接互聯網大數據。

“統計數據”麵對人類社會的各種實際活動,發揮定量、描述、關聯、網絡等作用,物聯網智能化數據、實驗數據、實物量統計數據、價值量統計數據、業務數據、行政數據、專業數據、文本數據、問卷調查及定性定量化的軟數據,以及展示數據說明客觀規律的指標及指標體係、統計分布、統計分位、統計分層、統計分類、相關分析、投入產出矩陣關係、網絡圖模型、描述統計和探索性統計分析等,都是針對“統計數據”的統計科學作用。探索以因果關係及其客觀規律的統計模型分析,是統計科學的另一部分——“統計模型”的主要功能,其中,涉及更廣泛的概率論與數理統計理論方法。麵對互聯網大數據的挑戰,統計科學首要的是要把“統計數據”的層麵講清楚,追求運用統計科學解析客觀存在的複雜係統運行的最優體係和機製,並且根據實際需要,還要探索出其他學科不能及的“統計數據”內涵層麵及其理論方法,要讓全社會深刻認識到,統計應該能夠成為推動互聯網大數據發展的重要工具,並且具有紮實的統計科學基礎。

統計科學要在“統計數據+統計模型”上,與互聯網所推動的現實內容深刻互動,探索滿足應用的統計理論方法,包括互聯網大數據推動了“數據”範圍擴大、內涵和性質多樣化的變化,統計科學要主動搶占互聯網大數據領域的核心地位。統計的實質是要聚集全社會的所有數據和能夠轉化為數據的信息。統計要成為互聯網大數據生產的核心科學工具,其中社會所有數據包括物聯網數據、業務數據、專業數據、行政數據等轉化成統計大數據,以及大量文本、音頻、視頻、圖像信息轉化成統計大數據,要覆蓋全社會可量化並形成有效係統應用的工具。

政府部門數據共享是實現政府大數據統計的一個更高層次,本質是統計與其他學科交叉發展,是社會分工與合作的體現。作為最通用的社會基礎又充滿智慧為實際服務的統計科學,在滲透到各個學科領域的過程中,都應該把其所對接的學科對應的實際活動與科學精髓認識清楚、準確,並追求全社會既唯一又統一的大數據統計設計,讓統計成為聚集全社會認知體係的量化工具。因此,統計與其他學科交叉是必須的,也是彰顯統計科學精神與創造社會價值的最好過程和方式。

(作者單位:中國人民大學應用統計科學研究中心、統計學院)

本文轉自d1net(轉載)

最後更新:2017-07-17 16:42:18

  上一篇:go  2016中國互聯網10大現象:大數據產業快速推進
  下一篇:go  安全市場五巨頭將麵臨新興廠商的挑戰