到底多大才是“大數據”?“大數據之‘大’并不在于其表面的‘大容量’,而在于其潛在的‘大價值’?!薄洞髷祿赫诘絹淼臄祿锩芬粫淖髡摺⒅畔⒐芾韺<彝孔优嬖诘谑畬脟倚畔⒒瘜<艺搲现赋?,數據的價值在于計算,未來將興起一個全計算型的社會,特別是以物聯網為核心的機器計算和社會計算,開放數據的目的是鼓勵創(chuàng)新、推動網絡經濟的發(fā)展、促進中國經濟向精細化轉型。
從全球數據技術投入的資金分布來看,傳統(tǒng)的小數據仍然占據絕對的重頭。據國際數據集團(IDG)統(tǒng)計,2012年,全球對小數據分析工具的投資為349億美元,而對大數據分析工具Hadoop的投資僅為1.3億美元,不及前者的1%。IDG的結論是,傳統(tǒng)的小數據軟件滿足了企業(yè)和組織95%的需求。涂子沛認為,目前行業(yè)發(fā)展的最新態(tài)勢,是“大”、“小”數據分析工具趨于一體化并在向“云”遷徙。
未來的計算機會越來越小,會無處不在,跟日常環(huán)境聯系到一起。涂子沛指出,我們的智能手機就是一臺計算機,有傳感器也有攝像頭,它可以收集數據,反饋數據。美國氣象局用來做氣象檢測的傳感器是隨著汽車不停行進的,從紐約到波士頓,每10秒鐘收集一次數據,一天收集十幾萬次數據,實時傳輸到數據中心。在1989年,就已經出現了數據挖掘。摩爾定律解決了一個問題,就是無論有多少信息,我們都可以以很低的成本保存下來。普適計算解決的問題是使得人類收集信息的能力越來越強,感應器、手機、無線網絡、望遠鏡、仿真計算都在產生數據,就是說保存數據的能力很強,收集數據的能力很強,到1989年數據挖掘出現之后,人類分析數據的能力也空前增強。
涂子沛指出,通過開放數據,大數據還可以成為啟動透明政府的利器。這對當下的中國,現實意義毋庸諱言。數據增值的關鍵在于整合,但自由整合的前提是數據的開放。開放數據是指將原始的數據及其相關元數據以可以下載的電子格式放在互聯網上,讓其他方自由使用。開放數據和公開數據是兩個不同的概念,公開是信息層面的,是一條一條的;開放是數據庫層面的,是一片一片的。開放也不一定代表免費,企業(yè)的數據,可以以收費的形式開放。開放也是有層次的,可以對某個群體、某個組織,也可以對整個社會開放。在大數據的時代,開放數據的意義,不僅僅是滿足公民的知情權,更在于讓大數據時代最重要的生產資料數據自由地流動起來,以催生創(chuàng)新,推動知識經濟和網絡經濟的發(fā)展,促進中國的經濟增長由粗放型向精細型轉型升級。
