大數據蹣跚前行,邁進下半場
隨著2012年維克托·邁爾-舍恩伯格《大數據時代》一書的出版,“大數據”這一概念乘著互聯網的浪潮在各行各業(yè)中扮演了舉足輕重的角色,得大數據者得天下,業(yè)界紛紛用大數據這個詞來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發(fā)展與創(chuàng)新。
2013年被稱為中國的“大數據元年”,大數據開始在我國流行,以勢不可擋的姿態(tài)進入人們的思想意識,并在社會的各個領域探索與落地實踐。涂子沛的《大數據》一時成為暢銷讀物,大數據的概念風行大江南北,阿里巴巴成為最早提出通過數據進行企業(yè)數據化運營的企業(yè)。2015年,我國政府通過了《關于促進大數據發(fā)展的行動綱要》,大數據更是上升為國家戰(zhàn)略。
同美國市場一樣,以Hadoop為代表的大數據技術,在中國的大數據產業(yè)中也經歷了一段狂熱期,在很長一段時期內,Hadoop幾乎成了大數據的代名詞。在這個數據大爆炸的時代,企業(yè)需要對海量數據存儲、快速處理和分析,Hadoop正是為此而生。但目前看來,這股浪潮正漸漸退去,Hadoop正在逐漸變成一項傳統(tǒng)技術。
從誕生到現在,Hadoop已經走過十多年的歷史,但近年來,以Hadoop為代表的大數據產業(yè)生態(tài),在實際落地中卻面臨著尷尬的局面。首先,大數據的價值被夸大,在投入產出比上差強人意。其次,中小企業(yè)對大數據的應用極為有限。目前看來,需求主要來源于一些大型企業(yè),數據量過大,數據分析需求旺盛,但中小企業(yè)自身數據量并不大,需求度較低,同時也缺少相應的大數據技術人才。最后,大數據管理難度大,數據開放共享、數據質量、數據安全、個人隱私信息保護等已經成為管理大數據最頭疼的問題。今年5月,歐盟數據保護法規(guī)《通用數據保護條例》發(fā)布,對大數據企業(yè)采集的個人隱私數據管理工作產生極大的挑戰(zhàn)。
2018年10月底,IBM宣布以高達340億美元的價格收購Red Hat,IBM宣稱其將成為全球的頭號混合云提供商,而亞馬遜、微軟、阿里巴巴等云計算巨頭早已將計算、存儲、網絡資源和應用軟件(大多來自開源社區(qū))作為在線云服務來提供,Anaconda產品和營銷高級副總裁Mathew Lodge指出,大數據的中心已經從Hadoop轉移到了云端,在云環(huán)境下的對象存儲系統(tǒng)(如亞馬遜 S3、微軟Azure Blob Storage和Google Cloud Storage)中存儲數據比在HDFS中便宜了5倍。
盡管現在就談Hadoop已死為時尚早,但大數據產業(yè)面臨的以上問題已經累積很久,也沒有被很好地解決,能否解決以上問題將直接關乎大數據的未來發(fā)展。
人工智能方興未艾,取得新突破
人工智能(AI)是研究用于模擬與延伸擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學,目前在商業(yè)和生活中已有大量應用場景,被產業(yè)界寄望為下一輪技術革命,對它的關注熱度已經超過大數據。
AI的發(fā)展歷程一波三折,呈螺旋式發(fā)展,在歷史上共經歷三個時期。首先是1956年達特茅斯會議提出了AI的概念,但當時的計算機處理性能和數據容量制約了AI技術的發(fā)展。然后在20世紀80年代,專家系統(tǒng)興起,AI算法模型有了重大發(fā)明,包括多層神經網絡和BP反向傳播算法的提出,出現了能與人類下象棋的高度智能機器,但隨著臺式機的出現,使得AI專家系統(tǒng)走向沒落。再往后就是2006年,Hinton論文開啟了深度學習時代,特別是2016年,AIphaGo大敗李世石,將AI從后臺推到了科技界的聚光燈下,一時間萬眾矚目。