" 數(shù)據(jù)是 21 世紀(jì)的石油,而分析則是內(nèi)燃機(jī)。" 這是 Gartner 研究院高級副總裁彼得 · 桑德加在一次報(bào)告上的講話觀點(diǎn)。沒有內(nèi)燃機(jī),石油也僅是埋在地下的一堆烴化物;沒有分析,數(shù)據(jù)也就是磁盤中的二進(jìn)制。數(shù)據(jù)分析作為一個日益重要的科學(xué)領(lǐng)域,成為了人工智能時(shí)代的基石。如今大紅大紫的人工智能 ChatGPT 其基本算法來自于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí),而 ChatGPT 的訓(xùn)練則是用了大數(shù)據(jù)和大算力。科學(xué)家司馬賀曾給出如下定義:" 如果一個系統(tǒng)能夠通過執(zhí)行某個過程改進(jìn)它的性能,這就是學(xué)習(xí)。" 而所謂 " 訓(xùn)練 " 則是為了讓人工智能歸納出模型而提供大量的數(shù)據(jù)讓它學(xué)習(xí)。總的來說,人類創(chuàng)造的人工智能如今能達(dá)到這個地步,與數(shù)據(jù)分析學(xué)科的一步步進(jìn)階是分不開的。要想在 AI 領(lǐng)域有所建樹,學(xué)習(xí)數(shù)據(jù)分析是必由之路。
數(shù)據(jù)分析不僅僅是人工智能的基礎(chǔ),它現(xiàn)在還被運(yùn)用于各個領(lǐng)域。我們正一腳跨入的這個人工智能時(shí)代,數(shù)據(jù)無處不在,不僅僅科技領(lǐng)域帶來了大數(shù)據(jù),商務(wù)世界也每天都在產(chǎn)生海量數(shù)據(jù)——金融領(lǐng)域利用數(shù)據(jù)對風(fēng)險(xiǎn)進(jìn)行管控,外貿(mào)領(lǐng)域利用數(shù)據(jù)對買方賣方信用度進(jìn)行考察。日常生活中處處有數(shù)據(jù),刷手機(jī)時(shí)有大數(shù)據(jù)推送,上網(wǎng)買書時(shí)有網(wǎng)站的推薦系統(tǒng),看足球比賽時(shí)有實(shí)時(shí)數(shù)據(jù)統(tǒng)計(jì)。了解數(shù)據(jù)分析的簡要?dú)v史,能讓你輕松愉快地走近數(shù)據(jù)分析的世界。
數(shù)據(jù)分析和科學(xué)是分不開的,它一直輔佐著科學(xué)的發(fā)展,伴隨科學(xué)成長。我們回顧歷史,人類科學(xué)史上歷經(jīng)了三個階段:被動地接受大自然賜予的一切并且探索客觀規(guī)律;研究信息并且用仿真模擬探索自然;研究主觀世界和人工智能。這三個階段科學(xué)和數(shù)據(jù)分析是保持同步的。
(資料圖)
《數(shù)據(jù)分析簡史∶從概率到大數(shù)據(jù)》
項(xiàng)亦子 著
上海科技教育出版社出版
統(tǒng)計(jì)學(xué)家拉奧曾經(jīng)說過:" 在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學(xué)都是數(shù)學(xué);在理性的世界里,所有的判斷都是統(tǒng)計(jì)學(xué)。" 對于數(shù)據(jù)分析的重要組成部分——統(tǒng)計(jì)學(xué),《數(shù)據(jù)分析簡史》一書將數(shù)據(jù)科學(xué)三個最重要的歷史階段和兩次統(tǒng)計(jì)學(xué)革命娓娓道來。從文藝復(fù)興起在距今 500 多年的歷程里,數(shù)據(jù)科學(xué)領(lǐng)域出現(xiàn)了一個接一個的才俊,從天文學(xué)家開普勒、神秘的牧師貝葉斯,到模糊數(shù)學(xué)開創(chuàng)者扎德、分形幾何大師芒德布羅,他們所開創(chuàng)的天文數(shù)據(jù)統(tǒng)計(jì)、主觀概率、分形統(tǒng)計(jì)……從不同角度對標(biāo)準(zhǔn)統(tǒng)計(jì)學(xué)作出了突破。最后就到了如今的時(shí)代,統(tǒng)計(jì)學(xué)習(xí)刮起了統(tǒng)計(jì)學(xué)革命的風(fēng)暴,和大數(shù)據(jù)一起為即將到來的人工智能時(shí)代打下了基礎(chǔ)。
《數(shù)據(jù)分析簡史》中所舉的例子多是輕松的話題,比如世界杯、房價(jià)、股市、旅游、婚戀等。書的正文以故事為主,數(shù)學(xué)概念和公式集中放在了每章末尾的注釋中。沒有專業(yè)數(shù)學(xué)知識背景的讀者可以選擇跳過注釋部分,輕松讀懂本書,而對具體數(shù)學(xué)推導(dǎo)過程有興趣的讀者,又可以在注釋中解惑。
近年來,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能、區(qū)塊鏈等技術(shù)加速創(chuàng)新,日益融入經(jīng)濟(jì)社會發(fā)展各領(lǐng)域全過程,各國競相制定數(shù)字經(jīng)濟(jì)發(fā)展戰(zhàn)略,出臺鼓勵政策。數(shù)字經(jīng)濟(jì)發(fā)展速度之快、輻射范圍之廣、影響程度之深前所未有,正在成為重組全球要素資源、重塑全球經(jīng)濟(jì)結(jié)構(gòu)、改變?nèi)蚋偁幐窬值年P(guān)鍵力量。
《數(shù)據(jù)分析簡史》在此時(shí)問世,也算是做了一點(diǎn)微末的科學(xué)普及的貢獻(xiàn)。
作者:項(xiàng)亦子
編輯:周怡倩
* 文匯獨(dú)家稿件,轉(zhuǎn)載請注明出處。
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-30
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29
頭條 23-07-29