人工智能爆發(fā)原因探討
下面,就讓我們追溯過去,簡單探討一下人工智能爆發(fā)所需要的種種環(huán)境和條件。任何一項(xiàng)技術(shù)的普及,被千家萬戶所熟知、接觸乃至使用,都離不開其廉價(jià)生產(chǎn)成本和使用成本,而不僅僅在于這項(xiàng)技術(shù)取得了多么輝煌的成果。下面將會從這一角度出發(fā),進(jìn)行相關(guān)的探討。
一、深度學(xué)習(xí)技術(shù)的發(fā)展奠定理論基礎(chǔ)
時(shí)間回溯到10年前,2006年,加拿大多倫多大學(xué)教授、機(jī)器學(xué)習(xí)領(lǐng)域泰斗、神經(jīng)網(wǎng)絡(luò)之父——Geoffrey Hinton 和他的學(xué)生Ruslan Salakhutdinov 在頂尖學(xué)術(shù)刊物《科學(xué)》上發(fā)表了一篇文章,該文章提出了深層網(wǎng)絡(luò)訓(xùn)練中梯度消失問題的解決方案:無監(jiān)督預(yù)訓(xùn)練對權(quán)值進(jìn)行初始化+有監(jiān)督訓(xùn)練微調(diào)。從此,深度學(xué)習(xí)成為了眾多人工智能領(lǐng)域中最有潛力的一部分,斯坦福大學(xué)、紐約大學(xué)、加拿大蒙特利爾大學(xué)等成為研究深度學(xué)習(xí)的重鎮(zhèn),至此開啟了深度學(xué)習(xí)在學(xué)術(shù)界和工業(yè)界的浪潮,人工智能也迎來了其最近的一次爆發(fā)期。而2006年,也被稱為深度學(xué)習(xí)元年。
在人工智能的發(fā)展史上,AlphaGo大戰(zhàn)李世石并非人工智能在智力比賽中戰(zhàn)勝人類的首例,但卻是證明了人工智能能夠達(dá)到如同人類大腦一般思考的重要事件。早在1997年,IBM的人工智能Deep Blue就在國際象棋上戰(zhàn)勝過世界冠軍Garry Kasparov,但這并不能證明人工智能的潛力,因?yàn)楫?dāng)時(shí)的Deep Blue是使用窮舉的方法來達(dá)到國際象棋的最優(yōu)解的,與人類的經(jīng)驗(yàn)和直覺相差甚遠(yuǎn)。而Hinton所解決的深度學(xué)習(xí)這一技術(shù)的難題,正是人工智能真正向人類智能靠近的重要一步,AlphaGo也正是仰賴于深度學(xué)習(xí)技術(shù)才能夠在圍棋大戰(zhàn)上大放異彩。

隨著時(shí)間的推移,基于深度學(xué)習(xí)的研究成果不斷涌現(xiàn),在圖像識別、文本處理和語音識別上取得大量足以商業(yè)化應(yīng)用的技術(shù)進(jìn)步。
2011年,ReLU激活函數(shù)被提出,該激活函數(shù)能夠有效的抑制梯度消失問題。2011年以來,微軟首次將DL應(yīng)用在語音識別上,取得了重大突破。微軟研究院和Google的語音識別研究人員先后采用DNN技術(shù)降低語音識別錯(cuò)誤率20%~30%,是語音識別領(lǐng)域十多年來最大的突破性進(jìn)展。2012年,DNN技術(shù)在圖像識別領(lǐng)域取得驚人的效果,在ImageNet評測上將錯(cuò)誤率從26%降低到15%。在這一年,DNN還被應(yīng)用于制藥公司的DrugeActivity預(yù)測問題,并獲得世界最好成績。
2012年,Hinton課題組為了證明深度學(xué)習(xí)的潛力,首次參加ImageNet圖像識別比賽,其通過構(gòu)建的CNN網(wǎng)絡(luò)AlexNet一舉奪得冠軍,且碾壓第二名(SVM方法)的分類性能。也正是由于該比賽,CNN吸引到了眾多研究者的注意。

2014年,Facebook基于深度學(xué)習(xí)技術(shù)的DeepFace項(xiàng)目,在人臉識別方面的準(zhǔn)確率已經(jīng)能達(dá)到97%以上,跟人類識別的準(zhǔn)確率幾乎沒有差別。這樣的結(jié)果也再一次證明了深度學(xué)習(xí)算法在圖像識別方面的一騎絕塵。
但是,技術(shù)想要走進(jìn)千家萬戶,光有理論成果還是不足的,不但要理論成為現(xiàn)實(shí),而且還需要理論能夠低成本的成為現(xiàn)實(shí)。下面幾點(diǎn)會從這個(gè)角度出發(fā)進(jìn)行探討。
二、互聯(lián)網(wǎng)時(shí)代的成熟使采集大量數(shù)據(jù)的成本變得廉價(jià)
說到深度學(xué)習(xí),不得不說到要想在深度學(xué)習(xí)方面取得成果,必須先要有大量數(shù)據(jù)作為先驗(yàn)知識的支撐。目前來說,深度學(xué)習(xí)應(yīng)用最廣泛的方面,說白了就是從大量已經(jīng)有標(biāo)注的數(shù)據(jù)中獲得像人類經(jīng)驗(yàn)一般的知識,然后再將這些知識應(yīng)用到新的同類數(shù)據(jù)之中。人工智能還無法做到完全像人類一樣只需要通過教育和自學(xué)就能夠獲得知識,因此能夠被用戶所使用的人工智能成果在產(chǎn)生之前,技術(shù)研究人員必須首先采集大量的用戶數(shù)據(jù)。而互聯(lián)網(wǎng)時(shí)代的到來,使得用戶數(shù)據(jù)的采集變得越來越廉價(jià)。
2000 年,Jimmy Wales 和Larry Sanger 共同成立Wikipedia,這是全球首個(gè)開源、在線、協(xié)作而成的百科全書,完全不同于《大英百科全書》的編撰方式。Wiki 的用戶在第一年就貢獻(xiàn)了20000 個(gè)在線詞條。
2002 年,Friendster 上線,這是首家用戶規(guī)模達(dá)到100 萬的社交網(wǎng)絡(luò)。Friendster 開創(chuàng)了通過個(gè)人主頁進(jìn)行交友的先河。
2003 年,面向青少年和青年群體的MySpace 上線,它再一次刷新了社交網(wǎng)絡(luò)的成長速度:一個(gè)月注冊量突破100 萬。
2004 年,Facebook 成立,根據(jù)Facebook上市后的首份財(cái)報(bào),Facebook 每月有9.55 億用戶活躍用戶(MAU),每月移動平臺活躍用戶數(shù)有5.43 億。
2004 年同年創(chuàng)立的還有flickr,現(xiàn)在它依然是非?;钴S的圖片社區(qū)。2005 年,YouTube 成立。2006年,Twitter 成立。兩者的用戶量和數(shù)據(jù)量當(dāng)然不用懷疑了。2006年成立的還有Spotify,它現(xiàn)在是社交音樂分享型應(yīng)用的典型,擁有1500 萬MAU 和400 萬付費(fèi)用戶。2007 年,輕博客平臺Tumblr 成立,目前該平臺上有7700 萬個(gè)博客;根據(jù)2011 年7 月的數(shù)據(jù),該網(wǎng)站每月的獨(dú)立訪問量是1340 萬。
社交網(wǎng)絡(luò)的發(fā)展使人們逐漸把自身的社交信息同時(shí)匯聚到幾個(gè)大的社交平臺上,而電商的發(fā)展使全球的買家和賣家聚集到幾個(gè)巨型網(wǎng)絡(luò)購物平臺上,提供大量購物偏好和購買習(xí)慣的信息以及商品的信息。擁有這些平臺的大公司可以輕易獲取到PB級別的巨量數(shù)據(jù),作為訓(xùn)練數(shù)據(jù)放入機(jī)器學(xué)習(xí)算法中去,從而獲得相關(guān)的人工智能成果。
雖然這些大公司曾發(fā)生未經(jīng)用戶許可擅自使用用戶數(shù)據(jù)從而侵犯用戶隱私權(quán)的事件,因此引發(fā)社交網(wǎng)絡(luò)的信任危機(jī)。但是隱私方面的問題并非本文討論的重點(diǎn),因此略過。
三、存儲巨量數(shù)據(jù)的成本降低,深度學(xué)習(xí)成本進(jìn)一步下降
獲得數(shù)據(jù)的成本降低了,但是巨量的數(shù)據(jù)同時(shí)意味著龐大的存儲需求。而慶幸的是,在深度學(xué)習(xí)教父hinton解決深度學(xué)習(xí)難題的前后,大規(guī)模數(shù)據(jù)存儲設(shè)備出現(xiàn)了,并且,存儲的成本也經(jīng)歷了快速的下降,對TB級別數(shù)據(jù)的存儲設(shè)備也可以被普通消費(fèi)者所購買到,存儲設(shè)備的讀寫速度和帶寬也飛速增大。這意味著,任何人都可以把從互聯(lián)網(wǎng)上或者其他途徑獲得的大量數(shù)據(jù)存儲起來,用作機(jī)器學(xué)習(xí)訓(xùn)練或者其他用途。
2003年1月,日立宣布完成20.5億美元的收購IBM硬盤事業(yè)部計(jì)劃,并成立日立環(huán)球存儲科技公司(Hitachi Global Storage Technologies, Hitachi GST)。
2005年日立環(huán)儲和希捷都宣布了將開始大量采用磁盤垂直寫入技術(shù)(perpendicular recording),該原理是將平行于盤片的磁場方向改變?yōu)榇怪保?/span>90度),更充分地利用的存儲空間。
2007年1月,日立環(huán)球存儲科技宣布將會發(fā)售全球首只1TB的硬盤。硬盤的售價(jià)為399美元,平均每美分可以購得27.5MB硬盤空間。
2018年的今天,1TB的大容量硬盤已經(jīng)普及到每一臺PC機(jī)上,人們隨身攜帶的手機(jī)上都有著上百GB的存儲容量。最流行的用作機(jī)器學(xué)習(xí)訓(xùn)練的數(shù)據(jù)集imagenet包含約120萬張訓(xùn)練圖像、5萬張驗(yàn)證圖像和10萬張測試圖像,分為1000個(gè)不同的類別,達(dá)到140GB以上,但是現(xiàn)在的人們不僅可以把這些數(shù)據(jù)直接放在家里的PC上,甚至可以用移動硬盤帶在身上到處走。

時(shí)至2016年alpha go橫空出世的時(shí)候,存儲的世界不再是傳統(tǒng)機(jī)械硬盤hdd的時(shí)代,而逐漸顯示出讀寫速度更快的固態(tài)硬盤ssd將會替代hdd的趨勢,容量更大、質(zhì)量更高的存儲的價(jià)格也持續(xù)的變得更加的便宜。
四、摩爾定律持續(xù)了半個(gè)世紀(jì),gpu計(jì)算框架橫空出世,計(jì)算能力變得越來越廉價(jià)
摩爾定律是由英特爾(Intel)創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出來的。其內(nèi)容為:當(dāng)價(jià)格不變時(shí),集成電路上可容納的元器件的數(shù)目,約每隔18-24個(gè)月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18-24個(gè)月翻一倍以上。這一定律從被提出的一刻開始,預(yù)言了未來半個(gè)世紀(jì)信息技術(shù)進(jìn)步的速度,同時(shí)也顯示出計(jì)算能力在半個(gè)世紀(jì)內(nèi)在同一價(jià)格水平上經(jīng)歷了34次的翻倍提升。
而在2010年之后,cpu算力增長出現(xiàn)明顯的放緩,但GPU類處理器內(nèi)部的晶體管數(shù)量還保持著快速增長的勢頭,大有從cpu手中接過摩爾定律大旗的態(tài)勢。

人工智能研究人員進(jìn)行每一次的深度學(xué)習(xí)研究過程中的算法訓(xùn)練,都離不開大規(guī)模計(jì)算能力的支撐。而在cpu經(jīng)歷了半個(gè)世紀(jì)的進(jìn)化迭代之后,在支持深度學(xué)習(xí)的訓(xùn)練方面仍然稱不上足夠廉價(jià)。而在NVIDIA于2008年開始打造CUDA架構(gòu)之后,GPU的用途已經(jīng)發(fā)生了翻天覆地的變化。長久以來受限于CPU處理能力的人工智能也在那個(gè)時(shí)刻找到了更加適合的源動力,并且憑借GPU的性能不斷提升,極大的拓展了人工智能的能力和適用范圍。
按照傳統(tǒng)方案,云服務(wù)商可以采購4個(gè)機(jī)架、共160個(gè)CPU服務(wù)器,在功耗65千瓦的情況下提供每秒45000張照片的處理能力。而如果換成NVIDIA的產(chǎn)品,只需要一個(gè)裝有8片V100 GPU的NVIDIA HGX服務(wù)器,同樣的每秒45000張照片處理能力,但是你只需要7個(gè)服務(wù)器插槽,總共的功耗也只有3個(gè)千瓦。
明顯的數(shù)字對比,背后是對于企業(yè)來說的巨大的采購和運(yùn)營成本差距。而對于個(gè)人來說,在學(xué)習(xí)深度學(xué)習(xí)時(shí)進(jìn)行算法訓(xùn)練所需要的龐大計(jì)算能力,也由于GPU對深度學(xué)習(xí)的友好支持變得觸手可及。大型3D游戲行業(yè)的發(fā)展使得臺式游戲機(jī)的價(jià)格變得普通家庭都可以承受,而每臺臺式游戲機(jī)的配置中只要包含CUDA 計(jì)算能力為3.0 或更高的GPU 卡,就可以搭建支持深度學(xué)習(xí)的計(jì)算環(huán)境。深度學(xué)習(xí)和人工智能的入門成本變得無比低廉,讓無數(shù)人才可以通過培訓(xùn)機(jī)構(gòu)甚至自學(xué)進(jìn)入人工智能這個(gè)正在飛速發(fā)展的行業(yè),無數(shù)的人工智能創(chuàng)業(yè)項(xiàng)目也得以基于小額的創(chuàng)投資金啟動起來,進(jìn)一步促進(jìn)人工智能行業(yè)的繁榮,從而吸引更多的投資進(jìn)入這個(gè)行業(yè),形成一個(gè)良性的循環(huán)。
總結(jié):
這一切都使人工智能的推廣變得沒有那么困難,人工智能的研究再也不是特定大公司或者政府贊助機(jī)構(gòu)的專利。任何一個(gè)行業(yè)的繁榮都不可能只由一兩家大公司營造出來,而需要由數(shù)量眾多的大小公司、無數(shù)的人才和創(chuàng)意以及大額的投資共同去促進(jìn)整個(gè)行業(yè)不斷生產(chǎn)出更多足以改變?nèi)祟惿畹陌l(fā)明和發(fā)現(xiàn)。目前的人工智能行業(yè)已經(jīng)具備了持續(xù)爆發(fā)性發(fā)展的環(huán)境和條件,也正處于持續(xù)上升期中。有理由去相信,這次的人工智能爆發(fā)和之前的新能源、VR以及智能硬件不同,能夠最終成長到可以改變普通人的生活的方方面面,邁出人類工業(yè)革命性的一步。
文章參考:
ü 百度百科:圖形處理器
ü 依圖科技:當(dāng)摩爾定律面臨失效,我們或許可以建立一個(gè)行星級的智能系統(tǒng)
ü 徐鑫:兩年股價(jià)漲十倍,英偉達(dá)用芯片綁架了整個(gè)人工智能圈子
ü 百度百科:戈登摩爾
ü 李賡:黃仁勛:GPU才是AI時(shí)代的摩爾定律
ü 機(jī)器之心: CVPR 2017 李飛飛總結(jié)8 年ImageNet 歷史,宣布挑戰(zhàn)賽最終歸于Kaggle
ü 快科技:數(shù)據(jù)解讀2011-2016年全球SSD發(fā)展史
ü 天空蔚藍(lán):硬盤15年發(fā)展滄桑:容量成長遠(yuǎn)勝于性能的建樹
ü 百度百科:社交網(wǎng)絡(luò)
相關(guān)新聞
廣州大麥干貨郵箱訂閱服務(wù)
免費(fèi)為您提供各類型高質(zhì)量電商干貨,方便您隨時(shí)閱讀感興趣的干貨!
輸入店鋪信息,獲取專業(yè)全方面分析
* 您的信息將被嚴(yán)格保密,請放心填寫