原創(chuàng)|行業(yè)資訊|編輯:陳俊吉|2017-12-11 10:26:22.000|閱讀 338 次
概述:伴隨著認(rèn)知計(jì)算時(shí)代的到來,如何將我們計(jì)算機(jī)的信息處理能力與人類的認(rèn)知能力相結(jié)合,從而提高我們的信息處理效率,是我們?cè)谀壳八伎嫉膯栴}。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
伴隨著認(rèn)知計(jì)算時(shí)代的到來,如何將我們計(jì)算機(jī)的信息處理能力與人類的認(rèn)知能力相結(jié)合,從而提高我們的信息處理效率,是我們?cè)谀壳八伎嫉膯栴}。本期清華大數(shù)據(jù)“技術(shù)·前沿”系列講座我們邀請(qǐng)到IBM研究院研究總監(jiān)、及計(jì)算研究方向首席數(shù)據(jù)科學(xué)家蘇中為大家?guī)眍}為《從深藍(lán)到AlphaGo,從大數(shù)據(jù)到認(rèn)知商業(yè)》的分享。
文字版干貨整理如下:
IBM研究院研究總監(jiān)蘇中
蘇中:美國(guó)的達(dá)特茅斯于61年前提出一詞,而人工智能的歷史可以向前追溯很長(zhǎng)的時(shí)間,甚至中國(guó)人發(fā)明算盤的時(shí)候就在思考將計(jì)算的機(jī)器演化成智能。這一演化進(jìn)程與人類認(rèn)識(shí)客觀規(guī)律的過程相類似。通過符號(hào)推理,人類體現(xiàn)出早期的智能行為,并認(rèn)識(shí)到世界的規(guī)則。以三段論為例,我們?cè)?認(rèn)識(shí)世界時(shí),先設(shè)定一個(gè)大前提或者一個(gè)更大的公理,而每件事情都有一個(gè)特例,根據(jù)這個(gè)公理和特例就可以推出一個(gè)結(jié)論。在很多人工智能的演化中,這方面已取得了非常大的進(jìn)步,如定理證明。
這方面的技術(shù)同樣應(yīng)用在產(chǎn)業(yè)界,以專家系統(tǒng)為例。在醫(yī)療行業(yè)中我們需要考慮一個(gè)好醫(yī)生所具備的特點(diǎn),到底是他診斷的病人比較多還是他遇到的疑難雜癥比較多?一般而言,一個(gè)疾病、一個(gè)好醫(yī)生大概可以總結(jié)為幾個(gè)類別。我們進(jìn)行數(shù)據(jù)分析通常把一個(gè)大問題劃分到一個(gè)小的問題空間,然后在小的問題空間領(lǐng)域求解。
專家系統(tǒng)采用同樣的角度,如醫(yī)療專家對(duì)一個(gè)病種的病人進(jìn)行分類,符合分類的病人具有怎樣的表征,通過什么樣的檢驗(yàn)方法得以確診,這類病人一般有幾種治療方式,其中每種治療方式對(duì)應(yīng)各自的優(yōu)缺點(diǎn),需考慮在什么情況下用什么方式治療。一般來講一個(gè)好醫(yī)生把一個(gè)病種稍微的梳理一下可能會(huì)累積幾十條規(guī)則,那么幾個(gè)醫(yī)生或幾十個(gè)該行業(yè)的專家醫(yī)生就能梳理出一個(gè)完整的知識(shí)體系,如《臨床醫(yī)療指南》。按照《臨床醫(yī)療指南》的整個(gè)流程,我們能夠很容易地確定病人該做什么樣的檢查,通過檢查能得到什么結(jié)論,得到結(jié)論以后有什么治療手法,以及在整個(gè)病程中該做一些什么樣的觀察。
這樣的專家系統(tǒng)是非常有效的,在醫(yī)療行業(yè)也有很好的應(yīng)用。但專家系統(tǒng)同樣面臨著一大挑戰(zhàn),即固化的知識(shí)體系不能應(yīng)對(duì)實(shí)際繁雜的問題。這種基于數(shù)據(jù)普適性的挑戰(zhàn)使得人工智能的發(fā)展進(jìn)入了一個(gè)瓶頸期。
的迅速發(fā)展得益于的爆發(fā),在這場(chǎng)爆發(fā)中,機(jī)器學(xué)習(xí)可以自動(dòng)地從數(shù)據(jù)里尋找規(guī)律、,規(guī)則同時(shí)隨數(shù)據(jù)的改變而自動(dòng)發(fā)生變化。由此,人工智能迅速在互聯(lián)網(wǎng)方面得以應(yīng)用,包括搜索、推薦、語音識(shí)別等等。
下棋是一個(gè)較容易驗(yàn)證計(jì)算機(jī)是否具有智能的方式,因?yàn)榭赡苤挥腥祟悤?huì)下棋,另外下棋有很多推理過程,如對(duì)于棋局的判斷等。隨著伴隨計(jì)算機(jī)習(xí)得經(jīng)驗(yàn)的增多,它的智能水準(zhǔn)就得以提高。下棋本身是相對(duì)比較容易理解的問題,因?yàn)槠宓囊?guī)則是開放的,不管是國(guó)際象棋、中國(guó)象棋、跳棋還是圍棋,規(guī)則是非常清晰的,在一個(gè)清晰的規(guī)則系統(tǒng)下,輸贏很容易判斷。
由于雙方的棋力都能在棋盤上顯示出來,再加上清晰的評(píng)價(jià)函數(shù)、規(guī)則系統(tǒng)和數(shù)據(jù),我們能比較容易地設(shè)定人工智能的系統(tǒng)。以IBM的深藍(lán)系統(tǒng)為例,當(dāng)把一個(gè)棋面變成數(shù)值時(shí),我們就可以讓機(jī)器去做搜索算法,而每一個(gè)棋子在不同方向都有被選擇的可能,就構(gòu)建出搜索素樹算法,再通過α-β剪枝的方法就可以迅速得到結(jié)論。當(dāng)時(shí)深藍(lán)就是通過這種方式對(duì)國(guó)際象棋做出很好的評(píng)估函數(shù),由于這些評(píng)估函數(shù)大多來自國(guó)際象棋大師,并且計(jì)算機(jī)算法搜索很深入,我們就可以讓計(jì)算機(jī)打敗像卡斯帕羅夫這樣的大師。
在用象棋的這種方法來解決圍棋問題時(shí)卻遇到很大的挑戰(zhàn):一是圍棋的棋盤是19乘19,有361個(gè)空間可能性,其搜索空間達(dá)2.08X10 107 ,那,那么搜索素樹就會(huì)相當(dāng)復(fù)雜;二是圍棋的每個(gè)子是一樣的,無法通過棋面盤面子粒的多少判斷它的狀態(tài);三是圍棋比賽中會(huì)出現(xiàn)一步臭棋,全盤皆輸?shù)那闆r,即圍棋的評(píng)價(jià)函數(shù)值不連續(xù),在某一點(diǎn)一個(gè)子粒的變化可以讓整個(gè)棋面的評(píng)估變得很復(fù)雜。蒙特卡羅搜索樹為解決這些問題提供了思路:雖然我們沒有辦法判斷當(dāng)前盤面的情況,但可以讓系統(tǒng)隨機(jī)下棋,拿勝率作為評(píng)估標(biāo)準(zhǔn)盤。隨機(jī)數(shù)可以從某種意義上描述評(píng)估值,從而解決怎樣評(píng)估一個(gè)棋子的問題。
當(dāng)計(jì)算機(jī)算到足夠的深度時(shí),這樣的方法會(huì)有較好的效果。但是它的速度空間還是太大,那有沒有什么辦法可以降低呢?通過深度學(xué)習(xí)的網(wǎng)絡(luò)來評(píng)估棋局就是一種好方法。我們用深度學(xué)習(xí)算法可以將評(píng)估變成一個(gè)深度學(xué)習(xí)的任務(wù),以當(dāng)前的對(duì)局作為輸入,輸出在某一點(diǎn)上的值,也可以提高預(yù)測(cè)精度。
那把蒙特卡羅搜索樹和CNN結(jié)合能產(chǎn)生什么樣的化學(xué)效應(yīng)呢?如果用神經(jīng)原網(wǎng)絡(luò)可以預(yù)測(cè)專業(yè)棋手在對(duì)局中下一步棋的位置,我們就可以讓搜索空間變小了。
AlphaGo把這個(gè)事情推到了極致,他們不光讓棋的搜索寬度變窄,更做了策略網(wǎng)絡(luò),來判斷當(dāng)前棋局黑白雙方獲勝的概率有多大,但遇到的挑戰(zhàn)是這個(gè)數(shù)據(jù)比對(duì)局的數(shù)據(jù)要少,對(duì)局的每一步都可以作為訓(xùn)練數(shù)據(jù),但輸贏一盤只有一次,訓(xùn)練數(shù)據(jù)有點(diǎn)稀疏。所以他們?cè)谶@個(gè)工作上使用了增強(qiáng)學(xué)習(xí)的方法,即讓一個(gè)戰(zhàn)斗力不錯(cuò)的系統(tǒng),或者兩個(gè)系統(tǒng)互相對(duì)戰(zhàn)產(chǎn)生對(duì)局,然后用最后的輸贏結(jié)果作為機(jī)器的樣本學(xué)習(xí)。結(jié)果就是這個(gè)系統(tǒng)戰(zhàn)勝了李世石,非常了不起。
AlphaGo zero又是一個(gè)非常重要的突破,一是 AlphaGo zero完全從零開始,二是 AlphaGo zero沒有用任何的方式評(píng)估,只用了對(duì)局本身的棋盤信息。它的輸入只有圍棋的規(guī)則,之后機(jī)器就自己跟自己下棋,以此確認(rèn)模型。在深度學(xué)習(xí)里面它把原來13層的網(wǎng)絡(luò)變成40層,而且把原來CNN的網(wǎng)絡(luò)變得更為復(fù)雜,同時(shí)把所有的人類知識(shí)都拋掉了。但在這一過程當(dāng)中,它的訓(xùn)練非常快,第三天這個(gè)系統(tǒng)跟李世石的系統(tǒng)對(duì)決可以完勝,過了21天它就打敗了戰(zhàn)勝柯潔的那個(gè)系統(tǒng)。從某種意義來講,像下棋這樣在規(guī)則明確、狀態(tài)空間有限、容易評(píng)估、所有信息透明的情況下,用增強(qiáng)學(xué)習(xí)的方法是可解的,而且它的解法可以比人做的還要好。
那這樣的方法能不能解決其他問題呢?現(xiàn)實(shí)當(dāng)中,很多問題可能沒法解。增強(qiáng)學(xué)習(xí)是大量數(shù)據(jù)的模擬,通過模擬的結(jié)果來調(diào)整參數(shù)。舉一個(gè)醫(yī)療上的例子,我們能拿一個(gè)病人去模擬嗎?給他吃不同的藥看他會(huì)發(fā)生什么問題?很難。另外,數(shù)據(jù)的來源信息不是單元的,各方面的因素都會(huì)影響到病人,如基因、飲食、生活習(xí)慣、家人、天氣等,這些因素不可能在一個(gè)簡(jiǎn)單的環(huán)境里被算出來,每多一個(gè)維度的參數(shù)都需要更多的數(shù)據(jù)來訓(xùn)練。
用多模型聚合的方法是不是可以放在行業(yè)里呢?舉個(gè)例子,比如水管的優(yōu)化問題預(yù)測(cè)。歷史上有一些數(shù)學(xué)模型來預(yù)測(cè)管道哪個(gè)地方容易發(fā)生銹蝕,我們該在哪個(gè)地方打開了去看,但用幾個(gè)模型、用不同的參數(shù)去優(yōu)化,可以取得很好的效果,而且產(chǎn)生了很大的經(jīng)濟(jì)效益。
又例如,在電商平臺(tái)上怎么提高電商的經(jīng)濟(jì)效益呢?在電商網(wǎng)站上買東西要經(jīng)過搜索、對(duì)比、加購(gòu)物車、看評(píng)論,這些步驟就是一個(gè)決策鏈,每個(gè)鏈條之間都有轉(zhuǎn)化率,我們?cè)趺刺岣唠娚痰匿N售額呢?最好的推薦算法是什么呢?在這個(gè)領(lǐng)域里面,采用協(xié)同過濾算法是最有效的。
協(xié)同過濾有一個(gè)方法是矩陣分解,我們可以把用戶作為一類,商品作為一類,比方說有6億用戶,1億商品,就是一個(gè)6億乘1億的矩陣。我們可以把這個(gè)矩陣分解成M乘K的矩陣,當(dāng)然這兩個(gè)矩陣之間不會(huì)完全一致,可能有一些像壓縮的損失。但是矩陣分解可以減小計(jì)算量,也可以根據(jù)用戶跟用戶之間的相似度、商品和商品之間的相似度做智能推薦。也就是說在這里面用一個(gè)多元K,用好多階層的K來做優(yōu)化,以達(dá)到最好的效果。
在新的時(shí)代里,由于多了數(shù)據(jù)維度,我們可以解決很多新的問題。例如皮膚癌的識(shí)別,每個(gè)醫(yī)生能看到的案例都是有限的,一個(gè)好的大夫一天可能看5個(gè)案例就已經(jīng)很了不起了。但機(jī)器可以學(xué)了幾十萬個(gè)案例以后做出判斷,這個(gè)場(chǎng)景就是拿自己手機(jī)拍了照片以后發(fā)到系統(tǒng),系統(tǒng)做出風(fēng)險(xiǎn)評(píng)估,以判斷患有皮膚癌或者黑色素瘤的概率有多大。
回到今天的主題,我們從下棋里面看到一些計(jì)算機(jī)的成長(zhǎng),包括它能用更多的數(shù)據(jù),也包括計(jì)算能力的增強(qiáng),新的算法的體現(xiàn)。如果面對(duì)的問題是可以解決的,那這些能力就可以應(yīng)用到現(xiàn)實(shí)當(dāng)中的行業(yè)里。但是現(xiàn)實(shí)當(dāng)中的問題往往比我們像下棋這樣的問題要復(fù)雜得多,所以我們講這種算法還有很長(zhǎng)的路要走。
我們很多人都在擔(dān)心機(jī)器人要替代人類的工作,但是其實(shí)機(jī)器人走路時(shí)還在以各種各樣的方式摔倒。實(shí)際上這些都是世界上最好的機(jī)器人在比賽。三年前有一個(gè)比賽,場(chǎng)景是以福島核電站的輻射場(chǎng)景作為藍(lán)圖,機(jī)器人可以開車,到達(dá)一個(gè)地方可以上樓梯,進(jìn)去以后找到閥門,關(guān)上指定的閥門。它可能會(huì)使用一些器械,包括使用電鉆等,這些都不復(fù)雜。當(dāng)年的冠軍是韓國(guó)一個(gè)大學(xué),他們做的系統(tǒng)相對(duì)來說更容易,就是四點(diǎn)著地,相當(dāng)于跪著,前面膝蓋的地方有一個(gè)像履帶的東西,所以它走路的時(shí)候像坦克車一樣行走,不容易摔倒。從某種意義上來講也驗(yàn)證了一個(gè)經(jīng)典,用最合適的方法去解決一個(gè)問題,也許成熟的技術(shù)或者是一些簡(jiǎn)單的技術(shù)在現(xiàn)實(shí)當(dāng)中更有效。
人工智能確實(shí)會(huì)有很大的發(fā)展,因?yàn)榇髷?shù)據(jù)的變化改變著很多產(chǎn)業(yè),對(duì)從金融行業(yè)到醫(yī)療行業(yè)、教育行業(yè)都有很大的幫助。人們經(jīng)常講的“人工智能威脅論”事實(shí)上有很多的局限性,無論是從應(yīng)用方法本身,還是問題本身。實(shí)際的問題很復(fù)雜,參數(shù)很多,而現(xiàn)在的方法都是簡(jiǎn)化的方法。當(dāng)我們回到真正的應(yīng)用當(dāng)中會(huì)發(fā)現(xiàn),還有很多最基本的東西需要攻克。
我們用計(jì)算機(jī)在圖象識(shí)別領(lǐng)域里面做得很好,但它仍然是有限的數(shù)據(jù)集,比方說我可以用100萬張的圖片訓(xùn)練出一個(gè)機(jī)器人識(shí)別貓,識(shí)別狗,它能做的比人還要準(zhǔn),但是如果把數(shù)據(jù)集換成漫畫,機(jī)器就識(shí)別不出來,但是孩子可以識(shí)別出來。孩子真正理解這是個(gè)蘋果,這是個(gè)小貓,那是真正的理解,而大數(shù)據(jù)的智能在某種意義上不是真正的理解。另外,智能的本身是真正了解人,人最復(fù)雜的不光是表象,還有很多情感,這對(duì)智能來說是不小的障礙。
迄今為止,我們看到智能化的門已經(jīng)打開,真正能夠改變多少,可能需要不斷的嘗試。因?yàn)椴⒉皇撬械膯栴}都可以用解決。
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn