AI史上的第一個成功的商業(yè)產(chǎn)品是怎樣誕生的?
● ● ●
2024年初,自然雜志公布了2024年重要的七項科技,其中一項是“蛋白質(zhì)序列的深度學(xué)習(xí)模型”。這起源于近來幾年谷歌公司旗下DeepMind的AlphaFold在識別蛋白質(zhì)結(jié)構(gòu)方面的重大進展,也例證了人工智能在解決復(fù)雜科學(xué)問題方面的杰出能力。
盡管AlphaFold識別蛋白質(zhì)使用的是深度學(xué)習(xí)技術(shù),但正如一條英語諺語所言:“羅馬不是一天建成的”,AI技術(shù)在幾十年的發(fā)展過程中,經(jīng)歷了一場又一場的變革之旅。從最初的“專家系統(tǒng)”的出現(xiàn),到現(xiàn)在復(fù)雜的“機器學(xué)習(xí)”模型時代,有一段長長的歷史進程。反思變革過程,回溯早期歷史,可以為充分利用人工智能的潛力來解決復(fù)雜的現(xiàn)實問題鋪平道路。因此,今天我們回顧用專家系統(tǒng)解決化學(xué)領(lǐng)域復(fù)雜問題的第一個AI模型,即1965年的DENDRAL。
圖1:自然雜志公布2024年重要的七項科技
專家系統(tǒng)是什么?
在上世紀的 60 年代初,計算機科學(xué)家埃德·費根鮑姆(Ed Feigenbaum,1936-)受到科學(xué)家思維過程的啟發(fā),開始創(chuàng)建模型來模擬專家的經(jīng)驗歸納法,這一歷程導(dǎo)致了第一個專家系統(tǒng)的誕生。費根鮑姆與1958年的生理醫(yī)學(xué)諾獎得主萊德伯格(Lederberg,1925-2008)合作,率先開發(fā)了化學(xué)領(lǐng)域開創(chuàng)性的專家系統(tǒng) DENDRAL,同時也開啟了一段專家系統(tǒng)引領(lǐng)人工智能的時代。
專家系統(tǒng)在上世紀80 年代,曾經(jīng)引領(lǐng)AI,占據(jù)AI的主導(dǎo)地位。第一個專家系統(tǒng)DENDRAL,是研究有機分子識別的工具。繼DENDRAL 之后,又有 MYCIN和CADUCEUS等醫(yī)療診斷的專家系統(tǒng)被開發(fā)出來,用戶向這些計算機系統(tǒng)描述他們的癥狀,就像向醫(yī)生描述癥狀一樣,然后,計算機返回醫(yī)療診斷。
這些專家系統(tǒng)成為改進決策的催化劑,徹底改變了行業(yè)。它們可以幫助化學(xué)家鑒定化合物,或者協(xié)助醫(yī)生診斷感染。隨著他們的成功,專家系統(tǒng)在80 年代獲得了廣泛的應(yīng)用,滲透到財富 500 強公司中并展示了一定的用處和優(yōu)越性。
之后,還有用于評估多種殘疾學(xué)生的專家系統(tǒng);澳大利亞醫(yī)學(xué)研究所開發(fā)的,可對病理實驗室的內(nèi)分泌報告提供自動臨床診斷評論的醫(yī)學(xué)專家系統(tǒng);意大利于 20 世紀 90 年代開發(fā)的監(jiān)測大壩安全的專家系統(tǒng),第一個版本于 1992 年安裝在 意大利Ridracoli 大壩上,至今仍在繼續(xù)運行。
后來,由于當年沒有高速的計算機,沒有先進的互聯(lián)網(wǎng),當然也沒有大數(shù)據(jù)的支撐。然而,盡管時機尚未成熟,人們對人工智能的期望卻過高,最終導(dǎo)致了上世紀 80 年代末被稱為“人工智能冬天”的衰退時期。專家系統(tǒng)也未能幸免于難。
不過,了解一下當年熱門的專家系統(tǒng),對深一步理解如今的AI會有所啟發(fā)和幫助。
專家系統(tǒng)(expert system)的意思與其名稱一致,是人類社會的“專家”在機器系統(tǒng)中的對應(yīng)物。
我們通常所說的人類中的專家,指的是那些擅長解決特定問題的專門人才。專家為什么能解決專門的問題呢?有3個條件:一是具有某個領(lǐng)域的專業(yè)知識,二是具有利用這些知識來進行邏輯推理的能力,最后第三條,是根據(jù)推理結(jié)果和他們的經(jīng)驗,具有作出正確決策的能力。
于是,計算機科學(xué)家便自然地想到:如果讓機器也擁有了這三種能力,不也就成為專家了嗎?有實干家們將此想法變成了現(xiàn)實,給計算機編程序,真正實現(xiàn)了這種具備“專家”功能的機器系統(tǒng)!于是,便取其名曰“專家系統(tǒng)”。
具體而言,專家系統(tǒng)是一個包括了某個領(lǐng)域的大量專門知識與經(jīng)驗的程序系統(tǒng),它應(yīng)用人工智能技術(shù)和計算機技術(shù),對這些知識和經(jīng)驗進行推理和判斷,并模擬人類專家的決策過程,模仿人類來解決所面臨的問題。
所以,專家系統(tǒng),不過是“知識就是力量”在機器智能上的具體體現(xiàn),它是早期人工智能的一個重要分支,是人工智能應(yīng)用研究中比較活躍和廣泛的課題之一。
一般來說,專家系統(tǒng)必須具備三要素:領(lǐng)域?qū)<壹壷R(知識庫);模擬專家思維,作出專家級水準的決策(推理機);問題輸入(界面);如圖2所示。
圖2:專家系統(tǒng)結(jié)構(gòu)示意圖
費根鮑姆其人
美國科學(xué)家費根鮑姆于1936年出生于新澤西州。他的父親是從波蘭移民的猶太人,但當費根鮑姆不到一歲時父親就去世了。年輕的費根鮑姆從他的繼父那兒,接觸到早期機電式計算器。繼父是一名會計,擁有一臺重型機械計算器,配有可轉(zhuǎn)動數(shù)字輪的電機,以及一個非常大的數(shù)字鍵盤。那個年代的中學(xué)生中,很少人喜歡這種龐大的計算器,但卻令費根鮑姆著迷。他曾經(jīng)吃力地將這個笨重機器搬上校車,展示給同學(xué)們看。但多數(shù)人都對此不感興趣,唯有費根鮑姆引以為傲自得其樂。之后,費根鮑姆由于對計算技術(shù)的極大好奇和癡迷,進入了卡內(nèi)基梅隆大學(xué)學(xué)習(xí)電氣工程[1]。在那里他遇到了著名的諾貝爾經(jīng)濟學(xué)獎獲得者赫伯特·西蒙(Herbert Simon,1916—2001)教授,后來又在西蒙的指導(dǎo)下于1960年獲得了博士學(xué)位。
在西蒙的指導(dǎo)下,費根鮑姆在讀博期間,實現(xiàn)了一個模擬人在刺激反應(yīng)環(huán)境中記憶單詞時的反應(yīng)的程序,叫做EPAM。這是第一個模仿人類學(xué)習(xí)能力的電腦系統(tǒng),費根鮑姆發(fā)明了動態(tài)增長的決策樹,以EPAM為題完成了他的博士論文。EPAM 通過一個簡單的模型實現(xiàn)了許多固定目標。之后,由它改進的模型結(jié)構(gòu)持續(xù)了許多年,在心理學(xué)領(lǐng)域一直活躍且富有成果。
獲得博士學(xué)位之后,費根鮑姆到英國國立物理實驗室NPL工作了一段時間,這段經(jīng)歷對他的影響很大。圖靈曾經(jīng)是NPL的研究員,在那里設(shè)計和制造了最早的計算機之一。遺憾的是圖靈早在1954年便已經(jīng)去世,費根鮑姆無緣見到圖靈,卻仍然感受到圖靈在NPL的巨大影響力。
在人工智能初創(chuàng)的第一個10年中,人們著重的是問題求解和推理的過程。費根鮑姆的重大貢獻是最早倡導(dǎo)了"知識工程",并使知識工程成為人工智能領(lǐng)域中取得實際成果最豐富、影響也最大的一個分支。
1994年,費根鮑姆因其在人工智能和智能系統(tǒng)上的顯著貢獻榮獲圖靈獎。
費根鮑姆本人,不僅是知識工程的倡導(dǎo)者,也是實踐者。他對此的早期實踐便是考慮開發(fā)一種知識密集型的,基于知識的計算機系統(tǒng)。這種程序適合于人類專家短缺或?qū)iT知識十分昂貴的的情況,可以模仿人類的專家,用比較經(jīng)濟、易于復(fù)制推廣的運行計算機程序的方法,由“專家系統(tǒng)”來完成專家才能完成的任務(wù)。如此一來,企業(yè)就不需要聘請很多有經(jīng)驗的專家,所以可以極大地減少勞務(wù)開支和培養(yǎng)費用,為用戶帶來經(jīng)濟效益。
因此,費根鮑姆如此定義專家系統(tǒng):“專家系統(tǒng)是一種智能的計算機程序,其內(nèi)部含有大量某個領(lǐng)域?qū)<宜降闹R與經(jīng)驗,能夠模擬人類專家的思維過程,求解該領(lǐng)域內(nèi)需要專家才能解決的困難問題?!?/p>
第一個專家系統(tǒng)
費根鮑姆十分欣賞他在卡內(nèi)基梅隆大學(xué)讀博的美好時光:活躍的學(xué)術(shù)氣氛,充滿創(chuàng)新和挑戰(zhàn)的環(huán)境。在那兒,費根鮑姆還有幾位良師益友:博士導(dǎo)師西蒙是AI先驅(qū),又是經(jīng)濟學(xué)諾獎得主,西蒙的學(xué)生中,還有另一位人工智能的先驅(qū)人物:紐厄爾,1975年和西蒙一起榮獲圖靈獎。博士畢業(yè)后,費根鮑姆在加州大學(xué)伯克利分校的商學(xué)院任教五年,但他對當年的伯克利缺乏計算機科學(xué)項目感到十分不滿,于是,在 1965 年,費根鮑姆穿過舊金山灣來到了斯坦福大學(xué)。
事實證明,斯坦福的環(huán)境更適合費根鮑姆的人工智能興趣,他的經(jīng)歷也說明了環(huán)境對科研的重要性,適合的環(huán)境、志同道合的合作者,會使科學(xué)家如魚得水。你別看如今AI很熱門,在60年前不是這個樣子。即使是硅谷,那年頭是晶體管和半導(dǎo)體等等公司爭奪天下的年代,此外還有處于萌芽狀態(tài)卻頗具商業(yè)潛力的集成電路。而研究人工智能的人卻沒幾個,所謂“思考機器”,實際上還只能算是少數(shù)幾位科學(xué)家深藏心中的夢。
不過,斯坦福大學(xué)別出一格,真正研究AI的人數(shù)雖然不多,但愿意朝此方向思考的人物卻不少。在約翰·麥卡錫等的帶頭倡議下,從1964 年開始,舊金山灣區(qū)少數(shù)幾個對機器智能感興趣的人,開始每月在斯坦福舉行一次聚會。
費根鮑姆十分強調(diào)“知識”對思考的重要性,到斯坦福大學(xué)后,他改變了研究方向,從計算機的認知模擬轉(zhuǎn)向工程,即對計算機進行編程,使其不僅能與人一樣聰明,而且還有可能比人聰明得多。費根鮑姆在斯坦福聚會上討論他的想法時,有幸認識了斯坦福大學(xué)遺傳學(xué)系主任萊德伯格。
圖3:費根鮑姆在卡內(nèi)基梅隆大學(xué)和斯坦福大學(xué)
約書亞·萊德伯格(Joshua Lederberg,1925-2008)是美國分子生物學(xué)家,主要研究方向為遺傳學(xué)、人工智能和太空探索。他因為發(fā)現(xiàn)細菌遺傳物質(zhì)及基因重組現(xiàn)象而獲得1958年諾貝爾生理醫(yī)學(xué)獎,那年他才33歲。
萊德伯格比費根鮑姆年長11歲,同是出生于新澤西的猶太人。他的專業(yè)是遺傳學(xué),卻曾經(jīng)對符號計算以及類似人工智能的目標有過濃厚的興趣。費根鮑姆談到他對建造人工智能系統(tǒng)的一些想法,重新燃起了萊德伯格長期以來對計算的興趣。當時費根鮑姆想選擇一個領(lǐng)域來研究科學(xué)家對知識和經(jīng)驗的推理行為,萊德伯格立即給出了一個具體建議:從質(zhì)譜中推導(dǎo)出分子拓撲結(jié)構(gòu)的任務(wù)。因為萊德伯格正在指導(dǎo)一個項目,其目標是探索火星上的生命,為此萊德伯格的實驗室正在測量氨基酸的質(zhì)譜,他認為質(zhì)譜分析是一項可以產(chǎn)生實際影響的有用的任務(wù),經(jīng)驗豐富的化學(xué)家,利用他們關(guān)于化合物的質(zhì)譜分析知識來猜測化合物的結(jié)構(gòu)。并且,萊德伯格告訴費根鮑姆,他最近開發(fā)的一種“樹突”算法,也許可以派上用場。
于是,兩人一拍即合,1965年,他們開始聚集一支出色的團隊,招募科學(xué)家及研究生參與該項目,開始了長達10年左右的DENDRAL專家系統(tǒng)開發(fā)的長期旅途。
剛得博士學(xué)位的布魯斯·布坎南(Bruce Buchanan)以及兩位碩士生首先加入其中,他們后來都在人工智能領(lǐng)域留下了自己的印記。
名為“專家系統(tǒng)”,專家的知識及經(jīng)驗積累舉足輕重,費根鮑姆認為“知識蘊含力量”,這一主題很快浮出水面,成為DENDRAL及后來的專家系統(tǒng)項目的旗幟。對DENDRAL來說,重要的是有機化學(xué)、拓撲學(xué)和質(zhì)譜方面的知識,而萊德伯格的質(zhì)譜知識還不夠,必須另請專家!
其實,需要的專家近在眼前,他們看中了萊德伯格的朋友卡爾·杰拉西。
卡爾·杰拉西(Carl Djerassi,1923—2015),是保加利亞與奧地利裔美國化學(xué)家。他最出名的貢獻是開發(fā)了口服避孕藥,但他也是一位頗有聲名的作家,是幾本科幻小說的作者。他于1978年獲得第一屆沃爾夫化學(xué)獎。杰拉西是斯坦福大學(xué)質(zhì)譜實驗室的負責人,那當然是質(zhì)譜分析領(lǐng)域?qū)<抑械膶<摇?/p>
為此兩人設(shè)計了一個“圈套”:向杰拉西演示他們構(gòu)建的DENDRAL的雛形:DENDRAL這位機器“專家”,能夠?qū)Ω逗唵蔚陌被幔?,對其他的化合物,例如酮和醇的族類,卻表現(xiàn)得無能為力。原因是顯而易見的,因為它沒有“獲取”這方面的有機化學(xué)家已經(jīng)了解的化學(xué)知識,當時的DENDRAL對這些族的質(zhì)譜幾乎一無所知。這個演示對杰拉西太有誘惑力了,他不就是這方面的專家么,于是,杰拉西欣然同意參與到項目中,使得該程序在酮和醇方面的性能顯著提高。
DENDRAL的四人團隊中,布坎南的貢獻也不容小覷,他是LISP程序?qū)<?,并且有他的特殊興趣:他希望系統(tǒng)能夠“自己做出發(fā)現(xiàn),而不僅僅是幫助人類做出發(fā)現(xiàn)”。因此,DENDRAL被設(shè)計為由兩部分組成:“Meta-Dendral”和“Heuristic Dendral“,前者是一個“假設(shè)制造者”,后者將作為知識豐富的學(xué)習(xí)系統(tǒng)的模型,可作為模板用于其他領(lǐng)域。
專家系統(tǒng)的意義
第一個專家系統(tǒng)DENDRAL誕生了,在不斷完善的過程中,該計劃處理了數(shù)百甚至數(shù)千數(shù)萬個案例[2]。DENDRAL是一個化學(xué)分析專家系統(tǒng),保存著化學(xué)家的知識和質(zhì)譜儀的知識,可以根據(jù)給定的有機化合物的分子式和質(zhì)譜圖,從幾千種可能的分子結(jié)構(gòu)中挑選出一個正確的分子結(jié)構(gòu)。不過,專家就是專家,僅僅擁有某一特定領(lǐng)域?qū)<业姆椒ê椭R。DENDRAL程序,對于某些分子家族,即使與人類的最佳表現(xiàn)相比,它也是該領(lǐng)域的專家。但是,專家不能通吃,某個領(lǐng)域的專家很難轉(zhuǎn)移到其它專業(yè)。例如,國際象棋大師不太可能是專業(yè)的代數(shù)學(xué)家或?qū)I(yè)的質(zhì)譜分析師。
DENDRAL的經(jīng)驗為下一個專家系統(tǒng)的創(chuàng)建提供了信息,MYCIN,幫助醫(yī)生診斷血液感染。因此,DENDRAL的研究成功被認為是人工智能研究的一個歷史性突破。
上世紀70-80年代,專家系統(tǒng)從實驗室出現(xiàn)并進入市場,“專家系統(tǒng)”這個短語開始流行,很快地在各個地方使用。專家系統(tǒng)成為最早真正成功的人工智能軟件形式之一,是第一個成功的商業(yè)人工智能產(chǎn)品,在許多制造業(yè)和軍隊中都發(fā)揮了作用。專家系統(tǒng)的成功不僅驗證了費根鮑姆關(guān)于知識工程的理論的正確性,還為專家系統(tǒng)軟件的發(fā)展和應(yīng)用開辟了道路,逐漸形成具有相當規(guī)模的市場,其應(yīng)用遍及各個領(lǐng)域、各個部門。
正如人工智能歷史上一次又一次的新突破一樣,專家系統(tǒng)這個“新事物”,在20世紀80年代產(chǎn)生了大量的炒作,得到一些令人興奮但卻是錯誤的預(yù)測,對其發(fā)展起了反作用。在20世紀90年代以后,“專家系統(tǒng)”一詞逐漸從IT詞典中消失,原因有多種,有人認為因為專家系統(tǒng)沒有兌現(xiàn)其過度炒作的承諾,因而成為其成功的受害者。但是實際上,早在1983年[3],費根鮑姆就發(fā)現(xiàn)了導(dǎo)致它們最終消亡的“關(guān)鍵瓶頸”,是因為“擴大知識獲取的過程非常艱苦,我們必須擁有更自動化的手段來取代目前非常繁瑣、耗時且昂貴的程序。知識獲取問題是人工智能的關(guān)鍵瓶頸問題。”
不過,正是專家系統(tǒng)的局限性,促使研究人員開發(fā)新型方法。他們開發(fā)了更高效、靈活和強大的方法來模擬人類決策過程,特別是具有反饋機制的機器學(xué)習(xí)和數(shù)據(jù)挖掘方法。
現(xiàn)代AI系統(tǒng)可以更容易地處理大量復(fù)雜數(shù)據(jù)(大數(shù)據(jù))而吸收新知識,從而進行自我更新,這些類型的專家系統(tǒng),后來被稱為“智能系統(tǒng)”。
如今,費根鮑姆期待的“知識獲取的自動化”最終實現(xiàn)了,但并不是通過他當時設(shè)想的方法,而是要歸結(jié)于“機器學(xué)習(xí)”方法的使用,尤其是在網(wǎng)絡(luò)出現(xiàn)之后,知識變成了可以通過互聯(lián)網(wǎng)及其他方式訪問的數(shù)字化實體,再通過機器學(xué)習(xí)以及近十年發(fā)展的“深度學(xué)習(xí)”方法,來挖掘和分析這些知識。所以,盡管專家系統(tǒng)這個名詞現(xiàn)在不常用,但當年發(fā)展出來的若干概念和思想,已經(jīng)融入到AI的血液里。
參考文獻:(上下滑動可瀏覽)