小受被各种姿势打桩gv视频,大胸美女被吃奶爽死视频,精品深夜AV无码一区二区,亚洲a片一区日韩精品无码

發(fā)布詢價單
您的位置:首頁 > 資訊 > 行業(yè)資訊 > 正文

尼克 | 從專家系統(tǒng)到知識圖譜

2018-01-15 07:12 性質(zhì):轉(zhuǎn)載 作者:尼克 來源:尼克
免責聲明:AGV網(wǎng)(m.xmydyc.com)尊重合法版權(quán),反對侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權(quán)均系原作者和機構(gòu)所有。文章內(nèi)容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷!)
本文節(jié)選自尼克老師的《人工智能簡史》第3章:從專家系統(tǒng)到知識圖譜。從第一個專家系統(tǒng)DENDRAL到語義網(wǎng)再到谷歌的開源知識圖譜,對知識圖譜的發(fā)展歷程進行了全面回顧和深度點評。尼...

本文節(jié)選自尼克老師的《人工智能簡史》第 3 章:從專家系統(tǒng)到知識圖譜。從第一個專家系統(tǒng) DENDRAL 到語義網(wǎng)再到谷歌的開源知識圖譜,對知識圖譜的發(fā)展歷程進行了全面回顧和深度點評。

尼克,早年曾任職哈佛和惠普;后創(chuàng)業(yè)投資,往返于大陸和硅谷。無論忙閑不忘讀書寫字,作品多發(fā)表于《上海書評》,并有著作《UNIX系統(tǒng) V內(nèi)核剖析》和《哲學評書》。

1. 費根鮑姆和DENDRAL

費根鮑姆進入卡內(nèi)基理工學院(卡內(nèi)基梅隆的前身)攻讀電氣工程(簡稱 EE)本科時才 16 歲。大三時一門“社會科學的數(shù)學模型”的課設定了他的人生軌跡,那門課的老師是司馬賀。本科畢業(yè)后他留校,在司馬賀任院長的工業(yè)管理研究生院讀博士。博士畢業(yè)后他來到加州大學伯克利分校的工商管理學院任教。他曾和師弟菲爾德曼(Julian Feldman)合編過一本論文集《計算機與思維》,這本文集的版稅后來被用來在國際人工智能聯(lián)合會(IJCAI)資助“計算機與思維”獎,這成為人工智能界給 40 歲以下青年學者最重要的獎項,初衷有點像數(shù)學界的菲爾茨獎。排在一長串獲獎人第一位的是維諾格拉德(Terry Winograd),其中還有雷納特(Douglas Lenat)、英年早逝的馬爾以及吳恩達,最新的一位(2016 年度)是斯坦福大學做自然語言處理的新秀 Percy Liang。1962 年麥卡錫從東岸的麻省理工學院搬到美麗的舊金山灣區(qū),組建了斯坦福大學計算機系。1964 年費根鮑姆響應麥卡錫的召喚,離開伯克利,到不遠處的斯坦福大學協(xié)助麥卡錫。

費根鮑姆(1936— )

1958 年李德伯格(Joshua Lederberger)獲得諾貝爾生理獎時才 33 歲,得獎的第二年,他就離開當時任教的威斯康星大學前往加州,受邀重建斯坦福大學的醫(yī)學院并擔任遺傳學系主任。那時,斯坦福大學的醫(yī)學院還在舊金山,和公立的加州大學舊金山分校一起。加州大學其他各分校沒有醫(yī)學院,舊金山分校就是整個加州大學的醫(yī)學院,直到 20 世紀 90 年代末期,斯坦福醫(yī)學院和加州大學舊金山分校分久必合,尋求合并但最終未果。話說回來,李德伯格在哥倫比亞大學讀本科時就受到“萊布尼茨之夢”的影響,企圖尋找人類知識的普遍規(guī)則。1962 年夏,李德伯格還在斯坦福計算中心聽編程的課,他上手的第一門語言是 BALGOL 。他很快就結(jié)識了剛從麻省理工學院加入斯坦福大學的麥卡錫,他們還企圖把明斯基也吸引到斯坦福醫(yī)學院。

李德伯格(1925—2008)

費根鮑姆 1964 年在斯坦福大學高等行為科學研究中心的一次會上見到了李德伯格,對科學哲學的共同愛好促成了他們漫長而富有成效的合作。那時李德伯格的研究方向是太空生命探測,更具體地說就是用質(zhì)譜儀分析火星上采集來的數(shù)據(jù),看火星上有無可能存在生命。費根鮑姆的興趣則是機器歸納法,用現(xiàn)在的話說就是機器學習。他們倆,一個有數(shù)據(jù),一個搞工具,一拍即合。從科學史的角度看,這是個跨學科的合作,李德伯格的影響力和領導力起了核心作用。按照布坎南的說法,以費根鮑姆為首的計算機團隊的任務就是把李德伯格的思路算法化。李德伯格完成哲學構(gòu)思后就興趣遷移了,他最初的想法花了費根鮑姆們 5 年的時間才得以實現(xiàn),李德伯格責怪他們太慢了。

費根鮑姆很快就發(fā)現(xiàn)李德伯格是遺傳學家,對化學其實也是一竅不通,于是他們找到同校的化學家兼作家兼口服避孕藥發(fā)明人翟若適(Carl Djerassi)幫忙。翟若適沒得過諾貝爾獎,但他得過美國國家科學獎(得獎人包括維納、哥德爾、香農(nóng)、丘成桐)和美國國家技術與創(chuàng)新獎(得獎人包括杜邦公司和 HP 創(chuàng)始人帕卡德、Intel 創(chuàng)始人諾伊斯、微軟創(chuàng)始人蓋茨),這是非常獨特的。另一位兩個獎都得過的是發(fā)明了計算機 RISC 架構(gòu)的寇克(John Cocke)。翟若適那時剛從韋恩州立大學轉(zhuǎn)到自由的斯坦福大學,李德伯格是他在加州結(jié)識的第一個朋友。三人合作的結(jié)果就是第一個專家系統(tǒng) DENDRAL。DENDRAL 輸入的是質(zhì)譜儀的數(shù)據(jù),輸出是給定物質(zhì)的化學結(jié)構(gòu)。費根鮑姆和他的學生捕捉翟若適和他的學生的化學分析知識,把知識提煉成規(guī)則。這個專家系統(tǒng)有時做得比翟若適的學生還準。在翟若適的大部頭自傳中,只有一小段提到 DENDRAL,這個項目在他成果輝煌的學術生涯和多姿多彩的生活中,實在算不上什么。翟自傳中說費根鮑姆一直把 DENDRAL 的核心稱為“翟算法”,而布坎南則記得大家都認為專業(yè)知識的提供者是李德伯格,也許是費根鮑姆圓滑,也許是計算機團隊更多地接觸李德伯格。

費根鮑姆是學術活動家,剛到斯坦福大學就擔任計算中心主任,當時這個職位比計算機系主任恐怕還更有影響力。20 世紀 60 年代初期和中期,費根鮑姆曾兩次訪問蘇聯(lián),對蘇聯(lián)的計算機科學和控制論研究印象深刻,他早就觀察到蘇聯(lián)的研究偏理論而輕實踐。但蘇聯(lián)下棋程序的勝利確實讓世界吃驚。蘇聯(lián)控制論的定義太寬泛,無所不包,其結(jié)果也沒有重點,難有突破性成果,而當時中國的自動化學科就是仿效蘇聯(lián)的。美國不存在自動化學科,無所不包的 EE 和自動化有很大交集。費根鮑姆意識到他的蘇聯(lián)同行企圖利用他的名望來為蘇聯(lián)同行背書并爭取資助。而在美國,動態(tài)規(guī)劃的發(fā)明人貝爾曼則通過軍方智庫蘭德公司給空軍建議美國應該提防蘇聯(lián)的計算機科學研究。費根鮑姆不爽貝爾曼的報告,認為這是他利用蘇聯(lián)威脅論來為自己爭取科研紅利。而若干年后,費根鮑姆卻利用日本的五代機項目宣揚日本威脅論,這不得不讓人懷疑他的動機。費根鮑姆創(chuàng)辦的數(shù)家公司因各種原因,都沒有大的成功。其中 Teknowledge 公司沒成,倒是副產(chǎn)品、知識庫項目 SUMO 留了下來,現(xiàn)在開源了,成為幾大基礎的常識知識圖譜之一。

2. MYCIN

MYCIN 的牽頭人布坎南也是 DENDRAL 的核心成員。布坎南是哲學出身,興趣廣泛。1964 年,在密執(zhí)安州立大學學哲學的布坎南想在系統(tǒng)開發(fā)公司(SDC)找份夏季實習的工作,沒曾想 SDC 居然把他的簡歷發(fā)給了蘭德公司,敢情國防口的簡歷也共享。當時在蘭德做夏季工作的費根鮑姆給布坎南打了個電話,于是布坎南到蘭德公司實習并和費根鮑姆結(jié)緣。布坎南的研究方向是科學發(fā)現(xiàn),他走的是邏輯路數(shù)而不是心理路數(shù),沒曾想費根鮑姆也對科學哲學興趣濃厚。事實上,費根鮑姆和李德伯格最早關于 DENDRAL 的文章中提到了“機械化科學推理”(mechanizing scientific inference)的概念。布坎南博士畢業(yè)后想去教哲學,請費根鮑姆寫推薦信,但費說服布坎南到斯坦福大學和他一起搞真正的科學發(fā)現(xiàn)。布坎南的哲學背景幫助了他,在 DENDRAL 項目的開頭,李德伯格和費根鮑姆都沒想到假設生成和理論生成的區(qū)別,同時布坎南也意識到他在哲學課堂里學到的卡爾納普理論在計算上行不通。整個 DENDRAL 團隊中沒有一個人對其中涉及的化學知識有全部的了解,每個人都假設其他人知道。布坎南早期的演講開頭都得講點化學背景知識,聽眾聽不懂也不耐煩,他記得有一次是麥卡錫站出來對聽眾大喊:“你們就不能好好聽著嗎?”(Just listen,will you?)麥卡錫的威望為他解了圍。

DENDRAL 獲得成功后,布坎南開始尋找新的方向。實驗科學與理論科學比較,是相對原始的,原始經(jīng)驗也相對容易轉(zhuǎn)換成規(guī)則。除了化學和生物學,醫(yī)學是另一個可以馬上利用專家系統(tǒng)的領域。此時的斯坦福醫(yī)學院來了一位從哈佛大學本科數(shù)學畢業(yè)的高才生肖特萊福(Edward Shortliffe),他 1976 年在斯坦福醫(yī)學院拿到醫(yī)學學位 M.D.,但一年前在布坎南的指導下,他已經(jīng)獲得了計算機科學的博士,論文就是專家系統(tǒng) MYCIN,一個針對細菌感染的診斷系統(tǒng)。MYCIN 的處方準確率是 69%,當時專科醫(yī)生的準確率是 80%,但 MYCIN 的成績已經(jīng)優(yōu)于非本專業(yè)的醫(yī)生。肖特萊福因此獲得 1976 年 ACM 為青年計算機科學家設立的霍普(Grace Murray Hopper)獎。肖特萊福隨后去麻省總醫(yī)院做了三年內(nèi)科住院醫(yī)生,1979 年回到斯坦福大學兼任醫(yī)學院和計算機系的教授。

MYCIN 團隊認為 DENDRAL 是專家系統(tǒng)的始祖,這一方面考慮了 DENDRAL 的時間點確實更早,另一方面布坎南本身就出自 DENDRAL。但紐厄爾,作為外人,卻認為 MYCIN 才是專家系統(tǒng)的鼻祖,因為 MYCIN 首創(chuàng)了后來作為專家系統(tǒng)要素的產(chǎn)生式規(guī)則:不精確推理。DENDRAL 的初衷則是從專家采集來的數(shù)據(jù)做機器歸納,或者說機器學習。雖然 MYCIN 從來沒被臨床使用過,但 MYCIN 的開發(fā)原理后來逐步被提煉成為專家系統(tǒng)核心 EMYCIN 的基礎。EMYCIN 的動機是兩方面的,除了通用化外,政府資助也是一個原因。20 世紀 70 年代初,DARPA 削減對人工智能的資助,原來的長期資助改為每年評審。每次向 DARPA 匯報時,費根鮑姆團隊都得事先對詞,他們不敢說研究經(jīng)費被用來做醫(yī)學相關的研究。直到后來他們拿到美國國家健康研究院(NIH)和美國國家醫(yī)學圖書館(NLM)的資助,情況才有所好轉(zhuǎn)。


3. 專家系統(tǒng)的成熟

一個領域成熟與否的主要測度之一是賺不賺錢。人工智能沒有商業(yè)應用一直是被批評的原因之一。專家系統(tǒng)時代最成功的案例是 DEC 的專家配置系統(tǒng) XCON。DEC 是 PC 時代來臨之前的寵兒,他們用小型機沖擊 IB+M。當客戶訂購 DEC 的 VAX 系列計算機時,XCON 可以按照需求自動配置零部件。從 1980 年投入使用到 1986 年,XCON 一共處理了八萬個訂單。

XCON 到底為 DEC 省了多少錢一直是個謎,最高的說法是一年省四千萬美元,還有的說法是兩千五百萬,最低的說法是頂多幾百萬。無論如何,DEC 是把 XCON 當作商業(yè)成功來宣傳的。XCON 確實體現(xiàn)了技術的進步,其起源是卡內(nèi)基梅隆的 R1。說來也有意思,最早的 XCON 居然是用 Fortran 語言寫的,失敗后居然令人發(fā)指地改用 BASIC 語言。紐厄爾的博士生 Charles Forgy 發(fā)明了 Rete 算法和 OPS 語言,極大地提高了專家系統(tǒng)的效率,XCON 迅速采用 OPS 和隨后的 OPS5。

20 世紀 80 年代初到 20 世紀 90 年代初,專家系統(tǒng)經(jīng)歷了十年的黃金期,隨著日本五代機的幻滅,“專家系統(tǒng)”變成了一個不僅不時髦,反而有負面含義的詞。互聯(lián)網(wǎng)催生的電子商務,有很多和 XCON 類似的應用場景,于是新瓶裝舊酒,專家系統(tǒng)搖身一變,改名規(guī)則引擎,成為中間件的標配。征信、反欺詐和風險控制一直是規(guī)則系統(tǒng)擅長的領域,征信公司 FICO 收購了一系列一直茍延殘喘的專家系統(tǒng)公司,包括 Forgy 的 RulesPower。目前已經(jīng)很少有獨立的專家系統(tǒng)公司了。

4. 知識表示

知識表示一直是人工智能不溫不火的一個領域,催生者是專家系統(tǒng)和自然語言理解。KRL(Knowledge Representation Language)是最早的知識表示語言之一,有影響但不成功。參加過施樂實驗室(XEROXParc)KRL 項目的維諾格拉德在多年后總結(jié)教訓時說,KRL 要同時解決兩個問題:第一,知識工程師的可用性,也就是說人可讀可寫;第二,得有底層的麥卡錫風格的邏輯來支撐語義。要同時解決這兩個互相矛盾的問題,必然導致結(jié)果太復雜,四不像,知識工程師和邏輯學家都不買賬。

邏輯

邏輯是最方便的知識表示語言,從亞里士多德開始人們就熟悉,邏輯同時具有各種數(shù)學性質(zhì)。任何一本邏輯入門書都會有那個著名的蘇格拉底的例子:人必有一死,蘇格拉底是人,所以蘇格拉底必死。這個三段論表示成現(xiàn)代的數(shù)理邏輯就成了如下形式。

大前提和小前提:(?x) Man(x) ? Mortal(x) & Man(Socrates)

結(jié)論:Mortal(Socrates)

一階邏輯也稱謂詞邏輯,是希爾伯特簡化羅素的《數(shù)學原理》中邏輯的結(jié)果。謂詞邏輯沒有本體,也就是沒有關于特定世界的公理。也正因此,哲學家、邏輯學家蒯因把邏輯等同于一階邏輯。一階邏輯只是語法,沒有本體,沒有語義;而高階邏輯,在蒯因的眼里,其實是“披著偽裝的集合論”(set theory in disguise)。費根鮑姆所謂的知識就是本體。當然,費根堡姆不是從邏輯的角度而是從心理的角度看問題,這顯然受到他的老師紐厄爾和司馬賀的影響。

可計算性和計算復雜性理論與邏輯密不可分。一階邏輯是不可判定的,命題邏輯的可滿足性問題是 NP 完全的。知識表示的一個核心問題是找到一個一階邏輯的子集,它是可判定的,并且盡可能地有效。描述邏輯應運而生。描述邏輯可以表達實體和類以及類和類之間的關系。描述邏輯中的實體就是一階邏輯中的常量。實體的表示在描述邏輯中也稱 Abox,例如“牛頓是物理學家”可以表示為:

Physicist(Newton)

描述邏輯中不需要變量,描述邏輯的術語更像是集合論,類和類之間的關系也稱 TBox。例如,在一個本體中,律師事務所(Lawfirm)是公司(Company)的子集,公司是組織(Organization)的子集,組織是 Agent 的子集,Agent 是 Thing 的子集,這樣一系列關系可以表示為:

律師事務所 ?公司 ?組織?Agent ?Thing

其對應的一階邏輯表達式為:    Lawfirm(x) → Company(x), Company(x) → Agent(x) ,    Agent(x) → Thing(x)

一階邏輯的定理證明的 Term Index 技術中有 Subsumption 的概念,表示 Term 之間的集合從屬關系。Tbox 表達了一種簡化的 Subsumption。除了 ABox 和 TBox,還有 RBox 表示關系或者角色,關系之間可以有集合論中常有的子集、交集、并集等操作,例如“父親的父親是祖父”可表示為:has Father ? has Father ? has GrandFather其對應的一階邏輯表達式為:

has Father(x, y ) ∧ has Father(y, z) → has GrandFather(x, z)

心理學和語言學

知識表示的另一個來源是心理學和語言學,例如概念的上下位繼承關系最方便的表示方式是樹而不是一階邏輯。心理學實驗表明人在回答“金絲雀會飛嗎?”要比回答“鳥會飛嗎?”花的時間長,要回答第一個問題,人要再做一次“金絲雀是鳥”的推理。因為人在存儲知識時只存儲抽象的,這是空間經(jīng)濟的考慮。心理學家米勒和喬姆斯基等一起開拓了認知科學,他最出名的論文大概就是那篇“魔力數(shù)字七”(The Magic Number Seven)。他除了理論的貢獻,晚年帶領普林斯頓大學的認知科學實驗室同仁做了“詞網(wǎng)”(WordNet)。WordNet 不單是一個同義詞辭典,還定義了詞的上下位關系,例如,car 的一種上位是 motor,可以再上位到 wheeled vehicle,直到 entity。WordNet 成為自然語言處理的基本工具。

圖WordNet

明斯基的框架

框架(Frame)就是類型。金絲雀是鳥,所有鳥的性質(zhì)自動流傳給金絲雀,鳥能飛,金絲雀也能飛。蘋果手機是手機,手機能打電話,蘋果手機也能打電話。框架導致了面向?qū)ο螅∣O,Object-Oriented)的設計哲學,相關的程序設計語言都受此影響。從這個意義上還真驗證了:當一個概念有了成熟的實現(xiàn)時,就自動脫離了人工智能。差不多同時出現(xiàn)的語義網(wǎng)絡(Semantic Net,注意這個和后面講到的 Semantic Web 相關但不同)是與框架等價的表示方式。語義網(wǎng)絡中的每個節(jié)點就是一個框架,每個節(jié)點上的邊可以看作一個 slot。

Sowa 的概念圖

IBM 的索瓦(John Sowa)在 20 世紀 80 年代初提出“概念圖”(Conceptual Graph),企圖把知識表示奠定在更加堅實的數(shù)學和邏輯基礎上。大約同時或稍早,德國數(shù)學家威勒(Rudolf Wille)提出基于代數(shù)的“形式化概念分析”(Formal Concept Analysis)。程序設計語言理論也變得越發(fā)嚴謹。在概念圖中,多重繼承的類型層次(Muliple Inheritance)可以用代數(shù)的偏序關系“格”(Lattice)來表示。“全序”關系(total-order)是“偏序”的一個特例。一個全序集中的成員要么是 a<=b,要么是 b<=a。偏序關系容許一個成員可以有多個上級,也可以有多個下級。而全序集中,每個成員只能有一個上級和一個下級,所以,全序關系有時也被稱為線性關系。當用“格”做知識表示時,每個概念就是“格”中的一員,概念之間服從偏序關系。多重繼承的 OO 都是偏序關系。

5. 雷納特和大知識系統(tǒng)

在日本五代機項目帶來的狂潮中,美國政府決定聯(lián)合多家高技術企業(yè)在得克薩斯大學奧斯汀分校所在地建立微電子與計算機技術公司(MCC,Micro electronics and Computer Technology Corporation)以抗衡日本,海軍上將英曼(Inman)被任命為 CEO,當時在奧斯汀分校從事機器定理證明的資深教授布萊索(Woody Bledsoe)全職加入 MCC 負責研發(fā)。這讓人想起二戰(zhàn)時曼哈頓工程中格里菲斯將軍和奧本海默的分工。費根鮑姆提議建立美國的國家知識技術中心(National Center for Knowledge Technology),像狄德羅創(chuàng)建百科全書一樣,把人類有史以來的知識建庫,這自然對 MCC 的計劃也有很大影響。布萊索向英曼推薦了費根鮑姆的學生雷納特(Douglas Lenat)。

雷納特此時 30 出頭,是人工智能領域的一顆新星。他在賓夕法尼亞大學得了數(shù)學和物理雙學位后又拿了個數(shù)學碩士,畢業(yè)后他對數(shù)學和物理的學術工作都失去了興趣,但他畢業(yè)馬上就面臨征兵,只得又跑到加州理工學院接著讀博士。期間他對人工智能產(chǎn)生了強烈興趣,遂轉(zhuǎn)學到斯坦福大學想跟隨麥卡錫,但正趕上麥卡錫的學術休假年,于是他變成了費根鮑姆和布坎南的學生。他的博士論文實現(xiàn)了一個稱作 AM 的程序,為此,IJCAI 在他博士畢業(yè)第二年就給了他一個“計算機與思維”大獎。AM 就是自動數(shù)學家(Automated Mathematician)的簡稱,它可以自動“發(fā)現(xiàn)”定理。雷納特沒有用“發(fā)明”這個詞,從某種意義上體現(xiàn)了他的哲學立場。在經(jīng)受了一連串關于 AM 不嚴謹?shù)呐u之后,雷納特推出了 AM 的后繼 Eurisko。Eurisko 的應用領域更加廣泛,包括博弈。

雷納特(1950— )

當雷納特來到 MCC 時,他已經(jīng)有了一個新的想法:把人類的常識編碼,建成知識庫。這個新項目叫 Cyc,這三個字母取自英文單詞“百科全書”(encyclopedia)。這其實就是最早的知識圖譜。雷納特堅定地支持他老師費根鮑姆的知識原則(Knowledge Principle):一個系統(tǒng)之所以能展示高級的智能理解和行為,主要是因為在所從事的領域所表現(xiàn)出來的特定知識:概念、事實、表示、方法、比喻以及啟發(fā)。雷納特甚至說:“智能就是一千萬條規(guī)則。”

索瓦提出“知識湯”(knowledge soup)的說法:我們腦子里的知識不是一坨知識,而是好幾坨知識,每一坨內(nèi)部是一致的,但坨和坨之間可能不一致,坨和坨之間是松散耦合的。古哈(Guha)在斯坦福大學的博士論文導師是麥卡錫和費根鮑姆,他的論文講的是如何將一個大理論分解為多個“微理論”(microtheory),如何利用 Cyc 作為多個不同數(shù)據(jù)源的前端而不是全部,這恰是索瓦的“知識湯”的實現(xiàn)。Cyc 由此可成為數(shù)據(jù)或信息整合的工具。雷納特對此有點不爽,但他還是把古哈招到了門下。

雷納特對 Cyc 自視甚高。他 1984 年時曾預言 15 年后,也就是 1999 年,每臺馬路上賣的電腦里都得預裝 Cyc。1986 年,雷納特再度預言:Cyc 如果可用的話,至少要有 25 萬條規(guī)則,這至少要花 350 個人年,也就是 35 個人干十年。Cyc 項目開始時有 30 個左右的知識工程師,他們每天的工作就是利用 Cyc 的語言 CycL 把日常生活的常識編碼,這包括教育、購物、娛樂、體育等。到了 1995 年,日本的五代機項目煙消云散,美國政府也削減了對 MCC 的支持。雷納特帶著 Cyc 離開 MCC,成立 Cycorp 公司,開始了漫長的創(chuàng)業(yè)路程。核心骨干古哈離開 MCC,先后加入了蘋果、網(wǎng)景和谷歌三家公司。

倒是 WordNet 在各種版本的 Linux 配置的 App Center 里很容易找到。WordNet 比 Cyc 更基本也更好用,當然 WordNet 沒有 Cyc 那么多的推理功能。再過 50 年,人們對一階邏輯也不會像對莎士比亞那么熟。也許 WordNet 并不是一個好的例子。Cyc 的原始目標更像是當今的維基百科,不過維基百科的受眾是人,Cyc 的用戶是機器。Cyc 在 20 世紀 90 年代初期就被批評說沒有成功案例,而當時的其他專家系統(tǒng)都有或多或少的應用。雷納特辯解道,Cyc 只有在知識量突破臨界點(critical mass)之后才能帶來收益。現(xiàn)在離開那時的批評,已經(jīng)又過去了 20 多年。我們還是看不到可觀的應用。

Cyc 現(xiàn)在有兩個版本:企業(yè)版和研究版。企業(yè)版收費,研究版對研究人員開放。曾經(jīng)有一個開源的 OpenCyc,是一個簡版,但試用中發(fā)現(xiàn) OpenCyc 引發(fā)的問題太多,被停掉了,Cyc 正在準備用一個云版代替 OpenCyc。雷納特曾說:“學習只在已知事物的邊緣發(fā)生,所以人們只可能學到與自己已知相似的新東西。如果你試圖學習的東西與你已知的東西距離不遠,那么你就能學會。這個邊緣的范圍越大(你已知的東西越多),就越有可能發(fā)現(xiàn)新的東西。”這不僅是他早期研究機器學習的感悟,也可以看作他對后來 Cyc 項目的體會。1984 年雷納特開始 Cyc 項目時,才 30 歲出頭,現(xiàn)在 30 多年過去了,他已經(jīng)年近 70 歲,仍然擔任 Cycorp 的 CEO。

6. 語義網(wǎng)

由專家系統(tǒng)一脈相傳的這一派自身的邏輯功力不夠,他們一直在和定理證明派掐架;另一方面,他們的工程實踐又略顯欠缺。專家系統(tǒng)風過了后,他們變成了暗流,直到歪打正著的萬維網(wǎng)支持者之一伯納斯?李(Tim Berners-Lee)提出“語義網(wǎng)”(Semantic Web,見 Berners-Lee 2001),他們認為機會來了。伯納斯?李因為草根且便捷的 HTTP 協(xié)議和超文本鏈接標準 HTML 出了名,被各種媒體稱為萬維網(wǎng)的發(fā)明人。第一波互聯(lián)網(wǎng)熱之后,他馬上離開歐洲粒子中心,到麻省理工學院新創(chuàng)辦的萬維網(wǎng)協(xié)會(W3C)擔任理事長。麻省理工學院給他在當時的計算機科學實驗室(現(xiàn)已合并為 CSAIL 計算機科學與人工智能實驗室)謀了個位置,顯然目的是提高學院在互聯(lián)網(wǎng)大潮中的影響力。互聯(lián)網(wǎng)熱拉大了美國科技創(chuàng)新之都硅谷和麻省理工學院所在波士頓 128 公路之間的距離。20 年后,伯納斯?李不負所望,得了 2016 年圖靈獎,這大概是圖靈獎有史以來含金量最低的一個。

其實萬維網(wǎng)更大的功勞應該算在天才程序員安德森(Marc Andreessen)的頭上,是革命性的 Mosaic 瀏覽器帶來了互聯(lián)網(wǎng)革命。年輕的安德森志在改變世界,而不是徒得虛名。在克拉克(Jim Clark)的指點和幫助下創(chuàng)辦了互聯(lián)網(wǎng)標志性企業(yè)“網(wǎng)景”后,他又經(jīng)歷了幾次艱難但不是特別成功的創(chuàng)業(yè)。在第二次互聯(lián)網(wǎng)高峰來臨時,安德森與時俱進地創(chuàng)辦了新一代風險投資公司安德森?霍洛維茨 ,成果和影響力直追老牌風投 KPCB 和紅杉資本。

話說回來,得益于 20 世紀 80 年代就已成熟的 SGML 標準,超文本鏈接標準 HTML 是 SGML 的某種不夠深謀遠慮的簡化版。而 HTTP 頂多算掛在瀏覽器偉岸身軀上的一個可有可無的小玩具,直到互聯(lián)網(wǎng)標準化組織 IETF 對 HTTP 做了幾次修改之后,HTTP 才更像是個專業(yè)的東西。萬維網(wǎng)協(xié)會(W3C)的目的是為萬維網(wǎng)設立標準。伯納斯?李身邊一下子聚集了一幫多年不得志的非主流 IT 從業(yè)者。他們在 W3C 中提出的幾個亂七八糟的標準確實體現(xiàn)出他們的理論功底之缺乏。在 W3C 的各種會中經(jīng)常會見到各大技術公司中游離于邊緣的資深從業(yè)者,有些人換了工作還是代表不同的公司參加各種標準化組織的工作組會議,他們的職業(yè)生涯不是為了做出技術貢獻,而是不斷為自己的存在找各種高尚的理由并脫離公司的管理體制。2006 年美國人工智能年會(AAAI)上,在伯納斯 - 李的主題發(fā)言之后,時任谷歌研發(fā)總監(jiān)的諾維格(Peter Norvig)尖銳地發(fā)問,被人認為是毫不留情地批評了語義網(wǎng)。

W3C 語義網(wǎng)的工作后來在一些準邏輯學家加入后引入了描述邏輯,變得貌似嚴格起來,經(jīng)過幾次迭代后演化成大雜燴,理論上不嚴謹,實踐中不可用。所謂“萬事開頭難”,但開了一個壞頭,則是災難,為后人修正制造了人為障礙。我們可以把語義網(wǎng)的工作與早期的 DENDRAL 和 MYCIN 做個對比,很明顯,無論理論、實踐還是人文社會政治環(huán)境,都不可同日而語。幾乎每個“語義網(wǎng)”的項目都能看到古哈的影子,2013 年他還在谷歌時曾有個演講“隧道深處見到光”(Light at the End of the Tunnel),與其說是夸耀成功,倒不如說是總結(jié)教訓。

7. 谷歌和知識圖譜

在維基百科的同時,還有個 Freebase。維基百科的受眾是人,而 Freebase 則強調(diào)機器可讀。2016 年維基百科達到 1000 萬篇文章,其中英文版達到 500 萬篇文章,而 Freebase 有 4000 萬個實體表示。Freebase 的背后是一家名叫 Metaweb 的創(chuàng)業(yè)公司,創(chuàng)始人之一是希利斯(Danny Hillis)。2010 年 Metaweb 被谷歌收購,谷歌給它起了個響亮的名字“知識圖譜”。2016 年谷歌對 Freebase 停止更新,把所有數(shù)據(jù)捐給維基數(shù)據(jù)(Wikidata)。維基數(shù)據(jù)是維基百科的母公司 Wikimedia 的德國分部的項目,得到了微軟創(chuàng)始人艾倫出資創(chuàng)辦的艾倫人工智能研究所的支持。

除了維基數(shù)據(jù)之外,另外還有幾個開源的知識圖譜,如 DBpedia、Yago、SUMO 等。值得一提的是,SUMO 是費根鮑姆創(chuàng)辦的一家失敗的公司 Teknowledge 的遺產(chǎn)。所有開源的知識圖譜的基礎數(shù)據(jù)的重要來源之一都是維基百科。以維基百科中居里夫人的詞條為例,在“居里夫人”頁面的右邊,有個被稱為 infobox 的框,里面包含了居里夫人的數(shù)據(jù),例如她的生日、卒日、出生地、母校、老師、學生等,這些數(shù)據(jù)已經(jīng)接近結(jié)構(gòu)化的質(zhì)量。

維基百科中“居里夫人”詞條

IBM 沃森的底層就整合了兩個開源知識圖譜 Yago 和 DBpedia。在常識圖譜的上面還可以構(gòu)建垂直領域(例如生物、健康、金融、電商、交通等)的專業(yè)圖譜。

紐厄爾和司馬賀在人工智能中是符號派。其實,符號派中也派中有派,比司馬賀一支更加“符號”的是機器定理證明,紐厄爾和司馬賀的早期生涯曾和一幫邏輯學家結(jié)下梁子,而費根鮑姆繼承了老師的基因,對定理證明的第二代代表人物阿蘭?羅賓遜極盡攻擊之能事。明尼蘇達大學巴貝奇研究所做口述歷史的諾伯格在采訪各位人工智能前輩時,總想把符號派歸結(jié)到麻省理工學院和卡內(nèi)基梅隆大學之爭,而在斯坦福大學的麥卡錫和 SRI 的尼爾森偏麻省理工學院,同在斯坦福大學的費根鮑姆則偏自己的母校卡內(nèi)基梅隆大學。當然我們還可以溯源到更早的達特茅斯會議上麥卡錫和司馬賀結(jié)下的梁子。但歸根結(jié)底,專家系統(tǒng)的理論基礎依然是機器定理證明。盡管費根鮑姆從某種意義上人造了“知識與推理”的對立話題,并強調(diào)知識對于邏輯推理的重要性,但知識和推理是不可分割的一對,強調(diào)知識并不能讓你脫離符號派。如果從純粹的定理證明的角度簡單地看專家系統(tǒng),所謂知識其實就是公理,公理越多,推理的步驟自然就會越少。所謂知識和推理的對立,其實是狹義(特殊目的)和廣義(通用)的區(qū)別。知識是狹義的,推理是廣義的,因為不需要過多的公理。狹義對機器的短期實現(xiàn)高效,但人的學習門檻較高;而廣義對機器的實現(xiàn)自然低效,但人學習的門檻較低。一階邏輯的學習門檻最低,但當知識庫變大,推理引擎也得變得更加專用才能高效。


來源:開放知識圖譜

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

  • “智慧鯨群”馳騁洋山!上海尚東集裝箱碼頭第六批AGV項目順利發(fā)運
    5月31日,正值端午時節(jié),上海尚東集裝箱碼頭第六批AGV項目順利發(fā)運,設備將投入使用于世界單體規(guī)模最大的自動化集裝箱碼頭——洋山四期碼頭。與前五批設備相同,第六批AGV采用了振華重工首創(chuàng)的高效...

    2025-06-05 11:44

  • 車間新來了兩個“AI智能工友”
    “智能AI叉車機器人可在無人值守的狀態(tài)下完成上下貨工作。”近日,在物資裝備公司配件倉庫,一場別開生面的“智能倉儲 AI助力”雙創(chuàng)發(fā)布會正在火熱進行中。隨著物資裝備公司楊帆勞模創(chuàng)新工作室負...

    2025-06-03 18:34

  • 文昌電廠:打造智能倉庫 讓倉儲管理提“智”增效
    4月,經(jīng)過星級倉庫現(xiàn)場評定,海南分公司文昌電廠倉庫被集團公司評定為“五星級倉庫”。走進這座“五星級倉庫”,WMS智能倉庫管理系統(tǒng)正化身“指揮官”調(diào)度著“智能倉儲員工”們有條不紊地進行著物...

    2025-06-03 18:33

  • 中國AGV網(wǎng)本周熱點回顧(2025年5月26日-5月31日)
    AGV網(wǎng)(m.xmydyc.com)是中國自動導航機器人(AGV)和自主移動機器人(AMR)行業(yè)網(wǎng)站!團隊擁有超過23年的行業(yè)垂直門戶運營經(jīng)驗,多年來見證了傳統(tǒng)內(nèi)部物料搬運從粗放化、低效率沿著更加智能化、...

    2025-06-03 18:30

  • 上海“智”造先鋒:AI重構(gòu)工業(yè)新范式下的柔性生產(chǎn)
    在上海長寧區(qū)的黑湖科技展廳里,一塊實時刷新的電子屏上跳動著數(shù)萬家工廠的生產(chǎn)數(shù)據(jù)——某食品企業(yè)的餃子皮切割模具利用率因AI工藝優(yōu)化提升23倍,某新能源車企的訂單響應時長通過智能排產(chǎn)縮短至原...

    2025-05-28 21:29

  • 強省會 拼經(jīng)濟 | “貴安造”機器人實現(xiàn)全線投產(chǎn)
    近日,貴安新區(qū)威邁爾科技有限公司四條智能產(chǎn)線全線投產(chǎn)。作為智能制造領域的新銳企業(yè),該公司從首臺機器人下線到全線投產(chǎn)僅用時三個月,跑出了產(chǎn)業(yè)發(fā)展"加速度"。走進貴安新區(qū)威邁爾科技有限公司...

    2025-05-28 21:24

  • 南京市創(chuàng)新產(chǎn)品巡展——智能制造裝備、軌道交通產(chǎn)業(yè)類32|電力行業(yè)室內(nèi)智能操作機器人
    1. 公司簡介億嘉和科技股份有限公司在2018年6月在上海證券交易所A股主板上市(股票代碼603666),公司踐行“應用智能科技 改善人類生活”的企業(yè)使命,聚合全球創(chuàng)新,以特種機器人研發(fā)為切入點,...

    2025-05-28 21:20

  • 中國AGV網(wǎng)本周熱點回顧(2025年5月19日-5月24日)
    AGV網(wǎng)(m.xmydyc.com)是中國自動導航機器人(AGV)和自主移動機器人(AMR)行業(yè)網(wǎng)站!團隊擁有超過23年的行業(yè)垂直門戶運營經(jīng)驗,多年來見證了傳統(tǒng)內(nèi)部物料搬運從粗放化、低效率沿著更加智能化、...

    2025-05-26 18:37

  • 中國自動化碼頭效率再次刷新世界紀錄
    5月22日,歷時10小時35分鐘,隨著“凱普圣拉薩羅”輪最后一個集裝箱完成裝卸作業(yè),山東港口青島港自動化碼頭以橋吊平均單機作業(yè)效率62.62自然箱/小時的優(yōu)異成績,第十三次刷新全球自動化集裝箱碼頭...

    2025-05-26 18:35

  • 數(shù)智工廠×智慧物流:LET 2025物流展今日正式開幕
    中國AGV網(wǎng)(m.xmydyc.com/)新聞中心2025年5月21日,備受業(yè)界矚目的中國(廣州)國際物流裝備與技術展覽會(LET 2025)在廣州·中國進出口商品交易會展館D區(qū)盛大啟幕!作為華南地區(qū)規(guī)模最大、...

    2025-05-22 13:30

關注官方微信

手機掃碼看新聞

主站蜘蛛池模板: 资兴市| 辽阳县| 白河县| 故城县| 赞皇县| 体育| 铜陵市| 普兰县| 建昌县| 漳州市| 嘉黎县| 台州市| 定襄县| 正定县| 广西| 天柱县| 龙南县| 五峰| 罗江县| 渝中区| 渝中区| 余姚市| 晋中市| 从江县| 高碑店市| 平果县| 彩票| 阜宁县| 南部县| 南岸区| 凯里市| 乌鲁木齐县| 榆树市| 名山县| 安龙县| 深圳市| 兴文县| 永泰县| 黔南| 美姑县| 保山市|