非凡的人工智能(AI)已經(jīng)進(jìn)入我們的生活。在象棋、圍棋或者解決預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等深?yuàn)W的科學(xué)問(wèn)題方面,計(jì)算機(jī)的能力遠(yuǎn)遠(yuǎn)超過(guò)人類(lèi)。但人類(lèi)還擁有一項(xiàng)它們遠(yuǎn)遠(yuǎn)沒(méi)有掌握的超能力:心理分析。 人類(lèi)擁有推斷他人目標(biāo)、欲望和信念的不可思議的能力,這項(xiàng)重要技能意味著我們可以預(yù)見(jiàn)他人行為和自身行為的后果。心理分析對(duì)人類(lèi)來(lái)說(shuō)很容易。如果AI要在日常生活中變得真正有用——與我們進(jìn)行有效合作,例如,就自動(dòng)駕駛汽車(chē)而言,知道一個(gè)孩子可能會(huì)跟著球跑到路上——那么它們就需要建立類(lèi)似的直覺(jué)能力。 麻煩在于,這要比訓(xùn)練一位國(guó)際象棋大師難得多。因?yàn)槿祟?lèi)行為具有不確定性,這需要靈活的思考,而這對(duì)AI來(lái)說(shuō)往往很難。但最近的一些研究成果,包括有證據(jù)表明,ChatGPT背后的AI能理解別人的觀點(diǎn),說(shuō)明有社交能力的機(jī)器不是白日夢(mèng)。更重要的是,這可能是朝著更宏偉的目標(biāo)邁出的一步——擁有自我意識(shí)的人工智能。 美國(guó)哥倫比亞大學(xué)的霍德·利普森說(shuō):“如果我們希望機(jī)器人或所有AI無(wú)縫融入我們的生活,那么我們就必須解決這個(gè)問(wèn)題。我們必須給它們這份進(jìn)化賦予人類(lèi)的禮物,即讀懂別人的心思。” 心理學(xué)家把理解他人心理狀態(tài)的能力稱(chēng)為心智理論。美國(guó)加利福尼亞大學(xué)伯克利分校的艾莉森·戈普尼克說(shuō),在人類(lèi)身上,這種能力在很小的時(shí)候就開(kāi)始形成。人類(lèi)到了5歲左右,就擁有推斷他人想法的高級(jí)能力。 理解人類(lèi) 不過(guò),人們還不清楚如何在機(jī)器中復(fù)制這些能力。問(wèn)題之一在于,所謂的心智理論并非單一要求。美國(guó)布朗大學(xué)的伯特拉姆·馬萊說(shuō):“人們所說(shuō)的心智理論包括很多要素。這是能力的大集合。”這其中最簡(jiǎn)單的是理解行為背后的動(dòng)機(jī),而最難的是復(fù)雜的社交活動(dòng)。 美國(guó)耶魯大學(xué)的朱利安·賈拉-埃廷格說(shuō),最大的挑戰(zhàn)之一是背景。比如,如果有人問(wèn)你要不要跑步,你回答“外面正在下雨”,他們馬上就推斷出答案是否定的。但這需要大量關(guān)于跑步、天氣和人類(lèi)喜好的背景知識(shí)。 馬萊說(shuō),在教會(huì)AI這些技能時(shí),要從最簡(jiǎn)單的開(kāi)始,尤其是考慮到心智理論的技能看起來(lái)是分等級(jí)的。他說(shuō):“某些能力在動(dòng)物世界中更普遍,且在人類(lèi)的發(fā)展中出現(xiàn)得更早,復(fù)雜程度更低。” 然而,即便教會(huì)機(jī)器最簡(jiǎn)單的社交技能也并非易事。它所涉及的計(jì)算與計(jì)算機(jī)通常使用的公式邏輯大相徑庭。 英國(guó)曼徹斯特大學(xué)的塞繆爾·卡斯基說(shuō),最重要的是,它們需要學(xué)會(huì)應(yīng)對(duì)不確定性。 一個(gè)人的內(nèi)在心理過(guò)程是無(wú)法直接觀察到的,所以你只能根據(jù)現(xiàn)有的證據(jù)做出有根據(jù)的猜測(cè)。這樣做通常需要改變一種被稱(chēng)為強(qiáng)化學(xué)習(xí)的傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)。按照傳統(tǒng)的形式,這包括為AI設(shè)定一個(gè)目標(biāo),并在它采取有助于實(shí)現(xiàn)這一目標(biāo)的行動(dòng)時(shí)給予它獎(jiǎng)勵(lì)。通過(guò)反復(fù)試驗(yàn)和試錯(cuò),它將學(xué)會(huì)達(dá)到目的的行為。“逆向強(qiáng)化學(xué)習(xí)”則是另辟蹊徑:在一段時(shí)間里持續(xù)觀察某人的行為,慢慢推測(cè)這個(gè)人想要干什么。這類(lèi)似于兒童第一次看別人玩捉迷藏游戲,并迅速推測(cè)出不同玩家的目標(biāo)是什么。 一種流行的逆強(qiáng)化學(xué)習(xí)方式依靠的是被稱(chēng)為貝葉斯推理的統(tǒng)計(jì)技術(shù)。這讓你在分析新數(shù)據(jù)的同時(shí)考慮到之前的知識(shí)??ㄋ够f(shuō),這項(xiàng)技術(shù)非常強(qiáng)大,因?yàn)樗芎玫貞?yīng)對(duì)了不確定性,使你可以利用已知信息,并適應(yīng)新信息。 2022年,卡斯基及其同事塞巴斯蒂安·佩烏特利用貝葉斯推理的方法開(kāi)發(fā)出一款原型數(shù)字助手,可以協(xié)助人類(lèi)做出一系列相互關(guān)聯(lián)的決定。在這個(gè)例子中,AI幫助人們根據(jù)預(yù)算、時(shí)間和偏好規(guī)劃周末的觀光行程。這個(gè)例子或許看起來(lái)微不足道,但卡斯基說(shuō),這從根本上類(lèi)似于幫助解決工程設(shè)計(jì)等更復(fù)雜的任務(wù),他的目標(biāo)是開(kāi)發(fā)協(xié)助科學(xué)家和醫(yī)生工作的AI助手。他說(shuō):“真正的動(dòng)力來(lái)自能夠更好地解決更難的問(wèn)題。” 迄今為止,大多數(shù)關(guān)于機(jī)器心智理論的研究依賴(lài)簡(jiǎn)化的場(chǎng)景,如推斷移動(dòng)智能體在基本二維網(wǎng)格世界中的目標(biāo)。但美國(guó)麻省理工學(xué)院的喬希·特南鮑姆正試圖將這些技術(shù)帶入現(xiàn)實(shí)世界。2020年,他的團(tuán)隊(duì)把貝葉斯推理與機(jī)器人編程語(yǔ)言結(jié)合起來(lái),他說(shuō)這最終可能有助于將這些技術(shù)應(yīng)用于機(jī)器人挑戰(zhàn)。最近,他們把這項(xiàng)任務(wù)的復(fù)雜性提高到了三維層面。 特南鮑姆說(shuō),測(cè)試幼兒心智理論的關(guān)鍵方法之一是向他們展示其他人的視頻,然后詢(xún)問(wèn)孩子這些人想要達(dá)到什么目的,他的團(tuán)隊(duì)希望用AI來(lái)嘗試這項(xiàng)測(cè)試。2021年,特南鮑姆和他的同事們展示了一項(xiàng)新挑戰(zhàn),讓AI觀看3D卡通人物在坡道上奔跑、翻墻和穿門(mén)而過(guò)的動(dòng)畫(huà)。他們的貝葉斯模型在幾種情景中都接近人類(lèi)的測(cè)試水平。 特南鮑姆說(shuō),雖然現(xiàn)在還為時(shí)尚早,但他的團(tuán)隊(duì)正在與微軟、IBM和谷歌的研究人員合作,這些研究人員有志于將他們的想法應(yīng)用于真正的產(chǎn)品。他說(shuō):“我們還遠(yuǎn)遠(yuǎn)沒(méi)有一個(gè)完整的心智理論模型。但我們有足夠的基礎(chǔ)材料,實(shí)際上已經(jīng)達(dá)到工程規(guī)模,可以在一系列應(yīng)用發(fā)揮作用。” 深度學(xué)習(xí) 還有一些研究人員采取了完全不同的路線。近年來(lái)最受關(guān)注的人工智能進(jìn)步大多依賴(lài)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),一個(gè)受大腦啟發(fā)的算法家族。一個(gè)重要特點(diǎn)是,程序員們很少在這些系統(tǒng)中建立以前的知識(shí),而是讓它們吸收海量數(shù)據(jù)來(lái)學(xué)習(xí)經(jīng)驗(yàn)。 谷歌旗下“深層思維”公司的研究人員開(kāi)發(fā)的“心智理論網(wǎng)絡(luò)”(NoM-net)就采用了這一路線。2018年,他們證明,NoM-net可以通過(guò)“錯(cuò)誤信念測(cè)試”。此后,還有一些研究者也把類(lèi)似的想法應(yīng)用于更復(fù)雜的領(lǐng)域。 利普森說(shuō),兒童心智理論發(fā)展的一個(gè)關(guān)鍵里程碑是,能理解他人觀點(diǎn)可以與自己的觀點(diǎn)不同。比如,4歲以下的孩子常常會(huì)閉上眼睛就以為自己躲起來(lái)了,認(rèn)為他們看不到你,你就看不到他們。因此,2019年利普森及其同事用深度學(xué)習(xí)AI挑戰(zhàn)了一場(chǎng)捉迷藏游戲。 他們創(chuàng)造了一個(gè)布滿(mǎn)障礙物的3D模擬場(chǎng)景,并放入兩個(gè)智能體——一個(gè)捕食者和一個(gè)獵物,它們唯一的信息來(lái)源只有從環(huán)境中獲得的一手信息。捕食者受一套規(guī)則的支配,這些規(guī)則旨在幫助它找到另一個(gè)智能體;而獵物受神經(jīng)網(wǎng)絡(luò)控制,經(jīng)過(guò)多次試驗(yàn)后,這些神經(jīng)網(wǎng)絡(luò)成功地學(xué)會(huì)了如何躲藏。 利普森說(shuō),要挑戰(zhàn)成功,獵物必須會(huì)通過(guò)捕食者的眼睛看世界。他說(shuō):“我認(rèn)為這是心智理論的根本。要能夠真正從另一個(gè)人的角度來(lái)看世界,而不僅僅是從邏輯上思考。” 2021年,利普森及其同事擴(kuò)展了他們的方法,證明在用數(shù)千張機(jī)器人進(jìn)行簡(jiǎn)單活動(dòng)的圖片進(jìn)行訓(xùn)練后,AI可以猜出機(jī)器人的目的,準(zhǔn)確率達(dá)到99%。它甚至能通過(guò)“錯(cuò)誤信念測(cè)試”。 構(gòu)建知識(shí) 利普森的方法的一個(gè)關(guān)鍵動(dòng)機(jī)是,他希望心智理論在學(xué)習(xí)過(guò)程中自發(fā)地出現(xiàn)。他說(shuō),把以前的知識(shí)植入到AI中,會(huì)讓它依賴(lài)我們對(duì)心智理論的不完美理解。此外,AI或許能開(kāi)發(fā)出我們永遠(yuǎn)無(wú)法想象的方法。利普森說(shuō):“還有很多形式的心智理論我們并不了解。原因很簡(jiǎn)單,因?yàn)槲覀兇嬖谟谝粋€(gè)擁有特定類(lèi)型感官和特定思考能力的人體中。” 本月早些時(shí)候,斯坦福大學(xué)的邁克爾·科辛斯基報(bào)告了這方面心智理論發(fā)展的振奮人心的證據(jù)。他在一篇未經(jīng)同行評(píng)議的論文中介紹,他用一些經(jīng)典的“錯(cuò)誤信念測(cè)試”文本信息“投喂”ChatGPT背后的深度學(xué)習(xí)AI。在沒(méi)有經(jīng)過(guò)任何特殊訓(xùn)練的情況下,AI在測(cè)試中的表現(xiàn)達(dá)到了9歲兒童的水平。 美國(guó)元宇宙公司研究人員的最新成果表明,將多種方法結(jié)合在一起可能是更強(qiáng)大的手段,可以復(fù)制一些涉及心智理論的能力。去年11月,他們開(kāi)發(fā)出一款名為“西塞羅”的AI,它能在戰(zhàn)略棋盤(pán)游戲《外交》中打出人類(lèi)級(jí)別的表現(xiàn)。這款游戲最多可有7名玩家,目標(biāo)是爭(zhēng)奪歐洲的控制權(quán)。在每輪比賽前,玩家可以相互談判并結(jié)成聯(lián)盟。這對(duì)AI來(lái)說(shuō)極具挑戰(zhàn)性,因?yàn)檫@不光需要有效的溝通,還需要預(yù)測(cè)其他玩家的意圖,以研究如何合作。 該團(tuán)隊(duì)通過(guò)將一種深度學(xué)習(xí)語(yǔ)言模型與一種戰(zhàn)略規(guī)劃模型相結(jié)合,解決了這一難題。最關(guān)鍵的是,規(guī)劃模型依靠的是博弈論的概念,即用數(shù)學(xué)模型來(lái)理解戰(zhàn)略決策。西塞羅利用真實(shí)《外交》游戲的數(shù)據(jù)進(jìn)行訓(xùn)練,以預(yù)測(cè)玩家會(huì)根據(jù)棋盤(pán)狀態(tài)和之前的對(duì)話做什么。這些隨后被納入規(guī)劃模型中,該模型提出了一種策略,即在所有玩家理論上的最佳行動(dòng),以及他們的對(duì)話暗示他們要做什么之間進(jìn)行權(quán)衡。然后,西塞羅會(huì)生成對(duì)話,以幫助它實(shí)現(xiàn)目標(biāo)。在一個(gè)在線聯(lián)盟的排名中,它進(jìn)入了前10%,但并沒(méi)有引起人們對(duì)它是AI的懷疑。 主要研究人員之一諾姆·布朗說(shuō):“我認(rèn)為我們真正做到了讓它理解玩家的信念、目標(biāo)和意圖。”這是在通向具有社交能力的機(jī)器的道路上邁出的重要一步。但特南鮑姆說(shuō),西塞羅模擬玩家心理過(guò)程能力還算不上真正的心智理論,因?yàn)檫@局限于《外交》這款游戲,不能應(yīng)用在其他任務(wù)中。他說(shuō):“它們似乎已經(jīng)獲得了一些反映人類(lèi)運(yùn)用心智理論的策略,但這并不等于它們已經(jīng)獲得了心智理論。” 特南鮑姆說(shuō),我們希望AI擁有更接近人類(lèi)的心智理論,是有現(xiàn)實(shí)原因的。深度學(xué)習(xí)系統(tǒng)通常是黑匣子——很難破解它們究竟是如何做決定的。另一方面,人類(lèi)可以用自己的語(yǔ)言和思想,清晰地向其他人解釋自己的目標(biāo)和愿望。特南鮑姆說(shuō),盡管基于學(xué)習(xí)的方法可能在開(kāi)發(fā)更強(qiáng)大的AI方面發(fā)揮重要作用,但以共享的方式構(gòu)建知識(shí)可能對(duì)人類(lèi)信任AI并與之溝通至關(guān)重要。 特南鮑姆說(shuō):“它們應(yīng)當(dāng)在根本上具有類(lèi)人性。如果只是走大數(shù)據(jù)路線,并進(jìn)行大量機(jī)器學(xué)習(xí),我認(rèn)為是得不到這些的。”他還說(shuō),如果我們希望利用AI來(lái)幫助我們更好地理解心智理論對(duì)人類(lèi)的作用,這一點(diǎn)同樣重要。 不過(guò),利普森說(shuō),重要的是要記住,向機(jī)器灌輸心智理論不僅僅是為了制造更多有用的機(jī)器人。這也是在為實(shí)現(xiàn)人工智能和機(jī)器人研究的更深層次目標(biāo)鋪路,這個(gè)目標(biāo)就是——制造真正有感情的機(jī)器。 注:文章及圖片轉(zhuǎn)載自網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除 |