Hinton預言的「AI將擁有常識」如何實現？劍橋最新研究：從小狗學起

作者：由新智元發表于體育時間：2020-10-27

【新智元導讀】

常識一直是困擾AI發展的難解謎題。就算AI能夠在圍棋比賽中戰勝人類，但機智如GPT-3卻不能理解「太陽有幾隻眼睛」這種問題是反常識的。而最近，谷歌DeepMind、

帝國理工

和劍橋的研究人員開創性地提出，AI可以從動物身上學習常識！今後可以像訓練小狗一樣訓練智慧體了。

Geoffery Hinton曾經預言，十年內，我們將研發出具有常識的計算機。

這些計算機並沒有靈魂，它們只是具備了人類世界如何運作的知識，熟悉我們的慣例。它們知道爐子是熱的，知道人們通常不會買12臺烤箱等等。常識是什麼？最通俗的解釋是指與生俱來、毋須特別學習的判斷能力，或是眾人皆知、無須解釋或加以論證的知識。

數十年來，常識是一直以來困擾著AI發展的難解謎題，就算AI能夠在圍棋比賽和Atari遊戲中戰勝人類，但聰明如GPT-3卻不能理解「太陽有幾隻眼睛」這種問題是違背常識的。

在如何讓AI擁有常識的漫長求索之路上，研究人員往往會從嬰幼兒身上入手，從神經科學和

行為科學

中尋找靈感和答案。而最近，谷歌 DeepMind、

倫敦帝國理工學院

和劍橋大學的人工智慧研究人員開創性地提出，AI可以從動物身上學習常識！這其實不是第一次提出AI應該向動物學習了，AI大神Yann LeCun曾表示，「家貓都比最聰明的機器有常識得多。」

人的常識是建立在許多其他動物所擁有的一系列基本能力之上的，而透過深度強化學習，智慧體或許可以從動物身上學到很多東西。該研究小組發表在《 CellPress Reviews 》雜誌上的論文《

人工智慧與動物常識

》（Artificial Intelligence and the Common Sense of Animals）寫道：「動物認知提供了一個很好理解的，非語言的，智慧行為的概要，提出了作為評估基準的實驗方法，它以指導環境和任務設計。」

向小狗學習？像訓練寵物一樣訓練智慧體

在著名的伊索寓言中，試驗者要求鳥類將物體投入裝有水和浮動食物的玻璃管中，提升水位，來獲取食物。

訓練動物的過程，通常包含著目標和獎勵。比如說訓練小狗，動作做的對，就獎勵他食物，這和運用深度強化學習訓練智慧體的方式有相似之處。

相比之下，其他形式的人工智慧，例如助手 Alexa 或 Siri，就不具備這種類似於在迷宮中搜索獎勵或食物的能力。此前，認知行為科學家已經發現，動物的智力水平比先前設想的要高，包括

海鴉

的復仇心理和海豚的自我意識。（小孩子要長到一歲半時才能有自我意識，才能認出鏡子裡自己的形象）

很多時候，動物甚至會採取欺騙或者詭計來達成自己的目的。例如，黑猩猩把目光從渴望得到的東西上移開，來迷惑競爭對手，而

松鴉

會假裝把食物儲存在虛假的地點來保護它們的隱秘儲藏處。實驗中，研究人員將測試場景中的動物和強化學習智慧體進行類比，用一種新的方法來測試

人工智慧系統

的認知能力。《人工智慧與動物常識》一文細講述了對鳥類和靈長類動物的認知實驗。這個實驗最初的目的是確定鳥類是否能夠區分與任務相關的功能性和非功能性物體，並探索它們對所涉及的因果關係的理解程度。

做的好才有的吃，學會理解因果，要先試錯！

松鼠會想辦法撬開堅果的外殼，獲取裡面的果實；某些鸚鵡也十分擅長從各種容器中提取食物；當看到裂縫，孔洞或破裂之類的東西時，有的動物會作出「我要開啟它」的反應。這是為什麼？這是它們的意識中有了「因果」這一概念。也就是，「只要我開啟它，就會有食物。」而這，也是AI要訓練的部分。作者聯想到訓練動物的方法，發現「試錯」是十分奏效的。

（B）用一個看不見的

位移任務

來測試對物體永久性的理解。在用食物做誘餌後，杯子被移動至右邊所示的最終排布。然後，動物要選擇盛有食物的杯子。

當然，杯子是不透明的，但是食物的位置能夠清晰地顯示出來。能夠理解這種看不見的位移的動物在所有四種不同情況中都表現得很好，即使它以前從未見過相關的物體。而足夠逼真的3D世界模擬，是訓練的必要條件，包括可能會破裂或被撬開的貝殼，無法擰開或撬開的瓶蓋，可撕開的包裝盒等等物體。

訓練RL智慧體的3D環境（A）DeepMind遊戲室環境（B）與前者相同，不過是智慧體視角下智慧體可以在場景中移動，並推動物體。在遊戲室的環境中，智慧體也可以拿起物品並把它們放下，它透過成功地執行自然語言指令獲得獎勵，比如「把一個

泰迪熊

放在一個藍色的方塊上」。在動物AI環境中，智慧體透過移動綠色球體獲得獎勵。更為有趣的是，為了精準模仿動物與食物的因果關係。研究人員將

綠色物體

定位為「食物」，當被觸控時會產生積極的獎勵，然後就像被吃掉一樣消失。

更高層次的常識：類比和隱喻，AI：我太難了

總結來說，常識是人類獨有的嗎？研究人員認為，並不是，常識是取決於一些基本概念的。比如，眼前的物體是什麼？它會佔據多大空間？以及因果之間的關係等等。而且，這些理解被深深地刻進頭腦，並不會隨著時間的推移而發生改變。

然而，動物所表現出來的常識，很可能就包含對獎勵的認知。「如何構建這樣的人工智慧技術仍然有待解答。但是我們提倡一種方法，讓 RL 智慧體透過與豐富的虛擬環境進行擴充套件互動來獲得所需的東西。」因此，透過適當的任務訓練智慧體，很可能就能為AI賦予常識。

當然，常識也不僅僅是這些。物理學只是常識的一個領域。我們忽略了一些心理學概念（如相信某件事或表達出不開心）以及相關的常識性社會概念（如與某人某物在一起，或給予某人某物）。物理上講，上述實驗的重點是固體。

更完整的還應該包括液體（水坑、溪流、瓶中的酒）、氣態物質（煙、霧、火焰）和

顆粒物

（土壤、沙子），甚至包括可變形物體（海綿、紙張、繩子、衣服、樹葉、樹枝、動物的身體）和空間（洞、門道、入口）等。從這個意義上講，常識可以看作是一組相互關聯的基本原則和抽象概念。更高更抽象的層面上，還包括類比和隱喻的運用。

「理想情況下，我們希望建立一種AI技術能夠把握這些（關於認知的）相互關聯的原則和概念，並擁有人類層面的概括和創新能力」論文的最後寫道。

看來，讓AI擁有常識終歸是一條漫漫長路。

參考連結：

https：//

venturebeat。com/2020/10

/25/researchers-suggest-ai-can-learn-common-sense-from-animals/

https：//www。

cell。com/trends/cogniti

ve-sciences/fulltext/S1364-6613（20）

30216-3

標簽：常識 ai 動物智慧訓練

上一篇:網路配線架怎麼打線？配線架安裝順序？

下一篇：我應該請假嗎？

Hinton預言的「AI將擁有常識」如何實現？劍橋最新研究：從小狗學起

猜你喜歡

如何跑得更遠？給新手的12個建議（建議收藏）

為什麼狐被稱為狐狸，而不是狐子?

想自學中醫但是又讀不懂文言文，亂看譯註又害怕被誤導，有沒有什麼好的解決辦法或者譯註推薦?

請問大家的防盜門都是怎樣的才算安全？開鎖師傅好像很多加鎖的門用類似卡的工具一劃就開了，太不安全了吧？

延時訓練，動停法擠捏法是基礎，關鍵是降敏與大腦射精閾值