Nautilus 《鹦鹉螺》科学杂志【为什么人工智能需要基因组】Why AI Needs a Genome
当前位置: 首页 → 时事动态 →
Nautilus 《鹦鹉螺》科学杂志【为什么人工智能需要基因组】
-人工智能可以像人类一样利用类似基因的算法进行学习和适应。
莉娜·泽尔多维奇(LINA ZELDOVICH) | 2021年12月7日
2050年的某个周一清晨,你被C-3PO冲泡的咖啡香气吸引,走进厨房。而C-3PO正在洗碗机旁忙碌,"给你,汉·索洛,我用了你昨天买的全新口味。” C-3PO边说边递给你杯子。你笑出声来。C-3PO才到这里不到一个月,就已经培养出绝佳的幽默感,甚至带点调侃。
当然,他不是真正的 C-3PO——你只是因为是个复古电影迷才给他起这个名字——但他是最新的神经网络机器人 NeuroCyber 模型,最接近人类的思考、说话和获取知识的方式。他比不上原版 C-3PO 对 600 万种交流方式的流利掌握,但他完全掌握了语言,可以像人类一样学习——通过观察和模仿,无论是使用讽刺语气还是把盘子塞进插槽。与早期如Siri或Alexa这类只能识别指令并执行任务的助手不同,它们可以识别命令并执行,神经网络机器人能进化为直觉型助手和伴侣。你暗自决定在即将到来的节日季为奶奶买一个。她最近感到孤独,需要陪伴。
先明确一点——你在今年的节日期间,或者可预见的未来任何一个节假日,都还买不到这款C-3PO神经网络机器人。但是,冷泉港实验室神经科学教授安东尼·扎多尔 (Anthony Zador)认为,如果我们设计出与人类或其他动物相似的学习能力,打造出这样的智能助手和伙伴并非不可能,他研究的领域是大脑回路如何引发复杂行为。
目前,一些人工智能模型正在利用所谓的“深度学习方法”在自然语言处理方面取得进展,这种方法试图模仿人类获取知识的方式。总部位于旧金山的OpenAI公司开发的GPT-3就是这样一种语言学习模型,“就像手机自动完成功能的增强版”,拉斐尔·米利耶(Raphael Milliere)在Nautilus杂志上写道:“只要给出一个定义,它就能用一个自造的词造句。它能用著名作家的风格改写一段话。它能创作小说。或者根据程序的功能描述生成程序代码。它甚至可以回答关于常识的问题。”
但说 GPT-3 像人类一样思考是言过其实,因为它仍然会犯人类不会犯的滑稽错误。在其中一篇文章中,GPT-3 写道,如果一个人喝了一杯蔓越莓汁加一勺葡萄汁,就会死。“GPT-3 的能力给我留下了深刻的印象,”扎多尔说,但它仍然需要学习一些基本的人生常识。“所以,关注它仍然缺少的东西很重要。”而 GPT-3 和其他人工智能程序缺少的是一些重要的东西:基因组。以及这个基因组形成所需的数百万年的进化。
人类和所有其他生物都天生带有一套写入基因的预设行为,这些行为在漫长而曲折的进化历程中逐渐积累。动物已经存在了大约1亿年,人类也存在了大约10万年。这些行为智慧蕴藏在氨基酸和核苷酸的基因语言中。相反,人工智能没有任何遗传物质。它没有基因可以继承,也没有基因可以传承。人类和动物都是先天和后天的产物,但人工智能只有前者。没有后者,它永远不会像我们一样思考。
这就是为什么人工智能和机器人只在某些特定领域优于人类,而在其他领域却力不从心。它们能在国际象棋和围棋比赛中击败世界级选手。它们在数学以及其他所有依赖规则或计算的领域都胜过我们。当遇到危险、枯燥、过于繁重或重复性的工作时,它们是必不可少的。但它们不擅长随机应变、即兴发挥以及与现实世界互动,尤其是在面对它们未受过训练的全新情境时。
“我很想有一个机器人把碗碟放进洗碗机,我很想有一个机器人打扫我的房子,”扎多尔说,但我们离制造出如此有用的助手还很遥远。说到家务,我们处于Roomba的水平。“你可能会认为储存碗碟和整理房间比下围棋更容易。但对于机器人来说并非如此,对于人工智能来说也是如此。”孩子可以通过观察父母来学习将碗碟装满洗碗机,但没有 Roomba 可以掌握这一技能。在 18 届世界围棋冠军李世石和他的人工智能对手 AlphaGo 之间的著名比赛中,后者通过计算获胜,但无法在实际棋局中摆放棋子。它不得不依靠人类助手来移动棋子。
即使你训练一个机器人将一套餐具和杯子放入洗碗机,但如果加入锅碗瓢盆,你的机器人助手就会感到困惑,而一个孩子很可能知道如何重新排列这些物品。这种局限性在整个人工智能领域都存在。麦吉尔大学计算机科学学院和蒙特利尔神经学研究所助理教授布莱克·理查兹说:“目前,人工智能的适用范围非常狭窄。 ”即使是智能算法在其任务方面也受到限制。“例如,Facebook 的算法会检查每张图片以确保其不是色情或暴力内容,”理查兹说——这是一项令人印象深刻的壮举,但它无法完成其他任务。“人工智能针对一项特定任务进行了优化,但如果你给它们一个不同的任务,它们就表现不佳。”它们不能像生物那样学习。
在神经科学中,“学习”一词指的是通过经验而导致的持久行为变化。然而,大多数动物只花费少量时间学习,但它们却表现良好。“大多数鱼类不会花很多时间向父母学习,昆虫也是如此,但它们的行为却非常成功,”扎多尔指出。蜜蜂生来就知道如何授粉,苍蝇能熟练地逃脱你的苍蝇拍,蟑螂听到你走路的声音就会逃走。“但绝大多数这些行为都是蜜蜂、苍蝇和蟑螂天生就有的,”扎多尔说。“它们并非后天习得的,而是从盒子里——或者从卵子里——生来就具备了做任何它们应该做的事情的能力。” 使它们能够做到这一点的指令集在哪里?当然是在它们的基因组里。“动物的能力是由它们与生俱来的先天结构赋予的——它们的DNA编码了执行这些行为所需的指令,”扎多尔说。
哺乳动物比昆虫花费更多时间学习,而人类则花费相当长的时间来获取知识和练习技能。“我们花在学习上的时间至少比其他动物多一个数量级,”扎多尔说道。但我们也拥有许多“预先设定”的智慧。“我们学习语言的能力很大程度上得益于那些已做好准备的神经回路。” 而人工智能则相反,它没有任何准备,所以它必须从零开始学习一切。
因此,人工智能创造者一直需要进行大量的训练。理查兹说,直到20世纪90年代末,人工智能开发者们还在尝试为人工智能制定一套规则。例如,在教计算机“看”的时候,他们会对它们进行编程,让它们识别特定的形状和特征。“这些是眼睛或鼻子的形状,如果你看到两只眼睛中间有一个鼻子,那很可能就是一张脸,”理查兹解释道。不幸的是,这种方法效果不佳,因为世界太复杂了,无法被这些规则涵盖。“我们当时还不够聪明,无法针对现实世界的混乱来手工设计这些东西。”
如今,人工智能开发人员依赖于三种不同类型的学习。一种称为监督学习,其中人工智能会扫描数十万张带有标注为小狗或大象的图片,并学习小狗和大象的特征。但扎多尔指出,因为人类不会盯着一堆狗的图片来记忆狗的样子,所以这不是教人工智能像人类一样思考的理想方式。他举了一个有趣的例子。人工智能系统是在 1000 万张标注过的图片上进行训练的,这相当于一年的秒数。人类儿童若要处理同等规模的标注数据,就必须每秒提出一个问题;此外,儿童遇到的大多数图像都没有标注。但儿童却能很好地识别图像。
另一种方法是无监督学习,其中人工智能训练师会预先划分大象、小狗、汽车、树木等类别;AI会将图像映射到相应类别,并识别它所看到的是什么。这更类似于人类的学习方式——一个孩子玩一个小塑料狗玩具和一个大毛绒狗玩具时,很可能会意识到它们是同一种动物。
最后,第三种方式是强化学习:人工智能训练师给它一个目标——例如,在迷宫中找到一个物体——然后让它自己想办法找到它。老鼠非常擅长在迷宫中寻找奶酪。人工智能还有很长的路要走。这是因为寻找食物的能力被嵌入在老鼠的基因组中,而人工智能却没有。我们又回到了原点。要开发类人智能——或者说类鼠智能——人工智能需要一个基因组。但是,如何将一组基因赋予算法呢?
扎多尔对此有个想法。基因组编码了构建我们神经系统的蓝图。从这个蓝图出发,诞生了拥有约 1000 亿个神经元的人脑,每个神经元都与大约一千个相邻神经元进行交流。“基因组是一种非常紧凑、浓缩和压缩的信息形式,”扎多尔说道。他将基因组比作 CliffNotes——将文学作品浓缩为关键情节和主题的学习指南。“基因组必须将所有关键内容压缩成一种生物学版的 CliffNotes ,”扎多尔说——我们也应该尝试对人工智能这样做。我们应该给人工智能提供大量行为 CliffNotes,然后它可以将其展开成一个类似人脑的知识库。
扎多尔表示,尽管基因组具有生物复杂性,但它们包含一套简化的规则来连接大脑。生物只保留了最有用的行为中最重要的特征。蜜蜂不会唱歌,苍蝇不会跳舞,因为它们不需要。人类可以唱歌和跳舞,但不会飞。扎多尔正在开发一种算法,其功能类似于简单的规则来生成行为。“我的算法会写下一些关于如何解决特定问题的 CliffNotes,”他解释道。“然后,神经网络会利用它们来找出哪些是有用的,并将它们融入到它的行为中。”之后,可以添加更复杂的行为——大概包括能用洗碗机、支付账单以及与奶奶交谈的智能助手。
模拟学习的另一种方法(至少对于简单生物而言)是为人工智能配备其神经元结构,并让其通过强化学习的方式进步。在一项这样的尝试中,扎多尔实验室的学生尼基尔·巴塔萨利为人工智能配备了一种名为秀丽隐杆线虫的简单蠕虫的神经元结构的数字模拟子集,并让它学习如何更快地移动。“我们提取了秀丽隐杆线虫的神经接线图,并基本上教会了它游泳,”扎多尔说。这些蠕虫通过数百万年的进化才完善了它们的蠕动动作。当仅配备大约二十几个神经元时,人工智能迅速掌握游泳动作。“有了这个内置的图,它学会游泳的速度比没有图快得多。”
理查兹补充道,让这种人工智能发展的最佳方式本质上是模仿进化。“进化赋予我们与生俱来的能力,但进化本身并非智能设计师,”他指出。“相反,进化是一种强力优化算法。因此,我们不应该将任何特定行为硬编码到人工智能中,而应该优化一个系统,然后将这个优化点用于下一代人工智能——就像进化一样。”
如果这些想法奏效,人类智慧与计算机速度的结合能否立即推动机器人达到奇点,超越人类的智能?如果创造一个人类阿尔伯特·爱因斯坦需要32亿年,那么创造一个与他相当的人工智能又需要多长时间呢?
理查兹认为人工智能无法达到阿尔伯特·爱因斯坦的水平,原因如下:它很可能会遭遇能源瓶颈。要让人工智能积累像阿尔伯特·爱因斯坦,甚至像普通人一样多的知识,可能需要耗费巨量电力,而这将造成污染,难以维持。GPT-3在训练期间排放了相当于 552 吨二氧化碳的排放量——相当于 120 辆汽车一年的排放量——结果却误以为葡萄汁有毒。
“我觉得我们离奇点还很远呢,”扎多尔轻笑道。他引用了一个统计学上的理由来解释为什么这不值得担心。“假设机器真的取代我们成为下一个爱因斯坦,”他理论道。“根据定义,我们中很少有人能像爱因斯坦那样做出杰出的贡献。那么,如果做出这种贡献的概率从每代一亿分之一下降到几乎为零,这重要吗?”其实不然。
因此,构建一个与阿尔伯特·爱因斯坦相当的人工智能可能既不值得投入精力,在统计上也不重要。此外,这位天才理论家以思维混乱、思维飘忽和健忘而闻名。有了这样的人工智能,你得帮它收拾残局。
莉娜·泽尔多维奇(Lina Zeldovich)在一个俄罗斯科学家家庭长大,从小就听着关于火山、黑洞和勇敢探险家的睡前故事。她曾为《纽约时报》、《科学美国人》、《读者文摘》和《奥杜邦杂志》等刊物撰稿,并因报道粪便科学而四次获奖。她的著作《另一种暗物质:变废为宝的科学与商业》(The Other Dark Matter: The Science and Business of Turning Waste into Wealth)刚刚由芝加哥大学出版社出版。您可以在LinaZeldovich.com和@LinaZeldovich上找到她。
本文由冷泉港实验室提供支持。更多信息请访问Nautilus频道“Biology + Beyond”。
原文链接:(中文翻译出自翻译软件,仅供参考。)
https://nautil.us/why-ai-needs-a-genome-238366/
当前位置: 首页 → 时事动态 →