详情请进入 湖南阳光电子学校 已关注:人 咨询电话:0731-85579057 微信号:yp941688, yp94168
从搜索引擎到自动驾驶汽车,人工智能已经进入了我们的日常生活。这与近年来计算能力的巨大提升有关。但是, 新的人工智能研究成果表明,更简单、更小的神经网络可以比以前更好、更高效、更可靠得解决特定任务。 来自维也纳理工大学(TU Wien)、奥地利IST和美国麻省理工学院(MIT)的一个国际研究团队开发了一种基于微小动物(如线虫)大脑的新型人工智能系统。 这种新颖的人工智能系统只需几个人工神经元就能控制车辆。该团队表示,与之前的深度学习模型相比,该系统具有决定性的优势:它能更好地应对嘈杂的输入信息。此外,由于它的简单性,它的运作模式可以被详细的解释。它不必被视为一个复杂的"黑盒子",它可以被人类理解。 目前,这种新的深度学习模型已经发表在《自然机器智能》杂志上。
向自然学习
与活体大脑类似,人工神经网络由许多单个细胞组成。当一个细胞处于活跃状态时,它会向其他细胞发出信号。下一个细胞会把接收到的所有信号都结合起来,以决定自己是否要活跃起来。一个细胞影响下一个细胞活动的方式决定了神经系统的行为——这些参数在自动学习过程中被调整,直到神经网络能够解决特定的任务。 TU Wien的“网络-物理系统”研究小组负责人Radu Grosu教授说:“多年来,我们一直在研究我们可以从自然界中学习到什么来改善深度学习。举例来说,线虫C.elegans的神经元的数量少得惊人,却仍然能显现出有趣的行为模式。这是因为线虫的神经系统处理信息的方式高效而和谐。” 麻省理工学院计算机科学与人工智能实验室(CSAIL)主任Daniela Rus教授说:“大自然告诉我们,现存的模型还有很多改进的空间。因此,我们的目标是大规模降低神经网络模型的复杂性并增强其可解释性。” 奥地利IST公司总裁Thomas Henzinger教授说:“受自然界的启发,我们开发了新的神经元和突触的数学模型。” TU Wien计算机工程研究所和MIT CSAIL的博士后Ramin Hasani博士说:“单个细胞内的信号处理遵循的数学原理与之前的深度学习模型不同。另外,我们的网络是高度稀疏的——这意味着不是每个单元都与其他每个单元相连。这也使得网络更加简单。”
自主车道保持功能
为了测试这些新想法,该团队选择了一个特别重要的测试任务:使自动驾驶汽车保持在自己的车道上,神经网络接收道路的摄像头图像作为输入,然后自动决定向右还是向左转向。 TU Wien校友、奥地利IST的博士生Mathias Lechner说:“当今市面上,具有数百万个参数的深度学习模型才通常用于学习如自动驾驶一样复杂的任务。然而,我们的新方法使我们能够将网络的大小减少两个数量级。我们的系统只使用75000个可训练参数。” 麻省理工学院CSAIL的博士生Alexander Amini解释说,新系统由两部分组成。摄像头图像的输入首先由一个所谓的卷积神经网络处理。该网络只感知视觉数据,并从输入的像素中提取结构特征。它决定了图像中哪些部分是有趣的、重要的,随后将信号传递给网络的关键部分——引导车辆的“控制系统”。 这两个子系统叠加在一起,并同时进行训练。该团队收集了许多大波士顿地区人类驾驶的交通视频,并将这些视频与不同特定情况下如何转向汽车的信息一起输入网络——直到系统学会了自动将图像与适当的转向方向连接起来,并能独立处理新情况。 系统的控制部分(称为神经回路策略,或NCP),将感知模块的数据转化为转向指令,并只由19个神经元组成。Mathias Lechner解释说,NCP比以前 先进的模型所能做到的要小3个数量级。
因果关系和可解释性
新的深度学习模型已经在一辆真正的自动汽车上进行了测试。 Ramin Hasani说:“我们的模型可以让我们研究网络在驾驶时在关注什么。我们的网络关注着的是摄像头画面中非常特定的部分:路边和地平线。这种行为是非常理想的,它在人工智能系统中是独一无二的。此外,我们还可以识别每一个细胞在任何驾驶决策中的作用。我们可以理解单个细胞的功能及其行为。实现这种程度的可解释性是大型深度学习模型不可能做到的。”
稳健性
Mathias Lechner说:“为了测试与之前的深度模型相比,NCPs的稳健性如何,我们干扰了输入图像,并评估了模型处理噪声的能力。虽然噪音是其他深度神经网络无法克服的问题,但我们的NCPs表现出了对输入噪音的强大抵抗力。这一属性是新型神经模型和架构的直接结果。” Ramin Hasani说:"可解释性和稳健性是我们新模型的两大优势。但我们的模型还有更多的优势。使用我们的新方法还可以减少训练时间,以及在相对简单的系统中实现AI。我们的NCP可以在广泛的潜在应用(从仓库的自动化工作到机器人运动)中实现模仿学习。这个新的发现为人工智能界开辟了重要的新视角:生物神经系统中的计算原理可以成为创建高性能,可解释的人工智能的重要资源——成为迄今为止所使用的黑盒机器学习系统的替代方案。"
责任编辑:lq