新的计算机神经网络识别以及灵长类的大脑

时间：2021-10-14 15:24:58 来源：

一个麻省理工学院神经科学家的团队发现，一些计算机程序可以识别这些图像中的对象以及灵长类的大脑。

来自麻省理工学院神经科学家的新研究表明，最新的计算机神经网络可以识别视觉物体以及灵长类的大脑。

几十年来，神经科学家一直试图设计能够模仿视觉技能，例如识别物体的计算机网络，人类大脑确实非常准确且快速地。

到目前为止，在简要浏览期间，没有计算机模型能够在视觉对象识别下匹配灵长类的大脑。然而，来自麻省理工学院神经科学家的新研究发现，这些所谓的“深度神经网络”的最新一代之一与灵长类的大脑相匹配。

因为这些网络基于神经科学家的目前了解大脑如何进行对象识别，所以最新网络的成功表明，神经科学家有一个相当准确的对象识别如何有效地掌握，这是神经科学教授和麻省理工学院的教授脑和认知科学系和一篇文章中的高级作者，描述了12月18日杂志计算生物学期刊的研究。

“模型预测神经响应的事实和神经人口空间中的物体的距离表明，这些模型封装了我们目前的最佳理解，即在这个先前的大脑中发生的事情发生了什么，”Dicarlo也是如此麻省理工学院麦戈尔恩大脑研究所的成员。

这种改进了了解灵长类动物的作品如何导致更好的人工智能，有一天，修复视觉功能障碍的新方法，在麦戈尔恩研究所和纸质领先作者中添加了Charles Cadieu。

其他作者是研究生哈洪和迭戈·阿尔迪拉，研究科学家Daniel Yamins，前麻省理工学院研究生尼古拉斯·彭托，前麻省理工学院本科ethan所罗门，以及研究联盟纳吉·塔迈··纳伯。

受到大脑的启发

科学家在20世纪70年代开始建立神经网络，希望模仿大脑处理视觉信息的能力，认识语音和理解语言。

对于基于视觉的神经网络，科学家受到大脑中视觉信息的分层表示的启发。随着视觉输入从视网膜流入原发性视觉皮质，然后从那时起，它在每个级别处理它，并且变得更具体，直到可以识别对象。

为了模仿这一点，神经网络设计人员在其模型中创建了几个计算。每个级别执行数学操作，例如线性点产品。在每个级别，视觉对象的表示变得越来越复杂，并且除了对象的位置或移动之外的不需要的信息，抛弃。

“每个辛格元素通常是一个非常简单的数学表达式，”Cadieu说。“但是当您将千分之一和数百万这些事情组合在一起时，您将从原始信号变为非常复杂的转换，以非常适合对象识别的表示。”

对于这项研究，研究人员首先测量了大脑的物体识别能力。由Hong和Majaj领导，它们在IT皮层中的电极阵列以及在区域V4中植入，这是一种视觉系统，其进入IT皮质。这允许他们看到神经表示 - 为动物看起来的每个物体的神经元群体。

然后，研究人员可以将其与深神经网络创建的表示进行比较，这包括由系统中的每个计算元素产生的数字矩阵组成。每个图像产生不同的数字数组。模型的准确性由其在表示内的类似集群中是否将类似的对象组群体确定。

“通过这些计算变换中的每一个，通过这些网络层中的每一个，某些物体或图像都越来越近，而其他物体则进一步进一步，”Cadieu说。

最好的网络是纽约大学的研究人员开发的网络，该大学的分类物品以及猕猴大脑。

更多加工能力

Cadieu说，这两个主要因素占这类神经网络的最近成功。一个是计算处理能力的可用性的重要飞跃。研究人员一直利用图形处理单元（GPU），这是针对高性能而设计的小芯片，用于加工视频游戏所需的大量视觉内容。“这允许人们通过购买这些相对便宜的显卡来推动信封，”Cadieu说。

第二个因素是研究人员现在可以访问大型数据集以将算法送到“训练”它们。这些数据集包含数百万图像，每个数据集通过具有不同识别级别的人类注释。例如，狗的照片将被标记为动物，犬，驯养的狗和狗的品种。

起初，神经网络并不擅长识别这些图像，但随着他们看到越来越多的图像，并找出何时出错，他们会在识别对象时更准确地改进他们的计算。

Cadieu说，研究人员对究竟允许这些网络区分不同对象的知识不太了解。

“那是一个亲和力的，”他说。“这非常擅长，我们不必真正知道这些物体的事情是什么。但是，大康是，检查那些网络是很难看的，看看内部，看看他们真正做了什么。现在人们可以看到这些事情正在运作良好，他们会更加努力了解他们内心的发生。“

最新电脑型号的高性能“不仅仅是工程壮举，而且还为我们提供了更好的计算工具，用于建模生物大脑如何工作，包括人类大脑，”英国主要调查员尼古拉·克里·克里斯（Nikolaus Kriegeskorte）表示医学研究委员会认知和大脑科学单位，不是研究团队的一部分。“随着其他另外两个最近的研究，这项工作表明，深度学习模型以与生物大脑有点类似的方式解决了视觉识别的复杂任务。”

Dicarlo的实验室现在计划尝试生成可以模仿视觉处理的其他方面的模型，包括跟踪运动并识别三维形式。他们还希望创建包含在人类视觉系统中看到的反馈投影的模型。目前的网络仅将来自视网膜的“馈送”投影模拟到IT Cortex，但是有10倍的连接，即从IT Cortex返回系统的其余部分。

这项工作得到了国家眼科研究所，国家科学基金会和国防高级研究项目机构的支持。

出版物：Charles F. Cadieu，等，“深度神经网络竞争激烈的核心视觉对象识别的灵长类动物的代表，2014年PLOS计算生物学; DOI：10.1371 / journal.pcbi.1003963.

图像：图片由研究人员提供

郑重声明：文章仅代表原作者观点，不代表本站立场；如有侵权、违规，可直接反馈本站，我们将会作修改或删除处理。