「What can 5.17 billion regression fits tell us about artificial models of the human visual system? 」这篇论文便回答了大脑区域是用来做什么这一问题。
然而,正如Jess Thompson指出的那样,这不是唯一的解释形式。
特别是,任务优化网络通常在生物学上被认为是不合理的,因为传统的ImageNet训练会使用1M图像。
即便是为了让婴儿识别一项任务,他们必须每5秒接受一个新的监督标签,例如父母指着一只鸭子对孩子说「鸭子」,每天3小时,持续一年以上。
那对于非人类的灵长类动物和老鼠又是怎样的一种情况?因此,寻找与人类大脑相匹配的生物学上相似的神经网络研究仍在继续。
·无监督学习旨在表示数据分布。该领域最常用的技术之一是变分自编码器 (VAE)。 ·自监督训练旨在通过解决代理任务来找到良好的数据表示。如今,语言模型几乎普遍使用自监督训练,比如BERT和GPT-3。 ·对比学习是自监督学习的一种特殊形式,其代理任务是预测样本是来自正面还是负面(或干扰项)。对比学习有很多不同的风格:MoCo、InfoNCE、SimCLR、CPC等。也有一些密切相关的非对比方法可以消除负样本,包括BYOL和BarlowTwins。 ·多模态学习是自监督训练的另一种特殊形式,其目的是通过预测两种不同的模态(如视觉、文本、音频等)的共同子空间,或者预测一个模态共同的子空间。CLIP 便是一个典型的例子。
所有这些方法都允许我们在不需要监督情况下学习表示。其实,自监督和无监督方法相结合比只使用监督方法在生物学上更合理。
就此,Mineault 回顾了今年MAIN、NeurIPS、CCN会议,以及其他预印本,并做出了一份关于无监督学习的大脑模型总结。 Unsupervised neural network models of the ventral visual stream
这篇论文刚刚发表在PNAS顶刊上,引用量已超过60。
论文地址:https://www.pnas.org/content/118/3/e2014196118
作者发现,无监督和自监督方法学习的表征与腹侧流(V1,V4,IT)神经元实现方式一致。论文摘要指出:
灵长类动物显示出非凡的识别能力。这种能力是通过腹侧视觉流实现的,腹侧流是多个等级相互关联的大脑区域。这些领域最好的定量模型是经过人工标记训练的深层神经网络。
然而,这些模型需要比婴儿接收到更多的标记,使他们无法实现腹侧流发展模式。
最近,在无监督学习取得的进展在很大程度上弥补了这一差距。我们发现,用最新的无监督学习的神经网络在腹侧流中获得的预测精度等于或超过当今最好的模型。
这些结果说明了使用无监督学习来建立大脑系统的模型,并为感官学习计算理论提供了一个强有力的备选方案。
特别是,作者发现 SimCLR 和其他对比学习方法几乎可以像监督学习方法一样解释腹侧神经元。
训练模型时标签不是必要的,这篇论文是一个非常强有力的证明。 Beyond category-supervision: Computational support for domain-general pressures guiding human visual system representation
论文地址:https://www.biorxiv.org/content/10.1101/2020.06.15.153247v3
Konkle and Alvarez 在论文提出了一个与 Zhuang 等人论文类似的问题:
腹侧信息流是否可以由一个不经过监督式学习训练的网络来解释?他们使用功能磁共振成像而不是单个神经元的记录来评估这一点。他们发现结果与Zhuang的文章大体一致,并且有着自己独特的实例——对比自我监督,以及其他类似的解释 fMRI 数据的结果。 Your head is there to move you around: Goal-driven models of the primate dorsal pathway
这篇论文便是由神经科学家 Patrick Mineault撰写,已在2021NeurIPS发表。
正如作者之前所讨论的,腹侧神经元对形状是有选择性的。然而,视觉皮层输出的讯息会传送到两个渠道,一个是腹侧流,另一个便是背侧流,这是怎么回事?作者通过比较许多自监督的3D网络和不同的背侧流区域,发现它们不能解释非人灵长类动物单个神经元的反应。