大脑 「眼中」 的视觉

大脑 「眼中」 的视觉

“看” 似乎是一个简单的过程,只要睁开眼睛我们就能看到周围的世界。睁开眼睛你可以看到川流不息的人海,你可以看到五彩斑斓的花朵,你可以看见车水马龙的大街。一切都是那么自然,不过你有没有思考过“看” 是怎么完成的呢?我们是怎么能够把景色净收眼底的呢?心理学家和认知神经科学家们其实在这个领域耕耘无数载,“看”的科学被他们称之为视觉研究。


一切心理过程都有这神经科学的表现。当我们的眼睛上视网膜(retina)接收到光线时候,它会把看到的光线转化为电信号,通过神经元之间的信息传递,往大脑皮层而去。经过对外侧膝状体(LGN)的中继,视觉信息达到了大脑皮层。首先接收信息的就是初级视觉皮层(V1),它会分析所看见物体的大小,方向,边缘等信息。之后,视觉信息会被个个大脑区域逐步分析,比如下颞叶皮层(IT)会分析看到的东西是什么,而中颞区皮层(MT)会分析所看到东西的运动和位置信息。最终,我们的大脑会汇总看到的一切,解读出我们眼前的事物。按照神经科学以及人工智能的巨擎 David Marr所言:“视觉正是信息处理过程”,我们在 “看” 世界的时候,就是视觉信息在视觉处理脑区内被逐步分析解读的过程。


图 1、这张图是我们视觉系统的简化图。其结构已经非常复杂。


研究眼低的视网膜正是研究视觉过程的“窗户”。视觉起始于眼睛底部的视网膜。在视网膜上有视杆和视锥两类光感受器,他们对于不同波长的光线敏感程度不同,于是我们能看到五彩斑斓的景象。事实的确如此,不过视网膜只不过是视觉的起点。光线会汇聚在眼睛底部的视网膜区域。在这里,我们有两类光感受器:视杆细胞(柱状)以及视锥细胞(椎状)。有趣的是,视杆和视锥细胞其实分布在视网膜的最后。它们接收到光线之后,会把这部分能量转化为电信号向前面的神经节细胞传递。是不是有点像叶绿体把光转化为能量?让我们反思下戴维·马尔的洞察,视觉神经系统的每一层都是在做信息处理,比如光感受器就是把光信号转化为生物电信号。虽然整个视觉系统每一层的信号转换,以及方式方法不同,不过在抽象的角度看,他们都在做类似的事情。

之所以感受光线的神经元在排布在视网膜最后,有一个很不错的解释。因为光线的传递过程中,眼内各种半透明的结构都会导致光线的反射、折射、和衍射。越多曾半透明结构,更大可能导致成像模糊。而光感受器在最后几层可以有效地减少各类光学干扰。不过当然,排在光感受器前面的神经节细胞等神经元也会影响到光的接受。


视网膜上成像最清晰的地方就是中央凹(foveal)了。在这里,只有视锥细胞。而且在视锥细胞之前没有任何神经元影响成像。因此光学干扰被压低到最小。但是为什么只有视锥细胞没有视杆细胞呢?这就是视网膜的有趣之处:视锥细胞接收到的的清晰度更高。虽然每个眼球内视网膜上的光感受器有一亿多个,不过只有六百万个是视锥细胞,其余是视杆细胞。视锥细胞对于亮光敏感,也对色彩敏感。我们看到的世界大多数是视锥细胞为我们提供的。视锥细胞大多出现在中央凹。它们基本与参与中继的神经节细胞一一对应,保证传递信息的精确。但是视杆细胞往往在中央凹之外,他们的成像也不够清晰,上百个视杆细胞才会与一个神经节细胞对应,这样能保证信息强度足够大(毕竟在模糊的情况下,传递的信息也是很模糊,通过这样的“举手表决”可以加强信息的强度)。


之所以我们能看到颜色,还得归功于视锥细胞。科学家把视锥细胞分为三类,根据他们所敏感的光线波长分为S(短波),M(中波),和L(长波)三种。下图就是这三类细胞对于不同波长光的敏感程度。可见光正是一个光谱带,短波更加蓝,因此S型视锥细胞对于蓝色的光线更敏感。不过色彩知觉可远比这个复杂,还得涉及到细胞感受野的拮抗理论,还有视觉皮层的一些工作方式。学海无涯,哪怕简单的视觉也是如此复杂。


视网膜接收到的信息会通过视神经向大脑皮层传去。我们的左右半脑其实处理的都是对侧的信息。在这里我得要给大家普及下更加正确的说法:在不同半脑的初级感觉皮层(视觉,听觉,触觉),的确是更倾向于接收对侧的信息,但是同侧信息也有;而在高级处理皮层就对双侧信息都加以处理。用更科学的术语来说,我们看下右眼,它能接收颞侧信息(在这里就是右边,靠近太阳穴的那一侧的信息),也可以接收鼻侧信息(用右眼看鼻子是不是能看到左侧的信息?)。这两类信息会在视交叉做一个交叉。总归左边的信息输到右侧大脑,反之亦然。经过传递与预处理,视网膜上的信息最终会抵达初级视觉皮层。也就是大脑的最后端枕叶区域。从这里开始,大脑正式开始对视网膜接收到的信息进行处理。


首先接收到信息的就是初级视觉皮层(V1)。在这里的神经元可以从视网膜提供的信号中恢复出颜色信息,方向信息,以及边缘信息。按照伦敦大学学院的李兆平教授的观点,初级视觉皮层提供了一张‘看’到的特征图。不过初级视觉皮层,顾名思义,它的处理还是很初级的。在它之后的V2皮层会对于初级视觉皮层的信息进行线性与非线性转置(根据Freeman团队与2013年在《自然》杂志上的研究成果),从而恢复出更为复杂的信息:材质信息。再之后,视觉信息兵分两路。其中关于运动,位置,方向的信息更多的向中颞叶皮层(MT)而去以抵达顶叶;这被称为背侧通路(图上绿色部分)。而分析视觉信息的内容(比如这是什么汽车,这是什么树)会被传递到v4皮层最终抵达下颞叶皮层(IT);被称为腹侧通路(图上紫色部分)。



背侧通路和腹侧通路的划分假说,得要说到著名科学家Leslie Ungerleider。她通过摧毁猕猴的部分脑区的方法发现了两个通路的功能不同。在腹侧受损之后,猕猴没法判断两个图案是否一致;但是在背侧受损之后,猕猴就不能判断某个特别的图案是在左边还是右边。

在腹侧和背侧通路上,视觉的处理就非常的复杂了。倘若在初级视觉皮层,神经元的处理可以用数学公式来描述的话,在腹侧通路上的下颞叶皮层的活动对于我们来说还是无法用数学模型表达
。这种数学描述就是所谓的计算视觉:像物理学一样,用数学模型来解释复杂的处理过程。所以,在上世纪六、七十年代时候,当以Hubel和Wiesel两位诺奖得主为代表生理学家摸清楚初级视觉皮层的功能时候,计算机学界的科学家以及用电脑模拟人脑指日可待。但是我们到现在还没有能力彻底地描述腹侧通路,可以说前路漫漫。

视觉已经是神经科学中探索最为广泛与深刻的一部分,但它依旧迷雾重重。哪怕是聪明的科学家们都没有办法避免科研道路上的挑战。在2017年,视觉科学协会(Vision
Science Society)年度大会上,来自明尼苏达大学的Kendrick Kay教授提到他的研究取向:“不要用我们自己的视觉系统来研究人类的视觉系统。” 简单说来,“看”这件事情太过轻松和简单,会让我们有时候低估了视觉的复杂性。


这是在《知识就是力量》杂志的一篇稿子。比较浅显的介绍了视觉系统的基本知识,所以就放上来了。
发布于 2018-08-07

文章被以下专栏收录