摘要: 目的:材质的感知与识别是视觉感知领域的组成部分, 对研究人类视觉和计算机视觉系统具有重要意义。本文通过心理物理学实验, 对材质图像的注视区域进行基于人类视觉系统的材质识别的研究。 方法:实验一, 在FMD(Flickr Material Database)、OpenSurfaces以及人工收集的材质图像中, 选取织物、玻璃、皮革、金属、纸、塑料、石头、水、木头, 共9类、每类12幅图像作为10名被试的观察图像。其中, 所选图像去除了物体边缘信息, 减少被试观察材质时的影响。每幅图像显示时间为4秒, 间隔1秒。同时用眼动仪记录实验过程中的眼动数据。被试根据观察到的图像判断材质的类别。根据相应的热力图, 对注视区域进行进一步分析。实验二, 只保留实验一中注视区域的子图像, 由未参与实验一的另外12名被试针对子图像进行材质分类任务。 结果:注视区域子图像的平均识别准确率(82.5%)低于原图像的平均识别准确率(91.1%)。针对具体材质类别, 金属、水的注视区域图像与原图像的识别准确率差别很小(<2%); 玻璃、塑料的实验结果差别较大(>20%)。 结论:视觉系统通过单幅图像进行材质分类时, 原图像提供的信息量大于注视区域子图像, 因此仅观察注视区域图像的识别准确率较低。但对于某些材质, 注视区域子图像包含了材质识别所需的信息, 仅观察注视区域图像与观察原图像的识别效果相当。相反, 对于某些材质的识别, 注视区域子图像丢失了材质识别所需的信息, 仅观察注视区域图像与原图像的识别效果相差较大。
中图分类号: