摘要: 目的:本文首先综述我们前期基于眼动的引导注意计算模型及应用方面的研究,具体包括通过结合眼动实验和视觉计算方法,建立场景信息引导的视觉注意计算模型,验证场景结构在引导视觉注意过程中的重要作用并应用于交通场景。此外,进一步探索基于目标的视觉注意模型评价指标。
方法:首先,基于眼动实验考察被试观看轮廓图像和夜间交通场景时的注视点分布规律。其次,基于生物视觉皮层中长程连接机制的启发,结合深度学习技术分别建立了轮廓信息引导的区域和场景结构特征学习模块,并建立场景信息引导的视觉注意计算模型以提高视觉注意预测的性能。此外,以夜间交通场景为应用场景,建立了针对交通场景的视觉场景结构表达方法,并实现交通场景结构信息引导的视觉注意预测模型。最后,针对基于稀疏注视点评价模型性能存在的问题,本文探索并建立一种基于目标区域的视觉注意模型评价指标。
结果:针对眼动实验研究,发现在自由观看任务中受试者更关注轮廓图像中的封闭区域,这些区域通常与场景中的主要目标及场景结构相关。基于此,本文建立的模拟皮层长程连接的神经网络模型,能够有效提取大范围场景结构信息,并提高视觉注意预测模型性能。同时,针对交通场景的应用研究表明,场景结构引导的计算模型能有效提高各种显著性检测方法的性能,并在小规模的数据集或视觉场景迁移应用中具有更高的鲁棒性。
结论:通过计算模型验证了以轮廓分布构建的场景结构表达在引导视觉注意过程中具有重要作用。此外,本文建立了针对夜间交通场景的视觉引导注意计算方法,并建立了基于目标的注意模型评价新指标。