视觉注意力建模研究-公共安全科创平台网站-产业技术创新战略平台

高新技术

高新技术

信息技术

项目名称：视觉注意力建模研究

　　项目简介：

　　随着移动互联网的飞速发展，智能手机用户能非常方便地通过移动终端上传视频图像到各类社交网站上。互联网海量视频图像数据的涌现，使得基于网络的视觉数据处理成为当前的一个重要研究热点。如何在海量的视频图像数据中，提取有效的视觉信息，是当前视频图像特征表达的一个重要问题。视觉神经生理学的相关研究证明，人眼在观看视频图像时，往往会把注意力集中在视频图像的某部分区域上，而忽略其他的区域。根据人类视觉系统的相关感知机制设计视觉注意力模型，检测视频图像的显著性区域，能广泛地应用于各类视频图像处理中，比如视频图像的压缩，检索，分割，质量评价等。本项目提出了压缩域下的视频图像视觉注意力模型，通过DCT系数和运动向量提取视频图像的基本特征，来计算特征的中心-环绕差，最终求得视频图像的显著图，为各类视频图像处理应用提供了高效的视觉信息提取方法。本项目提出的基于图像和视频的人类视觉注意力模型框架图如图1和2所示。

图1. 压缩域下的图像显著性区域检测。

图2. 压缩域下视频显著性区域检测

　　项目结果分析：部分视频图像的显著性区域检测结果

参考文献：

1. Yuming Fang, Weisi Lin, Zhenzhong Chen, Chia-Ming Tsai, and Chia-Wen Lin, “A Video Saliency Detection Model in the Compressed Domain,” IEEE Transactions on Circuits and Systems for Video Technology. Vol. 24 (1), 27-38, 2014

2. Yuming Fang, Zhenzhong Chen, Weisi Lin, and Chia-Wen Lin, ‘Saliency Detection in the compressed domain for adaptive image retargeting‘, IEEE Transactions on Image Processing, Vol. 21, No. 9, 3888-3901, 2012.

下一篇：NSCT域多聚焦图像融合技术上一篇：什么是动环