在计算机技术飞速发展的今天, 世界范围内的网站数量正以每分钟571个的速度飞涨着。与快速增长的网页数量相对的是网页设计水平的参差不齐。唯有符合一定设计规律的网页才利于用户体验与信息传播。而根据眼球的生理结构, 视觉最有效的感知部位, 在视网膜上只占很小的比例, 这决定了视觉在一定时间内只能容纳少量的视觉信息。一旦视觉接收到的信息超出一定的视觉容量, 人们就会产生相应的抵触反应, 引起不快。因此网页信息的呈现需符合一定的人类视觉规律。依据人的视觉机制对所设计网页进行评估显得尤为重要。
人类视觉系统中的视觉显著性提取机制可以快速高效的从大量的视觉输入信息中提取出那些最重要的信息。同样的, 在视觉计算研究领域, 视觉显著性检测模型可以得到一幅用以描述原图像中各位置相对于其周边的“显著”程度的灰度图, 即显著图, 从而感知出图像数据中的显著性区域。本文将网页页面作为图像数据进行研究, 对其视觉显著性区域进行分析与检测, 从而为后续网页设计优化提供相关建议。
1 人类视觉系统
关于人类视觉系统, 目前认可度最高的是Neisser提出的描述人类视觉系统作用过程的机制。他将早期视觉处理过程分为预注意处理阶段和注意处理阶段。第一阶段主要是处理和检测场景中能引起视觉细胞更大刺激的显著的特征, 即那些不同于大多数的背景的区域部分。第二阶段中, 神经系统将这些显著的特征通过某种关系进行融合和聚类, 然后形成注意力分配图用来指导眼球运动。后来MIT的David C.Marr做出补充, 提出预注意阶段会将进入视觉系统内的光线转化为颜色、边缘、线条和倾角等特征, 并对其进行特定的编码来形成对视觉场景的初步表示, 最终让视觉系统能够进行识别和分析。
2 基于视觉显著性的图像理解
将视觉注意机制引入图像信息处理过程, 形成了一种由选择处理和集中处理组成图像信息处理的方法。注意机制被纳入到该方法之中, 选择处理对应选择性注意机制, 用来对图像信息进行选择;集中处理对应集中性注意机制, 用来集中处理相关图像信息, 忽略或舍弃不相关的图像信息。
另外, 知识库将选择处理和集中处理联系起来, 通过其内部的高层知识形成反馈信息与控制指令, 对整个图像信息处理过程进行管理。
3 视觉显著性描述与检测模型
在计算机视觉领域的各方向例如目标检测、图像分割、以及图像和视频压缩中, 显著性检测都得到了广泛应用, 用以得到显著性区域。其显示结果是一幅用以描述源图像中各位置相对于其周边“显著”程度的灰度图, 即显著图。
总体上来说, 视觉显著性检测的方法可以分为两大类, 分别是自底向上数据驱动的显著性提取和自顶向下任务驱动的显著性提取。考虑到自顶向下的显著性提取是根据特定的任务建立, 理论和应用均具有局限性, 本文重点介绍自底向上数据驱动的显著性提取类型。同时, 目前显著性检测中的绝大多数研究成果均是研究自底向上的由底层特征驱动的计算模型。下面对视觉显著性检测模型的发展历程做一个简单的梳理。
Niebur等人提出第一个具有实际意义的视觉显著性检测算法, 而具有里程碑式的视觉显著性检测模型则是由美国加州理工学院的Christof Koch教授和美国南加州大学的Laurent Itti副教授二人于1998年合作提出, 对输入图像分布计算得到亮度、颜色和方向3个通道的高斯金字塔, 再对各金字塔计算中央周边差运算得到特征图, 最后将各通道的特征图也分别规则化后合并得到最终的显著图, 具有较高的计算机适用度。GBVS是基于图论求取显著性, 提取过程类似于Itti等人模型模拟视觉原理, 但在显著图的生成过程中加入Markov链, 利用图的模型计算中央周边差, 然后通过纯数字计算得到显著性。DISK算法用样本方差和峰度估计假设的广义高斯概率密度函数, 然后计算中央周边的相互信息。基于中央周边差的显著性算法考虑局部特征的对比往往用多尺度而不是单个尺度的方案以更好地求得显著图, 然而多尺度算法的计算花销较大运算较慢, 并且由于频繁地使用邻近插值导致显著图的分辨率降低, 也一定程度丢失了目标边缘信息除此以外, SR算法和IG算法等基于图像空间频域分析的显著性检测算法也都是隶属于自底向上的显著性检测经常采用的代表性算法, 它们具有运算速度较快的优点, 但IG算法计算的显著图中显著区域的显著度较低, 无法很好地突出最显著的位置;SR算法没有考虑颜色特征, 也没保存足够多的高频信息, 使得显著图中显著区域的边界不够清晰。
显著性模型在上个世纪八十年代就被提出, 但是直到近几年才出现许多新的显著性建模思想, 并且形成了一个热门的研究领域。
4 视觉显著性检测在网页设计中的应用
视觉显著性模型可以适用于许多应用, 研究较为成熟的有目标检测和分割, 视频分析等。其在平面设计中同样具有重要的意义可以通过这些模型与技术为设计师提供具参考价值的设计优化方向, 预测用户对网页设计效果的评估与反馈。
在众多基于区域的显著性模型中, Itti模型是极具代表性的显著性模型, 但仍需在图像处理和数学角度理解其本质的基础上针对网页页面的图像特点进行研究, 从而构造出符合网页场景的新的显著性模型。关于这一领域的研究还较少, 目前针对用户网页浏览行为的视觉显著性模型仅有少数基于非图像信息的概念模型以及计算模型。由于网页浏览具有其不同于自然图像的行为特点, 应用于网页的视觉显著性模型还需要进一步的研究与发展。