GazeFusion:引领视觉注意力的创新图像生成技术
摘要
本文介绍了一种名为GazeFusion的新型人工智能框架,该框架利用显著性引导(saliency guidance)来生成图像,这些图像不仅符合文本描述,还能引导观众的注意力到特定的图像区域。GazeFusion通过结合低级图像特征(如颜色、对比度、频率和布局)和高级语义信息(如对象、文本和面部),实现了对视觉注意力的精确控制。该研究通过眼动追踪用户研究和大规模模型基础的显著性分析,验证了其方法的有效性,并展示了其在交互式设计、注意力抑制和适应不同显示/观看条件等多种应用中的潜力。
Read more...




