探索人工智能与人类感知的对齐:多维度度量的挑战与前景
摘要
本文探讨了不同对齐度量之间的相关性,特别是在评估人工神经网络与人类神经和行为数据的对齐程度时。通过分析Brain-Score中的视觉数据和多种对齐度量,研究发现这些度量之间的成对相关性通常较低,有时甚至是负的。例如,在Brain-Score上完全评估的80个模型中,平均相关性仅为0.198。这表明,与人类感知对齐可能最好被视为一个多维概念,不同的方法测量不同的方面。文章还探讨了如何正确组合和聚合这些度量,强调了综合基准测试的重要性,并提出了几种聚合选项以确保不同对齐度量公平地贡献于综合基准分数。
Read more...








