探索XAI体验的新维度:XEQ量表的开发与应用
摘要
本文介绍了一种基于心理测量理论的XAI体验质量评估量表(XEQ Scale),旨在评估用户中心的XAI体验质量。XEQ量表通过四个评估维度(学习、实用性、满足感和参与度)量化XAI体验的质量,超越了传统单一维度评估单次解释的局限。论文详细阐述了XEQ量表的开发和验证过程,包括内容验证、判别验证和构建验证,并通过大规模试点研究证明了其作为评估用户中心XAI体验的综合框架的有效性。
原理
XEQ量表的工作原理基于心理测量理论,通过四个核心维度(学习、实用性、满足感和参与度)来评估XAI系统的用户体验质量。每个维度包含多个具体问题,用户通过5点Likert量表进行回答,从而量化其对XAI体验的感受。这种多维度的评估方法能够全面捕捉用户与XAI系统交互过程中的各个方面,确保评估结果的全面性和准确性。
流程
XEQ量表的工作流程包括以下几个步骤:
- 内容验证:通过XAI专家对初始量表项目进行评估,确保每个项目的内容相关性和清晰度。
 - 试点研究:在大规模试点研究中,参与者通过观看XAI体验的视频样本,然后回答XEQ量表的问题,以评估量表的内部一致性、判别效度和构建效度。
 - 数据分析:使用统计方法(如Cronbach’s alpha、因子分析等)对试点研究的数据进行分析,以验证量表的可靠性和有效性。
 - 量表优化:根据试点研究的结果,对量表项目进行必要的调整和优化,以提高量表的性能。
 
应用
XEQ量表的应用前景广泛,可用于评估和改进各种XAI系统的用户体验。它不仅可以帮助XAI系统的设计者和开发者了解用户的需求和偏好,还可以作为监管机构和政府部门评估XAI系统性能的工具。随着XAI技术的不断发展,XEQ量表有望成为评估XAI体验质量的行业标准。
