探索XAI体验的新维度：XEQ量表的开发与应用

Posted on 2024-07-15 in CS.AI • 14 words • 1 minute read

Last updated on 2024-07-16

摘要

本文介绍了一种基于心理测量理论的XAI体验质量评估量表（XEQ Scale），旨在评估用户中心的XAI体验质量。XEQ量表通过四个评估维度（学习、实用性、满足感和参与度）量化XAI体验的质量，超越了传统单一维度评估单次解释的局限。论文详细阐述了XEQ量表的开发和验证过程，包括内容验证、判别验证和构建验证，并通过大规模试点研究证明了其作为评估用户中心XAI体验的综合框架的有效性。

原理

XEQ量表的工作原理基于心理测量理论，通过四个核心维度（学习、实用性、满足感和参与度）来评估XAI系统的用户体验质量。每个维度包含多个具体问题，用户通过5点Likert量表进行回答，从而量化其对XAI体验的感受。这种多维度的评估方法能够全面捕捉用户与XAI系统交互过程中的各个方面，确保评估结果的全面性和准确性。

流程

XEQ量表的工作流程包括以下几个步骤：

内容验证：通过XAI专家对初始量表项目进行评估，确保每个项目的内容相关性和清晰度。
试点研究：在大规模试点研究中，参与者通过观看XAI体验的视频样本，然后回答XEQ量表的问题，以评估量表的内部一致性、判别效度和构建效度。
数据分析：使用统计方法（如Cronbach’s alpha、因子分析等）对试点研究的数据进行分析，以验证量表的可靠性和有效性。
量表优化：根据试点研究的结果，对量表项目进行必要的调整和优化，以提高量表的性能。

应用

XEQ量表的应用前景广泛，可用于评估和改进各种XAI系统的用户体验。它不仅可以帮助XAI系统的设计者和开发者了解用户的需求和偏好，还可以作为监管机构和政府部门评估XAI系统性能的工具。随着XAI技术的不断发展，XEQ量表有望成为评估XAI体验质量的行业标准。