AI4UI脑电实验后问卷01

感谢您的参与！请您完成问卷，方便我们后续分析🌹

1. 我清楚理解实验中 prompt 对目标卡片的要求。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

2. 我清楚理解“合理 / 不合理”的判断标准。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

3. 我在判断时主要关注目标卡片，而不是页面其他区域。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

4. 我能理解最终界面与 prompt 之间的关系。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

5. 我认为实验任务整体容易理解。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

6. 我觉得每个 trial 需要记住的信息较多。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

7. 看到最终界面时，我通常还能记得 prompt 中的关键信息。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

8. 我有时因为忘记 prompt 而无法判断界面是否正确。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

9. 我认为 prompt 中的信息量是可以接受的。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

10. 我主要是在比较 prompt 与目标卡片，而不是凭直觉随便判断。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

11. 实验过程中我感到疲劳。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

12. 实验后半段我的注意力有所下降。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

13. 6 个 block 的任务量对我来说是可以接受的。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

14. 每个 block 之间的休息时间足够。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

15. 我在大多数 trial 中都能保持认真判断。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

16. 我能明显识别图片与名称不匹配的问题。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

17. 我能明显识别价格、配送费、时间、评分等属性错误。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

18. 我能明显识别布局错位、重叠、溢出等结构错误。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

19. 我能明显识别关键信息缺失的问题。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

20. 不同错误类型之间整体上容易区分。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

21. 实验中的界面整体看起来像真实移动 App 界面。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

22. 实验中的错误看起来像 AI 生成界面时可能出现的问题。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

23. 这些错误不像人为故意制造的夸张“找茬图”。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

24. 这些错误符合组件生成、数据绑定、API 字段映射或布局生成时可能出现的 bug。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

25. 我认为这些界面错误在真实 AI 辅助前端开发中可能出现。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

26. 我认为研究人类如何检测这类 AI 生成界面错误是有意义的。（1 = 非常不同意，4 = 一般，7 = 非常同意）

1234567

27. 在判断界面是否合理时，您主要关注哪些方面的错误信息?

语义错误（如:图片内容与文字叙述不符，指东打西）属性错误（如:价格、评分、时间等数值或标签信息不准确）结构错误（如:组件排列错乱、重叠、溢出、对齐不齐）信息缺失（如:卡片中漏掉了原本应该有的图片、文字或价格）

28. 您觉得哪一类错误最容易被发现?

语义错误（图文不符，常识性错误）属性错误（数值/标签错误，需仔细核对但通常明显）结构错误（视觉布局混乱，一眼就能看出异常）信息缺失（关键信息直接看不到了）

29. 您觉得哪一类错误最难被发现?

语义错误（需要结合 prompt 理解和常识判断逻辑）属性错误（数值看起来正常，不核对 prompt 难以察觉，如配送费比菜价贵）结构错误（轻微的不对齐或像素级偏差）信息缺失（不知道本来应该有什么信息，难以察觉漏了什么）

30. 您认为以下哪几类错误最具“AI生成特征”（即最像目前的AI在生成网页/App前端界面时容易出现的bug）?

语义错误（如：图片内容与文字叙述不符，指东打西）属性错误（如：价格、评分、时间等数值或标签信息不准确）结构错误（如：组件排列错乱、重叠、溢出、对齐不齐）信息缺失（如：卡片中漏掉了原本应该有的图片、文字或价格）

更多问卷复制此问卷