AI4UI脑电实验后问卷01

感谢您的参与!请您完成问卷,方便我们后续分析🌹
1. 我清楚理解实验中 prompt 对目标卡片的要求。(1 = 非常不同意,4 = 一般,7 = 非常同意)
2. 我清楚理解“合理 / 不合理”的判断标准。(1 = 非常不同意,4 = 一般,7 = 非常同意)
3. 我在判断时主要关注目标卡片,而不是页面其他区域。(1 = 非常不同意,4 = 一般,7 = 非常同意)
4. 我能理解最终界面与 prompt 之间的关系。(1 = 非常不同意,4 = 一般,7 = 非常同意)
5. 我认为实验任务整体容易理解。(1 = 非常不同意,4 = 一般,7 = 非常同意)
6. 我觉得每个 trial 需要记住的信息较多。(1 = 非常不同意,4 = 一般,7 = 非常同意)
7. 看到最终界面时,我通常还能记得 prompt 中的关键信息。(1 = 非常不同意,4 = 一般,7 = 非常同意)
8. 我有时因为忘记 prompt 而无法判断界面是否正确。(1 = 非常不同意,4 = 一般,7 = 非常同意)
9. 我认为 prompt 中的信息量是可以接受的。(1 = 非常不同意,4 = 一般,7 = 非常同意)
10. 我主要是在比较 prompt 与目标卡片,而不是凭直觉随便判断。(1 = 非常不同意,4 = 一般,7 = 非常同意)
11. 实验过程中我感到疲劳。(1 = 非常不同意,4 = 一般,7 = 非常同意)
12. 实验后半段我的注意力有所下降。(1 = 非常不同意,4 = 一般,7 = 非常同意)
13. 6 个 block 的任务量对我来说是可以接受的。(1 = 非常不同意,4 = 一般,7 = 非常同意)
14. 每个 block 之间的休息时间足够。(1 = 非常不同意,4 = 一般,7 = 非常同意)
15. 我在大多数 trial 中都能保持认真判断。(1 = 非常不同意,4 = 一般,7 = 非常同意)
16. 我能明显识别图片与名称不匹配的问题。(1 = 非常不同意,4 = 一般,7 = 非常同意)
17. 我能明显识别价格、配送费、时间、评分等属性错误。(1 = 非常不同意,4 = 一般,7 = 非常同意)
18. 我能明显识别布局错位、重叠、溢出等结构错误。(1 = 非常不同意,4 = 一般,7 = 非常同意)
19. 我能明显识别关键信息缺失的问题。(1 = 非常不同意,4 = 一般,7 = 非常同意)
20. 不同错误类型之间整体上容易区分。(1 = 非常不同意,4 = 一般,7 = 非常同意)
21. 实验中的界面整体看起来像真实移动 App 界面。(1 = 非常不同意,4 = 一般,7 = 非常同意)
22. 实验中的错误看起来像 AI 生成界面时可能出现的问题。(1 = 非常不同意,4 = 一般,7 = 非常同意)
23. 这些错误不像人为故意制造的夸张“找茬图”。(1 = 非常不同意,4 = 一般,7 = 非常同意)
24. 这些错误符合组件生成、数据绑定、API 字段映射或布局生成时可能出现的 bug。(1 = 非常不同意,4 = 一般,7 = 非常同意)
25. 我认为这些界面错误在真实 AI 辅助前端开发中可能出现。(1 = 非常不同意,4 = 一般,7 = 非常同意)
26. 我认为研究人类如何检测这类 AI 生成界面错误是有意义的。(1 = 非常不同意,4 = 一般,7 = 非常同意)
27. 在判断界面是否合理时,您主要关注哪些方面的错误信息?
28. 您觉得哪一类错误最容易被发现?
29. 您觉得哪一类错误最难被发现?
30. 您认为以下哪几类错误最具“AI生成特征”(即最像目前的AI在生成网页/App前端界面时容易出现的bug)?
更多问卷 复制此问卷