AI4UI脑电实验后问卷01
感谢您的参与!请您完成问卷,方便我们后续分析🌹
1. 我清楚理解实验中 prompt 对目标卡片的要求。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
2. 我清楚理解“合理 / 不合理”的判断标准。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
3. 我在判断时主要关注目标卡片,而不是页面其他区域。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
4. 我能理解最终界面与 prompt 之间的关系。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
5. 我认为实验任务整体容易理解。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
6. 我觉得每个 trial 需要记住的信息较多。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
7. 看到最终界面时,我通常还能记得 prompt 中的关键信息。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
8. 我有时因为忘记 prompt 而无法判断界面是否正确。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
9. 我认为 prompt 中的信息量是可以接受的。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
10. 我主要是在比较 prompt 与目标卡片,而不是凭直觉随便判断。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
11. 实验过程中我感到疲劳。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
12. 实验后半段我的注意力有所下降。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
13. 6 个 block 的任务量对我来说是可以接受的。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
14. 每个 block 之间的休息时间足够。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
15. 我在大多数 trial 中都能保持认真判断。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
16. 我能明显识别图片与名称不匹配的问题。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
17. 我能明显识别价格、配送费、时间、评分等属性错误。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
18. 我能明显识别布局错位、重叠、溢出等结构错误。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
19. 我能明显识别关键信息缺失的问题。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
20. 不同错误类型之间整体上容易区分。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
21. 实验中的界面整体看起来像真实移动 App 界面。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
22. 实验中的错误看起来像 AI 生成界面时可能出现的问题。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
23. 这些错误不像人为故意制造的夸张“找茬图”。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
24. 这些错误符合组件生成、数据绑定、API 字段映射或布局生成时可能出现的 bug。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
25. 我认为这些界面错误在真实 AI 辅助前端开发中可能出现。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
26. 我认为研究人类如何检测这类 AI 生成界面错误是有意义的。(1 = 非常不同意,4 = 一般,7 = 非常同意)
1
2
3
4
5
6
7
27. 在判断界面是否合理时,您主要关注哪些方面的错误信息?
语义错误(如:图片内容与文字叙述不符,指东打西)
属性错误(如:价格、评分、时间等数值或标签信息不准确)
结构错误(如:组件排列错乱、重叠、溢出、对齐不齐)
信息缺失(如:卡片中漏掉了原本应该有的图片、文字或价格)
28. 您觉得哪一类错误最容易被发现?
语义错误(图文不符,常识性错误)
属性错误(数值/标签错误,需仔细核对但通常明显)
结构错误(视觉布局混乱,一眼就能看出异常)
信息缺失(关键信息直接看不到了)
29. 您觉得哪一类错误最难被发现?
语义错误(需要结合 prompt 理解和常识判断逻辑)
属性错误(数值看起来正常,不核对 prompt 难以察觉,如配送费比菜价贵)
结构错误(轻微的不对齐或像素级偏差)
信息缺失(不知道本来应该有什么信息,难以察觉漏了什么)
30. 您认为以下哪几类错误最具“AI生成特征”(即最像目前的AI在生成网页/App前端界面时容易出现的bug)?
语义错误(如:图片内容与文字叙述不符,指东打西)
属性错误(如:价格、评分、时间等数值或标签信息不准确)
结构错误(如:组件排列错乱、重叠、溢出、对齐不齐)
信息缺失(如:卡片中漏掉了原本应该有的图片、文字或价格)
关闭
更多问卷
复制此问卷