一、研究目的
本问卷用于评估:
1)临床医生在仅基于病历资料时对急重症患者谵妄发生风险的判断;
2)在参考多智能体系统DeLiriuMAgents输出的AI报告后,临床医生的判断是否改变、信心是否提升;
3)AI报告在临床准确性、推理质量、总体有用性方面的表现。
注:本评估仅用于科研。请按真实临床思维作答。
二、评估方案
评估者:5 名年资相近、具有急诊或重症相关经验的临床医生
病例:来自本地两家医院,各 50 例,共 100 例(均为匿名化病历摘要/结构化数据)
分配:每名医生评估 20 例(病例随机分配;尽量保证阳性/阴性比例与真实分布接近)
盲法:医生在步骤1时不参考任何 AI 输出;步骤2 才参考 AI 报告;每一页作答完成后不可返回修改(锁定)