谵妄预测多智能体AI报告辅助临床决策调查问卷031

一、研究目的

本问卷用于评估:
1)临床医生在仅基于病历资料时对急重症患者谵妄发生风险的判断;
2)在参考多智能体系统DeLiriuMAgents输出的AI报告后,临床医生的判断是否改变、信心是否提升;
3)AI报告在临床准确性、推理质量、总体有用性方面的表现。
注:本评估仅用于科研。请按真实临床思维作答。

二、评估方案

评估者:5 名年资相近、具有急诊或重症相关经验的临床医生

病例:来自本地两家医院,各 50 例,共 100 例(均为匿名化病历摘要/结构化数据)

分配:每名医生评估 20 例(病例随机分配;尽量保证阳性/阴性比例与真实分布接近)

盲法:医生在步骤1时不参考任何 AI 输出;步骤2 才参考 AI 报告;每一页作答完成后不可返回修改(锁定)
步骤1:仅基于病历资料的临床判断(没有AI辅助)

下面是患者的中文病历描述:
电子病历描述:

患者收治于急诊科重症监护病房(ED-ICU)。下列电子健康记录(EHR)数据为ED-ICU住院期间首次记录的有效值,涵盖人口统计学、生命体征、实验室检测结果及治疗措施: 

- 患者ID:B0332
- 性别:男
- 年龄:67岁
- 种族:亚裔
- 主诉:胸痛、呼吸困难、呕吐
- 合并症:脑梗死、糖尿病、肾脏疾病、高血压
- 改良早期预警评分(MEWS):1分。(MEWS依据生命体征和意识水平评估临床恶化风险:MEWS<5分通常提示低恶化风险,MEWS≥5分需加强监测或治疗,MEWS≥9分死亡风险显著增高)

格拉斯哥昏迷评分(GCS):
- GCS运动反应:6分(范围:1-6分;分值越低提示运动功能受损)
- GCS言语反应:5分(范围:1-5分;分值越低提示言语功能受损)
- GCS睁眼反应:4分(范围:1-4分;分值越低提示睁眼功能受损)
- GCS总分:15分(GCS总分评估意识水平,范围3分[深度昏迷]至15分[完全清醒],15分提示意识正常)

生命体征:
- 心率:88.00 次/分(参考范围:60-100次/分)——在参考范围内
- 收缩压(SBP):178.00 mmHg(参考范围:90-120 mmHg)——超出参考范围
- 舒张压(DBP):87.00 mmHg(参考范围:60-80 mmHg)——超出参考范围
- 呼吸频率:20.00 次/分(参考范围:12-20次/分)——在参考范围内
- 体温:36.00 °C(参考范围:36-37.3 °C)——在参考范围内
- 血氧饱和度(SpO₂):95.00 %(参考范围:95-100%)——在参考范围内

实验室检测:
血液学:
- 血细胞比容:38.00 %(参考范围:35.0-50.0%)——在参考范围内
- 血红蛋白:13.10 g/dL(参考范围:12.0-18.0 g/dL)——在参考范围内
- 血小板计数:123.00 ×10⁹/L(参考范围:150-350×10⁹/L)——低于参考范围
- 白细胞计数(WBC):7.79 ×10⁹/L(参考范围:4.5-11×10⁹/L)——在参考范围内
肾功能:
- 血尿素氮(BUN):13.08 mg/dL(参考范围:8-23 mg/dL)——在参考范围内
- 血清肌酐:0.92 mg/dL(参考范围:0.6-1.2 mg/dL)——在参考范围内
血清电解质:
- 钠(Na⁺):142.40 mmol/L(参考范围:136-142 mmol/L)——超出参考范围
- 钾(K⁺):3.70 mmol/L(参考范围:3.5-5.0 mmol/L)——在参考范围内
- 钙(Ca²⁺):9.20 mg/dL(参考范围:8.5-10.2 mg/dL)——在参考范围内
- 镁(Mg²⁺):2.04 mg/dL(参考范围:1.3-2.1 mg/dL)——在参考范围内
代谢指标:
- 葡萄糖:145.62 mg/dL(参考范围:70-110 mg/dL)——超出参考范围
肝功能与酶学:
- 天冬氨酸氨基转移酶(AST):23.00 IU/L(参考范围:10-30 IU/L)——在参考范围内
- 丙氨酸氨基转移酶(ALT):17.00 IU/L(参考范围:10-40 IU/L)——在参考范围内
- 白蛋白:4.23 g/dL(参考范围:3.5-5.0 g/dL)——在参考范围内
- 总胆红素:1.58 mg/dL(参考范围:0.3-1.2 mg/dL)——超出参考范围
- 乳酸脱氢酶(LDH):260.00 IU/L(参考范围:100-200 IU/L)——超出参考范围

治疗措施:
- 抗生素使用:否
- 镇静剂使用:否
- 血管升压药使用:是
- 糖皮质激素使用:否
- 侵入性操作:否
- 呼吸支持措施:无
- 最高级别呼吸支持:无
## 电子健康记录结束 ##
1. 您预测该患者发生谵妄的可能性:
步骤2:参考多智能体AI报告后的临床判断(AI报告为DeLiriuMAgents输出

下面是患者的中文病历描述与AI报告:
2. 此处电子病历描述与步骤1中相同, 是否需要重新阅读:

电子病历描述:

患者收治于急诊科重症监护病房(ED-ICU)。下列电子健康记录(EHR)数据为ED-ICU住院期间首次记录的有效值,涵盖人口统计学、生命体征、实验室检测结果及治疗措施:

- 患者ID:B0332
- 性别:男
- 年龄:67岁
- 种族:亚裔
- 主诉:胸痛、呼吸困难、呕吐
- 合并症:脑梗死、糖尿病、肾脏疾病、高血压
- 改良早期预警评分(MEWS):1分。(MEWS依据生命体征和意识水平评估临床恶化风险:MEWS<5分通常提示低恶化风险,MEWS≥5分需加强监测或治疗,MEWS≥9分死亡风险显著增高)

格拉斯哥昏迷评分(GCS):
- GCS运动反应:6分(范围:1-6分;分值越低提示运动功能受损)
- GCS言语反应:5分(范围:1-5分;分值越低提示言语功能受损)
- GCS睁眼反应:4分(范围:1-4分;分值越低提示睁眼功能受损)
- GCS总分:15分(GCS总分评估意识水平,范围3分[深度昏迷]至15分[完全清醒],15分提示意识正常)

生命体征:
- 心率:88.00 次/分(参考范围:60-100次/分)——在参考范围内
- 收缩压(SBP):178.00 mmHg(参考范围:90-120 mmHg)——超出参考范围
- 舒张压(DBP):87.00 mmHg(参考范围:60-80 mmHg)——超出参考范围
- 呼吸频率:20.00 次/分(参考范围:12-20次/分)——在参考范围内
- 体温:36.00 °C(参考范围:36-37.3 °C)——在参考范围内
- 血氧饱和度(SpO₂):95.00 %(参考范围:95-100%)——在参考范围内

实验室检测:
血液学:
- 血细胞比容:38.00 %(参考范围:35.0-50.0%)——在参考范围内
- 血红蛋白:13.10 g/dL(参考范围:12.0-18.0 g/dL)——在参考范围内
- 血小板计数:123.00 ×10⁹/L(参考范围:150-350×10⁹/L)——低于参考范围
- 白细胞计数(WBC):7.79 ×10⁹/L(参考范围:4.5-11×10⁹/L)——在参考范围内
肾功能:
- 血尿素氮(BUN):13.08 mg/dL(参考范围:8-23 mg/dL)——在参考范围内
- 血清肌酐:0.92 mg/dL(参考范围:0.6-1.2 mg/dL)——在参考范围内
血清电解质:
- 钠(Na⁺):142.40 mmol/L(参考范围:136-142 mmol/L)——超出参考范围
- 钾(K⁺):3.70 mmol/L(参考范围:3.5-5.0 mmol/L)——在参考范围内
- 钙(Ca²⁺):9.20 mg/dL(参考范围:8.5-10.2 mg/dL)——在参考范围内
- 镁(Mg²⁺):2.04 mg/dL(参考范围:1.3-2.1 mg/dL)——在参考范围内
代谢指标:
- 葡萄糖:145.62 mg/dL(参考范围:70-110 mg/dL)——超出参考范围
肝功能与酶学:
- 天冬氨酸氨基转移酶(AST):23.00 IU/L(参考范围:10-30 IU/L)——在参考范围内
- 丙氨酸氨基转移酶(ALT):17.00 IU/L(参考范围:10-40 IU/L)——在参考范围内
- 白蛋白:4.23 g/dL(参考范围:3.5-5.0 g/dL)——在参考范围内
- 总胆红素:1.58 mg/dL(参考范围:0.3-1.2 mg/dL)——超出参考范围
- 乳酸脱氢酶(LDH):260.00 IU/L(参考范围:100-200 IU/L)——超出参考范围

治疗措施:
- 抗生素使用:否
- 镇静剂使用:否
- 血管升压药使用:是
- 糖皮质激素使用:否
- 侵入性操作:否
- 呼吸支持措施:无
- 最高级别呼吸支持:无
## 电子健康记录结束 ##

多智能体系统DeLiriuMAgents输出的AI报告

急诊科ICU谵妄风险预测临床报告



**1. 最终风险评估**
综合机器学习预测、多学科医师评估及当前医学证据,该患者在急诊-重症监护病房住院期间**发生谵妄可能性低**。主观风险概率为**0.22**,置信评分为**0.85**。

该判断整合了机器学习模型的低风险预测(概率:0.15,置信度:76.4%)、急诊科/神经科/精神科专家的一致共识,以及电子健康档案显示的稳定意识状态和无急性诱因。尽管年龄与慢性共病增加了基础脆弱性,但保护性因素——包括格拉斯哥昏迷评分正常(GCS 15)、未使用镇静剂或机械通气、血氧正常、临床稳定(MEWS 1)——抵消了这些风险。概率略高于模型估值以反映年龄相关易感性,但仍低于急诊-重症监护病房发病率基线(20%~30%),符合临床稳定性。

**2. 关键变量**
四个变量对本评估至关重要:
- **格拉斯哥昏迷评分(总分:15)**:强保护性因素。GCS 15表明意识与定向力完整,直接排除谵妄核心诊断标准。此优势超越了患者无急性恶化的脑梗死病史。
- **镇静剂使用(未使用)**:保护性因素。避免苯二氮䓬类药物或其他γ-氨基丁酸受体激动剂可消除因神经递质紊乱引发谵妄的主要医源性诱因。
- **年龄(67岁)**:轻度风险因素。年龄>65岁通过累积性血管病变和胆碱能储备下降降低神经弹性,但不足以抵消保护性因素。
- **血钠(142.4 mmol/L,轻度升高)**:中性-低风险。虽低钠血症是明确的可控风险因素,但此处血钠仅边际性升高且无相关临床表现(如脱水症状),故重要性降低。

**3. 证据推理链**
**患者状况(电子健康档案)**:主诉胸痛、呼吸困难、呕吐提示急性心源性应激,但无谵妄诱发因素。生命体征稳定(氧合正常、体温正常),肾/肝功能无急性衰竭,神经状态最佳(GCS 15)。高血压使用升压药表明需血流动力学支持,但无低血压或休克征象。轻度高血糖与血小板减少属慢性病变,非急性损伤。

**医师智能体协同**:三位专家均认同低谵妄风险,强调GCS稳定、无高危干预(镇静剂、通气)、无感染证据。急诊科重点关注升压药与血小板作为监测优先级,但认为不足以构成谵妄风险。神经科指出无脑病标志物(如尿素氮正常、血氨未升高)。精神科强调昼夜节律与认知功能保留。无分歧存在,因无急性神经、代谢或药物诱因。

**证据整合**:现有医学证据证实年龄与卒中史为风险因素,但强调感染、低氧和镇静是主要可控诱因——本病例均未出现。代谢紊乱(如血钠>145 mmol/L)为明确风险因素,但本病例水平未达临界值。值得注意的是,GCS在急诊专属模型中非验证预测因子,但其稳定性在本例中仍具临床保障意义。呼吸频率正常(RR=20次/分)进一步支持病情稳定。

**4. 需监测因素**
未来24~48小时需重点监测的动态变量包括:
- **血压趋势**:若升压药滴定过快,持续高血压可能损害脑灌注。
- **血糖水平**:需严格控制高血糖(145 mg/dL)以避免渗透压应激加重血管脆弱性。
- **血小板计数(123×10⁹/L)**:监测下降趋势以识别进展性炎症或微血管损伤。
- **GCS波动**:任何低于15分的情况需紧急重新评估。

**5. 初始干预建议**
- **非药物干预**:实施昼夜节律维护(减少夜间干扰)、定向力训练、认知刺激(如家属参与)。建议降低急诊-重症监护病房噪音。
- **药物调整**:避免苯二氮䓬类药物;必要时优先选用对乙酰氨基酚等镇痛剂。维持当前升压药方案,禁用镇静辅助剂。
- **会诊建议**:除非GCS下降或出现激越症状,否则无需神经科/精神科正式随访。
- **流程规范**:标记为常规谵妄风险(非高风险),纳入标准急诊-重症监护病房监测(如每日两次CAM-ICU筛查)。

---
*本报告整合机器学习预测、多学科专家共识及循证风险因素。虽存在慢性脆弱性,但急性稳定性主导预后。对进展性心肺或代谢应激源的警惕仍至关重要。*

3. 基于病历资料和AI报告,您预测该患者发生谵妄的可能性:
4. AI报告是否改变了您的判断?
5. 若您的判断发生变化,AI报告让您改变原先判断的理由是?(可多选)
6.
在AI报告影响您判断的因素中,以下哪些具体内容最关键?(可多选):
步骤3:AI报告质量评价

下面是AI的预测报告:
7. 此处AI报告与步骤2中相同, 是否需要重新阅读:

多智能体系统DeLiriuMAgents输出的AI报告

急诊科ICU谵妄风险预测临床报告



**1. 最终风险评估**
综合机器学习预测、多学科医师评估及当前医学证据,该患者在急诊-重症监护病房住院期间**发生谵妄可能性低**。主观风险概率为**0.22**,置信评分为**0.85**。

该判断整合了机器学习模型的低风险预测(概率:0.15,置信度:76.4%)、急诊科/神经科/精神科专家的一致共识,以及电子健康档案显示的稳定意识状态和无急性诱因。尽管年龄与慢性共病增加了基础脆弱性,但保护性因素——包括格拉斯哥昏迷评分正常(GCS 15)、未使用镇静剂或机械通气、血氧正常、临床稳定(MEWS 1)——抵消了这些风险。概率略高于模型估值以反映年龄相关易感性,但仍低于急诊-重症监护病房发病率基线(20%~30%),符合临床稳定性。

**2. 关键变量**
四个变量对本评估至关重要:
- **格拉斯哥昏迷评分(总分:15)**:强保护性因素。GCS 15表明意识与定向力完整,直接排除谵妄核心诊断标准。此优势超越了患者无急性恶化的脑梗死病史。
- **镇静剂使用(未使用)**:保护性因素。避免苯二氮䓬类药物或其他γ-氨基丁酸受体激动剂可消除因神经递质紊乱引发谵妄的主要医源性诱因。
- **年龄(67岁)**:轻度风险因素。年龄>65岁通过累积性血管病变和胆碱能储备下降降低神经弹性,但不足以抵消保护性因素。
- **血钠(142.4 mmol/L,轻度升高)**:中性-低风险。虽低钠血症是明确的可控风险因素,但此处血钠仅边际性升高且无相关临床表现(如脱水症状),故重要性降低。

**3. 证据推理链**
**患者状况(电子健康档案)**:主诉胸痛、呼吸困难、呕吐提示急性心源性应激,但无谵妄诱发因素。生命体征稳定(氧合正常、体温正常),肾/肝功能无急性衰竭,神经状态最佳(GCS 15)。高血压使用升压药表明需血流动力学支持,但无低血压或休克征象。轻度高血糖与血小板减少属慢性病变,非急性损伤。

**医师智能体协同**:三位专家均认同低谵妄风险,强调GCS稳定、无高危干预(镇静剂、通气)、无感染证据。急诊科重点关注升压药与血小板作为监测优先级,但认为不足以构成谵妄风险。神经科指出无脑病标志物(如尿素氮正常、血氨未升高)。精神科强调昼夜节律与认知功能保留。无分歧存在,因无急性神经、代谢或药物诱因。

**证据整合**:现有医学证据证实年龄与卒中史为风险因素,但强调感染、低氧和镇静是主要可控诱因——本病例均未出现。代谢紊乱(如血钠>145 mmol/L)为明确风险因素,但本病例水平未达临界值。值得注意的是,GCS在急诊专属模型中非验证预测因子,但其稳定性在本例中仍具临床保障意义。呼吸频率正常(RR=20次/分)进一步支持病情稳定。

**4. 需监测因素**
未来24~48小时需重点监测的动态变量包括:
- **血压趋势**:若升压药滴定过快,持续高血压可能损害脑灌注。
- **血糖水平**:需严格控制高血糖(145 mg/dL)以避免渗透压应激加重血管脆弱性。
- **血小板计数(123×10⁹/L)**:监测下降趋势以识别进展性炎症或微血管损伤。
- **GCS波动**:任何低于15分的情况需紧急重新评估。

**5. 初始干预建议**
- **非药物干预**:实施昼夜节律维护(减少夜间干扰)、定向力训练、认知刺激(如家属参与)。建议降低急诊-重症监护病房噪音。
- **药物调整**:避免苯二氮䓬类药物;必要时优先选用对乙酰氨基酚等镇痛剂。维持当前升压药方案,禁用镇静辅助剂。
- **会诊建议**:除非GCS下降或出现激越症状,否则无需神经科/精神科正式随访。
- **流程规范**:标记为常规谵妄风险(非高风险),纳入标准急诊-重症监护病房监测(如每日两次CAM-ICU筛查)。

---
*本报告整合机器学习预测、多学科专家共识及循证风险因素。虽存在慢性脆弱性,但急性稳定性主导预后。对进展性心肺或代谢应激源的警惕仍至关重要。*

角度A. Clinical accuracy(临床准确性)

8. 报告对谵妄风险相关医学解释的准确性:
9. 您认为该报告是否存在“幻觉”?
10. 若“有”,请指出可能错误信息出现在哪里(可多选):
11. 请描述您在AI报告中发现的可能错误信息:
角度B. Reasoning quality(推理质量)

12. 推理逻辑连贯性(前后是否一致、因果链是否清晰):
13. 证据支撑与可追溯性(结论是否能回溯到病历事实/关键特征/检索证据,而非“凭空推断”):
角度C. Overall usefulness(总体有用性)

14. AI报告会不会帮助提高您的效率:
15. AI报告的内容设计(长度、逻辑等)是否合理:
16. 在真实急诊流程中,您将DeLiriuMAgents作为决策辅助工具使用的意愿:
更多问卷 复制此问卷