谵妄预测多智能体AI报告辅助临床决策调查问卷77

一、研究目的

本问卷用于评估:
1)临床医生在仅基于病历资料时对急重症患者谵妄发生风险的判断;
2)在参考多智能体系统DeLiriuMAgents输出的AI报告后,临床医生的判断是否改变、信心是否提升;
3)AI报告在临床准确性、推理质量、总体有用性方面的表现。
注:本评估仅用于科研。请按真实临床思维作答。

二、评估方案

评估者:5 名年资相近、具有急诊或重症相关经验的临床医生

病例:来自本地两家医院,各 50 例,共 100 例(均为匿名化病历摘要/结构化数据)

分配:每名医生评估 20 例(病例随机分配;尽量保证阳性/阴性比例与真实分布接近)

盲法:医生在步骤1时不参考任何 AI 输出;步骤2 才参考 AI 报告;每一页作答完成后不可返回修改(锁定)
步骤1:仅基于病历资料的临床判断(没有AI辅助)

下面是患者的中文病历描述:
电子病历描述:

## 电子健康记录开始 ##
患者收入急诊科重症监护病房(ED-ICU)。下列电子健康记录数据为ED-ICU住院期间首次记录值,包括人口统计学资料、生命体征、实验室检测结果及治疗措施:
- 患者ID:B0368
- 性别:男性
- 年龄:82岁
- 种族:亚裔
- 主诉:胸痛、呼吸困难、发热、心悸
- 合并症:脑梗死、糖尿病、冠心病
- 改良早期预警评分(MEWS):1分(MEWS根据生命体征和意识水平评估临床恶化风险:MEWS<5分提示低恶化风险,MEWS≥5分提示需加强监护或治疗的高风险,MEWS≥9分预示死亡风险显著增加)

格拉斯哥昏迷量表(GCS)评分:
- GCS运动反应:6分(范围:1-6分;分数越低表明运动反应受损)
- GCS言语反应:5分(范围:1-5分;分数越低表明言语反应受损)
- GCS睁眼反应:4分(范围:1-4分;分数越低表明睁眼反应受损)
- GCS总评分:15分(GCS总分评估意识水平,3分表示深度昏迷,15分表示完全清醒定向。15分提示意识正常)

生命体征:
- 心率:97.00次/分(参考范围:60-100次/分)。在参考范围内
- 收缩压(SBP):157.00 mmHg(参考范围:90-120 mmHg)。高于参考范围
- 舒张压(DBP):112.00 mmHg(参考范围:60-80 mmHg)。高于参考范围
- 呼吸频率:18.00次/分(参考范围:12-20次/分)。在参考范围内
- 体温:36.00°C(参考范围:36-37.3°C)。在参考范围内
- 氧饱和度(SpO₂):96.00%(参考范围:95-100%)。在参考范围内

实验室检测:
血液学:
- 血细胞比容:40.00%(参考范围:35.0-50.0%)。在参考范围内
- 血红蛋白:13.70 g/dL(参考范围:12.0-18.0 g/dL)。在参考范围内
- 血小板计数:162.00 ×10^9/L(参考范围:150-350 ×10^9/L)。在参考范围内
- 白细胞计数(WBC):7.79 ×10^9/L(参考范围:4.5-11 ×10^9/L)。在参考范围内
肾功能:
- 血尿素氮(BUN):19.63 mg/dL(参考范围:8-23 mg/dL)。在参考范围内
- 血清肌酐:0.68 mg/dL(参考范围:0.6-1.2 mg/dL)。在参考范围内
血清电解质:
- 钠(Na⁺):140.90 mmol/L(参考范围:136-142 mmol/L)。在参考范围内
- 钾(K⁺):3.27 mmol/L(参考范围:3.5-5.0 mmol/L)。低于参考范围
- 钙(Ca²⁺):9.12 mg/dL(参考范围:8.5-10.2 mg/dL)。在参考范围内
- 镁(Mg²⁺):2.55 mg/dL(参考范围:1.3-2.1 mg/dL)。高于参考范围
代谢指标:
- 葡萄糖:190.26 mg/dL(参考范围:70-110 mg/dL)。高于参考范围
肝功能与酶学:
- 天门冬氨酸氨基转移酶(AST):56.00 IU/L(参考范围:10-30 IU/L)。高于参考范围
- 丙氨酸氨基转移酶(ALT):42.00 IU/L(参考范围:10-40 IU/L)。高于参考范围
- 白蛋白:4.60 g/dL(参考范围:3.5-5.0 g/dL)。在参考范围内
- 总胆红素:1.84 mg/dL(参考范围:0.3-1.2 mg/dL)。高于参考范围
- 乳酸脱氢酶(LDH):350.00 IU/L(参考范围:100-200 IU/L)。高于参考范围

治疗措施:
- 抗生素使用:是
- 镇静剂使用:否
- 血管加压药使用:是
- 糖皮质激素使用:否
- 有创操作:否
- 呼吸支持措施:无
- 最高级别呼吸支持:无
## 电子健康记录结束 ##

1. 您预测该患者发生谵妄的可能性:
步骤2:参考多智能体AI报告后的临床判断(AI报告为DeLiriuMAgents输出

下面是患者的中文病历描述与AI报告:
2. 此处电子病历描述与步骤1中相同, 是否需要重新阅读:

电子病历描述:

## 电子健康记录开始 ##
患者收入急诊科重症监护病房(ED-ICU)。下列电子健康记录数据为ED-ICU住院期间首次记录值,包括人口统计学资料、生命体征、实验室检测结果及治疗措施:
- 患者ID:B0368
- 性别:男性
- 年龄:82岁
- 种族:亚裔
- 主诉:胸痛、呼吸困难、发热、心悸
- 合并症:脑梗死、糖尿病、冠心病
- 改良早期预警评分(MEWS):1分(MEWS根据生命体征和意识水平评估临床恶化风险:MEWS<5分提示低恶化风险,MEWS≥5分提示需加强监护或治疗的高风险,MEWS≥9分预示死亡风险显著增加)

格拉斯哥昏迷量表(GCS)评分:
- GCS运动反应:6分(范围:1-6分;分数越低表明运动反应受损)
- GCS言语反应:5分(范围:1-5分;分数越低表明言语反应受损)
- GCS睁眼反应:4分(范围:1-4分;分数越低表明睁眼反应受损)
- GCS总评分:15分(GCS总分评估意识水平,3分表示深度昏迷,15分表示完全清醒定向。15分提示意识正常)

生命体征:
- 心率:97.00次/分(参考范围:60-100次/分)。在参考范围内
- 收缩压(SBP):157.00 mmHg(参考范围:90-120 mmHg)。高于参考范围
- 舒张压(DBP):112.00 mmHg(参考范围:60-80 mmHg)。高于参考范围
- 呼吸频率:18.00次/分(参考范围:12-20次/分)。在参考范围内
- 体温:36.00°C(参考范围:36-37.3°C)。在参考范围内
- 氧饱和度(SpO₂):96.00%(参考范围:95-100%)。在参考范围内

实验室检测:
血液学:
- 血细胞比容:40.00%(参考范围:35.0-50.0%)。在参考范围内
- 血红蛋白:13.70 g/dL(参考范围:12.0-18.0 g/dL)。在参考范围内
- 血小板计数:162.00 ×10^9/L(参考范围:150-350 ×10^9/L)。在参考范围内
- 白细胞计数(WBC):7.79 ×10^9/L(参考范围:4.5-11 ×10^9/L)。在参考范围内
肾功能:
- 血尿素氮(BUN):19.63 mg/dL(参考范围:8-23 mg/dL)。在参考范围内
- 血清肌酐:0.68 mg/dL(参考范围:0.6-1.2 mg/dL)。在参考范围内
血清电解质:
- 钠(Na⁺):140.90 mmol/L(参考范围:136-142 mmol/L)。在参考范围内
- 钾(K⁺):3.27 mmol/L(参考范围:3.5-5.0 mmol/L)。低于参考范围
- 钙(Ca²⁺):9.12 mg/dL(参考范围:8.5-10.2 mg/dL)。在参考范围内
- 镁(Mg²⁺):2.55 mg/dL(参考范围:1.3-2.1 mg/dL)。高于参考范围
代谢指标:
- 葡萄糖:190.26 mg/dL(参考范围:70-110 mg/dL)。高于参考范围
肝功能与酶学:
- 天门冬氨酸氨基转移酶(AST):56.00 IU/L(参考范围:10-30 IU/L)。高于参考范围
- 丙氨酸氨基转移酶(ALT):42.00 IU/L(参考范围:10-40 IU/L)。高于参考范围
- 白蛋白:4.60 g/dL(参考范围:3.5-5.0 g/dL)。在参考范围内
- 总胆红素:1.84 mg/dL(参考范围:0.3-1.2 mg/dL)。高于参考范围
- 乳酸脱氢酶(LDH):350.00 IU/L(参考范围:100-200 IU/L)。高于参考范围

治疗措施:
- 抗生素使用:是
- 镇静剂使用:否
- 血管加压药使用:是
- 糖皮质激素使用:否
- 有创操作:否
- 呼吸支持措施:无
- 最高级别呼吸支持:无
## 电子健康记录结束 ##

多智能体系统DeLiriuMAgents输出的AI报告

### ED-ICU谵妄风险预测临床报告

#### 1. **最终风险评估**
综合电子健康档案(EHR)、机器学习预测、多学科医师评估及检索医学文献的证据,该患者**在ED-ICU期间发生谵妄的可能性较低**。
- **预测结果:** 否
- **主观风险概率:** 0.22
- **置信分数:** 0.75

本判断整合了机器学习模型的低风险预测(19%概率,76.4%置信度)、医师智能体(急诊科、神经科、精神科)的一致共识,以及EHR记录的客观临床稳定性。概率值略高于模型输出,以纳入高龄(82岁)和感染风险因素;置信度则反映多源证据的强共识。患者神经功能完好且无高危暴露因素,与ED-ICU谵妄20–30%的基线发生率相符。

---

#### 2. **关键变量**
三个关键变量主导本次评估:
1. **格拉斯哥昏迷评分总分(15分):** 强保护因素。所有子项正常(运动6分、言语5分、睁眼4分)表明认知与觉醒回路完整,降低谵妄易感性。病理生理层面,完好的GCS可排除早期脑病风险。
2. **抗生素使用(存在):** 轻度风险因素。虽提示感染性炎症可能,但稳定的白细胞计数(7.79×10⁹/L)、正常体温(36°C)及血氧饱和度(96%)限制了即时风险。RAG证据证实感染独立增加风险(OR 3.2),但需共存不稳定因素。
3. **血钾(3.27 mmol/L):** 中度可修正风险。低钾血症可能干扰神经元兴奋性,但属轻度且可纠正。RAG数据显示电解质异常携带谵妄风险(RR 3.4);及时补充可缓解影响。
*权重分配:* GCS因对意识完整性的特异性占主导权重(70%);抗生素使用与低钾血症因补偿因素各占较低权重(15%)。

---

#### 3. **证据推理链**
**患者状态(EHR):** 82岁男性,心肺症状伴脑梗死/糖尿病史,关键风险包括:年龄(>65岁,每十年OR 1.6)及疑似感染(启用抗生素)。关键抵消因素为客观稳定性:GCS 15(子项均正常)、MEWS 1分(血流动力学稳定)、正常氧合(SpO₂ 96%)、无镇静/机械通气/代谢危象。轻度低钾血症/高血糖未引发意识障碍。

**医师智能体一致性:** 所有智能体认可低风险。急诊科强调GCS 15分且无镇静;神经科指出无急性神经病变;精神科关注极低精神诱因。无分歧——仅次要风险优先级差异(如急诊重视感染,神经科关注慢性血管风险)。共识核心为完整意识状态覆盖脆弱性。

**检索证据(RAG):** 文献支持年龄与感染为谵妄预测因子,但强调需急性诱因(如低氧、镇静)方能显现。实验证实低氧(SpO₂≤92%)致谵妄,但本例无此情况;苯二氮䓬类药物升高风险(避免使用具保护作用)。GCS对谵妄的特异性尚未明确,但其排除急性意识障碍的临床效用已获验证。

**整合分析:** 机器学习模型(侧重神经/微生物因素)与临床稳定性及专家共识吻合。RAG证据将孤立风险置于语境中,避免过度评估。

---

#### 4. **需监测因素**
未来24–48小时需重点监测:
- **电解质:** 血钾(纠正目标>3.5 mmol/L)与血糖(目标<180 mg/dL),未纠正的紊乱可能诱发脑病。
- **感染标志物:** 连续监测白细胞计数、体温及C反应蛋白以识别炎症进展。
- **神经状态:** 每8小时复查GCS;若意识波动需行正式谵妄筛查(如CAM-ICU)。
- **血压:** SBP>120 mmHg时应调整血管加压药剂量,限制脑低灌注/水肿风险。

---

#### 5. **初步干预建议**
- **非药物干预:** 执行睡眠管理(减少夜间干扰)、认知刺激(再定向训练)及自然光照。RAG证据支持多因素预防方案。
- **药物管理:** 纠正低钾血症;持续避免苯二氮䓬类药物(RAG列为高风险)。监测抗生素应答;感染进展时升级治疗。
- **会诊安排:** 除非GCS下降,否则无需神经科随访;无行为异常则暂缓精神科会诊。
- **风险标记:** 归入*低风险谵妄协议*,实施护理主导的再定向及每小时神经功能检查。

---
由ED-ICU主治医师代表多学科智能团队制定。

3. 基于病历资料和AI报告,您预测该患者发生谵妄的可能性:
4. AI报告是否改变了您的判断?
5. 若您的判断发生变化,AI报告让您改变原先判断的理由是?(可多选)
6.
在AI报告影响您判断的因素中,以下哪些具体内容最关键?(可多选):
步骤3:AI报告质量评价

下面是AI的预测报告:
7. 此处AI报告与步骤2中相同, 是否需要重新阅读:

多智能体系统DeLiriuMAgents输出的AI报告

### ED-ICU谵妄风险预测临床报告

#### 1. **最终风险评估**
综合电子健康档案(EHR)、机器学习预测、多学科医师评估及检索医学文献的证据,该患者**在ED-ICU期间发生谵妄的可能性较低**。
- **预测结果:** 否
- **主观风险概率:** 0.22
- **置信分数:** 0.75

本判断整合了机器学习模型的低风险预测(19%概率,76.4%置信度)、医师智能体(急诊科、神经科、精神科)的一致共识,以及EHR记录的客观临床稳定性。概率值略高于模型输出,以纳入高龄(82岁)和感染风险因素;置信度则反映多源证据的强共识。患者神经功能完好且无高危暴露因素,与ED-ICU谵妄20–30%的基线发生率相符。

---

#### 2. **关键变量**
三个关键变量主导本次评估:
1. **格拉斯哥昏迷评分总分(15分):** 强保护因素。所有子项正常(运动6分、言语5分、睁眼4分)表明认知与觉醒回路完整,降低谵妄易感性。病理生理层面,完好的GCS可排除早期脑病风险。
2. **抗生素使用(存在):** 轻度风险因素。虽提示感染性炎症可能,但稳定的白细胞计数(7.79×10⁹/L)、正常体温(36°C)及血氧饱和度(96%)限制了即时风险。RAG证据证实感染独立增加风险(OR 3.2),但需共存不稳定因素。
3. **血钾(3.27 mmol/L):** 中度可修正风险。低钾血症可能干扰神经元兴奋性,但属轻度且可纠正。RAG数据显示电解质异常携带谵妄风险(RR 3.4);及时补充可缓解影响。
*权重分配:* GCS因对意识完整性的特异性占主导权重(70%);抗生素使用与低钾血症因补偿因素各占较低权重(15%)。

---

#### 3. **证据推理链**
**患者状态(EHR):** 82岁男性,心肺症状伴脑梗死/糖尿病史,关键风险包括:年龄(>65岁,每十年OR 1.6)及疑似感染(启用抗生素)。关键抵消因素为客观稳定性:GCS 15(子项均正常)、MEWS 1分(血流动力学稳定)、正常氧合(SpO₂ 96%)、无镇静/机械通气/代谢危象。轻度低钾血症/高血糖未引发意识障碍。

**医师智能体一致性:** 所有智能体认可低风险。急诊科强调GCS 15分且无镇静;神经科指出无急性神经病变;精神科关注极低精神诱因。无分歧——仅次要风险优先级差异(如急诊重视感染,神经科关注慢性血管风险)。共识核心为完整意识状态覆盖脆弱性。

**检索证据(RAG):** 文献支持年龄与感染为谵妄预测因子,但强调需急性诱因(如低氧、镇静)方能显现。实验证实低氧(SpO₂≤92%)致谵妄,但本例无此情况;苯二氮䓬类药物升高风险(避免使用具保护作用)。GCS对谵妄的特异性尚未明确,但其排除急性意识障碍的临床效用已获验证。

**整合分析:** 机器学习模型(侧重神经/微生物因素)与临床稳定性及专家共识吻合。RAG证据将孤立风险置于语境中,避免过度评估。

---

#### 4. **需监测因素**
未来24–48小时需重点监测:
- **电解质:** 血钾(纠正目标>3.5 mmol/L)与血糖(目标<180 mg/dL),未纠正的紊乱可能诱发脑病。
- **感染标志物:** 连续监测白细胞计数、体温及C反应蛋白以识别炎症进展。
- **神经状态:** 每8小时复查GCS;若意识波动需行正式谵妄筛查(如CAM-ICU)。
- **血压:** SBP>120 mmHg时应调整血管加压药剂量,限制脑低灌注/水肿风险。

---

#### 5. **初步干预建议**
- **非药物干预:** 执行睡眠管理(减少夜间干扰)、认知刺激(再定向训练)及自然光照。RAG证据支持多因素预防方案。
- **药物管理:** 纠正低钾血症;持续避免苯二氮䓬类药物(RAG列为高风险)。监测抗生素应答;感染进展时升级治疗。
- **会诊安排:** 除非GCS下降,否则无需神经科随访;无行为异常则暂缓精神科会诊。
- **风险标记:** 归入*低风险谵妄协议*,实施护理主导的再定向及每小时神经功能检查。

---
由ED-ICU主治医师代表多学科智能团队制定。

角度A. Clinical accuracy(临床准确性)

8. 报告对谵妄风险相关医学解释的准确性:
9. 您认为该报告是否存在“幻觉”?
10. 若“有”,请指出可能错误信息出现在哪里(可多选):
11. 请描述您在AI报告中发现的可能错误信息:
角度B. Reasoning quality(推理质量)

12. 推理逻辑连贯性(前后是否一致、因果链是否清晰):
13. 证据支撑与可追溯性(结论是否能回溯到病历事实/关键特征/检索证据,而非“凭空推断”):
角度C. Overall usefulness(总体有用性)

14. AI报告会不会帮助提高您的效率:
15. AI报告的内容设计(长度、逻辑等)是否合理:
16. 在真实急诊流程中,您将DeLiriuMAgents作为决策辅助工具使用的意愿:
更多问卷 复制此问卷