谵妄预测多智能体AI报告辅助临床决策调查问卷98

一、研究目的

本问卷用于评估:
1)临床医生在仅基于病历资料时对急重症患者谵妄发生风险的判断;
2)在参考多智能体系统DeLiriuMAgents输出的AI报告后,临床医生的判断是否改变、信心是否提升;
3)AI报告在临床准确性、推理质量、总体有用性方面的表现。
注:本评估仅用于科研。请按真实临床思维作答。

二、评估方案

评估者:5 名年资相近、具有急诊或重症相关经验的临床医生

病例:来自本地两家医院,各 50 例,共 100 例(均为匿名化病历摘要/结构化数据)

分配:每名医生评估 20 例(病例随机分配;尽量保证阳性/阴性比例与真实分布接近)

盲法:医生在步骤1时不参考任何 AI 输出;步骤2 才参考 AI 报告;每一页作答完成后不可返回修改(锁定)
步骤1:仅基于病历资料的临床判断(没有AI辅助)

下面是患者的中文病历描述:
电子病历描述:

## 电子健康记录开始 ##
这名患者被收入急诊科重症监护室(ED-ICU)。以下EHR数据代表在ED-ICU住院期间记录的首次可用值。这些数据包括人口统计信息、生命体征、实验室检查结果以及治疗或干预措施:
- 患者ID:B0088。
- 性别:女性。
- 年龄:36岁。
- 种族:亚洲人。
- 主诉:胸痛、腹痛、呼吸困难、晕厥、乏力、心悸、胃肠道出血、呕吐。
- 合并症:无记录的合并症。
- 修改的早期预警评分(MEWS): 1。(MEWS评估基于生命体征和意识水平的临床恶化风险。MEWS <5通常表示恶化风险较低,而MEWS ≥5表示需要重症监护或治疗的高风险。MEWS ≥9与死亡率显著增加相关。)

格拉斯哥昏迷评分(GCS)评分:
- GCS运动反应:6。(范围:1–6;分数越低表示运动反应受损。)
- GCS语言反应:5。(范围:1–5;分数越低表示语言反应受损。)
- GCS眼球睁开:4。(范围:1–4;分数越低表示眼球睁开反应受损。)
- GCS总分:15。(GCS总分评估意识水平。分数范围从3(深度昏迷)到15(完全警觉和定向)。15分表示正常意识状态。)

生命体征:
- 心率:83.00 次/分(参考范围:60 - 100 次/分)。在参考范围内。
- 收缩压(SBP):176.00 mmHg(参考范围:90 - 120 mmHg)。高于参考范围。
- 舒张压(DBP):115.00 mmHg(参考范围:60 - 80 mmHg)。高于参考范围。
- 呼吸频率:16.00 次呼吸/分(参考范围:12 - 20 次呼吸/分)。在参考范围内。
- 体温:36.00 °C(参考范围:36 – 37.3 °C)。在参考范围内。
- 氧饱和度(SpO2):98.00 %(参考范围:95 - 100 %)。在参考范围内。

实验室检查:
血液学:
- 红细胞压积:60.00 %(参考范围:35.0 - 50.0 %)。高于参考范围。
- 血红蛋白:9.60 g/dL(参考范围:12.0 - 18.0 g/dL)。低于参考范围。
- 血小板计数:135.00 ×10^9/L(参考范围:150 - 350 ×10^9/L)。低于参考范围。
- 白细胞计数(WBC):4.89 ×10^9/L(参考范围:4.5 - 11 ×10^9/L)。在参考范围内。
肾功能:
- 血清肌酐:0.60 mg/dL(参考范围:0.6 - 1.2 mg/dL)。在参考范围内。
血清电解质:
- 钠(Na⁺):138.00 mmol/L(参考范围:136 - 142 mmol/L)。在参考范围内。
- 钾(K⁺):5.44 mmol/L(参考范围:3.5 - 5.0 mmol/L)。高于参考范围。
- 钙(Ca²⁺):9.04 mg/dL(参考范围:8.5 - 10.2 mg/dL)。在参考范围内。
- 镁(Mg²⁺):1.70 mg/dL(参考范围:1.3 - 2.1 mg/dL)。在参考范围内。
代谢:
- 葡萄糖:79.20 mg/dL(参考范围:70 - 110 mg/dL)。在参考范围内。
肝功能和酶:
- 天冬氨酸氨基转移酶(AST):21.00 IU/L(参考范围:10 - 30 IU/L)。在参考范围内。
- 总胆红素:0.50 mg/dL(参考范围:0.3 - 1.2 mg/dL)。在参考范围内。

治疗措施:
- 抗生素使用:是。
- 镇静剂使用:是。
- 升压药使用:是。
- 糖皮质激素使用:否。
- 侵入性操作:是。
- 所有呼吸支持措施:无。
- 最高呼吸支持:无。
## 电子健康记录结束 ##

1. 您预测该患者发生谵妄的可能性:
步骤2:参考多智能体AI报告后的临床判断(AI报告为DeLiriuMAgents输出

下面是患者的中文病历描述与AI报告:
2. 此处电子病历描述与步骤1中相同, 是否需要重新阅读:

电子病历描述:

## 电子健康记录开始 ##
这名患者被收入急诊科重症监护室(ED-ICU)。以下EHR数据代表在ED-ICU住院期间记录的首次可用值。这些数据包括人口统计信息、生命体征、实验室检查结果以及治疗或干预措施:
- 患者ID:B0088。
- 性别:女性。
- 年龄:36岁。
- 种族:亚洲人。
- 主诉:胸痛、腹痛、呼吸困难、晕厥、乏力、心悸、胃肠道出血、呕吐。
- 合并症:无记录的合并症。
- 修改的早期预警评分(MEWS): 1。(MEWS评估基于生命体征和意识水平的临床恶化风险。MEWS <5通常表示恶化风险较低,而MEWS ≥5表示需要重症监护或治疗的高风险。MEWS ≥9与死亡率显著增加相关。)

格拉斯哥昏迷评分(GCS)评分:
- GCS运动反应:6。(范围:1–6;分数越低表示运动反应受损。)
- GCS语言反应:5。(范围:1–5;分数越低表示语言反应受损。)
- GCS眼球睁开:4。(范围:1–4;分数越低表示眼球睁开反应受损。)
- GCS总分:15。(GCS总分评估意识水平。分数范围从3(深度昏迷)到15(完全警觉和定向)。15分表示正常意识状态。)

生命体征:
- 心率:83.00 次/分(参考范围:60 - 100 次/分)。在参考范围内。
- 收缩压(SBP):176.00 mmHg(参考范围:90 - 120 mmHg)。高于参考范围。
- 舒张压(DBP):115.00 mmHg(参考范围:60 - 80 mmHg)。高于参考范围。
- 呼吸频率:16.00 次呼吸/分(参考范围:12 - 20 次呼吸/分)。在参考范围内。
- 体温:36.00 °C(参考范围:36 – 37.3 °C)。在参考范围内。
- 氧饱和度(SpO2):98.00 %(参考范围:95 - 100 %)。在参考范围内。

实验室检查:
血液学:
- 红细胞压积:60.00 %(参考范围:35.0 - 50.0 %)。高于参考范围。
- 血红蛋白:9.60 g/dL(参考范围:12.0 - 18.0 g/dL)。低于参考范围。
- 血小板计数:135.00 ×10^9/L(参考范围:150 - 350 ×10^9/L)。低于参考范围。
- 白细胞计数(WBC):4.89 ×10^9/L(参考范围:4.5 - 11 ×10^9/L)。在参考范围内。
肾功能:
- 血清肌酐:0.60 mg/dL(参考范围:0.6 - 1.2 mg/dL)。在参考范围内。
血清电解质:
- 钠(Na⁺):138.00 mmol/L(参考范围:136 - 142 mmol/L)。在参考范围内。
- 钾(K⁺):5.44 mmol/L(参考范围:3.5 - 5.0 mmol/L)。高于参考范围。
- 钙(Ca²⁺):9.04 mg/dL(参考范围:8.5 - 10.2 mg/dL)。在参考范围内。
- 镁(Mg²⁺):1.70 mg/dL(参考范围:1.3 - 2.1 mg/dL)。在参考范围内。
代谢:
- 葡萄糖:79.20 mg/dL(参考范围:70 - 110 mg/dL)。在参考范围内。
肝功能和酶:
- 天冬氨酸氨基转移酶(AST):21.00 IU/L(参考范围:10 - 30 IU/L)。在参考范围内。
- 总胆红素:0.50 mg/dL(参考范围:0.3 - 1.2 mg/dL)。在参考范围内。

治疗措施:
- 抗生素使用:是。
- 镇静剂使用:是。
- 升压药使用:是。
- 糖皮质激素使用:否。
- 侵入性操作:是。
- 所有呼吸支持措施:无。
- 最高呼吸支持:无。
## 电子健康记录结束 ##

多智能体系统DeLiriuMAgents输出的AI报告

**ED-ICU 谵妄风险预测临床报告**

### 1. 最终风险评估
主观风险概率:0.15
置信度评分:0.85

患者被评估为在ED-ICU设置中发展为谵妄的风险概率低(15%)。这一判断整合了高置信度的机器学习预测(“无”)以及急诊科、神经科和精神科医师代理人的一致同意。尽管电子健康记录数据显示风险因素——包括镇静剂使用、血管加压药应用和高钾血症——但患者正常的格拉斯哥昏迷量表(GCS=15)、低的改良早期预警评分(MEWS=1)以及无神经异常显著减轻了总体风险。这一概率低于典型的ED-ICU谵妄发生率基线(20–30%),增强了其临床合理性。鉴于模型的可靠性和多学科共识,我认同这一低风险评估。临床上,这不需要紧急谵妄预防,但因可改变的风险暴露证明针对性监测是合理的。

### 2. 关键变量
- **格拉斯哥昏迷量表(GCS=15)**: 正常GCS评分强烈表明意识清醒和定向力完整,作为最保护性的变量。这直接降低了谵妄风险,排除了基线认知障碍。
- **镇静剂使用**: 积极的镇静剂给药增加了风险,原因是神经抑制效应可能干扰皮层功能。这在推理中被高度加权,因为药理学干预是可修改的风险放大器。
- **血管加压药使用**: 表明血流动力学不稳定或危重疾病,导致代谢应激和低灌注相关神经元损伤。尽管有其他稳定因素,但其存在增加了担忧。
- **钾水平(5.44 mmol/L)**: 高钾血症反映了电解质失衡,可能加剧神经肌肉易激惹和混淆。虽然不严重,但鉴于钾在神经兴奋性中的作用,其贡献是中等。

这些变量形成一个张力:保护性的GCS/MEWS抵消了药理学和代谢风险,创造出整体的低风险轮廓。

### 3. 推理证据链
患者的表现——多种急性症状包括胃肠道出血和高血压——起初提示一个复杂的危重疾病。然而,她的正常GCS评分(15)和低MEWS(1)表明神经功能保留且恶化风险最小,有效对抗了高钾血症或贫血等因素。镇静剂和血管加压药使用虽然是已知的谵妄原,但缺乏当前神经影响的证据。机器学习模型和所有医师代理人的一致“无”评估强调了这一稳定性,因为他们的预测框架优先关注敏锐度和意识指标。值得注意的是,没有生成医疗证据查询,因为没有高风险指标(如败血症休克或严重代谢性酸中毒)出现以挑战这一观点。缺乏精神并发症、发热或缺氧进一步支持了低风险结论。尽管有治疗性暴露(抗生素、侵入性操作),但无系统性炎症(正常白细胞计数、体温)和完整的终末器官功能(正常肌酐、胆红素)使该病例与高风险谵妄表现类型区分开来。

### 4. 需要监测的因素
需要在24–48小时内密切监测的关键要素包括:
- **镇静剂暴露**: 剂量增加或延长使用可能引起急性混淆;监测任何躁动或嗜睡变化。
- **钾趋势**: 持续高钾血症风险神经肌肉功能障碍;重复测量对纠正效果至关重要。
- **血红蛋白/血细胞比容动态**: 从胃肠道出血持续的贫血可能损害大脑氧合;血红蛋白下降需要重新评估。
- **血压稳定性**: 未控制的高血压(收缩压/舒张压升高)可能发展成脑病;建议每小时检查。
- **感染标志物**: 注意新兴发热或升高的白细胞计数,因为未发现的感染可能迅速升级谵妄风险。

### 5. 初步干预建议
**非药物策略**: 优先环境改造——最小化夜间噪音,确保昼夜节律照明,引入定向线索(时钟、家庭互动)。鼓励早期活动以保持警觉。
**药物调整**: 立即审查镇静剂;减少剂量或考虑更低风险替代品(如右美托咪定优于苯二氮卓类药物)。用葡萄糖酸钙或胰岛素/葡萄糖纠正高钾血症,根据需要。
**会诊建议**: 鉴于风险低,目前不需要正式的精神科或神经科随访,但如果意识波动则重新评估。
**高风险标记**: 现阶段不要升级为高风险谵妄方案,但因镇静剂暴露包括在标准化的12小时护士主导筛查中(如CAM-ICU)。

---
**摘要**: 此评估反映了机器学习和多学科见解的协作整合。虽然需要对演进风险保持警惕,但没有证据与共识的低风险决定相矛盾。

3. 基于病历资料和AI报告,您预测该患者发生谵妄的可能性:
4. AI报告是否改变了您的判断?
5. 若您的判断发生变化,AI报告让您改变原先判断的理由是?(可多选)
6.
在AI报告影响您判断的因素中,以下哪些具体内容最关键?(可多选):
步骤3:AI报告质量评价

下面是AI的预测报告:
7. 此处AI报告与步骤2中相同, 是否需要重新阅读:

多智能体系统DeLiriuMAgents输出的AI报告

**ED-ICU 谵妄风险预测临床报告**

### 1. 最终风险评估
主观风险概率:0.15
置信度评分:0.85

患者被评估为在ED-ICU设置中发展为谵妄的风险概率低(15%)。这一判断整合了高置信度的机器学习预测(“无”)以及急诊科、神经科和精神科医师代理人的一致同意。尽管电子健康记录数据显示风险因素——包括镇静剂使用、血管加压药应用和高钾血症——但患者正常的格拉斯哥昏迷量表(GCS=15)、低的改良早期预警评分(MEWS=1)以及无神经异常显著减轻了总体风险。这一概率低于典型的ED-ICU谵妄发生率基线(20–30%),增强了其临床合理性。鉴于模型的可靠性和多学科共识,我认同这一低风险评估。临床上,这不需要紧急谵妄预防,但因可改变的风险暴露证明针对性监测是合理的。

### 2. 关键变量
- **格拉斯哥昏迷量表(GCS=15)**: 正常GCS评分强烈表明意识清醒和定向力完整,作为最保护性的变量。这直接降低了谵妄风险,排除了基线认知障碍。
- **镇静剂使用**: 积极的镇静剂给药增加了风险,原因是神经抑制效应可能干扰皮层功能。这在推理中被高度加权,因为药理学干预是可修改的风险放大器。
- **血管加压药使用**: 表明血流动力学不稳定或危重疾病,导致代谢应激和低灌注相关神经元损伤。尽管有其他稳定因素,但其存在增加了担忧。
- **钾水平(5.44 mmol/L)**: 高钾血症反映了电解质失衡,可能加剧神经肌肉易激惹和混淆。虽然不严重,但鉴于钾在神经兴奋性中的作用,其贡献是中等。

这些变量形成一个张力:保护性的GCS/MEWS抵消了药理学和代谢风险,创造出整体的低风险轮廓。

### 3. 推理证据链
患者的表现——多种急性症状包括胃肠道出血和高血压——起初提示一个复杂的危重疾病。然而,她的正常GCS评分(15)和低MEWS(1)表明神经功能保留且恶化风险最小,有效对抗了高钾血症或贫血等因素。镇静剂和血管加压药使用虽然是已知的谵妄原,但缺乏当前神经影响的证据。机器学习模型和所有医师代理人的一致“无”评估强调了这一稳定性,因为他们的预测框架优先关注敏锐度和意识指标。值得注意的是,没有生成医疗证据查询,因为没有高风险指标(如败血症休克或严重代谢性酸中毒)出现以挑战这一观点。缺乏精神并发症、发热或缺氧进一步支持了低风险结论。尽管有治疗性暴露(抗生素、侵入性操作),但无系统性炎症(正常白细胞计数、体温)和完整的终末器官功能(正常肌酐、胆红素)使该病例与高风险谵妄表现类型区分开来。

### 4. 需要监测的因素
需要在24–48小时内密切监测的关键要素包括:
- **镇静剂暴露**: 剂量增加或延长使用可能引起急性混淆;监测任何躁动或嗜睡变化。
- **钾趋势**: 持续高钾血症风险神经肌肉功能障碍;重复测量对纠正效果至关重要。
- **血红蛋白/血细胞比容动态**: 从胃肠道出血持续的贫血可能损害大脑氧合;血红蛋白下降需要重新评估。
- **血压稳定性**: 未控制的高血压(收缩压/舒张压升高)可能发展成脑病;建议每小时检查。
- **感染标志物**: 注意新兴发热或升高的白细胞计数,因为未发现的感染可能迅速升级谵妄风险。

### 5. 初步干预建议
**非药物策略**: 优先环境改造——最小化夜间噪音,确保昼夜节律照明,引入定向线索(时钟、家庭互动)。鼓励早期活动以保持警觉。
**药物调整**: 立即审查镇静剂;减少剂量或考虑更低风险替代品(如右美托咪定优于苯二氮卓类药物)。用葡萄糖酸钙或胰岛素/葡萄糖纠正高钾血症,根据需要。
**会诊建议**: 鉴于风险低,目前不需要正式的精神科或神经科随访,但如果意识波动则重新评估。
**高风险标记**: 现阶段不要升级为高风险谵妄方案,但因镇静剂暴露包括在标准化的12小时护士主导筛查中(如CAM-ICU)。

---
**摘要**: 此评估反映了机器学习和多学科见解的协作整合。虽然需要对演进风险保持警惕,但没有证据与共识的低风险决定相矛盾。

角度A. Clinical accuracy(临床准确性)

8. 报告对谵妄风险相关医学解释的准确性:
9. 您认为该报告是否存在“幻觉”?
10. 若“有”,请指出可能错误信息出现在哪里(可多选):
11. 请描述您在AI报告中发现的可能错误信息:
角度B. Reasoning quality(推理质量)

12. 推理逻辑连贯性(前后是否一致、因果链是否清晰):
13. 证据支撑与可追溯性(结论是否能回溯到病历事实/关键特征/检索证据,而非“凭空推断”):
角度C. Overall usefulness(总体有用性)

14. AI报告会不会帮助提高您的效率:
15. AI报告的内容设计(长度、逻辑等)是否合理:
16. 在真实急诊流程中,您将DeLiriuMAgents作为决策辅助工具使用的意愿:
更多问卷 复制此问卷