谵妄预测多智能体AI报告辅助临床决策调查问卷81

一、研究目的

本问卷用于评估:
1)临床医生在仅基于病历资料时对急重症患者谵妄发生风险的判断;
2)在参考多智能体系统DeLiriuMAgents输出的AI报告后,临床医生的判断是否改变、信心是否提升;
3)AI报告在临床准确性、推理质量、总体有用性方面的表现。
注:本评估仅用于科研。请按真实临床思维作答。

二、评估方案

评估者:5 名年资相近、具有急诊或重症相关经验的临床医生

病例:来自本地两家医院,各 50 例,共 100 例(均为匿名化病历摘要/结构化数据)

分配:每名医生评估 20 例(病例随机分配;尽量保证阳性/阴性比例与真实分布接近)

盲法:医生在步骤1时不参考任何 AI 输出;步骤2 才参考 AI 报告;每一页作答完成后不可返回修改(锁定)
步骤1:仅基于病历资料的临床判断(没有AI辅助)

下面是患者的中文病历描述:
电子病历描述:

## 电子健康记录开始 ##
该患者被送入急诊科重症监护室(ED-ICU)。以下EHR数据代表在ED-ICU住院期间记录的EHR中最早可用的数值。这些数据包括人口统计信息、生命体征、实验室检查结果和治疗或干预措施:
- 患者ID:B0268。
- 性别:女。
- 年龄:66岁。
- 种族:亚裔。
- 主诉:呼吸困难、意识障碍、创伤、痰液。
- 合并症:脑梗死。
- 改良早期预警评分(MEWS):1。(MEWS基于生命体征和意识水平评估临床恶化风险。MEWS <5通常表示恶化风险较低,而MEWS ≥5表示风险较高,需要加强监测或治疗。MEWS ≥9与死亡风险显著增加相关。)

格拉斯哥昏迷量表(GCS)评分:
- GCS运动反应:6。(范围:1-6;分数较低表示运动反应障碍。)
- GCS言语反应:5。(范围:1-5;分数较低表示言语反应障碍。)
- GCS睁眼反应:4。(范围:1-4;分数较低表示睁眼反应障碍。)
- GCS总分:15。(GCS总分评估意识水平。分数范围从3(深度昏迷)到15(完全清醒且定向正常)。分数15表示意识正常。)

生命体征:
- 心率:68.00 次/分(参考范围:60 - 100 次/分)。在参考范围内。
- 收缩压(SBP):184.00 mmHg(参考范围:90 - 120 mmHg)。高于参考范围。
- 舒张压(DBP):91.00 mmHg(参考范围:60 - 80 mmHg)。高于参考范围。
- 呼吸频率:15.00 次/分(参考范围:12 - 20 次/分)。在参考范围内。
- 体温:36.00 °C(参考范围:36 – 37.3 °C)。在参考范围内。
- 氧饱和度(SpO2):98.00 %(参考范围:95 - 100 %)。在参考范围内。

实验室检查:
血液学:
- 血细胞比容:35.00 %(参考范围:35.0 - 50.0 %)。在参考范围内。
- 血红蛋白:10.90 g/dL(参考范围:12.0 - 18.0 g/dL)。低于参考范围。
- 血小板计数:207.00 ×10^9/L(参考范围:150 - 350 ×10^9/L)。在参考范围内。
- 白细胞计数(WBC):8.19 ×10^9/L(参考范围:4.5 - 11 ×10^9/L)。在参考范围内。
肾功能:
- 血尿素氮(BUN):49.25 mg/dL(参考范围:8 - 23 mg/dL)。高于参考范围。
- 血清肌酐:3.12 mg/dL(参考范围:0.6 - 1.2 mg/dL)。高于参考范围。
血清电解质:
- 钠(Na⁺):142.00 mmol/L(参考范围:136 - 142 mmol/L)。在参考范围内。
- 钾(K⁺):7.36 mmol/L(参考范围:3.5 - 5.0 mmol/L)。高于参考范围。
- 钙(Ca²⁺):9.36 mg/dL(参考范围:8.5 - 10.2 mg/dL)。在参考范围内。
- 镁(Mg²⁺):2.62 mg/dL(参考范围:1.3 - 2.1 mg/dL)。高于参考范围。
代谢:
- 葡萄糖:199.44 mg/dL(参考范围:70 - 110 mg/dL)。高于参考范围。
肝功能和酶学:
- 天门冬氨酸氨基转移酶(AST):21.00 IU/L(参考范围:10 - 30 IU/L)。在参考范围内。
- 丙氨酸氨基转移酶(ALT):23.00 IU/L(参考范围:10 - 40 IU/L)。在参考范围内。
- 白蛋白:4.50 g/dL(参考范围:3.5 - 5.0 g/dL)。在参考范围内。
- 总胆红素:0.56 mg/dL(参考范围:0.3 - 1.2 mg/dL)。在参考范围内。
- 乳酸脱氢酶(LDH):258.00 IU/L(参考范围:100 - 200 IU/L)。高于参考范围。

治疗措施:
- 抗生素使用:无。
- 镇静剂使用:无。
- 血管加压药物使用:无。
- 糖皮质激素使用:无。
- 侵入性操作:无。
- 所有呼吸支持措施:无。
- 最高级别呼吸支持:无。
## 电子健康记录结束 ##

1. 您预测该患者发生谵妄的可能性:
步骤2:参考多智能体AI报告后的临床判断(AI报告为DeLiriuMAgents输出

下面是患者的中文病历描述与AI报告:
2. 此处电子病历描述与步骤1中相同, 是否需要重新阅读:

电子病历描述:

## 电子健康记录开始 ##
该患者被送入急诊科重症监护室(ED-ICU)。以下EHR数据代表在ED-ICU住院期间记录的EHR中最早可用的数值。这些数据包括人口统计信息、生命体征、实验室检查结果和治疗或干预措施:
- 患者ID:B0268。
- 性别:女。
- 年龄:66岁。
- 种族:亚裔。
- 主诉:呼吸困难、意识障碍、创伤、痰液。
- 合并症:脑梗死。
- 改良早期预警评分(MEWS):1。(MEWS基于生命体征和意识水平评估临床恶化风险。MEWS <5通常表示恶化风险较低,而MEWS ≥5表示风险较高,需要加强监测或治疗。MEWS ≥9与死亡风险显著增加相关。)

格拉斯哥昏迷量表(GCS)评分:
- GCS运动反应:6。(范围:1-6;分数较低表示运动反应障碍。)
- GCS言语反应:5。(范围:1-5;分数较低表示言语反应障碍。)
- GCS睁眼反应:4。(范围:1-4;分数较低表示睁眼反应障碍。)
- GCS总分:15。(GCS总分评估意识水平。分数范围从3(深度昏迷)到15(完全清醒且定向正常)。分数15表示意识正常。)

生命体征:
- 心率:68.00 次/分(参考范围:60 - 100 次/分)。在参考范围内。
- 收缩压(SBP):184.00 mmHg(参考范围:90 - 120 mmHg)。高于参考范围。
- 舒张压(DBP):91.00 mmHg(参考范围:60 - 80 mmHg)。高于参考范围。
- 呼吸频率:15.00 次/分(参考范围:12 - 20 次/分)。在参考范围内。
- 体温:36.00 °C(参考范围:36 – 37.3 °C)。在参考范围内。
- 氧饱和度(SpO2):98.00 %(参考范围:95 - 100 %)。在参考范围内。

实验室检查:
血液学:
- 血细胞比容:35.00 %(参考范围:35.0 - 50.0 %)。在参考范围内。
- 血红蛋白:10.90 g/dL(参考范围:12.0 - 18.0 g/dL)。低于参考范围。
- 血小板计数:207.00 ×10^9/L(参考范围:150 - 350 ×10^9/L)。在参考范围内。
- 白细胞计数(WBC):8.19 ×10^9/L(参考范围:4.5 - 11 ×10^9/L)。在参考范围内。
肾功能:
- 血尿素氮(BUN):49.25 mg/dL(参考范围:8 - 23 mg/dL)。高于参考范围。
- 血清肌酐:3.12 mg/dL(参考范围:0.6 - 1.2 mg/dL)。高于参考范围。
血清电解质:
- 钠(Na⁺):142.00 mmol/L(参考范围:136 - 142 mmol/L)。在参考范围内。
- 钾(K⁺):7.36 mmol/L(参考范围:3.5 - 5.0 mmol/L)。高于参考范围。
- 钙(Ca²⁺):9.36 mg/dL(参考范围:8.5 - 10.2 mg/dL)。在参考范围内。
- 镁(Mg²⁺):2.62 mg/dL(参考范围:1.3 - 2.1 mg/dL)。高于参考范围。
代谢:
- 葡萄糖:199.44 mg/dL(参考范围:70 - 110 mg/dL)。高于参考范围。
肝功能和酶学:
- 天门冬氨酸氨基转移酶(AST):21.00 IU/L(参考范围:10 - 30 IU/L)。在参考范围内。
- 丙氨酸氨基转移酶(ALT):23.00 IU/L(参考范围:10 - 40 IU/L)。在参考范围内。
- 白蛋白:4.50 g/dL(参考范围:3.5 - 5.0 g/dL)。在参考范围内。
- 总胆红素:0.56 mg/dL(参考范围:0.3 - 1.2 mg/dL)。在参考范围内。
- 乳酸脱氢酶(LDH):258.00 IU/L(参考范围:100 - 200 IU/L)。高于参考范围。

治疗措施:
- 抗生素使用:无。
- 镇静剂使用:无。
- 血管加压药物使用:无。
- 糖皮质激素使用:无。
- 侵入性操作:无。
- 所有呼吸支持措施:无。
- 最高级别呼吸支持:无。
## 电子健康记录结束 ##

多智能体系统DeLiriuMAgents输出的AI报告

### 急诊-重症监护病房谵妄风险预测临床报告

#### 1. **最终风险评估**
综合机器学习预测、多学科医师评估及检索的医学证据后,判定该患者在急诊-重症监护病房治疗期间**发生谵妄的可能性较低**。预估风险概率为**0.25**(低风险),置信度较高(**0.78**)。该结论整合了机器学习模型的低风险预测结果(概率0.26,置信度0.764)与急诊科、神经科、精神科专家的全票共识。患者意识状态稳定(格拉斯哥昏迷指数15分)、无高风险干预措施(镇静/机械通气)及保护性血流动力学特征,其价值超过年龄、既往脑梗死等静态风险因素。此结论符合急诊-重症监护病房基线谵妄发生率(20–30%),避免高估风险。

#### 2. **关键变量**
主导本评估的四项核心变量:
- **格拉斯哥昏迷指数(总分15分)**:强保护性因素。正常意识状态可排除急性脑病——循证医学证据显示任何GCS<14分均使谵妄风险倍增。本例中尽管主诉存在"意识改变",但完好的觉醒力与定向力降低了脆弱性。
- **镇静剂/抗生素使用(未应用)**:保护性因素。苯二氮卓类药物通过GABA能系统干扰增加谵妄发生率(RAG证据),抗生素则与感染性脑病相关。未使用此类药物消除了关键医源性诱发因素。
- **肾功能(尿素氮49.25 mg/dL)**:中度风险因素。尿毒症可能导致神经毒性,但因GCS正常而影响减弱。需优先紧急纠正伴发的高钾血症。
- **年龄(66岁)**:静态风险因素。年龄>65岁独立增加谵妄风险(RAG证实),但被神经功能稳定性这一保护因素抵消。

#### 3. **基于证据的推理链**
**患者状况**:虽有呼吸困难、外伤及已缓解的意识改变主诉,但电子健康档案显示其存在高血压、急性肾衰竭及高血糖等潜在谵妄风险因素。不过,GCS 15分、血氧正常(SpO₂ 98%)及极少干预措施(无镇静/机械通气)建立了稳定基线。肾功能障碍可能诱发代谢性脑病,但无相应神经功能异常佐证。

**医师共识**:三位专科医师均强调GCS 15分的保护作用。急诊科指出肾性/代谢问题需纠正,但若无神经功能损害则不构成谵妄特异性风险;神经科关注到尽管有卒中史但皮质功能完整;精神科承认年龄/共病风险,但未发现急性精神诱因。其共识源于客观神经功能稳定性超越生化指标紊乱。

**循证依据**:文献证实年龄与既往卒中是风险因素,但强调机械通气、镇静或低氧才是更强诱发因素——本例均未出现。低钠血症虽为可控风险,但患者血钠正常。需特别注意:脓毒症患者中低氧(SpO₂<90%)独立导致谵妄,而本例患者血氧正常具保护性。

**综合分析**:机器学习对低风险病例的高准确性(高置信度)与多学科共识共同支撑本结论。"意识改变"的主诉可能反映入院前的短暂状态,而非活动性谵妄。

#### 4. **需监测因素**
未来24-48小时需严密监测以下动态变化指标:
- **肾/代谢参数**:高钾血症(K⁺ 7.36 mmol/L)、尿素氮及肌酐未纠正可能诱发脑病。
- **血糖控制**:需调控高血糖(血糖199 mg/dL)以避免代谢波动。
- **意识波动**:鉴于卒中史,任何GCS下降均需立即重评估。
- **血压**:持续性高血压可能加剧脑血管脆弱性。

#### 5. **初步干预建议**
基于低谵妄风险与共病管理的主动措施:
- **非药物策略**:维持昼夜节律光照、减少夜间干扰、鼓励家属参与定向训练。
- **药物调整**:严格禁用苯二氮卓类药物(RAG证实的谵妄风险);静脉注射钙剂/胰岛素纠正高钾血症,胰岛素梯度注射控制高血糖。
- **会诊安排**:除非意识波动否则暂缓神经科会诊;无需常规精神科随访。
- **风险标记**:标准谵妄筛查(如CAM-ICU每日两次)即可,无需启动高风险预案。

---
本报告融合算法可靠性、专家共识及循证推理。若肾功能恶化或神经状态变化,建议重新评估。

**签署:**
高级临床医师,智能多学科会诊团队
[报告结束]

3. 基于病历资料和AI报告,您预测该患者发生谵妄的可能性:
4. AI报告是否改变了您的判断?
5. 若您的判断发生变化,AI报告让您改变原先判断的理由是?(可多选)
6.
在AI报告影响您判断的因素中,以下哪些具体内容最关键?(可多选):
步骤3:AI报告质量评价

下面是AI的预测报告:
7. 此处AI报告与步骤2中相同, 是否需要重新阅读:

多智能体系统DeLiriuMAgents输出的AI报告

### 急诊-重症监护病房谵妄风险预测临床报告

#### 1. **最终风险评估**
综合机器学习预测、多学科医师评估及检索的医学证据后,判定该患者在急诊-重症监护病房治疗期间**发生谵妄的可能性较低**。预估风险概率为**0.25**(低风险),置信度较高(**0.78**)。该结论整合了机器学习模型的低风险预测结果(概率0.26,置信度0.764)与急诊科、神经科、精神科专家的全票共识。患者意识状态稳定(格拉斯哥昏迷指数15分)、无高风险干预措施(镇静/机械通气)及保护性血流动力学特征,其价值超过年龄、既往脑梗死等静态风险因素。此结论符合急诊-重症监护病房基线谵妄发生率(20–30%),避免高估风险。

#### 2. **关键变量**
主导本评估的四项核心变量:
- **格拉斯哥昏迷指数(总分15分)**:强保护性因素。正常意识状态可排除急性脑病——循证医学证据显示任何GCS<14分均使谵妄风险倍增。本例中尽管主诉存在"意识改变",但完好的觉醒力与定向力降低了脆弱性。
- **镇静剂/抗生素使用(未应用)**:保护性因素。苯二氮卓类药物通过GABA能系统干扰增加谵妄发生率(RAG证据),抗生素则与感染性脑病相关。未使用此类药物消除了关键医源性诱发因素。
- **肾功能(尿素氮49.25 mg/dL)**:中度风险因素。尿毒症可能导致神经毒性,但因GCS正常而影响减弱。需优先紧急纠正伴发的高钾血症。
- **年龄(66岁)**:静态风险因素。年龄>65岁独立增加谵妄风险(RAG证实),但被神经功能稳定性这一保护因素抵消。

#### 3. **基于证据的推理链**
**患者状况**:虽有呼吸困难、外伤及已缓解的意识改变主诉,但电子健康档案显示其存在高血压、急性肾衰竭及高血糖等潜在谵妄风险因素。不过,GCS 15分、血氧正常(SpO₂ 98%)及极少干预措施(无镇静/机械通气)建立了稳定基线。肾功能障碍可能诱发代谢性脑病,但无相应神经功能异常佐证。

**医师共识**:三位专科医师均强调GCS 15分的保护作用。急诊科指出肾性/代谢问题需纠正,但若无神经功能损害则不构成谵妄特异性风险;神经科关注到尽管有卒中史但皮质功能完整;精神科承认年龄/共病风险,但未发现急性精神诱因。其共识源于客观神经功能稳定性超越生化指标紊乱。

**循证依据**:文献证实年龄与既往卒中是风险因素,但强调机械通气、镇静或低氧才是更强诱发因素——本例均未出现。低钠血症虽为可控风险,但患者血钠正常。需特别注意:脓毒症患者中低氧(SpO₂<90%)独立导致谵妄,而本例患者血氧正常具保护性。

**综合分析**:机器学习对低风险病例的高准确性(高置信度)与多学科共识共同支撑本结论。"意识改变"的主诉可能反映入院前的短暂状态,而非活动性谵妄。

#### 4. **需监测因素**
未来24-48小时需严密监测以下动态变化指标:
- **肾/代谢参数**:高钾血症(K⁺ 7.36 mmol/L)、尿素氮及肌酐未纠正可能诱发脑病。
- **血糖控制**:需调控高血糖(血糖199 mg/dL)以避免代谢波动。
- **意识波动**:鉴于卒中史,任何GCS下降均需立即重评估。
- **血压**:持续性高血压可能加剧脑血管脆弱性。

#### 5. **初步干预建议**
基于低谵妄风险与共病管理的主动措施:
- **非药物策略**:维持昼夜节律光照、减少夜间干扰、鼓励家属参与定向训练。
- **药物调整**:严格禁用苯二氮卓类药物(RAG证实的谵妄风险);静脉注射钙剂/胰岛素纠正高钾血症,胰岛素梯度注射控制高血糖。
- **会诊安排**:除非意识波动否则暂缓神经科会诊;无需常规精神科随访。
- **风险标记**:标准谵妄筛查(如CAM-ICU每日两次)即可,无需启动高风险预案。

---
本报告融合算法可靠性、专家共识及循证推理。若肾功能恶化或神经状态变化,建议重新评估。

**签署:**
高级临床医师,智能多学科会诊团队
[报告结束]

角度A. Clinical accuracy(临床准确性)

8. 报告对谵妄风险相关医学解释的准确性:
9. 您认为该报告是否存在“幻觉”?
10. 若“有”,请指出可能错误信息出现在哪里(可多选):
11. 请描述您在AI报告中发现的可能错误信息:
角度B. Reasoning quality(推理质量)

12. 推理逻辑连贯性(前后是否一致、因果链是否清晰):
13. 证据支撑与可追溯性(结论是否能回溯到病历事实/关键特征/检索证据,而非“凭空推断”):
角度C. Overall usefulness(总体有用性)

14. AI报告会不会帮助提高您的效率:
15. AI报告的内容设计(长度、逻辑等)是否合理:
16. 在真实急诊流程中,您将DeLiriuMAgents作为决策辅助工具使用的意愿:
更多问卷 复制此问卷