Los trastornos neurocognitivos perioperatorios (PND) representan una de las complicaciones más preocupantes en anestesiología, especialmente en pacientes de edad avanzada. Con el auge de los modelos de lenguaje grandes como ChatGPT, surge la pregunta: ¿pueden estas herramientas de inteligencia artificial generar recomendaciones confiables para el manejo de los PND?
Metodología y Resultados Principales
Los investigadores realizaron un análisis transversal web durante 48 horas en junio de 2024, evaluando las recomendaciones generadas por ChatGPT-4 y Gemini en seis ubicaciones diferentes across cinco países (Suiza, Bélgica, Turquía, Canadá y Estados Unidos).
Utilizando el prompt en inglés “a table of a bundle of care for perioperative neurocognitive disorders”, generaron 14 tablas que fueron evaluadas por revisores independientes. Los resultados se midieron usando dos métricas principales:
– Total Disagreement Score (TDS): Evaluó las discrepancias con las guías publicadas
– Quality Assessment of Medical Artificial Intelligence (QAMAI): Valoró la calidad general de las recomendaciones
Los resultados mostraron que tanto ChatGPT-4 como Gemini obtuvieron puntuaciones similares (TDS: 2 [1-3] vs 2 [2-3], p=0.636; QAMAI: 4 [4-4] vs 4 [3-4], p=0.424). Las recomendaciones generadas por IA se alinearon bien con las guías publicadas, con ChatGPT-4 mostrando la mayor concordancia.
El Estado Actual de los PND en Anestesiología
Los trastornos neurocognitivos perioperatorios incluyen el delirium postoperatorio y la disfunción cognitiva postoperatoria, condiciones que afectan hasta el 50% de los pacientes quirúrgicos mayores de 65 años. Estos trastornos no solo aumentan la morbilidad y mortalidad, sino que también incrementan significativamente los costos de atención médica.
Las principales sociedades médicas han desarrollado recomendaciones basadas en evidencia que incluyen:
– Evaluación preoperatoria: Identificación de factores de riesgo cognitivos
– Manejo intraoperatorio: Optimización de la profundidad anestésica y manejo hemodinámico
– Cuidados postoperatorios: Prevención y tratamiento temprano del delirium
– Estrategias multimodales: Protocolos que integran cuidados médicos, de enfermería y farmacológicos
Potencial y Limitaciones de la IA en PND
El estudio reveló aspectos prometedores y preocupantes sobre el uso de IA en este contexto:
Fortalezas identificadas:
– Buena alineación general con guías establecidas
– Capacidad de generar recomendaciones estructuradas y organizadas
– Consistencia en diferentes ubicaciones geográficas
– Potencial para servir como herramienta de consulta rápida
Limitaciones críticas:
– Ninguna recomendación logró concordancia completa con las guías
– Ausencia de fuentes citadas, limitando la verificabilidad
– Falta de personalización para casos específicos
– Imposibilidad de considerar el contexto clínico individual
Implicaciones para la Práctica Clínica
Aunque los resultados son alentadores, es crucial mantener una perspectiva equilibrada. Los modelos de lenguaje grandes pueden ser herramientas útiles para:
– Revisión rápida de conceptos generales
– Generación de listas de verificación básicas
– Apoyo educativo para residentes y estudiantes
– Punto de partida para la elaboración de protocolos institucionales
Sin embargo, no deben reemplazar:
– El juicio clínico individualizado
– La consulta de guías oficiales actualizadas
– La evaluación específica del paciente
– La toma de decisiones basada en evidencia contextualizada
Reflexión Final: El Futuro de la IA en el Manejo de PND
Este estudio representa un primer paso importante hacia la comprensión del potencial de la IA en el manejo de trastornos neurocognitivos perioperatorios. Los resultados sugieren que, aunque prometedores, estos modelos requieren mayor desarrollo y validación antes de su implementación clínica.
El futuro probablemente verá modelos de IA específicamente entrenados en datasets de anestesiología, con capacidad de integrar datos del paciente individual y proporcionar recomendaciones más personalizadas. La clave estará en desarrollar sistemas que complementen, no reemplacen, la experiencia clínica y el razonamiento médico.
¿Quieres aprender a usar herramientas de IA como ChatGPT o visión por computadora en anestesiología? Inscríbete al curso completo en www.cursosanestesia.com/ia y empieza hoy.
Artículo original: “A comparison of large language model-generated and published perioperative neurocognitive disorder recommendations: a cross-sectional web-based analysis” – British Journal of Anaesthesia
DOI: 10.1016/j.bja.2025.01.001