INTRODUCCIÓN
La Unidad de Cuidados Intensivos Pediátricos (UCIP) constituye un elemento fundamental en la atención médica especializada. No solo resulta esencial para la estabilización y el tratamiento intensivo de pacientes pediátricos, sino que también desempeña un papel crucial como centro de transferencia tecnológica y es responsable de una porción significativa del presupuesto hospitalario.(1)
La capacidad de pronosticar el desenlace de los pacientes, en términos de mortalidad y resultados clínicos, resulta fundamental para optimizar la distribución de recursos y mejorar la calidad de la asistencia sanitaria. (2),(3) En este contexto, los sistemas de clasificación de gravedad de los pacientes en cuidados intensivos juegan un papel crucial, permitiendo a los profesionales médicos tomar decisiones fundamentadas sobre la necesidad de recursos y la prioridad del tratamiento.(4)
Entre los sistemas de puntuación más utilizados en la UCIP se encuentran el Pediatric Risk of Mortality (PRISM), el Pediatric Index of Mortality (PIM-2) y la Pediatric Logistic Organ Dysfunction (PELOD) Cada uno de estos sistemas posee su propia metodología y parámetros específicos para evaluar la gravedad de la enfermedad y predecir la mortalidad.(5),(7) Por ejemplo, el PRISM es ampliamente reconocido por su capacidad de predicción independiente del entorno clínico, aunque su aplicabilidad puede variar según las características de la población y los patrones de enfermedades predominantes.(8)-(10) Por otro lado, el PELOD se enfoca en la disfunción multiorgánica, proporcionando una medida detallada de la progresión de la enfermedad durante la hospitalización.(11)-(13) Asimismo, el PIM-2, una versión actualizada del PIM original, simplifica la evaluación inicial del paciente mediante la utilización de un número reducido de variables, haciéndolo más accesible y menos dependiente de recursos complejos.(5),(13)-(15) Sin embargo, estos sistemas han sido desarrollados y validados principalmente en entornos de baja altitud, lo que plantea interrogantes sobre su aplicabilidad y precisión en condiciones fisiológicas diferentes.
En entornos de gran altitud, como los de varias UCIPs en Bolivia y otros países andinos, las condiciones fisiológicas pueden alterar significativamente los resultados clínicos. La presión parcial de oxígeno y otros parámetros críticos varían con la altitud, lo que potencialmente afecta la precisión de las predicciones de mortalidad basadas en estos sistemas de puntuación estándar. Esta variación fisiológica plantea una brecha significativa en nuestro conocimiento actual sobre la eficacia de estos sistemas de puntuación en entornos de gran altitud.
A pesar de la importancia de este tema, existe una escasez notable de estudios que evalúen específicamente la eficacia de PRISM, PIM-2 y PELOD en entornos de gran altitud. Esta brecha en la literatura científica es particularmente preocupante dado el gran número de personas que viven en regiones de alta altitud en todo el mundo y la necesidad de atención médica pediátrica especializada en estas áreas.
El presente estudio se propone llenar esta brecha de conocimiento al comparar el rendimiento de los sistemas de puntuación PRISM, PIM-2 y PELOD en una Unidad de Cuidados Intensivos Pediátrica situada a una altitud de 3600 metros sobre el nivel del mar. Nuestro objetivo es evaluar la relación entre los resultados observados (fallecimiento/supervivencia) y las tasas de mortalidad estimadas por cada sistema de puntuación, con el fin de identificar cuál de estos sistemas ofrece la evaluación más precisa y confiable en un entorno de gran altitud.
Además, este estudio busca identificar los factores específicos del entorno de gran altitud que podrían influir en la exactitud de estas predicciones. Los resultados de esta investigación no solo contribuirán a mejorar la atención de pacientes pediátricos críticos en entornos de gran altitud, sino que también podrían sentar las bases para el desarrollo de ajustes o modificaciones a estos sistemas de puntuación para su uso óptimo en condiciones de alta altitud.
Esta investigación tiene el potencial de impactar significativamente en la práctica clínica en UCIPs de altura, mejorando la precisión de las predicciones de mortalidad, optimizando la asignación de recursos y, en última instancia, mejorando los resultados para los pacientes pediátricos críticos en estas regiones únicas.
PACIENTES Y MÉTODOS
Este estudio observacional, analítico y prospectivo se realizó en la UCIP del Hospital de Especialidades Materno Infantil en La Paz, Bolivia, a una altitud de 3600 metros sobre el nivel del mar.
Población de estudio
Se incluyeron todos los pacientes pediátricos, entre 1 mes y 18 años, ingresados en la UCIP entre noviembre de 2022 y diciembre de 2023, que cumplieron los siguientes criterios de selección:
Criterios de Inclusión: Pacientes con indicación de ingreso a la UCIP, que permanecieron en la unidad por más de 24 horas y cuyos expedientes clínicos contenían todos los datos necesarios para calcular las puntuaciones PRISM, PIM-2 y PELOD.
Criterios de Exclusión: Pacientes con estancias menores a 24 horas y aquellos sin los resultados de laboratorio necesarios para el cálculo de las puntuaciones pronósticas.
Recolección de datos
Se realizó una recolección sistemática y estandarizada de datos clínicos y de laboratorio, desde el momento de ingreso de los pacientes hasta su alta o fallecimiento, utilizando formularios de registro digitalizados. Los datos fueron extraídos de los expedientes clínicos electrónicos y físicos, y se ingresaron en una base de datos diseñada específicamente para este estudio.
Para minimizar la presencia de datos faltantes, se implementó un riguroso protocolo de recolección de datos. En los casos donde se identificaron datos faltantes, se aplicó el siguiente procedimiento:
Para variables continuas, se utilizó la imputación por la media si el porcentaje de datos faltantes era menor al 5%.
Para variables categóricas, se creó una categoría adicional de “datos faltantes” si el porcentaje era menor al 5%.
Si el porcentaje de datos faltantes para cualquier variable superaba el 5%, se excluía al paciente del análisis.
Se realizó un análisis de sensibilidad comparando los resultados con y sin imputación para evaluar el impacto de los datos faltantes en los resultados finales.
Análisis Estadístico
Los datos recolectados se analizaron utilizando el software estadístico IBM-SPSS versión 2023 y el software específico para el cálculo de las escalas PRISM, PIM-2 y PELOD proporcionado por la Sociedad Andaluza de Medicina Intensiva y Unidades Coronarias (S.A.M.I.U.C.) (16)-(18).
Se realizaron los siguientes análisis estadísticos:
Estadística descriptiva: Se calcularon medias, desviaciones estándar, medianas y rangos intercuartílicos para variables continuas, y frecuencias y porcentajes para variables categóricas.
Análisis de la capacidad discriminativa: Se utilizaron curvas ROC (Receiver Operating Characteristic) y se calculó el área bajo la curva (AUC) con intervalos de confianza del 95% para cada escala (PRISM, PIM-2 y PELOD).
Análisis de calibración: Se realizaron pruebas de bondad de ajuste de Hosmer-Lemeshow para evaluar la calibración de los modelos. Se consideró una buena calibración cuando p > 0.05.
Comparación de escalas: Se utilizó el método de DeLong para comparar las AUC de las diferentes escalas.
Análisis de sensibilidad y especificidad: Se construyeron tablas de contingencia (2x2) de cada escala de mortalidad, para evaluar la sensibilidad, especificidad, valor predictivo positivo (VPP), valor predictivo negativo (VPN).
Índice de Youden: Se calculó para determinar el punto de corte óptimo para cada escala.
Análisis multivariante: Se realizó una regresión logística multivariante para identificar factores independientes asociados con la mortalidad.
Validación interna: Se utilizó la técnica de bootstrapping con 1000 repeticiones para validar internamente los modelos y evaluar su estabilidad.
El nivel de significancia estadística se estableció en p < 0.05 para todas las pruebas. Todos los intervalos de confianza se calcularon al 95%.
Aspectos Éticos
El estudio fue aprobado por el comité de ética del Hospital de Especialidades Materno Infantil. Los tutores legales de los pacientes pediátricos incluidos en el estudio dieron su consentimiento.
RESULTADOS
De los 201 pacientes, 10 fallecieron (4,5%), con un intervalo de confianza del 95% (2,2-6,8) de la población total del servicio. Además, del total de pacientes estudiados, 54 presentaron falla multiorgánica, lo que corresponde al 27% con un intervalo de confianza del 95% (20,9-33,1) de la población.
El análisis de la curva ROC para PRISM demostró una excelente capacidad discriminativa. En relación con los 10 fallecimientos registrados y los 191 pacientes vivos, con un total de 201 casos, el análisis de la curva de característica operativa del receptor (curva ROC) con respecto al PRISM reveló un área bajo la curva (AUC) del 92%, lo cual indica una mayor sensibilidad y especificidad de la prueba.
De igual forma, el análisis de la curva ROC para PIM-2, que presentó un área bajo la curva (AUC) del 88,1%, lo que sugiere una buena capacidad discriminativa.
Finalmente, el análisis de la curva característica de funcionamiento del receptor (curva ROC) para el PELOD, demostró un área bajo la curva (AUC) del 86%, lo que implica una adecuada capacidad discriminativa, si bien inferior a la del PRISM y el PIM-2.
Tras el análisis de la curva de características operativas del receptor (curva ROC) con relación al puntaje de disfunción orgánica pediátrica (PELOD) y los 10 casos de defunción registrados, se obtuvo un área bajo la curva del 86%. Dicho porcentaje indica que la prueba exhibió una mayor sensibilidad y especificidad.
Al comparar las tres escalas pronósticas de mortalidad, tal como se ilustra en la figura 1, la escala de riesgo de mortalidad pediátrica simplificada (PRISM) demostró la mayor capacidad discriminativa en nuestra población.
Además, se llevó a cabo un análisis de la sensibilidad, la especificidad, los VPP y VPN para cada una de las escalas. Los resultados se presentan en la tabla 1 a continuación:
La combinación más eficaz, con elevada sensibilidad y especificidad, se presenta en la escala PRISM. Además, exhibe un alto Valor Predictivo Negativo y, en comparación, el Valor Predictivo Positivo más elevado. No obstante, al calcular los Intervalos de Confianza al 95%, se observa una superposición, especialmente entre las escalas PRISM y PIM-2, lo que requiere de análisis estadísticos adicionales para establecer si la superioridad diagnóstica de PRISM es estadísticamente significativa, dado que ambas escalas presentan un buen desempeño diagnóstico en la población de estudio.
Por consiguiente, al calcular el índice de Yougen para las tres escalas, se obtuvo lo siguiente: PRISM (0,83), PIM-2 (0,80) y PELOD (0,76), lo cual sugiere que PRISM presenta un mejor rendimiento diagnóstico o una mayor capacidad discriminativa.
Asimismo, se llevó a cabo la prueba de Hosmer- Lemeshow, cuyo resultado fue:
- PRISM**: χ 2 = 7.49, p = 0.49 (buena calibración)
- PIM-2**: χ 2 = 9.65, p = 0.29 (buena calibración)
- PELOD**: χ 2 = 20.03, p < 0.001 (mala calibración)
La prueba de bondad de ajuste de Hosmer y Lemeshow con un valor mayor de 0,05 indica un buen ajuste del modelo, ya que no rechaza la hipótesis nula (no hay diferencia entre los valores observados y los predichos por el modelo), lo que implica que las estimaciones del modelo se adaptan a los datos en un nivel aceptable.
En consecuencia, PRISM y PIM-2 presentan una buena calibración, siendo PRISM ligeramente superior.
DISCUSIÓN
El estudio realizado da una tasa de mortalidad observada del 4,5%, significativamente menor en comparación con estudios similares en otros países en desarrollo, donde las tasas pueden alcanzar hasta el 28%. Esto puede atribuirse a la calidad de atención en la unidad de cuidados intensivos pediátricos, la disponibilidad de personal capacitado y la eficiencia en el uso de recursos. Asimismo, la incidencia de falla multiorgánica (27%) es inferior a las tasas reportadas en estudios de unidades especializadas en pacientes oncológicos.
El análisis comparativo de las escalas de pronóstico reveló que PRISM tiene la mejor capacidad discriminativa (92%), seguida de PIM-2 (88,1%) y PELOD (86%). Estos hallazgos son compatibles con investigaciones anteriores que han corroborado la validez de PRISM y PIM- 2 en diversos contextos, aunque es necesario tener en cuenta las características específicas de la gran altitud al interpretar estos resultados.
La evaluación de la capacidad discriminativa utilizando curvas ROC y AUC indicó que PRISM es la escala más efectiva para predecir la mortalidad en este contexto. Además, la prueba de bondad de ajuste de Hosmer-Lemeshow demostró una buena calibración para PRISM y PIM-2, pero no para PELOD, lo que sugiere que PRISM y PIM-2 son más adecuados para este entorno de alta altitud.
La variabilidad en los valores de gasometría arterial a gran altitud y la diversidad de patologías tratadas representan limitaciones en este estudio. No obstante, los resultados de este constituyen un fundamento sólido para la implementación de estas escalas en unidades de cuidados intensivos pediátricos en entornos análogos.
CONCLUSIONES
En conclusión, este estudio demuestra que el modelo PRISM tiene una mayor capacidad discriminativa (AUC 92%) al predecir la mortalidad en una Unidad de Cuidados Intensivos Pediátricos situada a 3600 metros sobre el nivel del mar, seguido por PIM-2 (AUC 88.1%) y PELOD (AUC 86%). PRISM y PIM- 2 mostraron una buena calibración según la prueba de Hosmer-Lemeshow, mientras que PELOD presentó una calibración deficiente en este entorno de alta altitud. La mortalidad observada del 4.5% y la incidencia de falla multiorgánica del 27% fueron notablemente inferiores a las reportadas en estudios similares en países en desarrollo, lo que sugiere una atención de alta calidad en nuestra UCIP.
Estos hallazgos son cruciales para mejorar la calidad de la atención y optimizar la gestión de recursos en UCIPs ubicadas en regiones de gran altitud. Sin embargo, es importante considerar que factores como la variabilidad en los valores de gasometría arterial a gran altitud y la diversidad de patologías tratadas pueden influir en la precisión de estas escalas.
Se recomienda realizar estudios multicéntricos adicionales para explorar con mayor profundidad los factores específicos que afectan la calibración y discriminación de estos modelos en diferentes entornos geográficos de alta altitud. Además, realizar pruebas de concordancia para validación cruzada e investigar la posible necesidad de ajustes en los parámetros de estas escalas para su uso óptimo en entornos de gran altitud.
Esta investigación proporciona una base sólida para la implementación informada de estas escalas pronósticas en UCIPs de altura, contribuyendo así a mejorar la atención y los resultados en pacientes pediátricos críticos en estas regiones únicas.















