Apesar da explosão de estudos sobre inteligência artificial em ambientes de terapia intensiva, a adoção clínica real ainda está distante.
A revisão sistemática publicada em 23 de julho de 2025, em JAMA Network Open atualiza o panorama da inteligência artificial nas unidades de terapia intensiva (UTIs) e revela dados preocupantes sobre o hiato entre desenvolvimento tecnológico e sua implementação prática. O estudo, que adota uma abordagem de Living Systematic Review (LSR), oferece um olhar dinâmico sobre o campo, considerando as evoluções ao longo do tempo e identificando obstáculos persistentes à operacionalização da IA na medicina intensiva.
O número de pesquisas sobre IA na UTI disparou nos últimos anos, principalmente em decorrência de modelos desenvolvidos retrospectivamente com grandes volumes de dados clínicos. No entanto, essa expansão não foi acompanhada por um aumento proporcional nos estudos prospectivos, aqueles que realmente testam a eficácia dos modelos em tempo real com pacientes. Isso limita severamente a utilidade prática e a confiança clínica nesses sistemas.
Falta de validação e testes reais
Entre os obstáculos identificados para a implementação da IA na prática clínica, destacam-se:
-
Ausência de validação externa dos modelos
-
Número extremamente baixo de avaliações prospectivas
-
Integração deficiente aos fluxos de trabalho clínicos
-
Legislação complexa e demorada
-
Adoção clínica lenta
-
Falta de retorno financeiro claro para implementação
-
Concentração de investimentos em desenvolvimento de novos modelos, em vez de validação e implantação dos já existentes
Qualidade metodológica ainda é um problema
Embora o número de estudos com alto risco de viés tenha diminuído, o número de estudos com risco de viés “desconhecido” aumentou. Além disso, o uso de padrões de relato, como TRIPOD permanece modesto. Apenas 9% dos estudos revisados adotaram esses padrões nos últimos três anos. Isso compromete a transparência, a reprodutibilidade e a confiança na aplicação clínica das ferramentas desenvolvidas.
Representatividade geográfica e diversidade ainda são limitadas
A revisão também destaca a distribuição desigual de pesquisas entre diferentes países e especialidades, o que levanta preocupações sobre a representatividade e a equidade dos modelos de IA desenvolvidos. A sub-representação de populações minoritárias nos conjuntos de dados é uma ameaça real à justiça algorítmica. Casos como menor taxa de diagnóstico para mulheres negras e estereótipos de gênero embutidos em sistemas automatizados mostram a urgência de auditorias de viés e diversidade de dados.
Uso de novas abordagens de IA: LLMs e aprendizado por reforço
A revisão incorpora também modelos baseados em aprendizado por reforço, aprendizado não supervisionado e large language models (LLMs), como os usados em aplicações generativas. Mesmo com o surgimento dessas novas abordagens, o cenário permanece dominado por pesquisas retrospectivas com baixa maturidade técnica para uso clínico.
Proposta de soluções e frameworks
Para superar os obstáculos mapeados, os autores recomendam:
-
Financiamento direcionado à validação e implementação
-
Avaliações prospectivas rigorosas
-
Integração de princípios da ciência da implementação
-
Adoção de frameworks éticos, como os propostos por Ning et al. e o STANDING Together
-
Engajamento em redes de maturidade em IA na saúde, como a Coalition for Healthcare AI (CHAI) e a TRAIN-Europe
Além disso, o uso de abordagens de revisão viva (LSR) é defendido como essencial para atualizar continuamente as evidências, evitando duplicação de esforços e mantendo a literatura relevante frente à velocidade das inovações tecnológicas.
O estudo reconhece algumas limitações, como:
-
Foco apenas em IA aplicada à UTI, excluindo outros ambientes clínicos relevantes
-
Não utilização de ferramentas mais atualizadas de avaliação de viés específicas para LLMs, como o TRIPOD-LLM
-
Intervalo de 4 anos entre as atualizações, embora a recomendação mais recente para LSRs seja de 2 anos
-
Falta de rastreamento dos modelos individuais ao longo de diferentes níveis de maturidade tecnológica (TRLs)
A revisão aponta que, apesar do entusiasmo e do volume crescente de publicações, a integração da IA no cuidado intensivo real ainda está longe do ideal. Sem testes clínicos prospectivos e estratégias estruturadas de implementação, a inteligência artificial permanece como uma promessa não realizada. A adoção de revisões sistemáticas vivas, com foco em maturidade técnica, viés, ética e equidade, é apresentada como uma via promissora para acelerar esse processo.
Referência:
Berkhout WEM, van Wijngaarden JJ, Workum JD, et al. Operationalization of Artificial Intelligence Applications in the Intensive Care Unit: A Systematic Review. JAMA Netw Open. 2025;8(7):e2522866. doi:10.1001/jamanetworkopen.2025.22866



