Clareza nas instruções pré e pós-operatórias é essencial para reduzir complicações, mas muitos pacientes ainda têm dificuldade em compreendê-las. Para enfrentar esse desafio, iniciativas como a biblioteca Easy-to-Read da Elsevier já oferecem materiais simplificados, mas em escala limitada. Agora, um estudo publicado no JAMA Surgery avaliou se modelos de linguagem de inteligência artificial (LLMs), como o ChatGPT, podem desempenhar esse papel de forma segura e eficaz.
Pesquisadores analisaram três versões de instruções cirúrgicas presentes no prontuário eletrônico Epic:
-
Versão padrão (texto técnico tradicional).
-
Versão humana simplificada (Easy-to-Read).
-
Versão simplificada por chatbot (ChatGPT-4o, temperatura 0, com o prompt “reescreva para nível de leitura de 6ª série, mantendo todos os elementos essenciais”).
Foram incluídas 790 instruções de procedimentos cirúrgicos, exceto pequenos procedimentos.
Resultados principais
-
Leiturabilidade:
As instruções padrão estavam em média no nível de 9º ano escolar.
Tanto humanos (43 documentos) quanto o ChatGPT (790 documentos) reduziram para aproximadamente o nível de 6ª série.
O chatbot apresentou escore médio de 6,6 (IC 95%: 6,5-6,6), próximo ao desempenho humano (6,2; IC 95%: 6,1-6,3).
Para instruções pré-operatórias, o chatbot simplificou menos (7,0; IC 95%: 6,9-7,1).
-
Fidelidade e segurança:
Em 43 documentos com todas as três versões disponíveis, revisores cegos identificaram inconsistências em 47% das versões humanas e 26% das versões geradas pelo ChatGPT.
A taxa de inconsistências foi de 1,1 por documento nos humanos contra 0,6 por documento na IA.
As inconsistências humanas foram majoritariamente omissões não críticas.
Os erros considerados críticos (severidade ≥ 3 em escala de 1 a 5) tiveram frequência semelhante em ambas as versões.
Interpretação
O estudo sugere que LLMs podem igualar o desempenho humano em simplificação de instruções cirúrgicas quanto à legibilidade e fidelidade. No entanto, a IA tende a ser mais conservadora na remoção de jargões em documentos pré-operatórios, o que reflete um equilíbrio delicado entre clareza e precisão clínica.
Implicações práticas
-
Escalabilidade: enquanto a iniciativa humana Easy-to-Read é limitada em número de documentos, o chatbot conseguiu simplificar rapidamente 790 instruções, demonstrando potencial para uso em larga escala.
-
Segurança: apesar do bom desempenho, supervisão médica continua essencial. A adoção prática deve contar com validação por cirurgiões e equipes assistenciais.
-
Perspectiva do paciente: embora não tenha havido validação direta com pacientes, pesquisas prévias indicam que muitos já pretendem usar chatbots para informações médicas, o que reforça a necessidade de garantir precisão e confiança no conteúdo gerado.
Limitações
-
Pouco volume de documentos humanos para comparação direta (apenas 43).
-
Avaliação manual das inconsistências.
-
Ausência de validação com pacientes para medir impacto real na compreensão e adesão.
Este é o primeiro estudo a demonstrar que chatbots podem simplificar instruções cirúrgicas de forma comparável a humanos, com legibilidade adequada e risco de inconsistência semelhante. A tecnologia mostra grande potencial para ampliar o acesso a materiais compreensíveis, mas deve ser implementada com cautela, sempre sob supervisão clínica.
Referência:
Sahhar M, Nassar JE, Rouffiac A, et al. Enhanced Surgical Instructions Using Large Language Models. JAMA Surg. Published online August 13, 2025. doi:10.1001/jamasurg.2025.2825

