A IA o1-preview, da OpenAI, pode ser uma ferramenta de apoio em prontos-socorros, segundo reportagem do site Singularity Hub. Para chegar a essa conclusão, pesquisadores alimentaram a inteligência artificial com 70 casos reais selecionados aleatoriamente do setor de emergência de um hospital em Boston. Para aproximar o teste da rotina médica, os prontuários mantinham distrações e informações irrelevantes presentes nos registros originais.
De acordo com os pesquisadores, o modelo apresentou desempenho superior ao de dois médicos especialistas em diversos cenários, desde exames até decisões de internação ou alta. Em uma avaliação onde a autoria dos diagnósticos era ocultada, os revisores não conseguiram distinguir, de forma confiável, as respostas dadas pela IA daquelas estruturadas pelos médicos.
A conclusão é que a ferramenta destacou-se por explicar de forma clara seu raciocínio, mostrando potencial para auxiliar na etapa da triagem, ou seja, o momento de maior urgência e com a menor disponibilidade de dados sobre o paciente.
Apesar do avanço, o modelo ainda não está preparado para ser implementado clinicamente de forma autônoma. Para isso, o raciocínio diagnóstico de alta complexidade entregue pela IA da OpenAI ainda precisa passar por ensaios clínicos rigorosos.
Na avaliação dos especialistas, a IA precisará ser testada em cenários supervisionados, como se fosse um médico estagiário recebendo orientações. Para eles, a tecnologia precisará garantir resultados equitativos, custo-benefício positivo e segurança, atrelada à transparência e um monitoramento contínuo antes de ser aplicada na prática.
IA ainda enfrenta limitações na prática clínica
Os testes com o o1-preview trouxeram resultados acima da média observada em estudos anteriores. Ao analisar relatórios do banco de dados do New England Journal of Medicine, publicação de referência em medicina, o modelo acertou o diagnóstico em quase 89% dos casos, superando os 73% do GPT-4, a outra IA criada pela OpenAI e mais conhecida publicamente.
O modelo também provou ser capaz de definir o próximo exame laboratorial a ser feito, escolher o antibiótico certo e até sugerir abordagens para difíceis conversas sobre fim de vida. Nos casos mais complexos, o o1-preview chegou a superar um painel formado por mais de 550 clínicos.
Ainda assim, os resultados não significam que a IA vá substituir os médicos, uma vez que existe uma diferença entre usar tecnologia para analisar textos de prontuários em laboratório e atuar de fato em situações reais de emergência. A análise teórica não possui as singularidades da vida real, ressalta a reportagem.
Isso acontece, entre outras razões, porque os registros eletrônicos de saúde do dia a dia estão repletos de distrações, com informações irrelevantes ou ambíguas que podem alterar o raciocínio médico. Além disso, a prática médica vai muito além de interpretar dados. Os médicos não diagnosticam apenas lendo gráficos e dados, eles observam o paciente, escutam sua respiração e fala, e analisam as reações durante os exames físicos.
Atualmente, ferramentas textuais de IA não conseguem replicar essa avaliação humana, baseando-se apenas em informações documentadas por outras pessoas. Em outras palavras: apenas passar em avaliações de testes escritos não garante que o sistema possua o desempenho prático de um médico em tarefas clínicas autênticas.
A integração da IA na saúde possui um longo histórico. O uso de apoio computacional na medicina é uma busca que atravessa décadas. O objetivo sempre foi criar uma IA capaz de diagnosticar casos complexos e reais, onde os sintomas se sobrepõem e o contexto do paciente.
Por muito tempo, as sucessivas gerações de computadores foram frustradas por esses desafios. As primeiras tentativas dependiam de regras estáticas pré-programadas ou tentavam aprender com erros de diagnóstico, mas falhavam em classificar as doenças com base na confiabilidade dos dados.
O jogo começou a mudar recentemente com os grandes modelos de linguagem (LLM), que passaram a analisar narrativas clínicas para gerar diagnósticos. No entanto, a maioria dessas avaliações dependia de textos limpos e simplificados, o que não é a realidade do dia a dia em hospitais e, particularmente, nos prontos socorros.
O que os especialistas defendem é que a IA atue como uma ferramenta de apoio, uma espécie de copiloto na tomada de decisões clínicas, e não como uma substituta para os profissionais humanos.
