Notas de prensa

Analizan o grao de veracidade das respostas que se obteñen na rede ante consultas sobre saúde

Un estudo do CiTUS da USC publicado na revista científica NPJ Digital Medicine do grupo Nature analiza o grao de veracidade das respostas que se obteñen na internet ante dúbidas relacionadas coa saúde, a través de buscadores ou ferramentas de Intelixencia Artificial. O CiTIUS seleccionou unha mostra de buscadores web e modelos de IA para analizar o comportamento destes sistemas ante as consultas médicas realizadas polo público xeral.

O traballo propón unha dúbida razoable no contexto actual: resulta máis fiable buscar información sobre síntomas médicos nun buscador tradicional ou facelo a través dunha intelixencia artificial conversacional? “Antes falabamos do Dr. Google e agora se suman as IAs”, sinalan os autores, “e por iso queriamos saber ata que punto estas ferramentas proporcionan respostas médicas correctas, que tipo de erros cometen e como podemos combinalas para sacar o mellor de cada unha».

Google ou ChatGPT, quen responde mellor?

O estudo avaliou o rendemento de catro motores de busca tradicional (Google, Bing, Yahoo e DuckDuckGo) e sete modelos de IA conversacional, entre os que destacan sistemas de propósito xeral como ChatGPT e LLaMA3, ou MedLLaMA, un modelo adestrado especificamente para proporcionar respostas a preguntas médicas. Os investigadores mediron a capacidade de todas estas tecnoloxías para ofrecer respostas médicas correctas ante un conxunto de consultas estandarizadas, valéndose para acadar este obxectivo dunha batería de preguntas médicas reais.

“Entre os achados máis relevantes do estudo”, apunta Marcos F. Pichel, primeiro autor do traballo, “obsérvase que os motores de busca tradicionais ofrecen entre un 60% e un 70% de respostas correctas dentro dos vinte primeiros resultados, aínda que moitas das páxinas recuperadas son irrelevantes ou non achegan información clara para resolver a dúbida médica”.

En canto ao uso de IAs, o investigador posdoutoral do CiTIUS recoñece unha maior porcentaxe de acertos, aínda que alerta de que o seu uso non está exento de riscos: “as intelixencias artificiais conversacionais presentan unha taxa de acerto superior, que oscila entre o 80% e o 90%, pero poden incorrer nun problema característico deste tipo de sistemas: a xeración de respostas falsas expresadas con gran seguridade, o que coñecemos como alucinacións”.

A análise de erros realizada ao longo do estudo permitiu agrupar os fallos en tres grandes categorías: aqueles que contradín o consenso médico establecido (“os máis preocupantes”); os que xorden dunha mala interpretación da IA ante a pregunta formulada; e os que dan lugar a respostas demasiado vagas ou imprecisas que, na práctica, non proporcionan unha axuda real a quen a necesita.

Outro dos autores, o catedrático en Arquitectura e Tecnoloxía de Computadores da USC Juan Carlos Pichel, subliña a importancia do xeito en que se formulan as preguntas: “Os modelos son moi sensibles ao contexto”, afirma, sinalando que un prompt (mensaxe de consulta) ben deseñado pode mellorar moito a resposta. “Aínda que tamén podería ocorrer o contrario: unha pregunta ambigua xera respostas perigosas”, afirma. “Un dos riscos máis serios que detectamos co uso das IAs é que, se non entenden ben a pregunta ou carecen de contexto suficiente, poden ofrecer consellos pouco seguros”, advirte.

O traballo afonda na idea de que a maneira en que se formula a pregunta ten un impacto crucial na calidade da resposta. “Unha mesma IA pode dar o salto de equivocarse a acertar, simplemente reformulando o prompt”, conclúe Pichel.

Buscadores vs. IAs: a unión fai a forza

Para o catedrático de Ciencia da Computación e Intelixencia Artificial da USC David Losada, unha parte clave do traballo é a que explora o modo de enriquecer as IAs con resultados obtidos por motores de busca, empregando para iso técnicas de xeración aumentada por recuperación (máis coñecidas como RAG - Retrieval-Augmented Generation, polas súas siglas en inglés). “Inxectar resultados web no prompt permite a IAs máis lixeiras, menos custosas de adestrar e por tanto, máis eficientes, razoar a partir de información externa e actual para xerar respostas acertadas, sen necesidade de ter toda a información pre-almacenada nos seus parámetros. É unha estratexia moi prometedora para sistemas médicos asistidos por IA, xa que presenta un horizonte de futuro seguro e sostible”, afirma Losada.

“Os resultados do noso traballo mostran que as IA conversacionais adoitan ofrecer respostas máis precisas e enfocadas que os buscadores, pero tamén poden incorrer en erros graves”, explica Losada. “O problema dos motores de busca é que devolven moita información irrelevante ou ambigua. A IA, pola contra, ofréceche unha única resposta, que pode ser boa ou estar completamente equivocada”, advirte.

O estudo conclúe que tanto buscadores como IAs teñen potencial para ofrecer información médica útil, pero requiren dun uso informado. “A nosa mensaxe non é elixir entre un ou outro, senón aprender a usalos ben e saber cando desconfiar”, axplican. Por iso, os autores insisten na necesidade de formación, tanto para o público xeral como para profesionais sanitarios. “Non se trata de prohibir nin de substituír, senón de comprender como funcionan estas tecnoloxías e aprender a sacarlles partido de forma crítica e informada. No mellor dos casos, tanto buscadores como IAs cometen entre un 10 e un 15% de erros, e en temas médicos, esa marxe pode ser moi delicada se non se detecta a tempo”, alertan.

Universidade de Santiago de Compostela (USC), 2025-04-10

Actualidad

Foto del resto de noticias (proxecto-xenoma-galicia.jpg) A primeira fase do piloto do proxecto Xenoma Galicia permitiu detectar, entre os máis de 1.000 participantes aos que se lle recolleu unha mostra de sangue, 14 novos casos de alto risco para as patoloxías investigadas de cancro de mama e ovario hereditario, síndrome de Lynch e hipercolesterolemia familiar. A Consellería de Sanidade presentou esta mañá ante o Consello da Xunta un informe de situación do piloto do proxecto Xenoma Galicia. Cun investimento de 20 millóns de euros, o Goberno galego márcase o obxectivo de recompilar o ADN de 400.000 persoas. Pola porcentaxe de poboación incluída, Xenoma Galicia é un dos proxectos de maior envergadura do mundo. Permitirá ofrecer tratamentos farmacolóxicos individualizados, predicir o risco de enfermidades antes de apareceren para poder anticiparse a elas e evitalas grazas ao estudo do xenoma e da historia clínica.
Foto de la tercera plana (veran.jpg) No marco do Plan de Actuacións fronte aos posibles efectos das altas temperaturas sobre a saúde, a Xunta de Galicia vén de rebaixar a alerta por altas temperaturas aos niveis 1 e 2. Deste xeito, a vaga de calor iniciada pasado venres, que na xornada de onte acadou o nivel 3 de alerta en diversas áreas de Galicia, agora queda establecida nos dous primeiros niveis de alerta. En concreto, as zonas que ficarán no nivel 2 son o noroeste de Ourense, o interior de Pontevedra, así como o Centro e a Montaña da provincia de Lugo. Pola súa banda, defínese o nivel de alerta 1 por vaga e calor as zonas do interior de Coruña, o sur de Lugo, Miño de Ourense, montaña de Ourense, sur de Ourense, Valdeorras, litoral de Pontevedra e a zona Miño de Pontevedra.

Notas

A décimo terceira edición do Campus de Verán XuvenCiencia, no que participan case un cento de adolescentes de terceiro e cuarto da ESO, primeiro e segundo de BAC e ciclos medios de FP, arrancou este luns e desenvolverase ata o sábado 5 en facultades, centros de investigación e laboratorios do Campus de Lugo da USC. Como en anos anteriores, o programa inclúe obradoiros prácticos, visitas a centros de investigación da USC en Lugo e doutros puntos da contorna, así como diversas actividades deportivas e de ocio.
Investigadores do grupo Encomat e do grupo e-Materiais da UVigo levan varios meses traballando de maneira conxunta para incrementar a vida útil de estruturas de formigón reforzadas con aceiros de memoria de forma. A súa proposta é a aplicación de películas intelixentes autorreparadoras ou smart coatings, cuxa viabilidade están a estudar no marco do proxecto SmartCoDur, seleccionado dentro do Plan Estatal de Investigación Científica, Técnica e de Innovación.
PUBLICIDAD
ACTUALIDAD GALICIADIGITAL
Blog de GaliciaDigital
HOMENAXES EGERIA
PUBLICACIONES