“Filtro de spam” científico marca más de 250.000 estudios potencialmente falsos sobre el cáncer

Salud y medicina

Una nueva herramienta de aprendizaje automático ha identificado más de 250.000 artículos de investigación sobre el cáncer que podrían haber sido producidos por las llamadas “fábricas de estudios”. Desarrollado por el profesor Adrian Barnett, investigador de la QUT y de la Escuela de Salud Pública y Trabajo Social del Centro Australiano de Servicios de Salud e Innovación (AusHSI), y un equipo internacional de colaboradores, el estudio, publicado en The BMJ, analizó 2,6 millones de estudios sobre el cáncer entre 1999 y 2024.

El estudio, “Detección basada en aprendizaje automático de posibles publicaciones de fábricas de papel en la investigación del cáncer: estudio metodológico y transversal”, encontró más de 250.000 artículos con patrones de escritura similares a artículos ya retractados por sospecha de invención.

“Las fábricas de papel son empresas que venden estudios científicos falsos o de baja calidad. Producen ‘investigación’ a escala industrial, y nuestros hallazgos sugieren que el problema en la investigación del cáncer es mucho mayor de lo que la mayoría de la gente creía”, afirmó el profesor Barnett.

Al vender autorías y artículos de investigación completos y listos para usar, las fábricas de papel a menudo utilizan texto reciclado, frases extrañas o datos e imágenes inventados.

“Lo más probable es que se basen en plantillas predefinidas que pueden ser detectadas por grandes modelos de lenguaje que analizan patrones en los textos”, dijo el profesor Barnett.

Él y su equipo entrenaron un modelo de lenguaje llamado BERT para reconocer las sutiles “huellas dactilares” textuales que aparecen repetidamente en productos conocidos de las fábricas de papel.

Cuando se probó en ejemplos verificados, el modelo identificó correctamente los documentos sospechosos el 91% de las veces.

“Básicamente, hemos construido un filtro de spam científico”, dijo el profesor Barnett.

“Al igual que su sistema de correo electrónico puede detectar mensajes no deseados, nuestra herramienta marca los documentos que coinciden con el estilo y la estructura de escritura que vemos en trabajos retractados y fraudulentos”.

Las principales conclusiones del análisis a gran escala incluyen:

  • Los artículos marcados han aumentado drásticamente en dos décadas, pasando de alrededor del 1% a principios de la década de 2000 a alcanzar un máximo de más del 16% en 2022.
  • El problema afecta a miles de revistas de importantes editoriales, incluidas algunas de gran impacto.
  • El problema se concentra más en campos como la biología molecular del cáncer y la investigación de laboratorio en fase inicial.
  • Algunos tipos de cáncer, incluidos el cáncer gástrico, de hígado, de huesos y de pulmón, muestran tasas especialmente altas de papeles sospechosos.

Tres revistas científicas ya están probando la herramienta como parte de su proceso de selección editorial. Esta herramienta permitirá a los editores identificar manuscritos potencialmente falsificados antes de enviarlos a revisión por pares.

El equipo planea expandir la herramienta a otros campos de investigación y mejorar el modelo a medida que se disponga de más casos confirmados de actividad en fábricas de papel. Enfatizan que los hallazgos no constituyen casos confirmados de fraude en la investigación y deben ser verificados por especialistas humanos.

“La investigación del cáncer influye en los ensayos clínicos, el desarrollo de medicamentos y la atención al paciente”, afirmó el profesor Barnett.

Si estudios inventados se introducen en la evidencia, pueden confundir a los verdaderos científicos y, en última instancia, retrasar el progreso de los pacientes. Por eso es vital que nos anticipemos a este problema.

Fuente: Medical Xpress.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *