Scite.ai, ciencia cualitativa y en contexto: de las citas tradicionales a las citas inteligentes

  • 10 marzo, 2023

GreenData i Scite.ai firman un acuerdo de distribución de Scite.ai, una plataforma que permite descubrir artículos científicos a través de “citas inteligentes”. La herramienta, basada en inteligencia artificial, tiene por objeto revelar si los resultados de cualquier investigación han sido respaldados o refutados por estudios posteriores. Con este acuerdo, ambas compañías mantienen su compromiso para la eficiencia y calidad de la investigación científica.

No hay duda de que los índices de citas son un componente fundamental de las publicaciones científicas, ya que vinculan los resultados de la investigación a lo largo del tiempo. Asimismo, han facilitado el descubrimiento y la evaluación de hallazgos científicos en todos los campos de la investigación. Tradicionalmente, junto con la revisión por pares, las citas han sido un indicador muy importante de calidad y de influencia: la relevancia de una investigación se establece por la cantidad de veces que se ha citado.

No obstante, el hecho de que un artículo sea muy citado no significa que sea bueno. Muchos estudios refutados después han sido citados muchísimas veces, pero no precisamente por su sólida evidencia. Así pues, lo cierto es que, sin un análisis exhaustivo de las citas, en realidad es difícil saber por qué un artículo determinado se cita más o menos.

Ciencia con perspectiva

De esta necesidad nace Scite.ai, una plataforma financiada parcialmente por la National Science Foundation y el National Institute of Drug Abuse de los National Institutes of Health de Estados Unidos.

 

A diferencia de las herramientas convencionales de medición de citas, Scite.ai indica a los usuarios, a través de “citas inteligentes”, con qué frecuencia un artículo ha sido apoyado o refutado por los estudios que lo citan, así como cuántas veces ha sido, simplemente, mencionado. Así, los informes resultantes muestran las citas en el contexto en el que se mencionan, lo que permite a los usuarios evaluar por sí mismos cómo se cita el artículo.Tal como indica uno de los creadores de Scite.ai., Joshua M. Nicholson: “las citas inteligentes en Scite.ai son como las citas normales, pero, en lugar de simplemente vincular un documento con otro, proporcionan el contexto circundante del documento que cita y clasifican automáticamente el tipo de cita como apoyo, disputa o simplemente mención utilizando el aprendizaje automático”.

 

En concreto, en Scite.ai. se utilizan 11 modelos diferentes de aprendizaje automático para identificar y emparejar citas dentro del texto con referencias, simplemente para extraer el enunciado de la cita y el texto que la rodea. Puede parecer fácil, pero hay que tener en cuenta que hay millones y millones de citas y, lo que es peor, miles de diseños de PDF de editoriales.

 

Con base en estas dificultades, para entrenar modelo de aprendizaje automático y poder clasificar los tipos de citas, ha habido que leer y clasificar manualmente 50.000 citas distintas. El modelo en sí está construido sobre SciBERT, un modelo de aprendizaje automático entrenado para el texto completo una gran cantidad de artículos científicos. Esta tecnología ha permitido extraer y analizar, hasta la fecha, 1.800 millones de declaraciones de citas de más de 33 millones de artículos a texto completo. Como afirma Nicholson, “en los días buenos, procesamos hasta 500.000 PDF al día”. Todo, asociándose con las editoriales más importantes del mundo. Y la idea es seguir creciendo.

A la herramienta puede accederse a través de un sitio web con función de búsqueda y como complemento de los navegadores Chrome y Firefox. Las “citas inteligentes” muestran la misma información bibliográfica que los índices de citas tradicionales, a la vez que proporcionan la siguiente información contextual adicional:

  • El enunciado de la cita: la frase que contiene la cita dentro del texto del artículo que cita.
  • El contexto de la cita: las frases antes y después del enunciado de la cita.
  • La ubicación de la cita dentro del artículo que cita (Introducción, Materiales y Métodos, Resultados, Discusión, etc.).
  • El tipo de cita que indica la intención de esta (apoyo, contraste o mención).
  • Información editorial de Crossref y PubMed, como correcciones o si el artículo ha sido rechazado.

¿Para qué puede utilizarse Scite.ai?

Scite.ai se ha creado para abordar los desafíos que enfrentan los investigadores, editores de revistas y otros profesionales en el campo de la investigación científica:

  • Sobrecarga de información
  • Dificultad para identificar la literatura relevante y de alta calidad en un corpus bibliográfico cada vez más amplio
  • Necesidad de evaluar la fiabilidad de las citas y referencias utilizadas en los artículos científicos para incentivar los trabajos reproducibles y estudiar cuantitativamente campos científicos enteros.
  • En el caso de los editores, la plataforma ofrece un enfoque novedoso que puede ayudarles a identificar aquellos artículos que pueden requerir una revisión adicional o que contienen plagio o datos falsos.

Los investigadores pueden utilizar Scite.ai para localizar evidencia y evaluar referencias. La información proporcionada por la plataforma les ayuda a comprender cómo y por qué se ha citado un artículo y se ha utilizado en investigaciones posteriores. Así, tienen acceso a una fuente de información más rica en matices que el simple recuento de citas y una lista de obras referenciadas carente de contexto.

Además de la función de búsqueda, Scite.ai también proporciona una herramienta de análisis de citas que utiliza el análisis de texto y el aprendizaje automático para identificar y clasificar las citas en los artículos según su contexto y tono. Esto permite a los investigadores y editores evaluar la calidad y la fiabilidad de las citas y las referencias utilizadas en los artículos.