CUED: ¿Cuán confiables son los DOI? Un 3% de los enlaces DOI fallan

jueves, 7 de marzo de 2024

¿Cuán confiables son los DOI? Un 3% de los enlaces DOI fallan

Tomado de Universo Abierto

Crossref, «What, though, do we actually know about the state of persistence of these links?,» Crossref Blog, acceso el 3 de marzo de 2024, https://www.crossref.org/blog/what-do-we-know-about-dois/.

Crossref guarda metadatos de aproximadamente 150 millones de artefactos académicos. Estos van desde artículos de revistas revisados por pares hasta libros académicos y entradas de blog científico. De hecho, en medio de tal heterogeneidad, el único factor singular que une a estos elementos es que se les ha asignado un identificador de objeto de documento (DOI, por sus siglas en inglés); una cadena de identificación única que se puede utilizar para resolver a un recurso relacionado con dichos metadatos (a menudo, aunque no siempre, una copia del trabajo identificado por los metadatos).

Pero, ¿qué sabemos realmente sobre el estado de persistencia de estos enlaces? ¿Cuántos DOIs se resuelven correctamente? ¿Cuántas páginas de destino, al otro extremo de la resolución del DOI, contienen la información que se supone que debe estar allí, incluido el título y el propio DOI? ¿Cómo podemos averiguarlo?

Hablemos de las estadísticas de resolución. Otros estudios, que examinan los enlaces generales en la web, han encontrado una tasa de descomposición de enlaces de aproximadamente del 60% al 70% en un período de diez años (Lessig, Zittrain y Albert 2014; Stox 2022). La tasa de resolución de DOIs que tenemos, con el 97% de los enlaces resueltos (o una tasa de descomposición de enlaces del 3%), es mucho mejor y más sólida que un enlace web en general.

¿Es un 3% un número bueno o malo? Es más sólido que la web en general, pero aún significa que, de cada 100 DOIs, casi 3 no se resolverán. Además, no podemos determinar si estos DOIs se están resolviendo al objetivo correcto, excepto mediante el uso de métricas de detección de metadatos (¿están el título y el DOI en la página de destino, lo cual solo podríamos detectar a una tasa mucho más baja?). Es completamente posible que un sitio web se resuelva con una respuesta HTTP 200 (OK), pero que la página en cuestión sea algo muy diferente a lo que el usuario esperaba, un fenómeno llamado deriva de contenido. Un buen ejemplo es el secuestro de dominios, donde un nombre de dominio expira y empresas de spam los compran. Estos todavía se resuelven a una página web, pero en lugar de un artículo sobre ARN, por ejemplo, el usuario recibe anuncios de mangueras de soldadura de caucho. Dicho esto, otros estudios también son propensos a esto y no hay garantía de que la deriva de contenido no afecte a una gran proporción de enlaces supuestamente buenos en los otros estudios también.

Tomado de Universo Abierto