03/05/2024
Publicado en Nature
https://www.nature.com/articles/d41586-024-00616-5
Traducción tomada de Boletín SciELO México:
Millones de documentos de investigación corren el riesgo de desaparecer de Internet
Un análisis de los DOI sugiere que la preservación digital no está a la altura del floreciente conocimiento académico.
Por Sarah Wild
Según un estudio de más de siete millones de publicaciones digitales, más de una cuarta parte de los artículos académicos no se archivan ni conservan adecuadamente. Los resultados, publicados en Journal of Librarianship and Scholarly Communication el 24 de enero1, indican que los sistemas de conservación de documentos en línea no han seguido el ritmo de crecimiento de la producción investigadora.
"Toda nuestra epistemología de la ciencia y la investigación se basa en la cadena de notas a pie de página", explica el autor Martin Eve, investigador en literatura, tecnología y edición de Birkbeck, Universidad de Londres. "Si no puedes verificar lo que alguien ha dicho en algún otro punto, sólo estás confiando en la fe ciega de unos artefactos que ya no puedes leer por ti mismo".
Eve, que también trabaja en investigación y desarrollo en la organización de infraestructuras digitales Crossref, comprobó si 7.438.037 obras etiquetadas con identificadores de objetos digitales (DOI) se conservan en archivos. Los DOI, que consisten en una cadena de números, letras y símbolos, son huellas dactilares únicas que se utilizan para identificar y enlazar a publicaciones específicas, como artículos académicos e informes oficiales. Crossref es la mayor agencia de registro de DOI, que asigna los identificadores a unos 20.000 miembros, entre ellos editoriales, museos y otras instituciones.
La muestra de DOI incluidos en el estudio estaba formada por una selección aleatoria de hasta 1.000 registrados en cada organización miembro. El 28% de estas obras -más de dos millones de artículos- no aparecían en ningún archivo digital importante, a pesar de tener un DOI activo. Sólo el 58% de los DOI hacían referencia a obras que habían sido almacenadas en al menos un archivo. El 14% restante se excluyó del estudio por haberse publicado demasiado recientemente, no ser artículos de revistas o no tener una fuente identificable.
El reto de la conservación
Eve señala que el estudio tiene limitaciones: a saber, que sólo rastreó artículos con DOI y que no buscó artículos en todos los repositorios digitales (no comprobó si los artículos con DOI estaban almacenados en repositorios institucionales, por ejemplo).
No obstante, los especialistas en preservación han acogido favorablemente el análisis. "Ha sido difícil conocer el alcance real del reto de la preservación digital al que se enfrentan las revistas electrónicas", afirma William Kilbride, director general de la Digital Preservation Coalition, con sede en York (Reino Unido). La coalición publica un manual en el que se detallan las buenas prácticas de preservación.
"Mucha gente tiene la suposición ciega de que si tienes un DOI, está ahí para siempre", dice Mikael Laakso, que estudia la publicación académica en la Hanken School of Economics de Helsinki."Pero eso no significa que el enlace funcione siempre".En 2021, Laakso y sus colegas informaron2 de que más de 170 revistas de acceso abierto habían desaparecido de Internet entre 2000 y 2019.
Kate Wittenberg, directora gerente del servicio de archivo digital Portico, de Nueva York, advierte de que los pequeños editores corren más riesgo de no conservar los artículos que los grandes."Preservar contenidos cuesta dinero", afirma, y añade que archivar implica una infraestructura, una tecnología y unos conocimientos a los que muchas organizaciones pequeñas no tienen acceso.
El estudio de Eve sugiere algunas medidas que podrían mejorar la preservación digital, entre ellas unos requisitos más estrictos en las agencias de registro DOI y una mejor educación y concienciación sobre el tema entre editores e investigadores.
"Todo el mundo piensa en los beneficios inmediatos que puede reportar la publicación de un artículo en algún sitio, pero en realidad deberíamos pensar en la sostenibilidad a largo plazo del ecosistema de investigación", afirma Eve. "Cuando lleves 100 años mu**to, ¿podrá la gente acceder a las cosas en las que has trabajado?".
doi: https://doi.org/10.1038/d41586-024-00616-5
Actualizaciones y correcciones
Aclaración 05 marzo 2024: El titular de esta noticia se ha modificado para reflejar el hecho de que algunos de estos trabajos no han desaparecido por completo de Internet. Más bien, muchos de ellos siguen siendo accesibles pero no han sido archivados correctamente.
An analysis of DOIs suggests that digital preservation is not keeping up with burgeoning scholarly knowledge.