Cómo la película analógica será el futuro de la historia digital

A principios de julio, una nueva iniciativa para preservar el código fuente histórico abierto comenzó, con instantáneas del código que hace que Facebook y Netflix, entre otros, estén archivados para la prosperidad futura. El código de código abierto de estos y otros repositorios de GitHub se depositó con éxito en la Bóveda de Código Ártico de GitHub. Estas instantáneas tienen como objetivo preservar el código para futuras generaciones, historiadores y científicos.

El medio de almacenamiento que GitHub está confiando para almacenar este valioso archivo es una buena película antigua, que no es diferente a los carretes que la gente solía poner en las cámaras antes de que los fabricantes de cámaras digitales aparecieran diciendo que las tarjetas SD eran mejores.

los Bóveda de código ártico de GitHub es un repositorio de datos preservado en el Arctic World Archive (AWA). Este depósito de datos se encuentra en una mina de carbón desmantelada en el archipiélago de Svalbard, más cerca del Polo Norte que del Círculo Polar Ártico. El archivo se almacena a 250 metros de profundidad en el permafrost de una montaña ártica. GitHub originalmente capturó una instantánea de cada repositorio público activo el 2 de febrero de 2020.

El archivo contiene 6,000 de sus repositorios más significativos para la perpetuidad, capturando la evolución de la tecnología y el software. Esta colección incluye el código fuente para los sistemas operativos Linux y Android; los lenguajes de programación Python, Ruby y Rust; plataformas web Node, V8, React y Angular; criptomonedas Bitcoin y Ethereum; Herramientas AI TensorFlow y FastAI; y muchos más.

Al describir por qué es importante mantener dicho archivo de código, Thomas Dohmke, vicepresidente de proyectos especiales en GitHub, dice: «En los últimos 20 años, el software de código abierto ha cambiado drásticamente nuestras vidas». Por ejemplo, la aplicación y las aplicaciones de rastreo y rastreo del coronavirus alemán para encontrar el estado de un vuelo o reservar un automóvil se basan en el código fuente abierto.

«En el futuro, no habrá una invención importante que no dependa del software de código abierto», dijo. Por ejemplo, el código que Katie Bouman y el equipo detrás del Event Horizon Telescope, utilizado para capturar la primera imagen de un agujero negro, se basa en software de código abierto. «Alrededor del 90% de todo el software depende del software de código abierto», dice Dohmke. “Nadie quiere reinventar la rueda. Los desarrolladores obtienen bibliotecas de GitHub «.

Desde una perspectiva puramente práctica, la dependencia del código fuente abierto en el desarrollo de software moderno en realidad significa que los desarrolladores pueden encontrar que el repositorio del código del que depende su aplicación ha sido eliminado por su responsable de mantenimiento. «Las cosas se pierden porque las unidades de disco duro fallan o el inventor elimina intencionalmente el repositorio cuando se convierte en una carga». Él dice que esto sucedió recientemente cuando el inventor de una biblioteca Javascript decidió eliminarlo. Su eliminación rompió el software que tenía dependencias de codificación basadas en él.

«Sabemos el conocimiento se pierde«, Dice Dohmke. “Por ejemplo, no puedes encontrar una receta para el concreto romano o cómo los construyeron. Los planes originales para el cohete Saturno V se perdieron «. Hoy en día, esto sucede a medida que los desarrolladores se esfuerzan por inventar cosas nuevas, lo que significa que las primeras versiones de los productos no solo se reemplazan, sino que también se olvidan. “No nos importaron las primeras páginas de Amazon o los primeros blogs. Sus creadores han seguido adelante «.

Desde una perspectiva histórica, agrega: «La forma en que hacemos el desarrollo de software puede ser irrelevante». Sin un archivo, la comprensión de cómo se realizó el desarrollo de software a principios del siglo XXI puede perderse para siempre.

Dohmke dice que el equipo de GitHub ha elaborado un manual que describe las prácticas de desarrollo de software y cómo colaboran los desarrolladores. Tal manual puede volverse más importante a medida que la codificación se vuelve más automatizada y el advenimiento de algoritmos de IA como GPT-3, que muestra que una IA puede aprender a escribir software.

Debido a la pandemia global, la instantánea original de GitHub no pudo ser enviada al Arctic Global Archive. En cambio, Github trabajó con Piql para escribir 21 TB de datos de repositorio en 186 carretes de piqlFilm.

Según Piql, la película es un medio fotosensible, químicamente estable y seguro con una longevidad comprobada de cientos de años. La película no se puede alterar, y una vez que se escriben los datos, no se puede editar. Los datos se almacenan sin conexión y no se verán afectados en caso de escasez de electricidad o si están expuestos a pulsos electromagnéticos.

El código se depositó con éxito en la Bóveda del Código del Ártico el 8 de julio de 2020.

Salir de la versión móvil