Wikipedia, y su banco de imágenes y videos, Wikimedia Commons, dependen de una base sin fines de lucro, basada en donaciones. Tus servidores están sobrecargados por Bots Para entrenar ai, Que toman todo el contenido sin siquiera dar gracias.
Wikimedia ha publicado un informe sobre el uso de su contenido, 144 millones de fotos, videos y otros archivos que ofrecen gratis y sin derechos de autor, y los datos son preocupantes: El 50% del tráfico desde enero de 2024 son bots Ese «escapar» de su contenido, para entrenar la inteligencia artificial.
Hay otra cifra aún peor: el 65% del tráfico de su contenido más pesado (videos a largo plazo) proviene de estos robots.
Bots ia: contenido gratuito, tráfico de ganancias
Quizás para gigantes como Google o Amazon, que ganan mucho dinero con datos, servicios, etc., la presencia de bots de IA no implica un problema. Para el Wikipediapuede significar su muerte.
Todo lo relacionado con su ecosistema, incluido Wikimedia Commonsse gestiona por un organismo sin fines de lucro, el Fundación Wikimedia. Se financia a través de donaciones, y no se quedan con dinero: seguramente ha visto más de una vez en Wikipedia, solicita donar a través de PayPal.
Como explica el informe mencionado anteriormente, «el contenido es gratuito, pero la infraestructura no». Wikipedia y los derivados no tienen publicidad, y todo su contenido es gratuito. Pero Su tráfico es enormeY eso exige una cara de infraestructura en forma de centros de datos distribuidos en todo el mundo.
Estos servidores tienen un tráfico finito, diseñado para satisfacer las necesidades de los seres humanos … pero no de inteligencia artificial.
Cuando se solicita un artículo varias veces, se «memoriza», es decir, se almacena en un caché en el centro de datos más cercano al usuario. Esto se hace porque gran parte del tráfico de Wikipedia está relacionado con el presente o el Tendencia. Por ejemplo, si un personaje famoso o un actor muere, gana un premio, el tráfico de su tarjeta en Wikipedia o sus fotos en Wikimedia, aumenta de repente.
Cuando un usuario consulta un tema, hay posibilidades de que otro vaya detrás. Es por eso Se almacenan en un caché, para aliviar el tráfico de los servidores centrales. Si pasa tiempo sin accesos, este problema se elimina del caché.
Desafortunadamente, el IA BOTS Este esquema está completamente rotoDebido a que no buscan contenido popular, sino «escapar», es decir, descargan todos los contenidos de masa, uno tras otro. Incluyendo contenido que casi cualquier persona solicita.
Esto hace Casi todas sus solicitudes se remiten a los servidores centrales, sobrecargándolos. Los empleados de Wikimedia intentan detener estas descargas masivas. Pero si pierden el tiempo luchando contra los abusadores, no pueden dedicarse a servir a los usuarios humanos.
Wikipedia no está en contra de la inteligencia artificial para usar su contenido, pero los bots lo toman abusivo, incluso usando trucos para esconderse o hacerse pasar por humanos, para que no se detecten. Toman todo gratis, y luego lo usarán con fines de lucro. Y ni siquiera pueden hacer una donación.
No es un problema exclusivo de la Fundación Wikimedia. Todos los repositorios y archivos de datos que funcionan sin ganancias, sufren la misma situación: abuso y bots insaciables, que usan todos los trucos sucios posibles para tomar todo el contenido, sin siquiera dar gracias.
Saber Cómo trabajamos en Informática.
Etiquetas: Cultura, inteligencia artificial, wikipedia
Con información de Telam, Reuters y AP









