Wikipedia ha aumentado su tráfico en un 50% debido a los bots que toman todo su contenido, y para un proyecto sin fines de lucro financiado con donaciones, ese tráfico artificial puede significar su muerte. Entonces ha decidido Prepare su contenido para la IA y ofrecerlo en un servicio externo, Kaggy.
Desde enero pasado, Su tráfico ha aumentado un 50% por bots Ese «escapar» de su contenido, para entrenar la inteligencia artificial.
Como dice la propia Fundación Wikipedia: «El contenido es gratuito, pero la infraestructura no». No tienen publicidad, y todo su contenido es gratuito. Pero su tráfico es enorme, y eso exige una cara de infraestructura en forma de centros de datos distribuidos en todo el mundo.
Wikipedia ofrece sus datos a AI
Cuando se solicita un artículo varias veces en Wikipedia, se almacena en un caché en el centro de datos más cercano al usuario. Esto se hace porque gran parte del tráfico de Wikipedia está relacionado con el presente o el Tendencia. Por ejemplo, si un personaje famoso o un actor muere, gana un premio, el tráfico de su tarjeta en Wikipedia o sus fotos en Wikimedia, aumenta de repente.
Desafortunadamente, el IA BOTS Este esquema está completamente rotoDebido a que no buscan contenido popular, sino «escapar», es decir, descargan todo contenido de masa, uno tras otro. Incluyendo datos que casi cualquier persona solicita.
Esto hace Casi todas sus solicitudes se remiten a los servidores centrales, sobrecargándolos. El 65% de su contenido más pesado (videos a largo plazo) proviene de estos robots.
Este aumento en el tráfico está afectando la velocidad de acceso a los usuarios humanos, y la Fundación Wikipedia no puede invertir en cientos de servidores solo para acomodar los bots de Internet, que toman el contenido y ni siquiera hacen una donación.
Wikipedia no está en contra de la capacitación de inteligencia artificial con sus datos, ya que son libres. Pero los bots que los recogen lo están matando. Entonces encontraste una solución: Ofrecerles en otro lugar.
Ha preparado un conjunto de datos formateado y organizado para entrenar una IA, y está disponible a través de la plataforma científica Kaggy. Entonces Los bots ya no tienen que ir a Wikipedia para tomar lo que necesitan.
Es una solución que satisface a todos, pero también Un ejemplo de tiranía de aiEso no tiene problemas para llamar a servicios globales como Wikipedia, con el único objetivo de lograr todos los datos que pueda. Es insaciable.
Saber Cómo trabajamos en Informática.
Etiquetas: Inteligencia artificial, wikipedia, industria
Con información de Telam, Reuters y AP








