Tecnología

«Los rastreadores de inteligencia artificial están arruinando Internet»: los bots amenazan incluso a Wikipedia

Share
Share

Internet está bajo asedio. Y no por ciberdelincuentes, sino por una ola creciente de bots de inteligencia artificial que consumen ancho de banda como nunca antes.

Su misión: rastrear y recolectar grandes volúmenes de contenido —textos, imágenes y videos— para entrenar modelos de lenguaje y generadores de imágenes. Pero el coste de esta actividad lo están pagando algunos de los pilares del conocimiento abierto, como Wikimedia, y miles de proyectos de software libre que operan con recursos limitados.

Desde comienzos de 2024, la Fundación Wikimedia ha registrado un aumento del 50 % en el consumo de su ancho de banda, sobre todo en su repositorio multimedia, Wikimedia Commons. En momentos de alta demanda —como tras el fallecimiento del expresidente estadounidense Jimmy Carter—, este tráfico excesivo provocó lentitud en la carga de páginas y saturación de conexiones para los usuarios.

Lo más preocupante es que no se trata de un aumento del interés humano. La mayoría de ese tráfico proviene de bots automatizados —muchos de ellos no identificados— que extraen contenido para alimentar sistemas de inteligencia artificial.

En la práctica, esto significa que cerca del 65 % de las conexiones a los servidores centrales de Wikimedia están siendo ocupadas por rastreadores que no respetan normas básicas como el archivo robots.txt, diseñado para limitar el acceso de bots a ciertos contenidos.

El modelo de Wikimedia se basa en el principio de “conocimiento como servicio”: su contenido es gratuito y libre de reutilizar, lo que ha sido clave en el desarrollo de buscadores, asistentes de voz y, más recientemente, modelos de IA. Pero esa misma apertura se está volviendo en su contra.

La situación es aún más crítica para proyectos de software libre pequeños, mantenidos por comunidades o desarrolladores individuales. Muchos están viendo cómo sus recursos se agotan debido al tráfico generado por bots, lo que dispara los costos o, directamente, deja a los proyectos fuera de línea.

Gergely Orosz, desarrollador y autor de The Software Engineer’s Guidebook, vivió esto en carne propia: el uso de datos en uno de sus proyectos se multiplicó por siete en pocas semanas, obligándolo a pagar penalizaciones por el exceso de tráfico.

Ante este panorama, algunos desarrolladores están pasando a la ofensiva. Herramientas comunitarias como Nepenthes o soluciones empresariales como AI Labyrinth de Cloudflare han comenzado a utilizar “tarpits”: trampas de contenido falso o irrelevante (en muchos casos, también generado por IA) que engañan a los bots, haciéndoles perder recursos sin obtener información útil.

En el fondo de esta crisis subyace una contradicción profunda: la misma apertura que permitió el auge de la inteligencia artificial está poniendo en riesgo la supervivencia de los espacios abiertos que la hicieron posible. Las empresas de IA se nutren del conocimiento libre, pero no contribuyen a sostener su infraestructura. Esta externalización de costes pone en jaque la sostenibilidad del ecosistema.

Si no se alcanza un nuevo consenso, el mayor riesgo no es que la IA se quede sin datos, sino que los espacios abiertos que la alimentan acaben desapareciendo por falta de apoyo.

Share
Written by
Jhon Soto

Apasionado por compartir contenido relevante y entretenido. Me encanta explorar temas actuales y transformar ideas en artículos que conecten con las personas. ¡Acompáñame en este viaje de historias y tendencias!

Leave a comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Related Articles
Tecnología

Intel busca redimirse con su nueva generación de procesadores Core Ultra 300 Nova Lake

Tras un lanzamiento con sabor amargo, la serie de procesadores Core Ultra...

TecnologíaViral

Meta refuerza medidas de seguridad para proteger a adolescentes en Instagram

Meta, la empresa matriz de Instagram, anunció nuevas herramientas de seguridad destinadas...

Tecnología

LibreOffice acusa a Microsoft de usar formatos «innecesariamente complejos» para mantener cautivos a sus usuarios

La organización detrás de LibreOffice ha lanzado duras críticas contra Microsoft, acusándola...

Tecnología

¿Es suficiente Windows Defender o necesitas un antivirus adicional?

La mayoría de usuarios de Windows cuenta con una primera línea de...

Plataforma de Gestión del Consentimiento de Real Cookie Banner