Una vez prolíficos raspadores web, Anthropic y autores y editores de noticias parecen dirigirse a un acuerdo

Antes del acuerdo judicial de ayer, Anthropic aún no había establecido los tipos de acuerdos de licencia de alto perfil con organizaciones de noticias que algunos de sus rivales en IA han conseguido. Mientras OpenAI ha forjado asociaciones con medios como The Atlantic, The Financial Times y la Associated Press, Anthropic ha tomado un camino más lento y menos público en lo que respecta al contenido de noticias. Según 360 law, Anthropic y un grupo de autores han llegado a un acuerdo que probablemente sentará un precedente para las personas que buscan una restitución debido al scraping de su contenido.

La empresa ha sido criticada por su dependencia del scraping agresivo, una práctica que muchas personas condenan como esencialmente un robo de contenido, incluso si es para uso derivado. Para ser justos, muchas empresas dependen del scraping para crear productos derivados, que ni siquiera están relacionados con la IA, sino que son productos que tienen el único propósito de agregar su contenido, muy parecido a un feed RSS, pero con características adicionales. Este contenido y uso también podría calificar como uso derivado, incluso si no es para generación de lenguaje natural (NLG) y otros propósitos de IA. Dado que el dinero ha cambiado de manos, se podría argumentar que hay una necesidad de restitución debido al perfil elevado que el scraping ha recibido como consecuencia de la IA. No nos sorprendería que productos como Lexis Nexus pudieran estar amenazados y otros motores de búsqueda de pago.

Investigaciones Pasadas

Una investigación reciente del Financial Times describió cómo los editores han acusado a Anthropic de extraer vastas cantidades de material sin permiso. Esta práctica ha alimentado la frustración entre los proveedores de noticias que ven su trabajo ser absorbido en sistemas de entrenamiento sin compensación. La tensión ha elevado los llamados en toda la industria para marcos de licencia que recompensen a los editores por el uso de sus archivos en el desarrollo de IA.

Hay indicios de que Anthropic se está posicionando para entrar en el espacio de licencias. La empresa contrató recientemente a Tom Turvey, un veterano ejecutivo de la publicación que anteriormente dirigía asociaciones globales en Google Books. Su experiencia en la gestión de relaciones complejas con editores sugiere que Anthropic puede estar preparándose para negociar acuerdos similares en el futuro. Sin embargo, hasta ahora, no se ha anunciado ningún acuerdo público con un importante medio de comunicación.

Mientras tanto, las asociaciones de Anthropic se han concentrado en otros lugares. La empresa ha trabajado con Wiley, la editorial académica, para probar formas responsables de integrar la investigación académica en sus modelos. Se ha asociado con Databricks para hacer que sus modelos Claude estén disponibles dentro de plataformas de datos empresariales, y ha profundizado lazos con Amazon y AWS, ambos inversores y proveedores de infraestructura en la nube. Más recientemente, Anthropic firmó un acuerdo de $200 millones con el Departamento de Defensa de EE. UU. para explorar aplicaciones de IA responsable en la seguridad nacional.

Tomados en conjunto, estos movimientos muestran que Anthropic está eligiendo construir relaciones con instituciones de investigación, plataformas empresariales y agencias gubernamentales primero. Los proveedores de noticias siguen siendo una frontera abierta porque son esencialmente víctimas con contenido que es fácil de robar. Deben pensar que el uso derivado de la tecnología les da la ventaja a largo plazo. La empresa ha señalado, a través de su reciente contratación y la presión más amplia de la industria, que las asociaciones formales con editores pueden estar en el horizonte, pero por ahora Anthropic aún no ha seguido a OpenAI y Perplexity en ese territorio.

Japón Reacciona

Por su parte, los editores japoneses han demandado a Perplexity por presunta infracción de derechos de autor en un tribunal japonés. Específicamente, el Asahi Shimbun y Nikkei Inc. alegan que sus artículos han sido copiados por Perplexity AI desde al menos alrededor de junio del año pasado. A menudo, la manera en que estos editores pueden confirmar su metodología de copiar/pegar es que solicitar un artículo muy específico – del cual son uno de los pocos autores – conduce a una regurgitación del contenido de su artículo.

El grupo de editores de noticias se ha unido para contraatacar contra la ahora demasiado común práctica de copiar abiertamente el contenido disponible en la web sin permiso o atribución. En otras palabras, muchas de las instituciones victimizadas ahora se encuentran en la ofensiva con un oído comprensivo en algunos tribunales.