Microsoft apuesta por robar contenido de Internet: las big tech usan los derechos de autor a su antojo

Miguel Regueira 01 julio 2024, 19:48

Los casi mágicos resultados de la inteligencia artificial no se basan en que razone por sí misma o tenga un criterio propio, sino que toma contenido previamente existente. Ahora Microsoft ha dejado claro que considera aceptable robar contenido de Internet para entrenar su IA, con una argumentación sorprendente.

Cuando comparamos ChatGPT, Google Gemini y Microsoft Copilot ya explicamos que la inteligencia artificial generativa hace una especie de "remezcla" del contenido con el que fue entrenada. Los "modelos de lenguaje grandes" (LLM por sus siglas en inglés) no tienen creatividad real, se basan en contenido existente.

Análisis

Era lógico que Microsoft, Google y OpenAI (creadores de ChatGPT) estuvieran tentadas a usar el conjunto de Internet para entrenar la IA. El problema es que toman contenido ajeno sin permiso y ponen en peligro la supervivencia de los creadores, que son precisamente quienes hacen posible el espejismo de que la IA es realmente inteligente.

Pues bien, una reciente entrevista con realizada a Mustafa Suleyman, director general de Microsoft AI, por parte del periodista Andrew Ross Sorkin, deja muy claras sus intenciones:

"Respecto al contenido que está en abierto en la web, el "contrato social" sobre ese contenido desde los años 90 ha sido que es uso razonable. Cualquiera lo puede copiar, imitar, reproducir... Como el freeware, por ejemplo. Ese es el acuerdo general."

Aquí Suleyman realiza una interpretación muy cuestionable del "uso razonable" en los derechos de autor. El uso razonable es una excepción a los derechos de autor que permite citar partes de un trabajo científico, hacer una reseña sobre un libro, informar de hechos noticiosos o divulgar con fines educativos.

El uso razonable exige que los fragmentos tomados de terceros sea pequeños en relación con el resultado final, pero las IA se basan en contenido de terceros casi por completo, así que no cabría que se acogiesen a una excepción así.

Además, un criterio importante para que se acepte un uso razonable es que no afecte negativamente al contenido original. Por ejemplo, sería aceptable usar un par de citas de un libro si estamos haciendo una crítica, pero no lo sería realizar tomar las frases clave de un ensayo para venderlo resumido, pues afectaría a sus posibilidades comerciales.

En muchos casos, los asistentes de IA roban tráfico a los creadores de contenido. Aunque enlacen al origen de la información, algo que no siempre es así, en muchos casos los internautas ya no accederán, pues su duda ha quedado resuelta.

A Microsoft no le importa ser denunciada por derechos de autor

La parte más sorprendente de las declaraciones Suleyman insinúa que Microsoft estaría robando contenido a sabiendas de que podría infringir la ley, y que se intentará defender en los tribunales cuando lleguen las denuncias:

"Hay una categoría separada en la que una página, un editor o una fuente de noticias explícitamente ha dicho: «No cojáis o analicéis mi contenido para ningún otro motivo que no sea indexarme para que otras personas puedan ver ese contenido.» Ese es un campo gris, y creo que va a acabar en los tribunales."

Microsoft apostaría por una estrategia completamente falta de ética. Hablamos de una empresa que suele estar entre las diez más valiosas del mundo, en función del mercado de valores, y enfrentarse legalmente a un gigante de estas dimensiones es algo al alcance de pocos.

Además, es muy hipócrita por parte de una compañía que lucha la piratería de Windows y Office, pero que tiene un criterio muy diferente cuando respetar los derechos de autor le perjudica.

A medio plazo, Internet se puede acabar llenando de webs creadas por la IA que han perdido conexión con la realidad. Sin incentivo económico para que redactores humanos creen textos de calidad, verídicos y actualizados, veremos una degradación progresiva de las respuestas de Copilot, Gemini o ChatGPT, pues todas las grandes tecnológicas están robando el contenido de Internet para entrenar a sus IAs.

Cuando la Unión Europea lanzó la Ley de Mercados Digitales (DMA) para limitar el excesivo poder de mercado de las "big tech" estadounidenses no tuvo en cuenta el entrenamiento de la IA, pero debería regularlo también.

Las grandes tecnológicas se han convertido en gigantes con un control excesivo de la vida de las personas. Incluso en El Grupo Informático hemos visto cómo Meta bloqueaba nuestra página en Facebook, sin apenas explicaciones, y con una atención al cliente basada en "bots" que no solucionan nada.

De hecho, hace poco que Irlanda a prohibido que Meta siga entrenando la IA con el contenido que suben a Facebook e Instagram sus usuarios, que podría ser el primer paso para que la UE regule la IA.

Está claro que necesitamos una IA que respete a los creadores de contenido, con fórmulas que les permitan excluirse de los sistemas de entrenamiento, o los compensen económicamente si los aceptan. Una idea que a las "big tech" desagrada, pero que es imprescindible para que la inteligencia artificial pueda seguir evolucionando como hasta ahora.

¿Quién es Sam Altman? La figura que está detrás de la IA ChatGPT

Conoce más sobre el equipo de El Grupo Informático y nuestra política editorial. Puedes seguirnos en Facebook, X, Instagram, WhatsApp, Telegram o recibirnos en tu correo para no perderte las últimas noticias de tecnología.

Ver Comentarios