Revelan que Meta descargó más de 80 TB de libros con copyright para entrenar su IA, y lo hizo utilizando BitTorrent
Meta, la empresa liderada por Mark Zuckerberg, se encuentra en medio de una batalla legal, tras haber sido acusada de utilizar obras protegidas por los derechos de autor para entrenar a sus modelos de inteligencia artificial. Documentos internos de la compañía han confirmado que, efectivamente, habría sido así. Los correos electrónicos de empleados que han sido desvelados en el caso de Kadrey contra Meta han revelado que trabajadores de la compañía descargaron 81,7 Terabytes de datos de múltiples bibliotecas. Las descargas habrían sido a través de archivos torrents e incluirían incontables libros protegidos por derechos de autor o copyright. Meta habría utilizado sin permiso contenido protegido por derecho de autor para entrenar su IA La inteligencia artificial es una de las piezas más importantes en la estrategia de Meta para corto, mediano y largo plazo. La compañía está invirtiendo miles de millones de dólares en el desarrollo de sus modelos de lenguaje como Llama, y en aplicaciones como el chatbot Meta AI. Entrenar de forma rápida y masiva su inteligencia artificial habría requerido que Meta accediera a este contenido, o al menos eso es de lo que se le acusa. En Xataka Android El "padrino" de la IA predice otra revolución tecnológica en los próximos cinco años Los correos electrónicos revelados por el caso incluyen mensajes entre empleados preocupados por este tipo de acceso a libros protegidos por copyright. Una empleada, llamada Melanie Kambadur, incluso bromeaba al respecto y mostraba su rechazo en uno de los correos enviados en 2022, mencionando: "Descargar vía torrents usando un portátil de la empresa no parece buena idea". Las pruebas reveladas en el caso aseguran que Meta descargó vía torrents unos 81,7 Terabytes de datos desde bibliotecas que ofrecen acceso a libros protegidos por derechos de autor. Incluso en otro documento se menciona que la compañía habría descargado al menos 35,7 Terabytes de bibliotecas como Z-Library o LibGen. Si tomamos en cuenta que un libro en promedio puede tener un tamaño de entre 1 y 20 MB, estaríamos hablando de al menos de cientos de miles de libros, para hacernos una idea. Meta, por su parte, espera desestimar los cargos de los que se le acusan, asegurando que no hay evidencia real de que empleados de la compañía hayan descargado ni distribuido estos libros. Otro documento en la demanda también muestra un mensaje de un empleado de Meta que indica que la compañía habría tomado medidas para evitar usar sus servidores al supuestamente descargar estos datos. En Xataka Android Probamos DeepSeek en móvil y PC: ventajas, inconvenientes y una gran diferencia Por supuesto, Meta no es ni será la única empresa de tecnología que utilice, o que sea acusada de utilizar, materiales protegidos por los derechos de autor para entrenar sus sistemas de inteligencia artificial. OpenAI incluso ha sido demandada por The New York Times. Es bastante posible que durante los próximos años veamos muchos más casos similares acusando a las grandes compañías de tecnología. Foto de portada | Ed Robertson en Unsplash + Captura de pantalla En Xataka Android | He probado ChatGPT en WhatsApp y tengo claro que Meta AI es mucho mejor. Te cuento por qué En Xataka Android | Este robot humanoide chino para el hogar se ha adelantado a todos: ya se puede comprar en España - La noticia Revelan que Meta descargó más de 80 TB de libros con copyright para entrenar su IA, y lo hizo utilizando BitTorrent fue publicada originalmente en Xataka Android por Eduardo Marín .
![Revelan que Meta descargó más de 80 TB de libros con copyright para entrenar su IA, y lo hizo utilizando BitTorrent](https://i.blogs.es/292897/meta-libros-ia/840_560.jpeg)
Meta, la empresa liderada por Mark Zuckerberg, se encuentra en medio de una batalla legal, tras haber sido acusada de utilizar obras protegidas por los derechos de autor para entrenar a sus modelos de inteligencia artificial. Documentos internos de la compañía han confirmado que, efectivamente, habría sido así.
Los correos electrónicos de empleados que han sido desvelados en el caso de Kadrey contra Meta han revelado que trabajadores de la compañía descargaron 81,7 Terabytes de datos de múltiples bibliotecas. Las descargas habrían sido a través de archivos torrents e incluirían incontables libros protegidos por derechos de autor o copyright.
Meta habría utilizado sin permiso contenido protegido por derecho de autor para entrenar su IA
La inteligencia artificial es una de las piezas más importantes en la estrategia de Meta para corto, mediano y largo plazo. La compañía está invirtiendo miles de millones de dólares en el desarrollo de sus modelos de lenguaje como Llama, y en aplicaciones como el chatbot Meta AI. Entrenar de forma rápida y masiva su inteligencia artificial habría requerido que Meta accediera a este contenido, o al menos eso es de lo que se le acusa.
Los correos electrónicos revelados por el caso incluyen mensajes entre empleados preocupados por este tipo de acceso a libros protegidos por copyright. Una empleada, llamada Melanie Kambadur, incluso bromeaba al respecto y mostraba su rechazo en uno de los correos enviados en 2022, mencionando:
"Descargar vía torrents usando un portátil de la empresa no parece buena idea".
Las pruebas reveladas en el caso aseguran que Meta descargó vía torrents unos 81,7 Terabytes de datos desde bibliotecas que ofrecen acceso a libros protegidos por derechos de autor. Incluso en otro documento se menciona que la compañía habría descargado al menos 35,7 Terabytes de bibliotecas como Z-Library o LibGen. Si tomamos en cuenta que un libro en promedio puede tener un tamaño de entre 1 y 20 MB, estaríamos hablando de al menos de cientos de miles de libros, para hacernos una idea.
Meta, por su parte, espera desestimar los cargos de los que se le acusan, asegurando que no hay evidencia real de que empleados de la compañía hayan descargado ni distribuido estos libros. Otro documento en la demanda también muestra un mensaje de un empleado de Meta que indica que la compañía habría tomado medidas para evitar usar sus servidores al supuestamente descargar estos datos.
Por supuesto, Meta no es ni será la única empresa de tecnología que utilice, o que sea acusada de utilizar, materiales protegidos por los derechos de autor para entrenar sus sistemas de inteligencia artificial. OpenAI incluso ha sido demandada por The New York Times. Es bastante posible que durante los próximos años veamos muchos más casos similares acusando a las grandes compañías de tecnología.
Foto de portada | Ed Robertson en Unsplash + Captura de pantalla
En Xataka Android | He probado ChatGPT en WhatsApp y tengo claro que Meta AI es mucho mejor. Te cuento por qué
En Xataka Android | Este robot humanoide chino para el hogar se ha adelantado a todos: ya se puede comprar en España
-
La noticia
Revelan que Meta descargó más de 80 TB de libros con copyright para entrenar su IA, y lo hizo utilizando BitTorrent
fue publicada originalmente en
Xataka Android
por
Eduardo Marín
.