Le New York Times accuse ChatGPT et son cousin Copilot de Microsoft, d’avoir pillé des millions d’articles, remontant jusqu’aux années 1950, sans autorisation. Le quotidien américain n’est pas le seul, puisque plusieurs médias d’investigation (Reveal, Mother Jones, The Intercept…) ou la banque d’image Getty, ont porté plainte contre OpenAI, l’éditeur de l’intelligence artificielle, et Microsoft, son principal actionnaire. Mais comme le prestigieux quotidien new-yorkais est le premier à l’avoir fait, et que son dossier s’annonce solide, c’est le procès qui devrait faire jurisprudence.
Résultat, les contre-attaques d’OpenAI et de ses avocats se concentrent contre le New York Times. Dernière en date : l’éditeur de ChatGPT exige que le journal fournisse « les notes des journalistes, les mémos d’interview, les enregistrements, les documents cités… » pour prouver que ces articles sont bien des œuvres originales protégées par la loi nord-américaine sur le droit d’auteur, rapporte le magazine spécialisé Press Gazette, qui a publié mardi la réponse des avocats du journal au juge. Le créateur de ChatGPT estime que le journal « ne peut faire valoir une contrefaçon que sur les parties des œuvres qui sont : originales de l’auteur et détenues ou sous licence exclusive du Times. » Tout ce qui serait du domaine public ou relevant du droit de citation par exemple, devrait se voir écarter de la plainte.
Une arme de dissuasion massive contre la presse
Les avocats du journal exhortent le juge de ne pas accéder à cette demande d’OpenAI, ce qui constituerait « une attaque invasive et sans précédent » contre la liberté de la presse. « Cela impliquerait la divulgation des sources et des dossiers confidentiels des journalistes, concernant des reportages, des enquêtes d’investigation qui ont pris plusieurs mois, sur des sujets hautement sensibles », affirme la lettre. Sans parler de la quantité de travail demandée : plus de 10 millions d’articles sont concernés. Cette requête d’Open AI va « bien en dehors de la portée de ce qui est autorisé par les règles fédérales et ne sert d’autre but que le harcèlement et les représailles contre la décision du Times d’intenter cette action en justice » estiment les avocats du journal. Lever le secret des sources en la matière serait une arme de dissuasion massive, pour tous les médias qui voudraient s’en prendre à OpenAI.
Quelques semaines plus tôt, l’entreprise avait accusé le New York Times d’avoir « payé quelqu’un pour pirater ChatGPT ». Dans son dossier, le journal présente quantité de preuves de plagiat : en lui posant des questions, l’IA répond parfois de véritables copier-coller d’enquêtes uniquement accessibles sur abonnement. Chaque exemple constitue, pour le quotidien, des preuves de la violation du droit d’auteur. C’est ainsi que dans sa plainte, le journal affirme que ChatGPT propose « des résultats qui récitent mot pour mot le contenu du Times, le résument étroitement et imitent son style expressif, comme le démontrent des dizaines d’exemples ». Parmi d’autres, le journal cite l’exemple d’une vaste enquête sur les taxis new-yorkais, publiée en 2019, qui a nécessité 18 mois de travail rédactionnel et a été récompensée par le prix Pulitzer, dont ChatGPT reprend des paragraphes complets sans renvoi vers la source.
« Plusieurs milliards de dollars » le préjudice subi
Les avocats d’OpenAI se défendent, arguant qu’il a fallu « des dizaines de milliers de tentatives pour générer les preuves de la plainte du journal » et que cela a été fait en « ciblant et en exploitant un bogue » que l’entreprise est en train de corriger. Autrement dit que ces preuves auraient été obtenues en exploitant une faille de l’IA.
Dans sa plainte, le groupe de presse estime à « plusieurs milliards de dollars » le préjudice subi. Open AI de son côté, négocie avec les gros groupes de presse (Le Monde, Associated Press, le Financial Times, le groupe Axel Springer…), le plus souvent entre 1 et 5 millions de dollars pour avoir accès à leurs articles à peine écrits, et à toutes leurs archives numérisées. Ce n’est vraiment pas cher payé pour permettre à un outil d’automatiser le plagiat.
Le média que les milliardaires ne peuvent pas s’acheter
Nous ne sommes financés par aucun milliardaire. Et nous en sommes fiers ! Mais nous sommes confrontés à des défis financiers constants. Soutenez-nous ! Votre don sera défiscalisé : donner 5€ vous reviendra à 1.65€. Le prix d’un café.Je veux en savoir plus !