{"id":134,"date":"2024-12-01T12:09:00","date_gmt":"2024-12-01T11:09:00","guid":{"rendered":"http:\/\/liege.attac.org\/blog\/?p=134"},"modified":"2025-01-20T12:12:50","modified_gmt":"2025-01-20T11:12:50","slug":"ia-ep-2-quand-lia-se-mord-la-queue","status":"publish","type":"post","link":"http:\/\/liege.attac.org\/blog\/2024\/12\/01\/ia-ep-2-quand-lia-se-mord-la-queue\/","title":{"rendered":"[IA : \u00e9p. 2] Quand l\u2019IA se mord la queue"},"content":{"rendered":"\n<p>[Pour ce texte \u00e0 propos de Madame IA, la forme f\u00e9minine sera utilis\u00e9e, quand le choix se pose.]<\/p>\n\n\n\n<p><a><\/a>Dans notre \u00e9pisode pr\u00e9c\u00e9dent, nous avons vu qu\u2019il \u00e9tait difficile de se projeter dans l\u2019avenir quant \u00e0 l\u2019impact de l\u2019IA sur l\u2019emploi. Alors que, comme ce fut le cas pour la robotisation, certaines redoutent que l\u2019intelligence artificielle ne remplace le travail humain, d\u2019autres affirment qu\u2019elle va \u00eatre la source de tr\u00e8s nombreux nouveaux emplois et qu\u2019il s\u2019agira m\u00eame d\u2019emplois qualifi\u00e9s.<\/p>\n\n\n\n<p>Nous le constatons, dans ce domaine nous fon\u00e7ons t\u00eate baiss\u00e9e, sans penser r\u00e9ellement \u00e0 toutes les implications et cons\u00e9quences de l\u2019utilisation en masse de cette nouvelle technologie. Mais, au fil de ses avanc\u00e9es et de son utilisation croissante par un nombre toujours plus grand d\u2019utilisatrices, elle se trouve confront\u00e9e \u00e0 un probl\u00e8me de taille&nbsp;: elle se mord la queue&nbsp;! Et j\u2019y vois deux aspects diff\u00e9rents mais toutefois li\u00e9s&nbsp;: l\u2019IA contre-attaque et le syndrome de la vache folle. Tout un programme&nbsp;!<\/p>\n\n\n\n<p><strong>L\u2019IA contre-attaque\u2026 l\u2019IA<\/strong><\/p>\n\n\n\n<p>Avec les grands mod\u00e8les de langage (LLM \u2013 sur lesquels est bas\u00e9 ChatGPT par exemple) et les autres technologies de l\u2019IA, s\u2019est ouverte la possibilit\u00e9 de cr\u00e9er des contenus de toutes sortes&nbsp;: textes, images, vid\u00e9os, musique,\u2026 Mais ceux-ci permettent aussi de cr\u00e9er, sans vouloir \u00eatre exhaustif, des robots conversationnels ou encore des attaques informatiques sophistiqu\u00e9es.<\/p>\n\n\n\n<p>Ces cr\u00e9ations, aussi fascinantes qu\u2019elles puissent \u00eatre, ont rapidement pos\u00e9 des soucis de plagiat (enseignement, domaines artistique, litt\u00e9raire,&#8230;), d\u2019usurpation d\u2019identit\u00e9 (on se rappelle cet employ\u00e9 d\u2019un centre financier \u00e0 Hong Kong qui a vers\u00e9 26 millions de dollars \u00e0 des escrocs, tromp\u00e9 par une fausse visioconf\u00e9rence),\u2026<\/p>\n\n\n\n<p>Il a donc fallu cr\u00e9er des IA qui soient capables de reconna\u00eetre des contenus ayant \u00e9t\u00e9 cr\u00e9\u00e9 par d\u2019autres IA et de se prot\u00e9ger contre les attaques qu\u2019elles peuvent aider \u00e0 mettre sur pied. Dans le domaine de l\u2019\u00e9ducation, par exemple, des outils ont \u00e9t\u00e9 construits pour les enseignantes afin de d\u00e9tecter les contenus g\u00e9n\u00e9r\u00e9s par une IA. Les faux positifs (contenus d\u00e9tect\u00e9s comme ayant \u00e9t\u00e9 g\u00e9n\u00e9r\u00e9s par une IA alors qu\u2019ils ne le sont pas) ne sont cependant pas rares, ce qui est tr\u00e8s probl\u00e9matique. On constate la m\u00eame chose dans le domaine informatique o\u00f9 des IA sont cr\u00e9\u00e9es pour contrer les IA qui produisent des cyberattaques, mais aussi dans le domaine artistique (d\u00e9tection de plagiat) ou encore de l\u2019information (d\u00e9tection de <em>deepfake<\/em>).<\/p>\n\n\n\n<p>Si on se hasarde \u00e0 consid\u00e9rer l\u2019intelligence artificielle comme une seule entit\u00e9 (puisqu\u2019il y a en fait une multitude d\u2019IA et de technologies diff\u00e9rentes), l\u2019image du serpent qui se mord la queue vient assez vite \u00e0 l\u2019esprit&nbsp;: l\u2019intelligence artificielle se voit en effet forc\u00e9e de traquer les contenus qu\u2019elle a pr\u00e9c\u00e9demment cr\u00e9\u00e9s.<\/p>\n\n\n\n<p><strong>Le syndrome de la vache folle<\/strong><\/p>\n\n\n\n<p><a><\/a>L\u2019autre versant de ce mouvement cannibale touche plus \u00e0 l\u2019essence m\u00eame de l\u2019intelligence artificielle et en particulier l\u2019IA g\u00e9n\u00e9rative (qui g\u00e9n\u00e8re des contenus en r\u00e9ponse \u00e0 des requ\u00eates). Pour fonctionner, l\u2019IA g\u00e9n\u00e9rative doit en effet \u00eatre aliment\u00e9e par des contenus, on parle d\u2019entra\u00eenement. Les grands mod\u00e8les de l\u2019intelligence artificielle (de langage mais aussi les mod\u00e8les qui g\u00e9n\u00e8rent les images entre autres) sont ainsi en \u00e9volution perp\u00e9tuelle en fonction de ces contenus dont on les abreuve. Or, au fur et \u00e0 mesure de leur utilisation croissante, des donn\u00e9es de plus en plus nombreuses, qui sont inject\u00e9es dans ces mod\u00e8les pour les entra\u00eener, sont \u00ab&nbsp;synth\u00e9tiques&nbsp;\u00bb (g\u00e9n\u00e9r\u00e9es par IA). Un mod\u00e8le comme ChatGPT par exemple, se nourrit en effet de contenu qu\u2019il va chercher sur internet, lequel est inond\u00e9 de contenus synth\u00e9tiques. Les IA \u00ab&nbsp;apprennent&nbsp;\u00bb alors sur base de contenus qu\u2019elles ont elles-m\u00eames g\u00e9n\u00e9r\u00e9s&nbsp;! C\u2019est ce que les informaticiennes appellent la \u00ab&nbsp;boucle de r\u00e9troaction&nbsp;\u00bb mais d\u2019autres font aussi r\u00e9f\u00e9rence au syndrome de la vache folle en nommant ce ph\u00e9nom\u00e8ne MAD (\u00ab&nbsp;fou&nbsp;\u00bb en anglais). Cette maladie appara\u00eet en effet chez des bovins qui ont consomm\u00e9 de la mati\u00e8re c\u00e9r\u00e9brale de leurs cong\u00e9n\u00e8res. Cette boucle de r\u00e9troaction pourrait entra\u00eener un effondrement du mod\u00e8le.<\/p>\n\n\n\n<p>Selon Sina Alemohammad, chercheur en <em>Machine Learning<\/em>&nbsp;: \u00ab&nbsp;<em>Imaginez que vous disposiez d&rsquo;un milliard d&rsquo;\u00e9l\u00e9ments de donn\u00e9es naturelles et d&rsquo;un seul \u00e9l\u00e9ment de donn\u00e9es synth\u00e9tiques. Dans ce cas, le ph\u00e9nom\u00e8ne MAD ne se manifestera pas. Cependant, un an plus tard, si le volume de donn\u00e9es synth\u00e9tiques atteint le milliard, il est certain qu&rsquo;en cinq it\u00e9rations, le syst\u00e8me basculera dans l&rsquo;\u00e9tat MAD<\/em>&nbsp;\u00bb<\/p>\n\n\n\n<p>Le principal probl\u00e8me de ce m\u00e9canisme est l\u2019apparition d\u2019erreurs dans les contenus re-inject\u00e9s dans les mod\u00e8les. Les grands mod\u00e8les de langage ne sont (tr\u00e8s sch\u00e9matiquement) que des algorithmes qui fournissent la r\u00e9ponse la plus statistiquement correcte, en fonction des donn\u00e9es sur lesquelles ils ont \u00e9t\u00e9 entra\u00een\u00e9s. Ainsi, si on demande \u00e0 ChatGPT si ses r\u00e9ponses sont toujours correctes, elle r\u00e9pond&nbsp;: \u00ab&nbsp;<em>Je fais de mon mieux pour fournir des r\u00e9ponses pr\u00e9cises, mais il peut arriver que certaines informations soient inexactes ou d\u00e9pass\u00e9es.<\/em>&nbsp;\u00bb S\u2019il fallait encore le d\u00e9montrer, les contenus synth\u00e9tiques ne sont donc pas fiables mais ils alimentent pourtant abondamment les mod\u00e8les, ce qui pourrait amener \u00e0 une spirale infinie d\u2019inexactitudes. Une \u00e9tude r\u00e9cente a d\u2019ailleurs d\u00e9j\u00e0 d\u00e9montr\u00e9 qu\u2019une IA entra\u00een\u00e9e sur des donn\u00e9es synth\u00e9tiques fournissait, apr\u00e8s peu de temps, des r\u00e9ponses incompr\u00e9hensibles.<\/p>\n\n\n\n<p>Le d\u00e9fi est donc maintenant de d\u00e9tecter les contenus synth\u00e9tiques pour ne pas les r\u00e9-injecter dans les mod\u00e8les d\u2019IA et d\u00e9t\u00e9riorer ses r\u00e9sultats. Nous en revenons donc \u00e0 notre premier point o\u00f9 une IA est forc\u00e9e de traquer ses propres contenus et ceux des autres IA pour ne pas \u00eatre contamin\u00e9e. Je terminerai en caricaturant ce ph\u00e9nom\u00e8ne comme ceci&nbsp;: plus une intelligence artificielle apprend plus elle devient ignorante (si on ne prend pas garde aux donn\u00e9es d\u2019entra\u00eenement).<\/p>\n\n\n\n<p>R\u00e9f\u00e9rences&nbsp;:<\/p>\n\n\n\n<p>&#8211; <a href=\"https:\/\/www.telegraph.co.uk\/business\/2024\/02\/01\/why-ai-new-age-of-fake-news-and-disinformation\/\">https:\/\/www.telegraph.co.uk\/business\/2024\/02\/01\/why-ai-new-age-of-fake-news-and-disinformation\/<\/a><\/p>\n\n\n\n<p>&#8211; <a href=\"https:\/\/futurism.com\/ai-trained-ai-generated-data-interview\">https:\/\/futurism.com\/ai-trained-ai-generated-data-interview<\/a><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"327\" src=\"http:\/\/liege.attac.org\/blog\/wp-content\/uploads\/2025\/01\/jormungandr-in-the-edda-oblongata-13622-1024x327.jpg\" alt=\"\" class=\"wp-image-135\" srcset=\"http:\/\/liege.attac.org\/blog\/wp-content\/uploads\/2025\/01\/jormungandr-in-the-edda-oblongata-13622-1024x327.jpg 1024w, http:\/\/liege.attac.org\/blog\/wp-content\/uploads\/2025\/01\/jormungandr-in-the-edda-oblongata-13622-300x96.jpg 300w, http:\/\/liege.attac.org\/blog\/wp-content\/uploads\/2025\/01\/jormungandr-in-the-edda-oblongata-13622-768x245.jpg 768w, http:\/\/liege.attac.org\/blog\/wp-content\/uploads\/2025\/01\/jormungandr-in-the-edda-oblongata-13622.jpg 1389w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n","protected":false},"excerpt":{"rendered":"<p>[Pour ce texte \u00e0 propos de Madame IA, la forme f\u00e9minine sera utilis\u00e9e, quand le choix se pose.] Dans notre \u00e9pisode pr\u00e9c\u00e9dent, nous avons vu qu\u2019il \u00e9tait difficile de se projeter dans l\u2019avenir quant \u00e0 l\u2019impact de l\u2019IA sur l\u2019emploi. Alors que, comme ce fut le cas pour la robotisation, certaines redoutent que l\u2019intelligence artificielle&#8230;<\/p>\n","protected":false},"author":1,"featured_media":135,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-134","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-digitalisation"],"_links":{"self":[{"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/posts\/134","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/comments?post=134"}],"version-history":[{"count":1,"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/posts\/134\/revisions"}],"predecessor-version":[{"id":136,"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/posts\/134\/revisions\/136"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/media\/135"}],"wp:attachment":[{"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/media?parent=134"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/categories?post=134"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/liege.attac.org\/blog\/wp-json\/wp\/v2\/tags?post=134"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}