Directrice du groupe recherche et des programmes scientifiques chez ServiceNow Research où elle dirige les équipes de recherche fondamentale et les labs de recherche appliquée, Valérie Bécaert a également travaillé pour IVADO et Element AI. Elle réfléchit depuis quelques années à la façon dont l’intelligence artificielle transforme le travail. Lors du Big Bang, événement qui fête cette année ses 20 ans, organisé par l’Association québécoise des technologies, elle a levé le voile sur ce que l’IA viendra changer dans le monde du travail.
Si on parle beaucoup d’éco anxiété, surtout chez les jeunes, la directrice du groupe recherche et des programmes scientifiques de ServiceNow Research avance le terme d’anxiété numérique. Selon plusieurs, l’industrie du logiciel pourrait changer davantage dans les 5 prochaines années que ce que l’on a vécu dans les 50 dernières années. Nous sommes passés de l’IA à l’IA générative en très peu d’années.
« En 2012, pour la première fois, l’ordinateur a dépassé la capacité à classer des images avec l’apprentissage profond, explique Valérie Bécaert. En 2017, la technologie a transformé la façon d’organiser une nouvelle architecture de réseau neuronal basée sur un mécanisme d’auto-attention. Fin 2022, GPT est arrivé. Il s’agissait d’une technologie qu’on connaissait depuis 2017. »
Par contre, ce qui a changé depuis décembre 2022, c’est la vitesse à laquelle le grand public se l’est approprié. En cinq jours, ChatGPT comptait un million d’utilisateurs.
GPT a amené la machine à avoir une relation intime avec l’être humain. « C’était la bougie d’allumage et, après, le bordel a pogné, s’amuse-t-elle. La tendance d’aujourd’hui s’avère plus c’est gros, mieux c’est. Le modèle prédictif demande des ressources et du temps à entraîner. » Aujourd’hui, GPT-4 prend en compte 1,7 trillions de paramètres, est entraîné sur 13 millions de tokens (unités qu’on utilise qu’il s’agisse de lettres, de mots ou de phrases) et aurait couté entre 63 et 100 millions $ à entraîner. Son inférence utilise 128 processeurs graphiques (GPU). En comparaison, le nouveau MAC compte un seul processeur graphique.
« On assiste à une course à la grosseur, d’autant plus que l’industrie s’en est emparée, ce n’est plus juste l’apanage des chercheurs. Avec ces capacités, on se retrouve dans un nouveau monde. »
Et ce n’est que le début de la transformation profonde : le Copilot de GitHub va pouvoir compléter le code et même suggérer de meilleures pratiques. Et, déjà, Midjourney peut créer des images pour un rendu artistique. Mila a aussi tenté l’exercice en essayant d’imaginer le futur climatique grâce à l’intelligence artificielle. Le grand modèle de langage (large language model en anglais) fait partie de ces modèles fondateurs. Et les grands joueurs comme Amazon, Google ou encore OpenAI ont déjà développé ces modèles. D’ailleurs, GPT-4 peut d’ores et déjà intégrer le son, la voix et les images. Ces modèles vont avoir des impacts sur notre travail, indique Valérie Bécaert. Il existe cependant des angles morts, comme les coûts, l’impact sur l’environnement et sur l’utilisation des ressources. « On commence à parler de sobriété numérique », note Valérie Bécaert
En revanche, il faut prendre en compte divers éléments qui arrivent avec ces nouveaux modèles, dont les biais, puisque les modèles sont entraînés par des hommes blancs en grande majorité. Il existe aussi un terrain moins connu, celui du droit d’auteur. En janvier 2022, Getty Images a intenté une poursuite contre les créateurs de l’outil artistique d’IA Stable Diffusion pour avoir récupéré son contenu. Autre exemple, l’office du droit d’auteur des États-Unis a accordé une protection limitée au roman graphique « Zarya of the Dawn » : si le scénario de Kris Kashtanova demeure protégé, les images, qu’elle a généré avec Midjourney, elles, ne le sont pas. C’est une véritable boîte de Pandore juridique qui commence à s’ouvrir. Et c’est sans compter les hypertrucages (deepfake) qui se promènent sur Internet.
Côté bonnes nouvelles, Valérie Bécaert rassure en soulignant que la technologie n’est pas encore au point, donc on peut déceler les erreurs. Et certaines initiatives internationales commencent à voir le jour, comme BigCode, une collaboration scientifique ouverte qui travaille au développement et à l’utilisation responsables de grands modèles de langage pour le code.
Une chose est certaine, avec l’IA générative, on proposera des interactions très personnelles avec le média. Alexa s’y est déjà attelé et Meta offre, de son côté, des avatars qui vont converser avec le public et devenir des coachs. Alors, vers quoi allons-nous ?
« Les modèles fondateurs distillent l’entièreté de la connaissance de l’humanité, il faut voir comment les appliquer dans la gestion d’entreprise », conclut Valérie Bécaert.