Introduction
La norme ISO sur le Langage Clair paraît aujourd’hui (On vous en avait déjà parlé ici). C’est l’occasion parfaite pour vous présenter nos dernières nouveautés.
Attention, nous allons parler de “deep learning”, de “transformeurs” et de “prompts”. Ces termes vous paraissent difficiles ? C’est normal.
S’il y a bien une chose qu’on a appris à U31 c’est que faire simple c’est parfois compliqué. Mais ne vous inquiétez pas, nous allons vous expliquer ça en langage clair 😉
Dans cet article vous allez :
• Découvrir les nouvelles fonctionnalités génératives d’U31;
• Lire une explication du fonctionnement de l’IA générative, que vous pourrez réutiliser pour vos grands-parents ;
• Comprendre pourquoi cette technologie a ses limites en rédaction claire ;
• Et prendre connaissance de notre démarche, pour l’utiliser au mieux !
U31 : de nouvelles fonctionnalités génératives dans notre éditeur
Avec les dernières avancées en Intelligence Artificielle et notre expertise en Langage Clair, l’éditeur U31 s’améliore pour faciliter vos adaptations :
– Obtenez un score de clarté plus précis ;
– Remplacez en un clic les mots difficiles par des synonymes plus simples qui s’adaptent au contexte de la phrase ;
– Insérez en un clic une définition simple d’un mot technique ou d’un concept que vous voulez garder et expliquer ;
– Cliquez pour insérer une réécriture plus simple d’une phrase compliquée ;
– Générez des titres pour vos paragraphes.
Cliquez ici pour découvrir toutes ces nouveautés en vidéo ➡️https://www.youtube.com/watch?v=wXVtjfKO9FI
Vous pouvez aussi essayer gratuitement l’éditeur sur https://u31.io.
L’IA générative, qu’est-ce que c’est ?
Vous avez peut-être entendu parler de ChatGPT. C’est un outil qui permet de poser des questions écrites à une intelligence artificielle. En retour, l’intelligence artificielle est capable de comprendre, et de vous répondre précisément.
La technologie derrière chatGPT est un modèle de langue de type GPT. GPT veut dire “Generative Pre-trained Transformer” en anglais : c’est un modèle d’apprentissage profond. Vous suivez-toujours ? Pas d’inquiétude, nous allons tout vous expliquer.
Pour faire simple, la technologie derrière chatGPT c’est un modèle de langue très puissant. Un modèle de langue, c’est un programme informatique qui peut deviner les mots à utiliser quand on lui pose une question précise.
C’est un peu de cette manière que les humains fonctionnent aussi. Imaginons que vous dites à un ami : “J’ai faim, je pense aller au…”. Votre ami pourrait prédire que vous êtes sur le point de dire “restaurant”, “frigo”, “supermarché”, etc. Il utilise son modèle de langue pour deviner ce qui pourrait venir après.
Pour apprendre à deviner, un modèle de langue utilise un réseau de neurones entraîné sur de grandes quantités de textes.
Un réseau de neurones artificiels fonctionne un peu comme le cerveau humain :
Un seul neurone c’est très simple, ça s’allume ou s’éteint selon les informations qu’il reçoit. Mais si on met plusieurs neurones ensemble, on est capable de faire des tâches complexes.
Un cerveau humain a environ 85 milliards de neurones. Dans le cas de GPT il y a des millions de neurones artificiels.
Un réseau de neurones a deux éléments importants :
• L’architecture : c’est-à-dire la façon dont sont placés les neurones entre eux. Le Transformer c’est une architecture qui marche très bien.
• Les poids de chaque neurone : Pour mieux comprendre faut imaginer qu’on a plein de boutons qu’on tourne pour trouver le bon réglage (appelé poids). Avec beaucoup d’exemples, on arrive à trouver les réglages qui permettent d’obtenir les meilleurs résultats. On appelle ça “l’entraînement”.
Après son entrainement, l’algorithme est donc capable de comprendre ce que vous lui écrivez, et de deviner les mots qu’il faut utiliser pour vous répondre.
Si vous voulez en savoir plus, vous pouvez cliquer pour accéder à une vidéo qui explique ChatGPT avec plus de détails : https://www.youtube.com/watch?v=7ell8KEbhJo
Les limites des modèles GPT pour la rédaction claire
La capacité d’outils comme GPT pour générer du texte est impressionnante, et c’est ce qui fait la force de ces modèles. Est ce qu’on peut compter sur ces outils pour adapter un texte en langage clair ?
La simplification d’une phrase n’est pas une tâche facile, même pour les humains. Elle nécessite une compréhension profonde de la grammaire, du contexte, du sens, mais surtout de ce qu’est un langage “clair” ou “simple”.
Quels sont les problématiques principales de ces modèles pour la simplification automatique ?
1) Les outils de génération sont entraînés sur énormément de textes provenant d’Internet. Malheureusement, ces textes sont loin d’être parfaits. Il y a des erreurs, des ambiguïtés, des biais et bien d’autres imperfections. Par ailleurs, les textes utilisés pour l’entraînement sont difficiles.
2) Ensuite, contrairement aux êtres humains, les outils de générations ne comprennent pas le monde réel. Pour ces outils, tout est calcul et mathématiques. Ils se contentent de deviner la prochaine série de mots sur la base de ce qu’ils ont “vu” lors de leur entraînement. La réponse la plus probable n’est pas toujours la plus pertinente, et parfois elle ne correspond même à rien dans le monde réel.
3) Enfin, simplifier une phrase n’est pas seulement une question de réduction du nombre de mots ou d’opérations linguistiques. Il faut aussi garder le sens, l’intention et le ton de la phrase originale, prendre en compte ses lectrices et lecteurs… Mesurer la simplicité d’une phrase est d’ailleurs un sujet de recherche à part entière (mais nous en parlerons dans un prochain article).
Utiliser seul un outil comme GPT est limité. Il ne permet pas de rédiger en Langage Clair.
Combiner l’IA et notre expertise en Langage Clair : apprendre à prompter
Pour obtenir des résultats un peu plus pertinents en utilisant un outil comme GPT, il faut lui donner des instructions précises. C’est ce qu’on appelle des prompts.
Pour être précis dans les questions, et donc dans les réponses, il faut :
– Connaître les difficultés des publics cibles et les règles du Langage Clair sur le bout des doigts, pour bien expliquer la tâche.
– Identifier les difficultés d’un texte et leur contexte, pour avoir des demandes très précises.
– Comprendre le fonctionnement des algorithmes de deep learning, pour l’adapter à au besoin de simplification.
➡️ Et ça tombe bien, c’est notre travail ! Notre équipe de chercheurs y travaille depuis maintenant 3 ans.
1) Utiliser des règles prouvées et reconnues
Pour construire U31, nous avons étudié précisément le Langage Clair. En travaillant sur le Langage Clair, U31 s’inscrit dans la continuité de tous les travaux existants et reconnus sur la clarté de la langue. Ce travail remonte au début des années 70. Il a pour but de permettre à toutes et tous d’accéder à l’information écrite.
2) Identifier des difficultés pour savoir comment simplifier
Nous avons développé un ensemble de règles linguistiques. Ces règles nous permettent de détecter automatiquement tous les éléments complexes d’un texte :
- Longueur des phrases ;
- Mots complexes, jargon technique et vocabulaire spécialisé ;
- Acronymes ;
- Énumérations ;
- Proportion de formes négatives, de voix passives ;
- Proportion de propositions relatives ;
- etc..
Nous avons ainsi travaillé des “prompts” à partir du standard du langage clair et des règles précises que nous avons construites.
3) Apprendre à connaître le modèle
En comprenant le fonctionnement des outils comme GPT, on peut améliorer la qualité des “prompts” mais aussi améliorer le modèle lui-même et contrôler les propositions faites.
Nous avons donc entraîné spécifiquement l’outil GPT pour la tâche de simplification. Pour cela, nous lui avons fourni des centaines d’exemples de mots et de phrases difficiles avec le type de difficulté associée et leur version simplifiée.
De plus, lorsqu’une génération est faite, on contrôle la réponse de l’outil par d’autres moyens pour améliorer le résultat. Par exemple, si un synonyme plus simple est généré par le modèle, nous pouvons croiser cette réponse avec un autre indicateur qui permet de déterminer si un mot est simple ou non : l’ordre et la fréquence d’apparition du mot dans les manuels scolaires.
➡️ Quelques exemples :
• Phrase d’origine :
La circulaire du 6 octobre 2022 rappelle l’objectif fixé par le Gouvernement de rendre la société pleinement inclusive en intégrant la dimension du handicap dans la mise en œuvre des politiques publiques, afin de favoriser l’accessibilité universelle, l’accès aux droits, la lutte contre les discriminations et la participation des personnes en situation de handicap à la construction des solutions qui les concernent.
• Phrase simplifiée avec un prompt simple et un modèle non entraîné spécifiquement :
La circulaire du 6 octobre 2022 rappelle l’objectif gouvernemental d’une société pleinement inclusive, intégrant le handicap dans les politiques publiques pour favoriser l’accessibilité universelle, les droits, la lutte contre les discriminations et la participation des personnes handicapées à la création de solutions les concernant.
• Phrase simplifiée avec un prompt U31 et notre modèle ré-entraîné :
La circulaire du 6 octobre 2022 rappelle l’objectif fixé par le Gouvernement de rendre la société pleinement inclusive.
Pour y parvenir, il est nécessaire d’intégrer la dimension du handicap dans la mise en œuvre des politiques publiques.
Cela favorise :
- l’accessibilité universelle,
- l’accès aux droits,
- la lutte contre les discriminations
- la participation des personnes en situation de handicap à la construction des solutions qui les concernent.
4) Proposer une supervision humaine
Même avec les meilleurs prompts, un modèle amélioré et des règles qui permettent de contrôler la sortie, ce n’est pas toujours suffisant.
Même dans les correcteurs orthographiques ou les traducteurs automatiques il y a des erreurs. Maintenant imaginez pour une tâche aussi complexe que la simplification !
Certains cas nécessitent de faire des choix très importants pour faciliter la compréhension des lectrices et des lecteurs. Par exemple,
• Choisir entre un mot difficile à comprendre, ou une explication simple mais beaucoup plus longue.
• Simplifier les temps verbaux tout en préservant la facilité à suivre le déroulé d’un texte en gardant une cohérence chronologique.
• Faire remonter ou ressortir certaines informations pour s’assurer qu’elles soient vues par les lectrices et lecteurs.
Les contextes d’écriture changent d’un document à un autre, d’un domaine à un autre, selon les besoins et la connaissance que l’on a de son public… De plus, chaque texte a son lot de difficultés et de solutions propres.
Les nouvelles fonctionnalités génératives permettent de gagner un temps précieux mais aussi en confort d’utilisation pour rédiger facilement des textes clairs. Mais ce sont des arbitrages et les décisions que vous prenez qui restent les plus importants !
➡️ L’éditeur conserve ainsi :
• Le score de clarté, pour se fixer des objectifs et suivre votre travail,
• Des cartes avec des explications détaillées et la possibilité d’ignorer la recommandation,
• Un système d’apprentissage et de personnalisation : U31 s’adapte, et apprend avec vous !
Sécurité des données et confidentialité
Dans un contexte troublé par l’arrivée rapide de ChatGPT, nous voulons trouver le bon équilibre entre performance, transparence et sécurité pour nos utilisatrices et utilisateurs. Nous avons pensé les fonctionnalités génératives comme un “mode” que vous faites le choix d’activer ou de désactiver.
Si vous choisissez de désactiver ce mode, vous aurez toujours accès aux autres fonctionnalités de notre éditeur : le score de clarté, la détection automatique des éléments compliqués, la suggestion de synonymes simples, la génération de titres…
Nous vous en dirons plus en septembre sur nos travaux et autres mesures en cours pour conserver une démarche de développement éthique et souveraine.
Pour découvrir l’ensemble des fonctionnalités de notre éditeur, rendez-vous sur https://u31.io