Atlas-Chat : des chercheurs mettent au point une IA en darija

Le 26 septembre, une avancée majeure a été réalisée dans le domaine de l'intelligence artificielle avec la publication d'Atlas-Chat, le premier ensemble de modèles linguistiques conçus spécifiquement pour la darija, langue parlée quotidiennement par des millions de Marocains mais largement sous-représentée technologiquement.

Par

TELQUEL
Selon un article publié sur ResearchGate en septembre, ce projet, qui est le fruit d’une collaboration entre des chercheurs de l’Université Mohamed bin Zayed of Artificial Intelligence (MBZUAI), EMINES-UM6P, et d’autres institutions internationales, représente une étape cruciale vers l’inclusion numérique des langues moins documentées.

L’Atlas-Chat ne se contente pas de traduire ou de comprendre la darija ; il est conçu pour interagir de manière intuitive avec les utilisateurs en darija, facilitant ainsi des tâches allant de la simple commande vocale à des interactions plus complexes nécessitant une compréhension contextuelle. Le projet a débuté par la consolidation de ressources linguistiques existantes, la création de nouveaux ensembles de données, et l’application de contrôles rigoureux de qualité pour la traduction des instructions en anglais.

à lire aussi

La darija, contrairement à l’arabe standard moderne utilisé dans les médias et l’enseignement au Maroc, présente des défis uniques en raison de sa structure grammaticale et de son vocabulaire qui emprunte largement à l’amazighe, au français, et à l’espagnol. Atlas-Chat aborde ces défis en intégrant ces spécificités, rendant ainsi la technologie plus accessible et plus pertinente pour ses utilisateurs.

Le potentiel d’Atlas-Chat pour transformer l’accès aux services numériques est immense. En éduquant les modèles d’intelligence artificielle pour comprendre et générer de la darija, les développeurs espèrent non seulement faciliter la vie quotidienne de millions de locuteurs de darija, mais aussi encourager l’inclusion numérique à une échelle plus large dans la région MENA.

Les ressources du projet sont accessibles publiquement, ce qui permettra à d’autres chercheurs de développer des applications adaptées à leurs propres besoins communautaires.