
Alors que l’intelligence artificielle s’impose partout dans le monde, l’Afrique risque l’exclusion numérique en raison du manque de ressources dans ses langues locales. Mais une série d’initiatives, de African Next Voices à Lelapa AI, vise à bâtir des modèles inclusifs et à valoriser la richesse linguistique du continent.
Avec plus de 2 000 langues parlées, l’Afrique représente près d’un quart de la diversité linguistique mondiale. Pourtant, cette richesse reste largement absente des modèles d’intelligence artificielle, dominés par l’anglais, le français, le chinois ou l’espagnol. Ces systèmes, devenus omniprésents dans l’éducation, la santé, l’administration ou la finance, reposent sur d’immenses corpus de textes et d’enregistrements… dont la plupart des langues africaines sont dépourvues. Beaucoup étant avant tout orales, elles ne disposent pas d’assez de ressources écrites pour alimenter l’apprentissage automatique. Résultat : des millions d’Africains risquent d’être exclus de la révolution numérique faute de maîtriser les idiomes dominants du numérique.
African Next Voices : une base de données inédite
Pour remédier à cette invisibilité, des chercheurs ont lancé African Next Voices, qui constitue aujourd’hui le plus vaste jeu de données vocales en langues africaines. En deux ans, ils ont enregistré 9 000 heures de discours dans la vie quotidienne – agriculture, santé, éducation – au Kenya, au Nigeria et en Afrique du Sud. Ce travail, soutenu par une bourse de 2,2 millions de dollars de la Fondation Gates, couvre 18 langues, dont le kikuyu, le dholuo, le haoussa, le yoruba, l’isiZulu et le tshivenda.
Les données, mises en libre accès, doivent servir de socle à de futures applications : outils de traduction, logiciels de reconnaissance vocale, assistants numériques en langues locales. Pour le professeur Vukosi Marivate, de l’Université de Pretoria, l’enjeu dépasse la technique : « Nous pensons dans nos langues, nous rêvons en elles et nous interprétons le monde à travers elles. Si la technologie ne reflète pas cette réalité, une partie de la population sera laissée pour compte ».
Des initiatives locales et internationales en plein essor
African Next Voices s’inscrit dans un mouvement plus large. Au Nigeria, le projet NaijaVoices a collecté près de 1 800 heures de données vocales auprès de 5 000 locuteurs en haoussa, igbo et yoruba. En Afrique du Sud, Swivuriso rassemble plus de 3 000 heures dans sept langues nationales. Le réseau panafricain Masakhane travaille sur la traduction automatique et la reconnaissance d’entités nommées en seize langues. Et au Nigeria, la startup CDIAL propose déjà un clavier multilingue actif dans 180 langues, ainsi qu’un dictionnaire interactif pour enrichir le vocabulaire numérique.
Ces efforts répondent à une conviction commune : l’inclusion numérique doit se construire à partir des langues maternelles. Les retombées sont concrètes. En Afrique du Sud, l’application AI-Farmer permet à la fermière Kelebogile Mosime de poser des questions agricoles en setswana et d’obtenir des réponses adaptées. La startup Lelapa AI, fondée par Pelonomi Moiloa, conçoit des outils pour la banque ou les télécoms. « Ne pas parler anglais peut signifier manquer des services essentiels. Nous voulons changer cela », insiste-t-elle.
Même les grands acteurs du numérique commencent à s’y intéresser. Fin 2024, Orange a annoncé un partenariat avec OpenAI et Meta pour développer des modèles d’IA adaptés au wolof et au pulaar. En août 2025, l’opérateur a confirmé qu’il utilisait les derniers modèles d’OpenAI pour affiner ces solutions et les rendre accessibles aux gouvernements et institutions publiques.
Lire aussi : L’Afrique et l’Intelligence Artificielle : pourquoi les données locales sont la clé de l’avenir ?
Une question de justice sociale et culturelle
Au-delà de la technologie, ces initiatives relèvent d’un enjeu de société. Exclure les langues africaines de l’IA, c’est marginaliser des millions de citoyens qui n’ont pas accès à l’anglais ou au français, et risquer de creuser encore les inégalités. Les intégrer, à l’inverse, c’est ouvrir la voie à une participation citoyenne renforcée, à de meilleurs services publics et à un accès élargi à la santé, à l’éducation et à la finance.
Pour les chercheurs comme pour les entrepreneurs, l’objectif est clair : bâtir une IA africaine, par et pour les Africains, qui reflète leur diversité linguistique et culturelle. Loin d’être un handicap, la richesse linguistique du continent pourrait ainsi devenir un atout majeur, à condition d’investir dans sa numérisation. L’Afrique dispose désormais d’une base solide pour que ses langues cessent d’être invisibles et trouvent toute leur place dans le futur numérique mondial.