DataFest Yerevan et l’avenir de la langue arménienne dans l’intelligence artificielle

Les 12 et 13 septembre derniers, Erevan s’est transformée en capitale mondiale des données avec la sixième édition de DataFest Yerevan. Ce festival international a attiré une foule d’experts en hautes technologies venus des quatre coins de la planète.

L’Arménie confirme ainsi sa montée en puissance dans le secteur tech. Ces dernières années, le pays a réalisé un bond spectaculaire, particulièrement en informatique et, plus récemment, en intelligence artificielle. Si l’événement avait pour mission de faire découvrir les dernières prouesses des entreprises locales et de tisser de nouveaux partenariats commerciaux, il a surtout mis l’accent sur un enjeu crucial : comment renforcer la présence de la langue arménienne dans l’univers numérique et perfectionner ses outils d’IA ?

Metric booste l’arménien numérique

L’une des révélations de ce DataFest 2025 est venue de Spartak Boughdarian, qui a dévoilé le projet phare de la société Metric : un grand modèle linguistique pour améliorer significativement le traitement de l’arménien par l’intelligence artificielle. Un pari ambitieux qui vise à perfectionner les outils existants.

Lancé il y a trois ans, ce projet a dû surmonter un obstacle majeur : la pénurie dramatique de contenus arméniens de qualité pour nourrir l’algorithme. L’équipe a donc fait preuve d’ingéniosité, puisant dans une mosaïque de sources : documents PDF, livres numériques et même vidéos YouTube en arménien.

Le résultat ? Un modèle encore anonyme mais déjà prometteur. Il parvient à produire des textes arméniens bien construits et grammaticalement corrects, même si la logique d’ensemble reste parfois fragile. L’équipe ne compte pas s’arrêter là : un modèle de nouvelle génération, plus performant et taillé sur mesure pour les besoins arméniens, est déjà sur les rails.

Face aux tarifs prohibitifs des géants de la tech, Metric a fait le choix de l’open source. « Nous voulons que chercheurs et développeurs puissent s’emparer de cet outil », explique Boughdarian. Une philosophie qui pourrait bien démocratiser l’accès à l’IA en arménien.

Sans date de lancement officielle, ce projet marque néanmoins une étape importante dans l’amélioration des outils numériques arméniens. Pour les millions d’arménophones dispersés à travers le monde, c’est l’espoir de voir leur langue bénéficier d’outils d’IA plus performants et mieux adaptés.

Éditorial