Սպարտակ Բուղդարեան կը ներկայացնէ “Metric” ընկերութեան հայերէնի ծրագրի զարգացումները
Սեպտեմբեր 12-13-ին Երեւանի մէջ տեղի ունեցած է համակարգչային տուեալներու (data) միջազգային վեցերորդ յաջորդական փառատօնը՝ DataFest Yerevan-ը, ի մի բերելով բարձր արհեստագիտութեան ոլորտի մեծ թիւով մասնագէտներ ամբողջ աշխարհէն։
Ծանօթ է, որ վերջին տարիներուն Հայաստան արձանագրած է հսկայական յառաջընթաց բարձր արհեստագիտութեան, յատկապէս համակարգչային ու վերջերս ալ արհեստական բանականութեան (ԱԲ) բնագաւառներուն մէջ։
Այս առումով՝ հայաստանեան ընկերութիւններու վերջին նուաճումները միջազգային աշխարհին ներկայացնելու, նոր գիւտերու համար նոր գործակցութիւններ հաստատելու, շուկայի նոր կարելիութիւններ որոնելու, յաջողութեան «գաղտնիք»-ներ բաժնելու տեսանկիւնէն ինքնին մեծապէս շահեկան նախաձեռնութիւն մը ըլլալու կողքին՝ DataFest Yerevan-ը մօտէն կը շահագրգռէ, կամ պէտք է շահագրգռէ առօրեայ կեանքին մէջ ընդհանրապէս եւ համակարգչային աշխարհի մէջ յատկապէս հայերէնին գրաւած տեղով մտահոգուողները։
Երբ առաջին chatbot-երը (գործիքի հետ արհեստական զրոյց) սկսան գործել հիմնուած՝ մեծ լեզուական նախատիպերու վրայ, յայտնի էր որ լաւ չէին տիրապետեր հայերէնին։ Սակայն, բարձր ահեստագիտութեան ընկերութիւններու զարգացուցած նոր սերունդի ամէն մէկ նախատիպի հետ որակը բարելաւուեցաւ. այժմ կարելի է ճիշդ հայերէն բնագրեր արտադրել, սրբագրութիւններ ու վերանայումներ կատարել եւ ոճի ու ստեղծագործութեան վրայ աշխատիլ։
Բայց եւ այնպէս, արհեստական բանականութեան մեծագոյններէն ChatGPT-ի, Gemini-ի կամ Claude-ի նման գործիքներուն համար՝ հայերէնը առաջնահերթութիւն չէ, քանի որ անոնք պէտք է գործեն տասնեակներով լեզուներով։
DataFest 2025-ի ընթացքին՝ Սպարտակ Բուղդարեան ներկայացուցած է Metric ընկերութեան կողմէ հայկական լեզուական մեծ նախատիպի մը զարգացման գործընթացը՝ նշելով նպատակները, կիրարկման ոլորտները եւ հանդիպած մարտահրաւէրները։
Նախագիծը սկսած է երեք տարի առաջ։ Հիմնական դժուարութիւնները կ՚առնչուէին հայերէնով որակեալ տուեալներու սահմանափակ քանակին հետ (տուեալներ, որոնց վրայ պէտք է հիմնուի գործիքը՝ գոհացուցիչ արդիւնքի համար)։ Այժմ, օգտագործուած աղբիւրները կը ներառեն PDF փաստաթուղթեր, առցանց գիրքեր եւ YouTube-ի վրայ հայերէն տեսանիւթեր։
Առայժմ անուն չունեցող նախատիպը այսօր կրնայ անսխալ, լաւ կառուցուած բնագրեր արտադրել, թէեւ երբեմն յարակցութենէ զուրկ։ Ներկայիս, խումբը կ՚աշխատի ա՛լ աւելի մեծ նախատիպի մը մշակման վրայ՝ որ ի վիճակի ըլլայ պատասխանելու Հայաստանի տեղական խնդիրներուն։
Սպարտակ Բուղդարեան շեշտած է, թէ մեծ ընկերութիւններու նախատիպերը շատ սուղ կ՚արժեն եւ Metric ուզած է իրը դարձնել open-source (ազատօրէն գործածելի), որպէսզի ուրիշ հետազօտողներ ու մշակողներ եւս կարենան օգտուիլ անկէ։
Metric-ի մշակած ծրագրի գործարկման թուականը դեռ յայտնի չէ, բայց ծրագիրը կարեւոր քայլ մըն է հայախօսներու եւ մա՛նաւանդ հայերէնով հաղորդակցողներուն համար։