Adimen artifiziala euskaraz

Maite Imaz Leunda

Common Voice Mozilla Fundazioak (kode irekiko Mozilla proiektuaren arduradun den irabazi asmorik gabeko erakundeak) abiarazitako lankidetza-proiektua da, ahots-grabaziozko datu-base libre bat sortzeko, horrekin kode irekiko ahots ezagutzailea (speech-to-text motorra) lortzeko hainbat hizkuntzatan. Boluntarioek mikrofono batekin grabatzen dituzte esaldiak eta grabazioak beste erabiltzaile batzuek berrikusten dituzte. Transkribatutako esaldiak ahotsezko datu-base batean jasotzen dira, jabari publikozko lizentziapean. Lizentzia horrek ziurtatzen du edozein garatzailek datu-basea erabil dezakeela ahotsetik testurako aplikazioetarako, mugarik edo kosturik gabe.

Euskarari dagokionez, Librezale euskara informatikaren munduan bultzatzea helburu duen lantaldea hasi zen sustapena ematen eta grabazioak egiten. Geroago Eusko Jaurlaritzako Hizkuntza Politikako Sailburuordetzak bultzada ematea erabaki zuen eta hainbat urrats egin ziren 2023an; egitasmoaren aurkezpen publikoa egin zen Tabakaleran eta horren inguruko hainbat publizitate egitasmo: spota komunikabideetan, Euskal Irrati Telebistako Gaitu-eguna, Grabazio maratoia hiriburuetan eta hainbat herritan, erronka bideratu zen ahotsak biltzeko proiektua bultzatzeko.

Bultzadaren ondorioz, boluntarioen kopuruak goraldia izan zuen, baina geroztik geldi samar dago. Gaur egun 10.000 hiztunetik gora daude erregistratuta eta 665 ordu grabatuta. Ekimenaren berri etengabe eman beharra dago jendeak ekarpenak egin ditzan. Ahots asko eta askotarikoak behar dira, adin tarte, genero eta mota guztietakoak. Milaka ahots behar dira eta milaka grabazio ordu euskaraz.

Kode irekiko ahots ezagutzailea librea izatean, edonork, hemengo eragileek zein beste enpresa teknologiko handiek, erabili ahal izango du garapenak egiteko.

Adimen artifizialak ekar ditzakeen abantailak handiak dira. Euskal Herrian badira adimen artifiziala eta euskara jorratzen ari diren ikertzaileak; esaterako, ahozko desgaitasuna duten pertsonen komunikazioa erraztuko duten sintesi-teknologien garapenean, ahots pertsonalizatuen sintesia lortzeko; edo ahotsaren transkripzio automatiko elebidunak egingo dituen tresnak garatzen, ahozko jarduna bi hizkuntzatan egiten den kasuetarako; edo euskara ikasten ari direnentzako txatbotak, ikasleek makinekin euskarazko elkarrizketak eduki ahal izan ditzaten.

Adimen artifizialaren arriskuak ere nabarmenak dira, ordea, modu desegokian erabiliz gero. Itzultzaileen eta interpreteen lana arriskuan egon daiteke itzultzaile automatiko neuronalak eta transkribatzaile automatikoak lagungarri gisa erabili beharrean profesionalen lana ordezkatzeko erabiltzen badira. Behin eta berriz esan beharra dago teknologia berrien egitekoa ez dela soilik euskara ikusgarriago egitea eta zabaltzea, kalitatezko euskara erabiltzea eta zabaltzea baizik.

Baina bada erabilera desegokiarena baino arrisku handiagoa: adimen artifizialean euskara ez sartzea eta ingurune digitaletik kanpo geratzea, alegia. Adimen artifizialaren kontrako ahotsak entzuten dira esanez hizkuntza gutxituak babestu egin behar direla. Baina adimen artifizialari uko egitea eta adimen artifizialetik kanpo gelditzea ez da euskara babestea. Orain dela hamarkada batzuk ere baziren euskara batuaren kontra zeudenak euskalkiak babestu behar omen zirelako, baina euskara batua sortu ezean euskarak berak bizirik irautea zen jokoan zegoena.

Teknologia digitaletan ingelesa eta beste hizkuntza nagusi batzuk izaten ari diren bilakaera azkarra baldintza beretan egin ezin duten hizkuntzek desagertze digitalerako zorian eta arrisku larrian egon daitezke. Hizkuntza digitaletan dauden ezberdintasunak mehatxu larria dira hizkuntza-aniztasunarentzat.

Gaur egungo egoerari begira, irtenbide digital aurreratuetarako behar den euskararen corpus digitala oso txikia da. Euskarazko corpus digitala izatea estrategikoa da hizkuntza-eredu eta aplikazio digital aurreratuak garatzeko ezinbesteko abiapuntua delako, eta datuak estrategikoak dira teknologia garatzeko.

Adimen Artifiziala hemen daukagu eta euskaraz egiten ez badu euskal hiztunek beste hizkuntza batzuetara joko dute. Hizkuntza gutxitu batek bere egiten ez duen esparrua inguruko hizkuntza hegemonikoek bereganatzen dute.