Estitxu Irisarri Egia
Beste behin ere, adimen artifiziala (AA). Esango nuke testu honek aurreko astean Itziar Otegik aipatzen zuen magia eta Ane Garmendia Alberdik apirilean eta Maite Imaz Leundak urtarrilean aipatutako ardura dakartzala berriz gogora. Pare bat kontu aztertu nahi izan ditut neure buruari jarri diodan erronkatxo honekin; batetik, Whisper AA darabilen TurboScribe doako bertsioak euskarazko audioak transkribatzeko zer gaitasun duen eta transkripzio horietatik abiatuta HeyGen eta Synthesia baliabideek eskaintzen dituzten zenbait ahotsek duten ahoskera behatzea.
HEOCen nondik norakoak irakurtzen nabilen honetan, eskuz idatzitako eskema bat audioan grabatu dut. Audioa 30 minutu baino gutxiagokoa bada, osorik transkriba dezake TurboScribe delakoak eta egunean tamaina horretako 3 audio transkriba ditzakegu ordaindu gabe. Transkripzioaren zehaztasuna finkatzeko aukera ematen digu tresna honek; horretarako, 3 animaliaren artean hautatu behar dugu: gepardoa, delfina edo balea. Gepardoa da aukerarik azkarrena, baina, badakizue, azkar eta ondo, usoak hegan. Balea da zehatzena. Transkribatu baino lehen audioaren hizkuntza zein den adierazi behar dugu eta zerrendan euskara ere azaltzen da. Hautatutako doako AAk honela transkribatu ditu nire jardunaren 3 bat minutu:
| (0:00) Eok, emillatua geitabat, elduen euskal duntzerako oinarrizko kurrikuluma, kurrikulumaren oinarriak, hogeita mar garran horrialdea. (0:18) Gaitasun komunikatibora eta ekintzetara bideratutako ikuspegia da, ikaslea gizartera gehiada eta ekintzak interesekoak izango dira. (0:33) Ekintzak komunikatiboa da elementua, ekintzak mundu sozialarekin loturadua eta komunikatiboak izkuntzenen munduarekin. (0:52) Kurrikulumaren oinarria ikaslearen autonomia ere bada eta izkuntza eta ekintzak komunikatiboa oso tasunak dira, oso tasun dinamikoak. (1:09) Iztunak kontuan izan behar ditu testu eta testuingurua. (1:14) Ekintzak komunikatiboak okial hortzeko, ekintzak komunikatibo guztiak ezin lan du eta autonomia eta estrategia da dira helburuak. (1:37) Maliak onarrizko lerruna, onarrizko erabiltzaia, abat eta abi. (1:45) Eguneroko gai buruzko euskarazko testu lagurrak ulertzea eta oz eta idatziz euskar alkarera ginean erabiltzea. (1:55) Lagur eta simple bainagoki eta erabinkor. (2:00) Lerruna horreratua, erabiltzaia horreratua, bebat eta bebi. (2:06) Ikasleak oikutik testuinguru gai eta egoera ezagunetan instrukzioak, kontak eta lagurrak eta azalpen testuak ulertzea. (2:17) Eta oz, zein idatziz euskaraz, zehaztasunez eta erabinkortasunez erabiltzea. (2:26) Adituaren lerruna, erabiltzaia aditua, zebat eta zebi. (2:33) Eremu profesional, publiko, zein pertsonalean ikaslea gai da eragustietako informazioa euskaraz trukatzeko. (2:41) Eralando eta jantzian. (2:45) Elburu orokorrak berrogitabat garran horri aldea. (2:50) Entzunena, abat gai izango da eguneroko harremanetan testu lagurren gaia eta komunikazioa asmoa identifikatzeko. (3:01) Hitzak eta zapideak ulertzeko, naiz edukiari buruzko hipoteziak egiteko. |
Denbora pixka bat itxaron behar dugu adimen artifizialak transkripzioa eskaini arte. Formatu desberdinetan jaisteko aukera ematen digu: .pdf, .docx, .txt eta .srt. Bideoaren azken bertsioa argitaratu baino lehen ezinbestekoa da transkripzioa eta audioa bat datozela ziurtatzea eta transkripzioan egin beharreko aldaketak eta zuzenketak egitea. Izan ere, zuzentasunaren aldetik hainbat aldaketa egin behar ditugu: ortografia, gaizki zatitutako hitzak, gaizki ulertutako edota asmatutako hotsak, etab.
Abatarra eratzeko, HeyGen azkarragoa eta eskuzabalagoa izan da. Synthesiak 63 minutu behar izan ditu bideo labur bat prozesatzeko eta ez dit eman bideo bat baino gehiago sortzeko aukerarik eta ezta sortutako bideoa editatu eta berriz ere gordetzeko aukerarik ere. Doako profilak, antza, ez du gehiagorako ematen. Hortaz, ondo ziurtatu behar dugu azken bertsioa erabat zuzenduta dagoela. Lortu dudan bideoan denboraren erreferentziak entzuten dira, zuzenketa fonetiko-morfologikoak egin gabe daude, etab. Bideoaren lotura hauxe da, baina esango nuke kontua izan ezean ezingo duzuela ikusi, eta ez duenez bideoa jaisteko aukerarik ematen, ezin izan dut hemen gehitu.
Nahiz eta HeyGenen transkripzioan denborari erreferentzia egiten dioten zenbakiak agertu, ez ditu irakurtzen. Horrez gain, bideoa jaisteko aukera ematen du eta baita editatzekoa ere; hiru bertsio egin ahal izan ditut eta ez dit gordetzeko arazorik eman; hilean 3 bideo sortzeko aukera omen dago. Halere kontuan izan behar dugu gure abatarrek ezingo dutela 3 minututik gorako jardunik eskaini. Hauxe azken bertsioa, zuzenketekin eta azpidatziekin:
Fokua abatarren ahoskeran jarrita, basque azentua ezarri arren, hainbat zuzenketa eta aldaketa fonetiko eta prosodiko beharko lituzkete euskara errealagoa izan dadin. Hainbat oztopo antzeman daitezke, esate baterako: siglak irakurtzerako garaian, hatxearen ahoskeran, e eta a bokalak nahastean, s eta z kontsonanteak ahoskatzean eta batez ere hitzen azentuekin, silaben banaketarekin eta, oro har, euskal prosodiarekin. Aitortuko dut emaitza uste baino politagoa izan dela eta ezpainen mugimendua ahoskatzen denarekin koherentzian doala ikustea pila bat gustatu zaidala, eta abatarrek mugimenduak izatea ere positiboa iruditu zait. Hori bai, aurretik aipatutako oztopo horiek sistematik aldatzeko aukera balego, bikaina litzateke; momentuz, besterik ezean, transkripzioan edo gidoian zenbait aldaketa egin daitezke eskuz.
Orairen Kimu hizkuntza eredu txikiaren berri izan dugu orain dela gutxi. Dirudienez, Orai NLP Teknologia Elhuyarren adimen artifizialeko zentroak jarri du martxan aipatutako euskarazko txatbota. Hurrengo pausoa izango ote dira abatar euskaldunak? Euskaldunok lortuko dugu euskarak testuinguru horretan tokia eta garrantzia izan dezan? Erabilera arduratsua egingo dugu? Teknologiarekin beti egon dira erreparoak eta adimen artifizialarekin ere bai, baina alderdi asko erraz ditzake egunerokotasunean. Euskara, jalgi hadi plazara zioen hark; hau ere bada plaza, digitala, baina plaza.

