Euskara eremu digitalean

Asier Larrinaga Larrazabal

Aurtengo Euskararen Egunean, aro digitalean bizi garela gogorarazi nahi izan dugu EITB barruan aurrera eraman dugun ekimenean. Gure egungo bizimoduan, nahitaezkoak zaizkigu baliabide digitalak, eta euskaldunok baliabide horiek euskaraz behar ditugu. Albiste ona da baliabide horiek baditugula: mugikorretako eta ordenagailuetako sistema-eragileak, era guztietako hiztegi eta terminologi banku elektronikoak, zuzentzaile ortografikoak, itzultzaile neuronalak, adimen artifizialak, jokoak… Ezagutu eta ezagutarazi itzazu.

Mezu hori bera Instagramen zabaldu dute EITBko Euskara Zerbitzuko Maria Gamboa eta Leire Yue Ortubay lankideek.

Euskaltzaindia hizketan

Iker Zaldua Zabalua

Sentsorearen parabola asko erabiltzen ari naiz aspaldion. Norbanako bakoitzak ditu bere sentsoreak, berezkoak, eta zenbaitetan belarriko mina jartzen zaigu sentsoreak zerbait hauteman, eta barnean durundi zorabiagarria entzuten dugulako. Eta, gehienetan, zarata hori besteek ez dute entzuten, hain justu, bestelako sentsoreak dituztelako, eta gureak hauteman duena berean ez delako arduragarri.

Itzultzaileok, uste dut, hizkuntza balioanitzeko habetzat dugula: hizkuntza, niretzat, gehienbat jolasa da. Oso gogoko dut hizkuntzarekin jolasean aritzea, baina hizkuntza kultura da, hizkuntza lana da, hizkuntza harremana da, hizkuntza haserrea da, bizimodua da. Nire kasuan, sentsorea arras finduta dago euskarari dagokionez, milimetro txikienean kalibratuta. Eta azkenaldian nahi baino gehiagotan entzun dezaket soinua barrunbeetan.

Ataunen bizi naiz, Goierriren sakonean, Sakanaren eta Tolosaldearen artean, ustez, euskara osasuntsu eta bizi dagoen lurraldean. Eta kalera irten, eta bai, euskara nagusi da han-hemen, baina hegemonia hori galtzen ari da, eta dagoeneko ez da arraroa azpiko tabernan norbait gaztelaniaz edo beste erdara batzuetan entzutea. Eta hori ez da gaitz, aberasgarri ere izan liteke, bi baldintza betetzen badira: euskara bera oraindik plazan lasai eta alai ibiltzea, eta euskara hori ongi zaindua izatea. Bigarren horretan ari zait nire sentsorea jo eta jo. Semeak 9 urte ditu, alabak 14 urte ditu, eta bi belaunaldi horietan, tartekoetan, eta datozenetan sentsorea urduritzen dizkidaten gauzak entzuten ditut.

โ€œAita, ahal det jun parkea?โ€. Esaldi hori normal-normala da Ataungo nerabe eta haurren artean. Niri sentsorea martxan jartzen zait, eta berehala zuzentzen dut: โ€œAita, jun deiket (naike) parkea?โ€. Duela dagoeneko aste zenbait horixe esan nion semeari eskola-atarian, eta nire semearen ikaskide baten amak berehala ihardetsi zidan, txantxetan edo: โ€œEuskaltzaindia hizketan, kar, karโ€. Hor ohartu nintzen: haren sentsoreak ez du hauteman nireak hauteman duena, bereak akaso bestelako kalibrazioa duelako, eta agian semea une jakin horretan jaten ari denarekin piztuko zaio argi gorria. Baina, esaldi hori oharkabean igaroko da, eta horrenbestez, 9 urteko mutiko horrek naturaltasunez erabiltzen jarraituko du.

Gogoeta egin, eta ohartzen zara kalibrazio hau gutxiengo batek dugula, eta ziurrenera dugun lanbideagatik izango dela hein handi samar batean. Eta horrekin, dugun arriskuarekin ohartu naiz.

Euskararen ezagutza-maila igo egin omen da, hau da, gero eta gehiagok omen daki euskaraz. Baina, zer da euskaraz jakitea? Aski da diosal eta agur egiten jakitearekin? Aski da elkarrizketa bat ulertzeko moduan jarraitzearekin? Euskararen etorkizuna oso ilun ikusten dut, etxean ezkorra naizela esaten didate, baina, berriro diot, Ataunen bizi naiz, gure etxean euskaraz egiten da, ama-hizkuntza, aita-hizkuntza, euskara dute seme-alabek. Itzultzailea dute aita, euskal filologoa eta euskararen kontuekin berehala erresumintzen omen dena, eta halere, โ€œAhal det jan jogurre?โ€ esaten dute. Eta adi! Eskola-atarian, sei-zazpi elkarrekin jolasean ari direnean, zenbaitetan, gaztelaniaz hitz egiten dute, horietako batek euskara ez duelako ongi menderatzen, etxean ama-hizkuntza, edo aita-hizkuntza (edo biak), beste bat delako. Eta berriro diot, Ataunen bizi naiz. Baina, hor ez noa sartzera orain, ate handi samarra baita testu xume baterako.

Sentsorea ez da isiltzen, eta itzulpengintzan, lanean, sentsorea jo eta jo. Adimen Artifizialak egindako testuak zuzentzea egokitzen ari zait aspaldi, eta dagoeneko normalizatu egin ditugu euskarari ez dagozkion zenbait formula. Duela hilabete eskas, Euskaltzaindiak Donostian duen txoko zoragarrian hitz-aspertua egin genuen, Idoia Santamarรญak gidatuta, eta ohartu ginen geronek ere irentsi ditugula formula horietako zenbait eta sentsoreak jadanik ez digula abisu ematen. Adimen Artifizialaren harira sortzen ari den corpusa euskara eskasten ari da. Hainbat zenbatzailea joker-karta bilakatu zaigu karta-sortaren barruan, eta masiboki erabiltzen (eta onartzen, baitaratzen) hasi gara, zenbait, batzuk eta bestelakoak alboratuz, gure hiztegietatik baztertuz. Gauzatu aditza ere beste joker-karta bat da, eta masiboki erabiltzen (eta onartzen, baitaratzen) dugu, egin aditza bezain aditz sano eta jatorra alboratuz sarri. Lazkao Txikik berak esan zigun โ€œMartxa honetan aurki erderaz hitz egingo dugu euskaraz ari garelakoanโ€. Eta esango nuke dagoeneko ari garela erdaraz euskaraz ari garelakoan.

Adimen Artifiziala ari da euskara-eredu bat sortzen, ari gara euskara-eredu bat sortzen, eta aberastasuna lapurtzen ari gatzaizkio, lautzen ari gara erabat euskara, eta beti izan duen bizitasun hori lausotzen ari da, goizeko behe-lainoa desagertzen den moduan, konturatzerako. Nerabeek eta haurrek hori jasoko dute, eta errua leporatuko diegu, baina krimena gu ari gara egiten (baimentzen).

Duela zenbait urte, blog bat eratu nuen, โ€œGure hitz galduen bilaโ€ izenekoa. Aspalditxo, han utzi dut nonbait, alboratuta, eta egia esaten badizuet, pasahitza ere ahaztu dut (beste bat jasotzeko eskaera ere egin nuen, baina ez nuen lortu), baina uste dut hura berriro martxan jartzea ideia ona dela, eta, zoritxarrez, gero eta hitz gehiago sartuko ditut zakuan. Orduan, pentsatu egin behar izaten nuen, โ€œzein ote da haur nintzela maiz entzun eta orain batere erabiltzen ez den hitza?โ€.

Konpromisoa hartuko dut blogari berrekiteko, baina konpromisoa hartu dezagun guztiok hitz galdu gehiago ez sortzeko. Izan dadila zaila hitza hautatzea, pasa dezadala denboratxo bat hitz jakin bat bilatu arte.

Gure sentsorera iristen dena jakinarazi dezagun, ezin ditugu besteak behartu beren sentsoreak gure zenbakiekin kalibratzera, baina egin dezagun pedagogia โ€œEuskaltzaindia hizketanโ€ ez diezaguten esan haurrari zuzenketa txiki bat egin diogulako.

Bide batez, aipatu dudanaren lekuko testu hau bera izango da ziur aski: baietz hemen ere normalizatu ditugun (ditudan) formulak agertu, euskarari berez ez dagozkionak (eta ez da nahita egindakoa izan, halakorik badago)!

Abatarren plaza digitalaz

Estitxu Irisarri Egia

Beste behin ere, adimen artifiziala (AA). Esango nuke testu honek aurreko astean Itziar Otegik aipatzen zuen magia eta Ane Garmendia Alberdik apirilean eta Maite Imaz Leundak urtarrilean aipatutako ardura dakartzala berriz gogora. Pare bat kontu aztertu nahi izan ditut neure buruari jarri diodan erronkatxo honekin; batetik, Whisper AA darabilen TurboScribe doako bertsioak euskarazko audioak transkribatzeko zer gaitasun duen eta transkripzio horietatik abiatuta HeyGen eta Synthesia baliabideek eskaintzen dituzten zenbait ahotsek duten ahoskera behatzea.

HEOCen nondik norakoak irakurtzen nabilen honetan, eskuz idatzitako eskema bat audioan grabatu dut. Audioa 30 minutu baino gutxiagokoa bada, osorik transkriba dezake TurboScribe delakoak eta egunean tamaina horretako 3 audio transkriba ditzakegu ordaindu gabe. Transkripzioaren zehaztasuna finkatzeko aukera ematen digu tresna honek; horretarako, 3 animaliaren artean hautatu behar dugu: gepardoa, delfina edo balea. Gepardoa da aukerarik azkarrena, baina, badakizue, azkar eta ondo, usoak hegan. Balea da zehatzena. Transkribatu baino lehen audioaren hizkuntza zein den adierazi behar dugu eta zerrendan euskara ere azaltzen da. Hautatutako doako AAk honela transkribatu ditu nire jardunaren 3 bat minutu:

(0:00) Eok, emillatua geitabat, elduen euskal duntzerako oinarrizko kurrikuluma, kurrikulumaren oinarriak, hogeita mar garran horrialdea. (0:18) Gaitasun komunikatibora eta ekintzetara bideratutako ikuspegia da, ikaslea gizartera gehiada eta ekintzak interesekoak izango dira. (0:33) Ekintzak komunikatiboa da elementua, ekintzak mundu sozialarekin loturadua eta komunikatiboak izkuntzenen munduarekin.
(0:52) Kurrikulumaren oinarria ikaslearen autonomia ere bada eta izkuntza eta ekintzak komunikatiboa oso tasunak dira, oso tasun dinamikoak. (1:09) Iztunak kontuan izan behar ditu testu eta testuingurua. (1:14) Ekintzak komunikatiboak okial hortzeko, ekintzak komunikatibo guztiak ezin lan du eta autonomia eta estrategia da dira helburuak.
(1:37) Maliak onarrizko lerruna, onarrizko erabiltzaia, abat eta abi. (1:45) Eguneroko gai buruzko euskarazko testu lagurrak ulertzea eta oz eta idatziz euskar alkarera ginean erabiltzea. (1:55) Lagur eta simple bainagoki eta erabinkor.
(2:00) Lerruna horreratua, erabiltzaia horreratua, bebat eta bebi. (2:06) Ikasleak oikutik testuinguru gai eta egoera ezagunetan instrukzioak, kontak eta lagurrak eta azalpen testuak ulertzea. (2:17) Eta oz, zein idatziz euskaraz, zehaztasunez eta erabinkortasunez erabiltzea.
(2:26) Adituaren lerruna, erabiltzaia aditua, zebat eta zebi. (2:33) Eremu profesional, publiko, zein pertsonalean ikaslea gai da eragustietako informazioa euskaraz trukatzeko. (2:41) Eralando eta jantzian.
(2:45) Elburu orokorrak berrogitabat garran horri aldea. (2:50) Entzunena, abat gai izango da eguneroko harremanetan testu lagurren gaia eta komunikazioa asmoa identifikatzeko. (3:01) Hitzak eta zapideak ulertzeko, naiz edukiari buruzko hipoteziak egiteko.

Denbora pixka bat itxaron behar dugu adimen artifizialak transkripzioa eskaini arte. Formatu desberdinetan jaisteko aukera ematen digu: .pdf, .docx, .txt eta .srt. Bideoaren azken bertsioa argitaratu baino lehen ezinbestekoa da transkripzioa eta audioa bat datozela ziurtatzea eta transkripzioan egin beharreko aldaketak eta zuzenketak egitea. Izan ere, zuzentasunaren aldetik hainbat aldaketa egin behar ditugu: ortografia, gaizki zatitutako hitzak, gaizki ulertutako edota asmatutako hotsak, etab.

Abatarra eratzeko, HeyGen azkarragoa eta eskuzabalagoa izan da. Synthesiak 63 minutu behar izan ditu bideo labur bat prozesatzeko eta ez dit eman bideo bat baino gehiago sortzeko aukerarik eta ezta sortutako bideoa editatu eta berriz ere gordetzeko aukerarik ere. Doako profilak, antza, ez du gehiagorako ematen. Hortaz, ondo ziurtatu behar dugu azken bertsioa erabat zuzenduta dagoela. Lortu dudan bideoan denboraren erreferentziak entzuten dira, zuzenketa fonetiko-morfologikoak egin gabe daude, etab. Bideoaren lotura hauxe da, baina esango nuke kontua izan ezean ezingo duzuela ikusi, eta ez duenez bideoa jaisteko aukerarik ematen, ezin izan dut hemen gehitu.

Nahiz eta HeyGenen transkripzioan denborari erreferentzia egiten dioten zenbakiak agertu, ez ditu irakurtzen. Horrez gain, bideoa jaisteko aukera ematen du eta baita editatzekoa ere; hiru bertsio egin ahal izan ditut eta ez dit gordetzeko arazorik eman; hilean 3 bideo sortzeko aukera omen dago. Halere kontuan izan behar dugu gure abatarrek ezingo dutela 3 minututik gorako jardunik eskaini. Hauxe azken bertsioa, zuzenketekin eta azpidatziekin:

Fokua abatarren ahoskeran jarrita, basque azentua ezarri arren, hainbat zuzenketa eta aldaketa fonetiko eta prosodiko beharko lituzkete euskara errealagoa izan dadin. Hainbat oztopo antzeman daitezke, esate baterako: siglak irakurtzerako garaian, hatxearen ahoskeran, e eta a bokalak nahastean, s eta z kontsonanteak ahoskatzean eta batez ere hitzen azentuekin, silaben banaketarekin eta, oro har, euskal prosodiarekin. Aitortuko dut emaitza uste baino politagoa izan dela eta ezpainen mugimendua ahoskatzen denarekin koherentzian doala ikustea pila bat gustatu zaidala, eta abatarrek mugimenduak izatea ere positiboa iruditu zait. Hori bai, aurretik aipatutako oztopo horiek sistematik aldatzeko aukera balego, bikaina litzateke; momentuz, besterik ezean, transkripzioan edo gidoian zenbait aldaketa egin daitezke eskuz.

Orairen Kimu hizkuntza eredu txikiaren berri izan dugu orain dela gutxi. Dirudienez, Orai NLP Teknologia Elhuyarren adimen artifizialeko zentroak jarri du martxan aipatutako euskarazko txatbota. Hurrengo pausoa izango ote dira abatar euskaldunak? Euskaldunok lortuko dugu euskarak testuinguru horretan tokia eta garrantzia izan dezan? Erabilera arduratsua egingo dugu? Teknologiarekin beti egon dira erreparoak eta adimen artifizialarekin ere bai, baina alderdi asko erraz ditzake egunerokotasunean. Euskara, jalgi hadi plazara zioen hark; hau ere bada plaza, digitala, baina plaza.

Teknologia eta magia

Itziar Otegi Aranburu

Arthur C. Clark zientzia-fikzioko idazleak hiru โ€œlegeโ€ eman omen zituen bere bizian. Hirugarrena da ezagunena: Behar bezain aurreratua den teknologia oro magiatik bereizezina da.

Nago adimen artifizial izendapen badaezpadako horren atzean dagoen teknologia, edo teknologia multzoa, sarritan parekatzen dela magiarekin, nolabait magiaren parekotzat aurkezten โ€•edo hartzenโ€• dela. Izenak berak iradoki nahi luke halako zerbait, gizakiak sortua dela, artifizialki, baina giza esku-hartzerik gabe dabilela, bere kasa. Itzulpen automatiko izendapenak ere hori ematen du aditzera: automatikoki funtzionatzen duela, botoi bati emanda.

Eta, egia esan, hala dirudi. Botoi bati eman, edo agindu batzuk, eta hortxe azaltzen da, magiaz bezala, testu bat, edo irudi bat, edo itzulpen bat, lehen ezer ez zegoen tokian. Istant batean abiapuntutik helmugara iritsi bagina bezala da, baina bidean batere nekatu gabe. Hori egiten baitigu adimen artifizialak, bidea aurreztu, edo bidea ebatsi, nola begiratzen den.

Automatikotzat jotzen den horretan, baina, ezinbestekoak dira giza eskua eta adimena, fase guztietan, hasi hastapenean garatzen hasi ahal izateko beharrezkoa duen input โ€•jakintza eta lan kolektibo metatuโ€• guztiarekin, eta buka ematen duen output horren gainbegiratze eta zuzenketarekin, tartean ahaztu gabe programatzaile, garatzaile eta beste diziplina askotako adituen adimena, eskarmentua eta lana, nahiz eta batzuek, eskujokari eta ilusionistek beren trikimailuak nola, ezkutatu egin nahi lituzketen tartean diren beste esku guztien eginak, erabiltzaile oharkabeari sentiarazteko botoiari ematen dionean makinak egiten duena magia dela.

Botoi bati ematea erraza den arren, magiatik gutxi du kontuak. Mark Coeckelbergh-ek, ร‰tica de la inteligencia artificial[1] liburuan, honako hau dio datuen zientziaz eta deep learning edo ikasketa sakonaz ari delarik:

Los errores siempre son posibles, y la elecciรณn humana, el conocimiento y la interpretaciรณn son cruciales. Los humanos son necesarios para interpretar de manera significativa y dirigir la tecnologรญa hacia la bรบsqueda de diferentes factores y relaciones. Como subraya Boden (2016), la IA carece de nuestra comprensiรณn de la relevancia. Se deberรญa aรฑadir que tambiรฉn carece de entendimiento, experiencia, sensibilidad y sabidurรญa. Este es un buen argumento en defensa de la idea de que en teorรญa y en principio deben estar involucrados los humanos. Pero tambiรฉn existe un argumento empรญrico a favor de la inclusiรณn humana: en la prรกctica, los humanos estรกn involucrados. Sin los programadores ni los cientรญficos de datos, la tecnologรญa, simplemente, no funciona. Ademรกs, la experiencia humana y la de la IA a menudo se combinan, por ejemplo, cuando un mรฉdico acepta una terapia contra el cรกncer sugerida por una IA, pero tambiรฉn por su experiencia y su intuiciรณn de especialista.

Aurrerago, ahanzturan utzi ohi diren beste langile batzuk aipatzen ditu, hala nola adimen artifizialak funtzionatzeko beharrezkoak dituen โ€•eta gutxitan bistaratzen direnโ€• euskarri fisikoak egiteko mineralak erauzten dituztenak, hondakin elektronikoez arduratzen direnak, edo adimen artifiziala trebatzen dutenak; besteak beste, โ€œmehatzetako langileak, itsas garraiolariak edo klikaren langileak, datu multzoak etiketatzen dituztenakโ€. Esaldi biribil batekin ixten du auzia egileak: โ€œSi se deja fuera la intervenciรณn humana, las cosas pueden salir mal, carecer de sentido, o simplemente, resultar ridรญculasโ€.

Itzulpenaren arlora etorrita, erraz arrazoitu daiteke gauzak antzera direla hor ere: itzulpen automatizatua gainbegiratze eta zuzenketarik gabe ematen denean, esaterako, gauzak gaizki atera daitezke, zentzugabeak izan, edo, besterik gabe, barregarriak. Ez noa adibideak jarrita anekdotan erortzera. Ez dago beharrik, egunero ikusten dugu, nork bere lanean, eta askotan hitz egin da horretaz blog honetan. Berriki, adibidez, Maite Imazek[2] ITZULBIDE tresnari buruz idatzi zuen, zeina Osakidetzan mediku-txostenak euskaratik gaztelaniara itzultzeko erabiliko den batez ere. Honela amaitzen zuen Maite Imazek bere testua:

Pentsatzen dut medikuntzako profesional euskaldunek euskaraz sortutako txosten klinikoak ez dituztela besterik gabe euskara hutsez gordeko ordenagailuan; hori egin aurretik emango diotela botoiari eta ziurtatuko dutela gaztelaniara egindako itzulpena zuzena dela, geroago etor daitekeen mediku erdaldunak uler dezan.

Maite Imazek ziurtatze-lan horretan oinarritzen zuen bere konfiantza ITZULBIDEren segurtasunean:

Euskaraz sortzen dugunok gaztelaniaratzeko itzultzaile automatiko neuronalak erabiltzen ditugunean ez gara botoi bati sakatuta konformatzen; zuzendu edo posteditatu egiten dugu. (โ€ฆ) ziurtatuko dugu testu biek gauza bera esaten dutela, jatorrizkoan esaten den guztia esaten dela itzulpenean, eta itzulpenean ez dela jatorrizkoan azaltzen ez denik esaten.

Nik neuk irudipena dut, itzulpen automatizatuaz hitz egiten denean, iristen den mezua ez dela izaten โ€œTresna ona da, baina itzulpen egokiak eta desegokiak tartekatzen ditu; hau da, itzulpen onen tartean batzuk akastunak dira, eta, horrenbestez, giza gainbegiraketa ezinbestekoa daโ€. Iristen den mezua da automatikoki lan egiten duen makina beregain bat dela, edo, kasurik onenean, nahikoa dela esku-hartze minimo bat. Kontua ez da hutsala, horratik; inplikazio sakonak ditu.

ITZULBIDEren kasuan, adibidez, pentsatzekoa da Osakidetzak izango duela protokoloren bat tresnaren erabilerari buruz, ezarrita egongo direla moduak, prozedurak, denbora gehigarriak eta abar, zeren, bestela, ITZULBIDEren erabilera โ€•erabilera zuzenaโ€• mediku euskaldunen prestasunaren esku uztea litzateke. Erantzukizunaren galdera ere sortzen da; alegia, norena litzatekeen erantzukizuna itzulpen akastun baten ondorioz okerren bat gertatuko balitz, eta aldatzen ote den erantzukizun hori, eta zer zentzutan, medikuak itzulpena bere horretan emanez gero, besterik gabe botoiari sakatuta, edo, aitzitik, gainbegiratuta, gainbegiratzeko ardura hartuta.

Gorago eman dudan Mark Coeckelberghen aipu horretan bada esapide deigarri bat: dirigir la tecnologรญa. Los humanos son necesarios para (โ€ฆ) dirigir la tecnologรญa (โ€ฆ). Auzia, azken batean, horixe da: nork daukan eskutik kontua, gizakiak ala makinak. Nork gidatzen duen nor. Makina gizakiaren tresna ote den, edo gizakia makinaren tresna. Irudi luke azken horretarantz goazela; izan ere, joera da teknologiaren โ€•makinarenโ€• garapen itxuraz agorrezina goratzea, eta gizakiaren โ€•langilearenโ€• esku-hartzea minimizatzea, eta debaluatzea.

Jakin nahi nuke nola izango ote ziren gauzak orain baldin eta, hasieratik bertatik, gauzak beste modu batean egin izan balira. Hasieratik aitortu izan balitz โ€•ondorio guztietarakoโ€• adimen artifiziala ez zela sortu ere egin izango guztion ekarpena gabe, giza jakituria metatuaren zordun dela, gizakiaren lan adimentsua eta gogorra dagoela haren fase guztietan; hutsetik sortutako zerbait ez, baizik eta lan kolektibo itzel baten ondorio dela, eta, horrenbestez, teknologia horren onurak ere kolektiboa izan behar duela, guztion mesederako.

Inolaz ere ez langileen kalterako.


[1] Coeckelbergh, M. (2021). ร‰tica de la inteligencia artificial. Cรกtedra: Madril.

[2] Imaz, M. (2025). โ€œEuskaraz sortutakoa gaztelaniara itzultzeko itzultzaile automatiko neuronalaโ€. 31 eskutik bloga.

Makinaren eta gizakiaren arteko elkarrekintza

Elizabete Manterola Agirrezabalaga

Unibertsitateko eskoletan, kongresuetan zein jardunaldi akademikoetan; lagunartean, sektoreko lankideen artean zein kazetariekin; non ez dugu hizketagai izan teknologiaren garapen azkarra azkenaldian? Zaila da iritzi argirik izatea, ez baita erraza neurtzen norainoko gaitasunak dituzten esku-eskura ditugun trepeta horiek eta zenbaterainoko eragina izango duten gure egunerokoan. Kontua ez da orain arteko lan-dinamika baztertu eta makinen mende jartzea, makinak gure mesederako erabiltzea baizik.

Gizakiak berezkoa du egokitzeko gaitasuna, eta guri geuri iraultza teknologiko honen erdian, eta gure lanaren helburuak bazterrean utzi gabe, egoera berrietara egokitzea dagokigu. Eta ahal dela, ongi neurtu, ebaluatu eta hausnartutako erabakiak hartzea. Gakoa ez baita teknologia berrienen bitartez gizakiaren lana bere horretan ordezkatzea, baizik eta teknologia gizakiaren helburuetara ahalik eta modurik eraginkorrenean baliatzea. Hori horrela izanik, inportantea da gizakiaren eta makinaren arteko interakzioan jartzea arreta: zer nolako harremana sortzen da bien artean? Zer modutara balia dezakegu teknologia zereginik nekosoenak egin ditzan? Zertan behar da bai ala bai gizakiaren eskua eta, batez ere, adimena?

Galdera horiek buruan ekin genion ikerketa-proiektu bati duela zenbait hilabete. KSIgunek babestutako sei hilabeteko proiektu baten esparruan, Konexioak deialdiaren barruan, Elhuyarreko lantalde bat eta EHUko ikertzaile batzuk elkarlanean[1] aritu gara ikus-entzunezko sektoreari lotutako ikerlan batean, gaztelaniatik euskararako azpidazketa jomugan hartuta. Ezinbestekoa izan da sektoreko hainbat itzultzaileren parte-hartzea esperimentua gauzatzeko. Alderatu nahi izan ditugu eskuzko jardunbideak eta modu automatiko zein erdiautomatikoan eginikoak, itzultzaile edota transkripzio automatikorako tresnak baliatuta. Hain zuzen ere, Elhuyarrek garatutako Aditu eta barruan integratuta dagoen Elia baliatu ditugu. Bost multzotan banatu ditugu jardunbideak: 1) eskuzko modua, gizakiak ohikoak dituen azpidazketarako ohiko tresnak baliatuta sortzea azpidazketa; 2) transkripzio automatikoa baliatuta, gizakiak hori berrikusi, itzuli eta azpidatziak sortzea; 3) transkripzio automatikoa baliatuta gizakiak hura berrikustea eta hori gero itzulpen automatiko bitartez itzuli eta berrikustea; 4) transkripzio automatikoa sortu, emaitza itzultzaile automatikoak itzuli eta gizakiak berrikustea; 5) modu erabat automatikoa, transkripzio automatikoa eta itzulpen automatikoa baliatuta.

Ezin hemen emaitza kuantitatiboak banan-banan aletzen hasi, baina azpimarratzeko moduko bi datu eman nahi nituzke. Batetik, modu erabat automatikoa baztertzeko jardunbidea da gaur-gaurkoz gaztelaniatik euskararako azpidazketan. Gainerako lau jardunbideekin alderatuta, emaitza oso kaxkarrak eman ditu. Bestetik, jardunbide erdiautomatikoek emaitza positiboak eskaini dituzte, eta erabat eskuzkoak diren jardunbideekin alderatuta emaitza ez da hain txarra. Makinaren eta gizakiaren arteko elkarrekintzak ibilbide oparoa izan dezakeela pentsa liteke, hortaz. Jakina, gure proiektua oso mugatua izan da, bai iraupenez, bai aztertutako laginari eta itzultzaile kopuruari dagokionez, eta lortutako emaitza horietan sakondu beharra dago oraindik ere.

Emaitza kuantitatiboak, baina, ez dira kontuan izateko emaitza bakarrak. Itzultzaileen lan-jardunaren berri izatea ere ezinbestekoa da lan-dinamiken garapena eta jasangarritasuna ezagutu nahi izatera. Hori horrela izanik, hainbat galdera erantzuteko eskatu genien esperimentuan parte hartu zuten itzultzaileei. Jakin nahi izan genuen zenbateko denbora behar izan zuten zeregina gauzatzeko, zenbateko laguntza eskaini zien transkribapen automatikoak eta zenbaterainokoa itzultzaile automatikoak, zer oztopo sortu zizkien, zer tarifa aplikatuko lieketen halako itzulpen prozesuei, onartuko ote luketen halako enkargurik aurrerantzean.

Lortutako erantzunen bitartez, jakin dugu itzultzaileek nahiago dutela itzulpen automatikorik gabe lan egin halako enkarguetan, edo behintzat, ez itzulpen automatikoaren emaitza modu sistematikoan erabili. Alabaina, transkribapen automatikoari buruzko hautematea hobea da. Horretaz gain, azterketa kualitatiboan ikusi dugu, baita ere, itzultzaileak ez direla maiz posteditatzera mugatu, eta hutsetik sortu dituzte azpidatziak. Horrek erakusten du kalitatearen aldeko apustua.

Bestalde, eta langintzaren ikuspegitik, kontuan izateko azken kontu bat ere ekarri nahi dut hona: modu erdiautomatikoan lan egiteak nekea sortzen duela diote esperimentuan parte hartutako itzultzaile batzuek. Kontuan izateko iritzia, inondik ere, lanbidearen jasangarritasuna profesionalen ongizateari lotuta dagoen heinean.

Aztertu, neurtu eta ebaluatzen jarraitu beharra daukagu ikusteko itzultzaileak prest ote dauden prozesu erdiautomatizatuetan jarduteko, horien eraginkortasuna denboretan eta dirutan ez ezik prozesuetan duten eraginean ere azpimarra jarrita.


[1] Elhuyarreko lantaldean Klara Ceberio, Lide Azkue eta Eli Pociello aritu dira. EHUko TRALIMA/ITZULIK ikerketa taldean, berriz, Ana Tamayo, Naroa Zubillaga, Zuriรฑe Sanz eta Elizabete Manterola. Lankideei eskertu nahi diet idatzi hau osatu eta orrazteko eman didaten laguntza.

IZIen eta euskararen garapen jasangarria

Amaia Astobiza Uriarte

Duela hirurogei eta koska urte, gure amari zeharo zirrimarratu zitzaion auzo-eskolan ikasi eta mojetan dotoretutako idazkera, hainbeste takigrafiatu nahi izan baitzuen hain denbora gutxian, gaztetxoa izanda ere idazkari-lanetarako hautagairik onena zela erakutsi nahian. Jada ez gaude 1960ko hamarkada hartan, baina orain ere halatsu gabiltza hizkuntzarekin, aurrez tentuz ikasi eta ekinaren ekinez edertutakoa lipar batean narrasten, adimen artifizialeko tresnen bidez tarte txiki-txikian hainbeste testu sortu ahal izateak eragindako lilurak itsututa eta edukiaren nolakotasunarekiko kezka lan ondo eginaren eta errentagarritasunaren arteko zirrikitu beti lausoetan galduta. Eta ez, ez naiz ari soilik itzulpenez; kasu honetan, jatorrizko testuak ere zaku berean sartzen dira, edo aldamenekoan.

Izan ere, hortxe ari dira azken belaunaldiko AAk lehen belaunaldietako AAek sortutako testu eta itzulpenekin beren buruari jaten ematen (autofagiaโ€ฆ selektiboa ala ez-selektiboa?) eta elikatze-kate hori behin eta berriro errepikatzen. Eta, itxura batean, inor gutxiri axola zaio makinok hala elikatuta gero eta lexiko pobreagoa eta gero eta sintaxi gutxi gorabeheragokoagoa eta gero eta adierazpen-gaitasun gutxiagoko edukiak โ€”hizkuntzakโ€” sortzen ditugula eta eduki/hizkuntza kamustu horiek izango direla laster, adibidez, gai potoloen inguruan erabakitzeko erabiliko ditugun argudioen eta diskurtsoen oinarri.

Egoera horren aurrean, itzultzaileak, zuzentzaileak eta interpreteak (IZI) ere kezkatuta daude, gaude, noski, AArekin, ez bakarrik lanpostuak dantzan eta langileak larrugorri jartzen dituelako, beste sektore batzuetan bezala, baizik eta baita hizkuntzaren kalitatea โ€”eta, beraz, bihar-etziko euskara eta haren plaza guztietarako erabilgarritasunaโ€” kolokan jartzen duelako ere.

Arretatsuak gara oso IZIok: hizkuntzaren zehaztasunaz, zuzentasunaz eta egokitasunaz arduratzen gara, eta, lan-baldintza prekarioek horretarako marjina-izpi bat uzten badigute, baita aberastasunaz eta dotoreziaz ere, ez soilik hizkuntzari zor zaion errespetuagatik, baita testuen hartzaile diren herritarrei, bezeroei, pazienteeiโ€ฆ zor zaienagatik ere. Baina, hara, ez omen da hori merkatuak (ente oteitzar hori, abstraktua bezain pisuzkoa) behar duena, ezta merkatuak nahi duena ere. [Ohartxo bat marjinan, eskultorea aipatu dugunez: Oteizak esaten zuen, gutxi gorabehera, aurrera begira baina atzerantz zebilela idazten zuela, hau da, erroak oinarri, abangoardia helburu; beharbada buelta pare bat eman behar genioke ideia horri]

Zer nahi du merkatuak? Edukien Aroan, kontsumo azkarreko testuak eta horien itzulpenak nahi ditu, behin ikusi eta betiko ahaztekoak. Eta, jakina, edukiak efimeroak badira, bost axola merkatuari hizkuntza ere halakoxea bada, behin erabili eta botatzekoa. Euskararekiko โ€”edo hizkuntzekikoโ€” zinezko begirunerik edo engaiamendurik ez duen enpresa edo erakunde batean, finantzetako nork egingo du paseko testu horien kalitatearen alde? Administrazio publikoek ere egiten ez badute (eta hori beste IZI batzuek azaldu dezakezue nik baino hobeto), nola egingo dute errentagarritasun ekonomikoari soilik begiratzen diotenek?

Itzul gaitezen AA-makinetara. Kalteak kalte, jada ez ditu (ia) inork zalantzan jartzen haien abantaila askotarikoak. Behin hori onartuta, zer da hobe, gure ekonomiaren eta gure hizkuntzaren ikuspegitik: etxean garatzea ala kanpotik ekartzea? Guk bultzatzea erabilera arduratsua (hizkuntzaren kalitatea zainduz) ala dena balizko autorregulazioaren esku uztea (eta gora orotariko kamustasuna)? Eta guk eta guretik eta guretzat egin nahi badugu, nola egingo dugu?

Gehienok jakingo duzue: garapen jasangarrirako 17 helburuei beste bat gehitu zitzaien, hemezortzigarrena: Hizkuntza eta Kultura Aniztasuna. Horren barruan, 17 konpromiso, 102 ekimen, 188 jarduera daude zehaztuta, eta tira, ez naiz hasi banan-banan begiratzen, baina pentsatzekoa da horietakoren batean zerbait esango dela euskararen kalitateaz (zeren bestela ez dakit zer mordoilokeria espero dugun ยซkontserbatzea, kudeatzea eta transmititzeaยป edo ยซzabaltzea suspertze-bidean dauden eremuetaraยป). Bada, ondo letorkiguke horiei arretaz begiratzea, iruditzen baitzait hor badagoela erakunde publikoetara kontu eske joateko aski oinarri. Kontuak, ez bakarrik hizkuntzaren kalitatearen eta haren etorkizun jasangarri eta duinaren erantzukizunaren ingurukoak, baita bestelakoak ere; alegia, IZIon lan- eta bizi-baldintzei zuzenean eragiten dietenak: ekonomikoak.

Konplexuak eta eskekoaren sindromea gainetik astintzeko, betiko adibidea ekarriko dut, hain baita agerikoa. Automobilgintzaren sektoreak aurrera egiten badu ez da sinmรกs auto asko saltzen direlako, baizik eta gobernuek sektore hori zuzenean diruz injektatzen dutelako; urtero dirutza ikaragarria erabiltzen dutelako enpresak nazioartekotzen eta legeak haien beharretara makurtzen; eta baita, noski, tarteka-tarteka herritarroi ere dirua ematen digutelako autoak erosteko, ez zintzo portatu garelako, baizik eta negozioari eutsi behar zaiolako eta Europatik datozen ingurumen-legeak bete behar direlako. Eta ondo dago hori guztia, horretarako ordaintzen baititugu zergak; besteak beste, gizarteak osotasunean baliabide berekin (zurrut) eta abiadura ber bakarrean (dobla zurrut) aurrera egiteko, gizakion eta planetaren jasangarritasuna bermatzen ahalegintzeko eta herritarren bizitza prekarioak apur bat bizigarriago egiteko.

Baina zergak denok ordaintzen ditugunez gero, industria erraldoi horretatik kanpo geratzen garen sektoreok eta langileok ere gure aldeko ahalegin bera eskatu behar genieke administrariei. Eta eskatu behar genieke, baita, herritarron dirutxoak eta Administrazioaren ahaleginak ekitatiboagoki banatzeko eta dibertsifikatzeko gure sektoreko autonomo, enpresa eta erakundeen artean; izan ere, ez da ezinbestekoa โ€”ezta bidezkoa ereโ€” dena fabrika traktore handien eta haien morrontzako tailer txiki apurjaleen logikara makurtzea.

Beraz: nik etsiak jo gabeko teknikarien saldo bat jarriko nuke 18. GJHko konpromisoak lan-orritik harago eramaten eta (besteak beste) IZI sektorea eta euskara hauspotzen, bata ito eta bestea asmatiko kroniko bihurtu aurretik.

Euskaraz sortutakoa gaztelaniara itzultzeko itzultzaile automatiko neuronala

Maite Imaz Leunda

Uda honetan komunikabideetan irakurri eta entzun dugun berria izan da Osakidetzak itzultzaile neuronal bat jarri duela martxan, historia klinikoak euskaratik gaztelaniara itzultzeko: ITZULBIDE du izena. Hasiera batean Donostialdeko erakunde sanitario integratuan (ESI) ipini dute, baina berandu baino lehen Osakidetzako sare guztietan erabilgarri egongo den itxaropenarekin.

Orain dela lau urte inguru hasi ziren proiektua garatzen, Osakidetzan euskara lan hizkuntza ere izan dadin. Dokumentazio estandarra ele bietan argitaratzen da Osakidetzan, baina dokumentazio klinikorako irizpide zehatzik ez dagoenez, joera gaztelaniaz egitekoa izan omen da orain arte. Felix Zubia mediku, irakasle eta dibulgatzaileak EITBko programa batean adierazi zuenez, Osakidetzaren 3. Euskara Planaren barruan dagoen zerbait da, bertan jasotzen baita euskarak lan hizkuntza ere izan behar duela.

Zubiaren esanetan, unibertsitatean prestatzen dira profesionalak euskaraz, badituzte beraz apunteak euskaraz, eta medikuntzako hiztegi terminologikoak ere landu dira, baina behin lanean hasitakoan, pazientearekin izandako harremana euskaraz izan arren, txosten klinikoak euskaraz idazteko baliabiderik ez dute izaten. Izan ere, geroago beste medikuren batek irakurri beharko du txosten hori eta baliteke euskaraz ez jakitea. Badira euskaraz lan egin nahi duten medikuak, baina euskara ulertzen ez dutenak ere badirenez, txosten klinikoak beti gaztelaniaz idatzi izan dira orain arte.

ITZULBIDEk bi norabideetan egiteko aukera eskaintzen du, baina helburua euskaratik gaztelaniara erabiltzea da, euskaraz lan egiteko eskubidea bermatzen baita horrela, eta baita pazienteak informazioa euskaraz jasotzekoa ere. Laburdurekin badu arazoren bat, ez ditu laburdura guztiak ondo atzematen, eta hori konpontzen ari dira.

Berri ona da euskarak espazio berriak irabaztea, orain arte gaztelania bakarrik erabili izan den eremuetan euskaraz egiteko aukerak jartzea, eta ni asko pozten naiz adimen artifizialean oinarritutako teknologia berriek euskara sustatzeko bideak irekitzen dituztenean.

Uda betean argitaratu zen, halaber, elcastellano.org gaztelania sustatzeko webgunean, medikuntzako itzulpen automatikoetan saihestu beharreko arriskuez ziharduen artikulu bat. Medikuntzako hizkera oso teknikoa eta zehatza izaten dela zioen, anbiguotasunetarako lekurik ez duena eta รฑabardurak oso kontuan hartu behar dituena.

Adierazten zuen hitz edo termino baten itzulpen desegokiak oso ondorio larriak izan ditzakeela eta adibide gisa ipintzen zuen ingeleseko โ€œstrokeโ€ hitza, gaztelaniara โ€œictusโ€ edo โ€œgolpeโ€ gisa itzuli behar den ezin duela asmatu neuronalak, edo zenbakizko adierazpenetan akatsak egitea zeinen larria izan daitekeen; gaizki jarritako hitz batek dena alda dezake: 0,5 eta 5 artean dosi bat nahasteak arriskuan jarri dezake paziente baten bizitza. Eta Itzultzaile automatiko batek inoiz itzuli behar ez lituzkeen dokumentuen artean sartzen zituen txosten klinikoak.

Orduan, elcastellano.org argitalpenean esaten denari kontra egitera ote dator ITZULBIDE? Ausartegia edo arriskutsua ote da hain eremu delikatuan itzultzaile automatiko neuronala erabiltzea?

ITZULBIDEri buruz zerbait gehiago ikasi nuen โ€œItzultzaile neuronalen eraginak euskararen erabileranโ€ izeneko ikastaroan; hori ere udan izan zen, baina joan den urteko udan, 2024an. Olatz Perez de Viรฑaspre informatikari eta ikerlariari ondo ulertu banion, espezialitate eremu jakin horretako itzultzaile neuronal berezia osatu ahal izateko corpus orokor elebiduna sartzeaz gain, historia klinikoetako corpusa sartu zuten, gaztelaniaz, eta behar bezala anonimizatuta, datu pertsonalak ezkutatzeko. Medikuntzako hiztegi terminologikoak ere sartu zituzten. Ondoren, txosten klinikoak itzultzeko agindu eta itzulpenak zuzendu edo posteditatu ondoren horiekin osatutako txosten klinikoen corpus elebidunak sartu zituzten.

Orain dela 30 urte inguru itzulpengintza automatikoaz irakurri nuen liburu batean (W. John Hutchins & Harold S. Somers. An Introduction to Machine translation, 1992) garai hartako itzultzaile automatikoen artean METEO nabarmentzen zen. Orduko itzultzaile automatikoak arauetan oinarritzen ziren, ez zuten gaur egungo itzultzaile automatiko neuronalak bezain ondo egiten eta ez zirudien euskara bezalako hizkuntza batentzat arauetan oinarritutako eredu egokirik sortzea posible izango zenik.

Kanadan eguraldi parteak ingelesetik frantsesera itzultzeko jarri zen martxan METEO, 1976an: transferentzia lexikoa eta analisi sintaktikoa egiten zituen. Erabiltzen zuen hiztegia mugatua izatea eta norabide bakarrean egitea jotzen ziren arrakastatsua izateko gakotzat. Itzulpen automatikoaren aldeko adibiderik egokiena zen garai hartan METEO.

Gaur egungo ITZULBIDE lehengo mendeko METEOren parekoa izan daiteke agian. Eremu zehatz jakin baterako bereziki entrenatua, hizkuntza ez seguru asko eguraldi parteena bezain mugatua baina bai oso espezifikoa, eta norabide bakarrean erabiltzekoa, hasiera batean behintzat. Ezaugarri horiek izanda, tresna segurua izan daiteke.

Bada beste arrazoi bat segurua izango dela ziurtatuko duena, nire ustez. Euskaraz sortzen dugunok gaztelaniaratzeko itzultzaile automatiko neuronalak erabiltzen ditugunean ez gara botoi bati sakatuta konformatzen; zuzendu edo posteditatu egiten dugu. Gaztelaniazko testuaren estiloak ez gaituenean erabat asebetetzen ez dugu beti asmatuko txukuntzen edo ez dugu behar bada gaztelania naturalean nola ipini jakingo, baina ziurtatuko dugu testu biek gauza bera esaten dutela, jatorrizkoan esaten den guztia esaten dela itzulpenean, eta itzulpenean ez dela jatorrizkoan azaltzen ez denik esaten.

Gaztelaniatik euskaratu behar denean, ordea, askok pentsatzen dute botoi bati emanda nahikoa dela; klik bat egitea nahikoa dela euskararekiko betebehar guztiak gauzatzeko. Itxurari ematen zaio garrantzia, mamia kontuan hartu beharrean. Euskararen prestigio urria dago joera horren oinarrian.

Pentsatzen dut medikuntzako profesional euskaldunek euskaraz sortutako txosten klinikoak ez dituztela besterik gabe euskara hutsez gordeko ordenagailuan; hori egin aurretik emango diotela botoiari, irakurriko dela ITZULBIDEk emandako ordaina, ziurtatuko dutela gaztelaniara egindako itzulpena zuzena dela eta geroago etor daitekeen mediku erdaldunak ondo ulertuko duela.

Noizko euskarazko itzulpengintzaren liburu zuria?

Josu Barambones Zubiria

Foro hau baliatu nahi dut aspaldion buruan jira-biraka dabilkidan kezka bat zuekin guztiekin partekatzeko. Adimen artifiziala itzulpenen fluxuan sartzearekin batera itzulpen automatikoak berebiziko bilakaera izan du eta gero eta itzulpen hobeak eskaintzen ditu, ez bakarrik hizkuntza hegemonikoen artean, baita euskaratik eta euskarara egiten diren itzulpenetan ere.

Teknologia berriek ekarritako aldaketek guztiz eraldatu dituzte itzulpengintzaren industria eta merkatua: adimen artifizialari esker itzulpenak segundo gutxi batzuetan eta eraginkortasunez egiten dira; kostuak izugarri gutxitzen ditu, enpresek, bereziki enpresa txikiek, ez baitute itzultzaile profesionalik kontratu behar; eta, azkenik, adimen artifizialeko tresnak une oro daude eskura, 7 egunez eta 24 orduz.

Horren ondorioz, gero eta tarifa baxuagoak ordaintzen dira, eta itzultzaile askok lanbidea utzi eta beste lanbide batzuen bila joan behar izan dute, eta utzi ez duten asko pentsatzen hasita daude lanbidea aldatzeaz.

Aurreko irailaren 24an, EIZIEko barne postan mezu-truke bat egon zen itzultzaile lanpostu baten karietara. Enpresa batek testuak itzuli, hainbat argitalpenen hizkuntza zuzentasuna berrikusi eta interpretazio lanak egiteko itzulzaile-interprete bat behar zuen. Egunean sei orduko lanaldia eskaintzen zuten eta horren truke lanbidearteko gutxieneko soldata baino apur bat gehiago (zehatzago, ia 8.000 euro gehiago urtean, 14 ordainsari aintzat harturik). Lankide batzuei ez zitzaien oso egokia iruditu EIZIEk horrelako eskaintza โ€œexkaxakโ€ argitaratzea, elkarteak euskal itzultzaileen lan baldintzak hobetzen saiatu beharko lukeelako. Horren aurrean, beste lankide batek erantzun zuen esanez eskaintza hori diruaren ikuspegitik txarra izanagatik ere, ez garela konturatzen zein den gure lanbidearen egungo egoera, eta hau gaineratu zuen: โ€œItzulpen neuronalaren ondorioz, batez ere, egoerak nabarmen egin du okerrera, lankide asko lanik gabe daude, askok eta askok ezin dute hilaren amaierara helduโ€ฆ Baldintzak asko okertu dira gehienontzat, duela urte batzuk kobratzen genuenaren erdia kobratzen duguโ€ฆ Hori da egoera, autonomoontzat behintzatโ€.

Nik neuk ere horrelako egoerak ezagutu izan ditut eta orain dela gutxi gertatutako kasu bat baino ez dut aipatuko. Ikus-entzunezkoen industrian punta-puntako enpresa batek minutuko 1,50 euro ordaintzen du itzulpen automatikoarekin egindako euskarazko azpidatziak posteditatzeagatik, hau da, azpidatziak hutsetik euskaratzeagatik minutuko ordaintzen duena baino 2,50 euro gutxiago. Horiek horrela, 60 minutuko serie bat euskaratzeagatik, kasu, 240 ordaintzen du; aitzitik, euskarara automatikoki itzulitako serie bera posteditatzeagatik 90 euro.

Teknologiak itzultzaileen arlo ekonomikoan duen eraginaz harago, itzultzaileek lan egiteko moduan ere aldaketa dexente ekarri ditu. Esango nuke arlo jakin batzuk alde batera utzita, hala nola itzulpen literarioa eta bikoizketarako itzulpen-egokitzapena (nahiz eta hemen ere gauzak aldatzen hasi diren), nik ikasi nuen bezala edo nire aurrekoek ikasi zuten bezala itzultzea desagertzear dagoela, jada desagertu ez bada.

Eta hori egunero ikusten dut unibertsitateko eskoletan: ikasleek ez dute dagoeneko itzultzen, DeepLek edo beste itzultzaile automatiko batek egiten die lan nekoso hori; ikasleek, kasurik onenean ere, zuzenketa txiki batzuk baino ez dituzte egiten. Paradigma berri horren aurrean irakaskuntzan dihardugun askok geure buruari egiten diogun galdera hau da: itzultzaileak izateko prestatu beharrean, posteditoreak izateko prestatu behar ditugu?

Nik ez dut uste itzultzaileon lanbidea desagertuko denik, baina bizirik jarraituko badu, garai berrietara egokitu beharra du. Gure sektorea krisian dago, baina ez dugu inongo daturik jakiteko benetan noraino iristen den krisia euskarazko itzulpengintzan. 2025ean Europa mailan egin den ikerketa baten arabera, lau itzultzaile freelancetik bat pentsatzen hasi da bere lanbidea uztea. Eta itzulpen-agentziek aitortzen dute % 33ko jaitsiera izan dutela beren jarduera profesionalean eta % 20koa fakturazioan.

Krisiaren aurrean neurriak hartzen hasteko, hemengo datuak ezagutu behar ditugu. Eta horretarako uste dut baitezpadakoa dela txosten zehatz bat egitea, euskarazko itzulpengintzaren lanbidearen egungo erradiografia osatu bat, lanbidearen argi-itzalak ezagutzeko. Eta horretarako, nik uste, elkartea da organorik egokiena halako lana gidatu eta zuzentzeko, itzulpengintzan jarduten duten itzulpen-agentzia, enpresa eta profesional guztien ezinbesteko laguntzarekin, unibertsitateko ikasle-irakasleak ahaztu gabe. Foro hau ez da egokiena txostenaren nondik-norakoak xehe-xehe azaltzeko, baina gorago aipatu ikerketak argi uzten du zein izan daitezkeen aztertu beharreko ildo nagusiak eta eredu moduan erabil daitekeela uste dut.

Urte asko kostatu da itzultzaile-interpreteon lanbideak aitormena lortzea eta gizarte barruan merezi duen izena eta entzutea lortzea. Ez dezagun jende askoren ahaleginari esker lortutako guztia di-da batean pikutara bidali.

Corpusen paradisua

Josu Barambones Zubiria

Euskal itzultzaileok pozik egoteko eta zoriontsu bizitzeko hamaika arrazoi ditugu. Horietako bat corpusen lurraldean jaiotzea fortunatzea da, izan ere gurean beste inon baino corpus gehiago aurkituko ditu bidaiariak. Gauza jakina da ez litzatekeela itzultzailerik existituko corpusik ez balego.

Euskaldunok corpusekiko dugun zaletasuna agorrezina da, halako moduan non lurralde malkartsu honetan paroxismoaren gailurra jo baitu. Edozein gai edo arlo dela ere, beti egingo zaio txoko bat corpusen lurraldean. Tajuz, tentuz eta zentzuz itzultzeko ez ezik, hizkuntza teknologiak garatzeko ere baitezpadakoak omen dira. Eta batek pentsa dezake dagoeneko euskara teknologikoki oso aurreratua egongo dela eskura dauden corpusen tamainari bistadizo bat ematen badio.

Euskalbarren corpus hauek ageri dira: orokorrak (12 zenbatu ditut), eleaniztunak (4) eta espezializatuak (5). Eta ez daude guztiak: Goenkale corpusa, kasu, ez dago (Egungo Testuen Corpusaren barruan dago, halere). Baina horrekin konformatu ez, eta hara non beste corpus bat sortzeko eta garatzeko proiektua aurkeztu duten orain dela gutxi: Euskorpora, euskal corpusetan corpusena izango omen dena (beharbada zantzu bat baino ez da, baina ia aldi berean jakin dut Euskorporaren jaiotzaren berri eta euskal kulturaren sinbolo bat izan den Itxaropena argitaldariaren heriotzarena). Eta zertarako sortzen da Euskorpora? Euskokorporako webgunean hau irakur daiteke: โ€œBaliabide linguistikoak ondo dituzten eta ez dituzten hizkuntzen arteko aldea murriztekoโ€. Baina ez al da nahikoa dagoeneko eskura dugun Egungo Testuen Corpusarekin, 21. mendeko ereduzko corpusarekin? Guztira 430,7 milioi testu-hitzez osatua eta 3.584.978 hitz desberdinez. Euskorporak bost milioi bider, milioi bat bider hobetuko du?

Itxaro Bordak Berriako maiatzaren 18ko artikuluan zioen bezala, badirudi euskararen etorkizuna segurtatzeko behar ditugun hiru gauzen artean โ€œdirua ausarki uzteaโ€ dela horietako bat. Izan ere, Euskorpora behar bezala doitu eta garatzeko, Industria, Trantsizio Energetiko eta Jasangarritasunaren Sailaren bidez, 5,55 milioi euroko zuzkidura bideratuko da (โ€œzuzkiduraโ€, zer hitz polita, durunditsua). 2025erako bi milioi euro esleitu zaizkio eta hurrengo urterako beste hiru milioi euro. Hori gutxi ez, eta Kultura eta Hizkuntza Politika sailak beste 550.000 euroko ekarpena egingo du hasieran, berotzen hasteko.

5,55 milioi euro, harrapa ezak/n. Gutxi? Askotxo? Ez dakit, baina corpusek ere jan behar izaten dute, eta zer jaten du corpus batek? Testuak, bai, testuez elikatzen dira, orotariko testuez: kalitate exkaxeko testuez eta kalitate oneko testuez, eta jakintza arlo guztietakoez. Eta bitxia begitantzen zait, besteak beste, testu literarioak sortzea eta itzultzea xedetzat dituzten elkarteek zenbat diru jasotzen duten. Gure Elkarteak, EIZIEk, 90.000 euro jasoko ditu 2025ean Eusko Jaurlaritzako Kultura Sustatzeko Zuzendaritzatik elkarteko ekintzak garatu eta Literatura Unibertsala bilduma eta berrargitalpen-plana sustatzeko. Hau da, urtean literatura unibertsaleko hiruzpalau liburu argitaratzeko beste, gordin esanda. Literatura unibertsaleko liburuekin jai dute corpusek, gosez hilko baitira. Euskal Idazleen Elkarteak 62.000 euro literatura-sektorea sustatzeko eta Euskal Editoreen Elkarteak 85.000 euro liburugintza-sektorea laguntzeko. Gutxi? Askotxo? Ez dakit, baina lehentasunak non dauden jarrita argi dago.

Baina ya esta. Euskarak behar zuen panazea hemen dago. Euskorpusari esker, gailu digitalak euskaraz jarduteko gai izango dira. Horrela, esaterako, Sirirekin edota Alexarekin euskaraz aritzeko aukera izango dut (Zergatik ez erabili horien ordez euskal izenak, esate baterako, Antton eta Arantzazu?), haiek ere euskalduntzea lortuko dugulako (agur euskaltegiei). Dagoeneko batek ikus ditzake inbertsio horren emaitzak Euskorporaren berri ematen duen Eusko Jaurlaritzako webgunean bertan: โ€œInbertsio horrekin, gainera, adimen artifizialaren eta datuaren kudeaketaren euskal ekosistema ere dinamizatuko daโ€. Zer ote da euskal ekosistema dinamizatzea? Nik jakin ez eta robot horietako bati galdetzea otu zait. Hona erantzuna:

Euskal ekosistema dinamizatzea, zure galderari erantzunez, ekosistema hori biziberritzeko, sustatzeko eta hazkundean laguntzeko lanak egitea da. Hau da, ekosistema hori osatzen duten enpresa, startup, ikerketa zentro, erakunde eta profesionalen arteko loturak eta lankidetza indartzea eta bultzada ematea da helburua.

Horrela, berrikuntza, enplegua eta garapena sustatzen dira, eta ingurune eraginkorragoa eta sortzaileagoa sortzen da. Euskal ekosistema dinamizatzea, beraz, ekintza, topaketak, sareak eta proiektu berritzaileak bultzatzea da, tokiko eta nazioarteko eragileekin elkarlanean arituz.

Laburbilduz, euskal ekosistema dinamizatzea ekintza eta estrategia multzoa da, Euskal Herriko ekonomiaren eta berrikuntzaren garapena laguntzeko asmoarekin.

Erantzunaren borobila ikusita, hemendik aurrera bakarrik robotekin hitz egiteko deliberamendua hartu dut.

Euskarak behar dituen elkarrizketak

Lamia Filali-Mouncef Lazkano

Inpresioa dut gero eta ohikoagoa dela baieztatzea euskararen eta, beraz, euskal hiztunon ยซgaraiko erronkaยป teknologia berrietan gure hizkuntzaren presentzia bermatzea dela. Hots, euskararen ยซetorkizunaยป eremu digitalaren zelaian jokatzen dela, eta, beraz, gure indarrak hara bideratu behar ditugula, euskararen heriotza ekidin nahi badugu. Horren ยซizar mediatikoaยป bihurtu da Adimen Artifiziala, eta, zehazki, hizkuntza teknologia adimendunak, Patricia Barroni hitzak lapurtuz[1].

Izan ere, zenbat elkarrizketa eskaini zaio euskaraz Adimen Artifizialari azken urteotan? Zenbat pentsamendu eskaini dizkiogu euskaldunok, zenbat klik egin dugu hura erabiltzeko, zenbat diru bideratzen ari da horretara? Zenbat jardunaldi, hitzaldi, mahai-inguru, albiste, formakuntza, hitzarmen, ikerketa, tabernako tertulia? Zer etorkizun hurbil ari gara irudikatzen โ€•eta eraikitzenโ€• elkarrizketa eta praktika horietako bakoitzarekin?

Hara nire iritzia: euskararen eta, beraz, euskal hiztunon etorkizunaren diagnostiko horri erpin asko eta inportanteak falta zaizkio, eta nago urgentzia horra bideratzeak interes jakin batzuei erantzun ahal diela. Gaur gaurkoz eremu digitalean euskararen presentzia bermatzea garrantzitsua da, nor bere burutik hasita[2]. Baina zer eremu digitali? Etorkizunaz eta begirada estrategikoaz ari bagara, AA lehentasuna izatea zalantzagarria iruditzen zait.

Hasteko, planetak muga biofisikoak dituelako. Jabetzen al gara Adimen Artifizialak behar duen ordenagailutzar batek zenbateko energia eta ur kontsumitzen duen Chatgptri galdera bat egin eta bere entrenamenduan gure aletxoa jartzen dugun bakoitzean? Badakigu energia eta ur horiek nondik ateratzen diren eta nola dauden erregai fosilen erreserbak eta urtegiak?

Petrolio eta gas naturalaren estrakzioa gero eta zailagoa da, geroz eta gutxiago dagoelako, dagoena gero eta kalitate txarragokoa delako, eta maiz estrakzio-kostuek etekinak gainditzen dituztelako, hortaz, ez dute lehen bezainbeste hornitzen; berriztagarriak, era berean, ez dira gai egungo energia-kontsumo maila sostengatzeko[3]. Eta inportanteena: planetaren bizigarritasuna bermatzen dituzten bederatzi muga fisikoak zeharkatzeko norabidean goaz, arazoa ez baita klima-aldaketara mugatzen, badira beste zortzi eremu kritiko ere[4]. Horrek esan nahi du mundu-mailako energiaren kontsumoa mugatu egin beharra dagoela planeta bizigarria izateko. Energia zertara bideratzea erabakiko dugu: adimen artifizialera guk egiten dakigun gauzetarako, ala soilik lehentasunezkoak diren erabileretarako, adibidez, helburu terapeutikoetarako[5]?

Galdera ez da ยซenergia-desazkundea bai ala ezยป, Ama Lurra oihuka ari zaigu ezin duela arpilatze maila hau sostengatu. Galdera da aldaketa hau nola egingo dugun ahalik eta justuena. Behar ez dugun energia-kontsumoari desazkundea aplikatuz, bai: gerrei, aberatsen gehiegikeriei, arropei, plastikoari, jaki prozesatuei, auto pribatuari, AAren erabilerei[6]โ€ฆ Eta behar ditugun alderdi horiei guztiei hazkundea aplikatuz: zaintzari, osasunari, kulturari, sormenari, erritmoa moteltzeari, garraio publikoari, bizikletari, sakon arnasteari, etab. Seguru blog hau irakurtzen duten askok bizitza erabat bizigarria ezagutu dutela azken urteotako energia-kontsumo basati hau gabe ere.

Horrez gain, ezaugarri problematiko asko ditu egungo AA ereduak. Dakigunez, sektore askori eragiten die, itzultzaileei, noski, baina baita artistei, bikoizleei, etab.[7]. Pentsatzen dut badirela euskarazko AA auzolanean eta kode-irekian eraikitzeko zenbait proposamen, baina, horietatik kanpo, gauzak oso bestelakoak dira[8]. Ez ditut hemen zerrendatuko aurreko blog-sarrera askotan eztabaidatu diren gainerako auziak, baina gaiak sortzen duen zalapartak erakusten du, nire ustez, kezkak handiak eta zilegiak direla.

Azkenik, nire iritziz euskarak hiztunak izango ditu adimen artifizialik gabe ere, bizitza publikoa non gertatzen den komunitateak erabakitzen duelako, bere praktiken bidez. Energia-kontsumoari muga jartzen badiogu, agian ez dugu pantailarik izango 24 orduetan begiratzeko, eta beste zerbaitetara bideratuko ditugu gure praktikak. Horietan euskaraz egitea da gakoa, hots, betikoa: erabilera. Erabilerak bermatzen du etorkizuna, nire iritziz ez dago beste formularik. Horri oraintxe bertan ekin ahal diogu. Etorkizunari begira bagaude, datorren astean hasiko den Euskaraldia serio hartzeak, nire ustez, zimendu askoz sendoagoak jartzen ditu ezein AAk baino. Uste dut ezin dugula ahaztu Adimen Artifiziala, fisikoki, elektrizitate-korrontetik desentxufatu orduko hondakin bilakatzen den ordenagailu multzoa baizik ez dela, eta entrenatzen dituen giza-daturik gabe adimengabea dela.

Euskarak behar du mingainetan eta gorputzetan egon, ospitale eta eskoletan, elkartasun ekintza orotan, bizia erdigunean jartzeko oinarrizkoak diren lanbide guztien artikulazioan. Zenbat eta lehenago hasi halako elkarrizketak biderkatzen, orduan eta hobeto erantzungo diogu komunitate gisa egoerari, eta orduan eta bermatuago izango dugu ยซeuskararen etorkizunaยป. Ez dakit euskara batua sortu zenean hil ala bizikoa zen kontua, baina orain nahiko argi dut baietz, hizkuntza-aniztasuna, bioaniztasuna bezalaxe, maldan behera doa-eta.

Euskarak behar du bere sostengu materiala bermatzeaz hitz egiten duen hiztun komunitate sendo bat. Prozesu hori egiteko zer aliantza eta zer adostasun bilatuko duen eztabaidatzen ari dena. Elikadura-burujabetza helburu duena eta agroekologian trebatzen dena, lur emankorrak dituena. Kontsumitzen duen energia nondik lortzen duen dakien hiztun komunitatea behar du. Zeren euskarak ez baitu hiztunik ez badute jatekorik edo beharrizanak betetzeko energiarik, eta hamaika modu dago gaurtik hasita bide hori euskaraz eraikitzeko.

Zergatik ari gara Adimen Artifizialaz hainbeste hitz egiten? Noren poltsikoak betetzeko? Noren pare egoteko? Zein da ยซgaraiko erronkaยป?


[1] Adimen Artifiziala eta euskara, Patricia Barron Berria egunkarian.

[2] https://www.lehenhitza.eus/

[3] Energiaren sektorea omen da egun mundu-mailan isuri gehien eragiten dituena. Antonio Turiel itzalaldia dela-eta elkarrizketatu dute azkenaldian, eta euskaratuta dugu haren Petrokalipsia liburua.

[4] https://eu.wikipedia.org/wiki/Muga_planetarioak

[5] Minbiziaren diagnostikoa errazteko, kasu.

[6] AAren erabilera askoren kostu ekologikoa erabat aurreztu liteke, eta algoritmoak entrenatzeaz aparte ez dago argi zein den haien funtzioa.

[7] https://ace-traductores.org/manifiesto-de-la-cultura-ante-la-ia/

[8] Kontrastatzea lortu ez dudan adibide bat ematearren, mihigaiztoek diote besteak beste Teslaren jabe ernegagarria aberasteko entrenatzen ibili garela AA urteetan, Googleko captcha delakoetan trafiko-seinaleak identifikatu ditugun bakoitzean.