Euskaraz sortutakoa gaztelaniara itzultzeko itzultzaile automatiko neuronala

Maite Imaz Leunda

Uda honetan komunikabideetan irakurri eta entzun dugun berria izan da Osakidetzak itzultzaile neuronal bat jarri duela martxan, historia klinikoak euskaratik gaztelaniara itzultzeko: ITZULBIDE du izena. Hasiera batean Donostialdeko erakunde sanitario integratuan (ESI) ipini dute, baina berandu baino lehen Osakidetzako sare guztietan erabilgarri egongo den itxaropenarekin.

Orain dela lau urte inguru hasi ziren proiektua garatzen, Osakidetzan euskara lan hizkuntza ere izan dadin. Dokumentazio estandarra ele bietan argitaratzen da Osakidetzan, baina dokumentazio klinikorako irizpide zehatzik ez dagoenez, joera gaztelaniaz egitekoa izan omen da orain arte. Felix Zubia mediku, irakasle eta dibulgatzaileak EITBko programa batean adierazi zuenez, Osakidetzaren 3. Euskara Planaren barruan dagoen zerbait da, bertan jasotzen baita euskarak lan hizkuntza ere izan behar duela.

Zubiaren esanetan, unibertsitatean prestatzen dira profesionalak euskaraz, badituzte beraz apunteak euskaraz, eta medikuntzako hiztegi terminologikoak ere landu dira, baina behin lanean hasitakoan, pazientearekin izandako harremana euskaraz izan arren, txosten klinikoak euskaraz idazteko baliabiderik ez dute izaten. Izan ere, geroago beste medikuren batek irakurri beharko du txosten hori eta baliteke euskaraz ez jakitea. Badira euskaraz lan egin nahi duten medikuak, baina euskara ulertzen ez dutenak ere badirenez, txosten klinikoak beti gaztelaniaz idatzi izan dira orain arte.

ITZULBIDEk bi norabideetan egiteko aukera eskaintzen du, baina helburua euskaratik gaztelaniara erabiltzea da, euskaraz lan egiteko eskubidea bermatzen baita horrela, eta baita pazienteak informazioa euskaraz jasotzekoa ere. Laburdurekin badu arazoren bat, ez ditu laburdura guztiak ondo atzematen, eta hori konpontzen ari dira.

Berri ona da euskarak espazio berriak irabaztea, orain arte gaztelania bakarrik erabili izan den eremuetan euskaraz egiteko aukerak jartzea, eta ni asko pozten naiz adimen artifizialean oinarritutako teknologia berriek euskara sustatzeko bideak irekitzen dituztenean.

Uda betean argitaratu zen, halaber, elcastellano.org gaztelania sustatzeko webgunean, medikuntzako itzulpen automatikoetan saihestu beharreko arriskuez ziharduen artikulu bat. Medikuntzako hizkera oso teknikoa eta zehatza izaten dela zioen, anbiguotasunetarako lekurik ez duena eta รฑabardurak oso kontuan hartu behar dituena.

Adierazten zuen hitz edo termino baten itzulpen desegokiak oso ondorio larriak izan ditzakeela eta adibide gisa ipintzen zuen ingeleseko โ€œstrokeโ€ hitza, gaztelaniara โ€œictusโ€ edo โ€œgolpeโ€ gisa itzuli behar den ezin duela asmatu neuronalak, edo zenbakizko adierazpenetan akatsak egitea zeinen larria izan daitekeen; gaizki jarritako hitz batek dena alda dezake: 0,5 eta 5 artean dosi bat nahasteak arriskuan jarri dezake paziente baten bizitza. Eta Itzultzaile automatiko batek inoiz itzuli behar ez lituzkeen dokumentuen artean sartzen zituen txosten klinikoak.

Orduan, elcastellano.org argitalpenean esaten denari kontra egitera ote dator ITZULBIDE? Ausartegia edo arriskutsua ote da hain eremu delikatuan itzultzaile automatiko neuronala erabiltzea?

ITZULBIDEri buruz zerbait gehiago ikasi nuen โ€œItzultzaile neuronalen eraginak euskararen erabileranโ€ izeneko ikastaroan; hori ere udan izan zen, baina joan den urteko udan, 2024an. Olatz Perez de Viรฑaspre informatikari eta ikerlariari ondo ulertu banion, espezialitate eremu jakin horretako itzultzaile neuronal berezia osatu ahal izateko corpus orokor elebiduna sartzeaz gain, historia klinikoetako corpusa sartu zuten, gaztelaniaz, eta behar bezala anonimizatuta, datu pertsonalak ezkutatzeko. Medikuntzako hiztegi terminologikoak ere sartu zituzten. Ondoren, txosten klinikoak itzultzeko agindu eta itzulpenak zuzendu edo posteditatu ondoren horiekin osatutako txosten klinikoen corpus elebidunak sartu zituzten.

Orain dela 30 urte inguru itzulpengintza automatikoaz irakurri nuen liburu batean (W. John Hutchins & Harold S. Somers. An Introduction to Machine translation, 1992) garai hartako itzultzaile automatikoen artean METEO nabarmentzen zen. Orduko itzultzaile automatikoak arauetan oinarritzen ziren, ez zuten gaur egungo itzultzaile automatiko neuronalak bezain ondo egiten eta ez zirudien euskara bezalako hizkuntza batentzat arauetan oinarritutako eredu egokirik sortzea posible izango zenik.

Kanadan eguraldi parteak ingelesetik frantsesera itzultzeko jarri zen martxan METEO, 1976an: transferentzia lexikoa eta analisi sintaktikoa egiten zituen. Erabiltzen zuen hiztegia mugatua izatea eta norabide bakarrean egitea jotzen ziren arrakastatsua izateko gakotzat. Itzulpen automatikoaren aldeko adibiderik egokiena zen garai hartan METEO.

Gaur egungo ITZULBIDE lehengo mendeko METEOren parekoa izan daiteke agian. Eremu zehatz jakin baterako bereziki entrenatua, hizkuntza ez seguru asko eguraldi parteena bezain mugatua baina bai oso espezifikoa, eta norabide bakarrean erabiltzekoa, hasiera batean behintzat. Ezaugarri horiek izanda, tresna segurua izan daiteke.

Bada beste arrazoi bat segurua izango dela ziurtatuko duena, nire ustez. Euskaraz sortzen dugunok gaztelaniaratzeko itzultzaile automatiko neuronalak erabiltzen ditugunean ez gara botoi bati sakatuta konformatzen; zuzendu edo posteditatu egiten dugu. Gaztelaniazko testuaren estiloak ez gaituenean erabat asebetetzen ez dugu beti asmatuko txukuntzen edo ez dugu behar bada gaztelania naturalean nola ipini jakingo, baina ziurtatuko dugu testu biek gauza bera esaten dutela, jatorrizkoan esaten den guztia esaten dela itzulpenean, eta itzulpenean ez dela jatorrizkoan azaltzen ez denik esaten.

Gaztelaniatik euskaratu behar denean, ordea, askok pentsatzen dute botoi bati emanda nahikoa dela; klik bat egitea nahikoa dela euskararekiko betebehar guztiak gauzatzeko. Itxurari ematen zaio garrantzia, mamia kontuan hartu beharrean. Euskararen prestigio urria dago joera horren oinarrian.

Pentsatzen dut medikuntzako profesional euskaldunek euskaraz sortutako txosten klinikoak ez dituztela besterik gabe euskara hutsez gordeko ordenagailuan; hori egin aurretik emango diotela botoiari, irakurriko dela ITZULBIDEk emandako ordaina, ziurtatuko dutela gaztelaniara egindako itzulpena zuzena dela eta geroago etor daitekeen mediku erdaldunak ondo ulertuko duela.

Noizko euskarazko itzulpengintzaren liburu zuria?

Josu Barambones Zubiria

Foro hau baliatu nahi dut aspaldion buruan jira-biraka dabilkidan kezka bat zuekin guztiekin partekatzeko. Adimen artifiziala itzulpenen fluxuan sartzearekin batera itzulpen automatikoak berebiziko bilakaera izan du eta gero eta itzulpen hobeak eskaintzen ditu, ez bakarrik hizkuntza hegemonikoen artean, baita euskaratik eta euskarara egiten diren itzulpenetan ere.

Teknologia berriek ekarritako aldaketek guztiz eraldatu dituzte itzulpengintzaren industria eta merkatua: adimen artifizialari esker itzulpenak segundo gutxi batzuetan eta eraginkortasunez egiten dira; kostuak izugarri gutxitzen ditu, enpresek, bereziki enpresa txikiek, ez baitute itzultzaile profesionalik kontratu behar; eta, azkenik, adimen artifizialeko tresnak une oro daude eskura, 7 egunez eta 24 orduz.

Horren ondorioz, gero eta tarifa baxuagoak ordaintzen dira, eta itzultzaile askok lanbidea utzi eta beste lanbide batzuen bila joan behar izan dute, eta utzi ez duten asko pentsatzen hasita daude lanbidea aldatzeaz.

Aurreko irailaren 24an, EIZIEko barne postan mezu-truke bat egon zen itzultzaile lanpostu baten karietara. Enpresa batek testuak itzuli, hainbat argitalpenen hizkuntza zuzentasuna berrikusi eta interpretazio lanak egiteko itzulzaile-interprete bat behar zuen. Egunean sei orduko lanaldia eskaintzen zuten eta horren truke lanbidearteko gutxieneko soldata baino apur bat gehiago (zehatzago, ia 8.000 euro gehiago urtean, 14 ordainsari aintzat harturik). Lankide batzuei ez zitzaien oso egokia iruditu EIZIEk horrelako eskaintza โ€œexkaxakโ€ argitaratzea, elkarteak euskal itzultzaileen lan baldintzak hobetzen saiatu beharko lukeelako. Horren aurrean, beste lankide batek erantzun zuen esanez eskaintza hori diruaren ikuspegitik txarra izanagatik ere, ez garela konturatzen zein den gure lanbidearen egungo egoera, eta hau gaineratu zuen: โ€œItzulpen neuronalaren ondorioz, batez ere, egoerak nabarmen egin du okerrera, lankide asko lanik gabe daude, askok eta askok ezin dute hilaren amaierara helduโ€ฆ Baldintzak asko okertu dira gehienontzat, duela urte batzuk kobratzen genuenaren erdia kobratzen duguโ€ฆ Hori da egoera, autonomoontzat behintzatโ€.

Nik neuk ere horrelako egoerak ezagutu izan ditut eta orain dela gutxi gertatutako kasu bat baino ez dut aipatuko. Ikus-entzunezkoen industrian punta-puntako enpresa batek minutuko 1,50 euro ordaintzen du itzulpen automatikoarekin egindako euskarazko azpidatziak posteditatzeagatik, hau da, azpidatziak hutsetik euskaratzeagatik minutuko ordaintzen duena baino 2,50 euro gutxiago. Horiek horrela, 60 minutuko serie bat euskaratzeagatik, kasu, 240 ordaintzen du; aitzitik, euskarara automatikoki itzulitako serie bera posteditatzeagatik 90 euro.

Teknologiak itzultzaileen arlo ekonomikoan duen eraginaz harago, itzultzaileek lan egiteko moduan ere aldaketa dexente ekarri ditu. Esango nuke arlo jakin batzuk alde batera utzita, hala nola itzulpen literarioa eta bikoizketarako itzulpen-egokitzapena (nahiz eta hemen ere gauzak aldatzen hasi diren), nik ikasi nuen bezala edo nire aurrekoek ikasi zuten bezala itzultzea desagertzear dagoela, jada desagertu ez bada.

Eta hori egunero ikusten dut unibertsitateko eskoletan: ikasleek ez dute dagoeneko itzultzen, DeepLek edo beste itzultzaile automatiko batek egiten die lan nekoso hori; ikasleek, kasurik onenean ere, zuzenketa txiki batzuk baino ez dituzte egiten. Paradigma berri horren aurrean irakaskuntzan dihardugun askok geure buruari egiten diogun galdera hau da: itzultzaileak izateko prestatu beharrean, posteditoreak izateko prestatu behar ditugu?

Nik ez dut uste itzultzaileon lanbidea desagertuko denik, baina bizirik jarraituko badu, garai berrietara egokitu beharra du. Gure sektorea krisian dago, baina ez dugu inongo daturik jakiteko benetan noraino iristen den krisia euskarazko itzulpengintzan. 2025ean Europa mailan egin den ikerketa baten arabera, lau itzultzaile freelancetik bat pentsatzen hasi da bere lanbidea uztea. Eta itzulpen-agentziek aitortzen dute % 33ko jaitsiera izan dutela beren jarduera profesionalean eta % 20koa fakturazioan.

Krisiaren aurrean neurriak hartzen hasteko, hemengo datuak ezagutu behar ditugu. Eta horretarako uste dut baitezpadakoa dela txosten zehatz bat egitea, euskarazko itzulpengintzaren lanbidearen egungo erradiografia osatu bat, lanbidearen argi-itzalak ezagutzeko. Eta horretarako, nik uste, elkartea da organorik egokiena halako lana gidatu eta zuzentzeko, itzulpengintzan jarduten duten itzulpen-agentzia, enpresa eta profesional guztien ezinbesteko laguntzarekin, unibertsitateko ikasle-irakasleak ahaztu gabe. Foro hau ez da egokiena txostenaren nondik-norakoak xehe-xehe azaltzeko, baina gorago aipatu ikerketak argi uzten du zein izan daitezkeen aztertu beharreko ildo nagusiak eta eredu moduan erabil daitekeela uste dut.

Urte asko kostatu da itzultzaile-interpreteon lanbideak aitormena lortzea eta gizarte barruan merezi duen izena eta entzutea lortzea. Ez dezagun jende askoren ahaleginari esker lortutako guztia di-da batean pikutara bidali.

Corpusen paradisua

Josu Barambones Zubiria

Euskal itzultzaileok pozik egoteko eta zoriontsu bizitzeko hamaika arrazoi ditugu. Horietako bat corpusen lurraldean jaiotzea fortunatzea da, izan ere gurean beste inon baino corpus gehiago aurkituko ditu bidaiariak. Gauza jakina da ez litzatekeela itzultzailerik existituko corpusik ez balego.

Euskaldunok corpusekiko dugun zaletasuna agorrezina da, halako moduan non lurralde malkartsu honetan paroxismoaren gailurra jo baitu. Edozein gai edo arlo dela ere, beti egingo zaio txoko bat corpusen lurraldean. Tajuz, tentuz eta zentzuz itzultzeko ez ezik, hizkuntza teknologiak garatzeko ere baitezpadakoak omen dira. Eta batek pentsa dezake dagoeneko euskara teknologikoki oso aurreratua egongo dela eskura dauden corpusen tamainari bistadizo bat ematen badio.

Euskalbarren corpus hauek ageri dira: orokorrak (12 zenbatu ditut), eleaniztunak (4) eta espezializatuak (5). Eta ez daude guztiak: Goenkale corpusa, kasu, ez dago (Egungo Testuen Corpusaren barruan dago, halere). Baina horrekin konformatu ez, eta hara non beste corpus bat sortzeko eta garatzeko proiektua aurkeztu duten orain dela gutxi: Euskorpora, euskal corpusetan corpusena izango omen dena (beharbada zantzu bat baino ez da, baina ia aldi berean jakin dut Euskorporaren jaiotzaren berri eta euskal kulturaren sinbolo bat izan den Itxaropena argitaldariaren heriotzarena). Eta zertarako sortzen da Euskorpora? Euskokorporako webgunean hau irakur daiteke: โ€œBaliabide linguistikoak ondo dituzten eta ez dituzten hizkuntzen arteko aldea murriztekoโ€. Baina ez al da nahikoa dagoeneko eskura dugun Egungo Testuen Corpusarekin, 21. mendeko ereduzko corpusarekin? Guztira 430,7 milioi testu-hitzez osatua eta 3.584.978 hitz desberdinez. Euskorporak bost milioi bider, milioi bat bider hobetuko du?

Itxaro Bordak Berriako maiatzaren 18ko artikuluan zioen bezala, badirudi euskararen etorkizuna segurtatzeko behar ditugun hiru gauzen artean โ€œdirua ausarki uzteaโ€ dela horietako bat. Izan ere, Euskorpora behar bezala doitu eta garatzeko, Industria, Trantsizio Energetiko eta Jasangarritasunaren Sailaren bidez, 5,55 milioi euroko zuzkidura bideratuko da (โ€œzuzkiduraโ€, zer hitz polita, durunditsua). 2025erako bi milioi euro esleitu zaizkio eta hurrengo urterako beste hiru milioi euro. Hori gutxi ez, eta Kultura eta Hizkuntza Politika sailak beste 550.000 euroko ekarpena egingo du hasieran, berotzen hasteko.

5,55 milioi euro, harrapa ezak/n. Gutxi? Askotxo? Ez dakit, baina corpusek ere jan behar izaten dute, eta zer jaten du corpus batek? Testuak, bai, testuez elikatzen dira, orotariko testuez: kalitate exkaxeko testuez eta kalitate oneko testuez, eta jakintza arlo guztietakoez. Eta bitxia begitantzen zait, besteak beste, testu literarioak sortzea eta itzultzea xedetzat dituzten elkarteek zenbat diru jasotzen duten. Gure Elkarteak, EIZIEk, 90.000 euro jasoko ditu 2025ean Eusko Jaurlaritzako Kultura Sustatzeko Zuzendaritzatik elkarteko ekintzak garatu eta Literatura Unibertsala bilduma eta berrargitalpen-plana sustatzeko. Hau da, urtean literatura unibertsaleko hiruzpalau liburu argitaratzeko beste, gordin esanda. Literatura unibertsaleko liburuekin jai dute corpusek, gosez hilko baitira. Euskal Idazleen Elkarteak 62.000 euro literatura-sektorea sustatzeko eta Euskal Editoreen Elkarteak 85.000 euro liburugintza-sektorea laguntzeko. Gutxi? Askotxo? Ez dakit, baina lehentasunak non dauden jarrita argi dago.

Baina ya esta. Euskarak behar zuen panazea hemen dago. Euskorpusari esker, gailu digitalak euskaraz jarduteko gai izango dira. Horrela, esaterako, Sirirekin edota Alexarekin euskaraz aritzeko aukera izango dut (Zergatik ez erabili horien ordez euskal izenak, esate baterako, Antton eta Arantzazu?), haiek ere euskalduntzea lortuko dugulako (agur euskaltegiei). Dagoeneko batek ikus ditzake inbertsio horren emaitzak Euskorporaren berri ematen duen Eusko Jaurlaritzako webgunean bertan: โ€œInbertsio horrekin, gainera, adimen artifizialaren eta datuaren kudeaketaren euskal ekosistema ere dinamizatuko daโ€. Zer ote da euskal ekosistema dinamizatzea? Nik jakin ez eta robot horietako bati galdetzea otu zait. Hona erantzuna:

Euskal ekosistema dinamizatzea, zure galderari erantzunez, ekosistema hori biziberritzeko, sustatzeko eta hazkundean laguntzeko lanak egitea da. Hau da, ekosistema hori osatzen duten enpresa, startup, ikerketa zentro, erakunde eta profesionalen arteko loturak eta lankidetza indartzea eta bultzada ematea da helburua.

Horrela, berrikuntza, enplegua eta garapena sustatzen dira, eta ingurune eraginkorragoa eta sortzaileagoa sortzen da. Euskal ekosistema dinamizatzea, beraz, ekintza, topaketak, sareak eta proiektu berritzaileak bultzatzea da, tokiko eta nazioarteko eragileekin elkarlanean arituz.

Laburbilduz, euskal ekosistema dinamizatzea ekintza eta estrategia multzoa da, Euskal Herriko ekonomiaren eta berrikuntzaren garapena laguntzeko asmoarekin.

Erantzunaren borobila ikusita, hemendik aurrera bakarrik robotekin hitz egiteko deliberamendua hartu dut.

Euskarak behar dituen elkarrizketak

Lamia Filali-Mouncef Lazkano

Inpresioa dut gero eta ohikoagoa dela baieztatzea euskararen eta, beraz, euskal hiztunon ยซgaraiko erronkaยป teknologia berrietan gure hizkuntzaren presentzia bermatzea dela. Hots, euskararen ยซetorkizunaยป eremu digitalaren zelaian jokatzen dela, eta, beraz, gure indarrak hara bideratu behar ditugula, euskararen heriotza ekidin nahi badugu. Horren ยซizar mediatikoaยป bihurtu da Adimen Artifiziala, eta, zehazki, hizkuntza teknologia adimendunak, Patricia Barroni hitzak lapurtuz[1].

Izan ere, zenbat elkarrizketa eskaini zaio euskaraz Adimen Artifizialari azken urteotan? Zenbat pentsamendu eskaini dizkiogu euskaldunok, zenbat klik egin dugu hura erabiltzeko, zenbat diru bideratzen ari da horretara? Zenbat jardunaldi, hitzaldi, mahai-inguru, albiste, formakuntza, hitzarmen, ikerketa, tabernako tertulia? Zer etorkizun hurbil ari gara irudikatzen โ€•eta eraikitzenโ€• elkarrizketa eta praktika horietako bakoitzarekin?

Hara nire iritzia: euskararen eta, beraz, euskal hiztunon etorkizunaren diagnostiko horri erpin asko eta inportanteak falta zaizkio, eta nago urgentzia horra bideratzeak interes jakin batzuei erantzun ahal diela. Gaur gaurkoz eremu digitalean euskararen presentzia bermatzea garrantzitsua da, nor bere burutik hasita[2]. Baina zer eremu digitali? Etorkizunaz eta begirada estrategikoaz ari bagara, AA lehentasuna izatea zalantzagarria iruditzen zait.

Hasteko, planetak muga biofisikoak dituelako. Jabetzen al gara Adimen Artifizialak behar duen ordenagailutzar batek zenbateko energia eta ur kontsumitzen duen Chatgptri galdera bat egin eta bere entrenamenduan gure aletxoa jartzen dugun bakoitzean? Badakigu energia eta ur horiek nondik ateratzen diren eta nola dauden erregai fosilen erreserbak eta urtegiak?

Petrolio eta gas naturalaren estrakzioa gero eta zailagoa da, geroz eta gutxiago dagoelako, dagoena gero eta kalitate txarragokoa delako, eta maiz estrakzio-kostuek etekinak gainditzen dituztelako, hortaz, ez dute lehen bezainbeste hornitzen; berriztagarriak, era berean, ez dira gai egungo energia-kontsumo maila sostengatzeko[3]. Eta inportanteena: planetaren bizigarritasuna bermatzen dituzten bederatzi muga fisikoak zeharkatzeko norabidean goaz, arazoa ez baita klima-aldaketara mugatzen, badira beste zortzi eremu kritiko ere[4]. Horrek esan nahi du mundu-mailako energiaren kontsumoa mugatu egin beharra dagoela planeta bizigarria izateko. Energia zertara bideratzea erabakiko dugu: adimen artifizialera guk egiten dakigun gauzetarako, ala soilik lehentasunezkoak diren erabileretarako, adibidez, helburu terapeutikoetarako[5]?

Galdera ez da ยซenergia-desazkundea bai ala ezยป, Ama Lurra oihuka ari zaigu ezin duela arpilatze maila hau sostengatu. Galdera da aldaketa hau nola egingo dugun ahalik eta justuena. Behar ez dugun energia-kontsumoari desazkundea aplikatuz, bai: gerrei, aberatsen gehiegikeriei, arropei, plastikoari, jaki prozesatuei, auto pribatuari, AAren erabilerei[6]โ€ฆ Eta behar ditugun alderdi horiei guztiei hazkundea aplikatuz: zaintzari, osasunari, kulturari, sormenari, erritmoa moteltzeari, garraio publikoari, bizikletari, sakon arnasteari, etab. Seguru blog hau irakurtzen duten askok bizitza erabat bizigarria ezagutu dutela azken urteotako energia-kontsumo basati hau gabe ere.

Horrez gain, ezaugarri problematiko asko ditu egungo AA ereduak. Dakigunez, sektore askori eragiten die, itzultzaileei, noski, baina baita artistei, bikoizleei, etab.[7]. Pentsatzen dut badirela euskarazko AA auzolanean eta kode-irekian eraikitzeko zenbait proposamen, baina, horietatik kanpo, gauzak oso bestelakoak dira[8]. Ez ditut hemen zerrendatuko aurreko blog-sarrera askotan eztabaidatu diren gainerako auziak, baina gaiak sortzen duen zalapartak erakusten du, nire ustez, kezkak handiak eta zilegiak direla.

Azkenik, nire iritziz euskarak hiztunak izango ditu adimen artifizialik gabe ere, bizitza publikoa non gertatzen den komunitateak erabakitzen duelako, bere praktiken bidez. Energia-kontsumoari muga jartzen badiogu, agian ez dugu pantailarik izango 24 orduetan begiratzeko, eta beste zerbaitetara bideratuko ditugu gure praktikak. Horietan euskaraz egitea da gakoa, hots, betikoa: erabilera. Erabilerak bermatzen du etorkizuna, nire iritziz ez dago beste formularik. Horri oraintxe bertan ekin ahal diogu. Etorkizunari begira bagaude, datorren astean hasiko den Euskaraldia serio hartzeak, nire ustez, zimendu askoz sendoagoak jartzen ditu ezein AAk baino. Uste dut ezin dugula ahaztu Adimen Artifiziala, fisikoki, elektrizitate-korrontetik desentxufatu orduko hondakin bilakatzen den ordenagailu multzoa baizik ez dela, eta entrenatzen dituen giza-daturik gabe adimengabea dela.

Euskarak behar du mingainetan eta gorputzetan egon, ospitale eta eskoletan, elkartasun ekintza orotan, bizia erdigunean jartzeko oinarrizkoak diren lanbide guztien artikulazioan. Zenbat eta lehenago hasi halako elkarrizketak biderkatzen, orduan eta hobeto erantzungo diogu komunitate gisa egoerari, eta orduan eta bermatuago izango dugu ยซeuskararen etorkizunaยป. Ez dakit euskara batua sortu zenean hil ala bizikoa zen kontua, baina orain nahiko argi dut baietz, hizkuntza-aniztasuna, bioaniztasuna bezalaxe, maldan behera doa-eta.

Euskarak behar du bere sostengu materiala bermatzeaz hitz egiten duen hiztun komunitate sendo bat. Prozesu hori egiteko zer aliantza eta zer adostasun bilatuko duen eztabaidatzen ari dena. Elikadura-burujabetza helburu duena eta agroekologian trebatzen dena, lur emankorrak dituena. Kontsumitzen duen energia nondik lortzen duen dakien hiztun komunitatea behar du. Zeren euskarak ez baitu hiztunik ez badute jatekorik edo beharrizanak betetzeko energiarik, eta hamaika modu dago gaurtik hasita bide hori euskaraz eraikitzeko.

Zergatik ari gara Adimen Artifizialaz hainbeste hitz egiten? Noren poltsikoak betetzeko? Noren pare egoteko? Zein da ยซgaraiko erronkaยป?


[1] Adimen Artifiziala eta euskara, Patricia Barron Berria egunkarian.

[2] https://www.lehenhitza.eus/

[3] Energiaren sektorea omen da egun mundu-mailan isuri gehien eragiten dituena. Antonio Turiel itzalaldia dela-eta elkarrizketatu dute azkenaldian, eta euskaratuta dugu haren Petrokalipsia liburua.

[4] https://eu.wikipedia.org/wiki/Muga_planetarioak

[5] Minbiziaren diagnostikoa errazteko, kasu.

[6] AAren erabilera askoren kostu ekologikoa erabat aurreztu liteke, eta algoritmoak entrenatzeaz aparte ez dago argi zein den haien funtzioa.

[7] https://ace-traductores.org/manifiesto-de-la-cultura-ante-la-ia/

[8] Kontrastatzea lortu ez dudan adibide bat ematearren, mihigaiztoek diote besteak beste Teslaren jabe ernegagarria aberasteko entrenatzen ibili garela AA urteetan, Googleko captcha delakoetan trafiko-seinaleak identifikatu ditugun bakoitzean.

Musika euskal-nafarra eta postedizioa

Fernando Rey Escalera

Otsailaren 9an, igandearekin, Iruรฑeko Gayarre antzokira joan nintzen La Pamplonesak eman behar zuen kontzertu batera.

Sarreran orri bana eman ziguten, kontzertuaren programa zehazten zuena beste zenbait daturekin batera. Orria elebidun, behar den bezala. Kasu honetan, alde batetik gaztelaniaz eta bestetik euskaraz: duin, letra tamaina berarekin, espazio berdina emanez bi hizkuntzei. Eta, nire ohiturari jarraikiz, euskarazkoa irakurri nuen lehenbizi, nahiz eta jakin nire deformazio profesionalak zuzentzaile-lana egitera naramala maiz.

Testua euskara on samarrean egonagatik, begi-kolpea sentitu nuen berehalaxe, lehenbiziko paragrafoan hauxe irakurri bainuen:

La Pamplonesaren helburuetako bat egungo musika hedatzea da. Bestalde, Musikagileak Konpositoreen Elkarteak musika euskal-nafarra sustatzen du.

Harri eta zur gelditu nintzen, ezin sinetsiz, eta, askotan bezala, pentsatu nuen berriz: โ€œbeharrik badakidan gaztelaniaz; bestelaโ€ฆโ€. Eta buelta eman nion orriari, nire susmoa betetzen ote zen jakin nahian.

Eta asmatu. Bai, โ€œmรบsica vasco-navarraโ€. Honela zioen testuak:

Entre los objetivos de La Pamplonesa estรก la divulgaciรณn de la mรบsica actual. Por su parte, la Asociaciรณn de Compositores Musikagileak promociona la mรบsica vasco-navarra.

Harrigarria. Ederki dakit โ€œvasco-navarroโ€ adjektibo konposatua egon badagoela eta zenbait elkartek halako izena eman diotela beren buruari. Oso ongi. Baina, halakoetan, errealitate kulturalari kasu eginez, eta irakurketa politiko oro bazter utzirik, โ€œEuskal Herrikoโ€ erabili izan da. Horren erakusgarri argia da COAVN: Colegio Oficial de Arquitectos Vasco-Navarro / Euskal Herriko Arkitektoen Elkargo Ofiziala. Iruditzen zait itzultzaileok hala jokatu izan dugula, โ€œvasco-navarroโ€ horren gaineko iritzia edozein delarik ere.

Euskal-nafarra hori munstro txiki bat iruditzen zait, ikuspuntu askotatik gaizki sortua.

Baina nolatan agertu zen ditxosozko adjektibo hori txukun antzean zegoen itzulpen horretan?

Etxera ailegatu, eta intuizioak itzultzaile automatikoetara eraman ninduen.

Honela egiten dute esaldia gaur egungo itzultzaile automatiko neuronal erabilienetako batzuek:

Itzuli itzultzaile neuronala:
La Pamplonesaren helburuen artean, gaur egungo musikaren dibulgazioa dago. Bestalde, Musikagileak Konpositoreen Elkarteak euskal-nafar musika sustatzen du.
Elia:
La Pamplonesaren helburuen artean dago gaur egungo musika zabaltzea. Bestalde, Musikagileak Musikagileen Elkarteak Euskal Herriko musika sustatzen du.
Googleren traslator:
La Pamplonesaren helburuen artean musika garaikidearen zabalkundea dago. Musikagileak Konpositoreen Elkarteak bere aldetik euskal-nafar musika sustatzen du.

Hiru horietatik bik โ€œeuskal-nafarraโ€. Adierazgarria.

Berretsi zen, bada, nire errezeloa. Itzultzaile automatiko batek egin zuen itzulpena, eta itzultzaileak edo testuaz arduratu zenak, segur aski, ez zion behar bezalako errepasoa egin itzulpenari, ez zuen behar bezain zorrotz zuzendu testua. Postedizio lana esaten diogu gaur egun, ezta?

Luze hitz egin genezake orain itzultzaile neuronalez, haien alde on eta txarrez. Nik orain, ur sakonetan sartu gabe, lau hitz esanen ditut: iruditzen zait zilegi dela erabiltzea, errazten ahal digutela lana, gero eta hobeki funtzionatzen dutela, eta ez dugula zertan lotsatu haietaz baliatzeagatik, baina, jakina, halakoren bat erabiliz gero, zorrotz, oso zorrotz, zuzendu behar dugu gero. Ez da aski axaleko zuzenketa bat, oso ongi zaindu behar dugu ez dadila egon kalko desegokiz tantotua. Haiek erabili ondoko presakako zuzenketa arrisku handikoa izan daiteke baldin eta euskarazko testu ona egitea baldin bada helburua. Euskarazko hitzez mozorrotutako erdal testu bat sortzen ahal dugu, euskarazko senik gabeko lexikoa, sintaxia edo bestelako alderdiak dituena.

KonformismoAA

Ane Garmendia Alberdi

Azkenaldian, asko hitz egiten da adimen artifizialaz. Blog honetan ere zenbait bider jorratu den gaia da, hainbat ikuspegitatik. Nik aukera hau baliatu nahi nuke nire kezka nagusia azaltzeko. Egiari zor, adimen artifizialak berak baino gehiago kezkatzen nau gizakion ergelkeriak, axolagabekeriak eta denaz paso egiteko daukagun gaitasunak. Arriskutsua dena ez da adimen artifiziala, baizik eta gizakiak tresna hori erabiltzeko modua.

Duela urte asko, ikus-entzunezkoen munduan fansubs delakoak agertu ziren. Fansub hitza fan eta subtitled hitzen laburketa da, hau da, zaleek baimenik gabe eta irabazi asmorik gabe edo doan egindako azpidatziak dira. Hasieran, animea japonieratik beste hizkuntza batzuetara itzultzeko erabili ziren Estatu Batuetan, baina laster hedatu ziren Europara eta Asiara, baita beste hizkuntza-konbinazio batzuetara ere. Doan zirelako eta eskuragarri zeudelako, jende asko hasi zen horrelako edukiak ikusten eta enpresa batzuk ere azpidazle afizionatuen lana erabiltzen hasi ziren itzultzaile profesionalen kostua eta epeak murrizteko. Ez dago misterio handirik. Azpidatzi batzuk ondo eginda egongo ziren, ziurrenik, baina asko akatsez beteta zeuden: akats linguistikoak eta azpidatzien ezaugarri teknikoei buruzkoak. Nik azpidatzi kaskar batzuk ikusi eta pentsatu nuen hura ezin zezakeela inork irentsi. Nork ikusiko zuen hain gaizki itzuli eta azpidatzitako telesail bat? Bada, lagun batzuekin gaiari buruz hizketan, konturatu nintzen beste batzuek ez zutela halako exijentzia maila eta bost axola zitzaiela azpidatzien kalitatea. โ€œEsaten dutena gutxi gorabehera ulertzen bada, ni konforme. Eta gainera doan daโ€. Benetan, flipatuta gelditu nintzen. Ezin nuen ulertu. Orain barre egiten diot garai hartako Aneri. Gaixoa.

Eta fansubek ibilitako antzeko bidetik doa adimen artifizial sortzailea ere ikus-entzunezkoen alorrean. Askori berdin zaio jasotzen ari dena txukuna den ala ez; akats ortografikoak dituen ala ez; azpidatziak karakterez beteta daudelako irakurtezinak diren ala ez. Jende asko doakotasunera eta berehalakotasunera harpidetuta dago. Dena den, badago argi izpirik iluntasunean. Duela urte batzuk polemika galanta sortu zen Squid Game (Txibiaren jokoa) telesail hegokorearraren azpidatzi automatikoak zirela-eta. Antza, Netflixek koreeratik ingelesera itzuli zuen automatikoki, eta jarraian ingelesetik beste hizkuntza batzuetara, hori ere automatikoki. Protesta ugari egon zen, zalaparta handia, eta uste dut azkenean Netflixek azpidatzi horiek kendu behar izan zituela. Gora protesta.

Zoritxarrez, esango nuke euskararentzat egoera are larriagoa eta kezkagarriagoa dela. Sarri sentitu dut euskarara egindako itzulpenak izapide hutsa izan direla. Hemengo enpresa askok jatorrizko testua gaztelaniaz sortu eta euskarara itzultzeko itzulpen automatikoa erabiltzeak, hautu zehatz horrek, argi erakusten du ia inposatutako tramite bat dela beraientzat eta bost axola zaiela itzulpenaren kalitatea.  Axola ez zaizun zerbaitetan sosak gastatzea zaila da, jakina. Eta orain adimen artifiziala harribitxi gisa ikusten dute askok. Izapidea arin eta doan egiten duena. Ikus-entzunezkoen alorra ez da salbuespena eta egin dira eta egingo dira saiakerak edukien itzulpena ahalik eta gehien automatizatzeko. Hortxe egon behar dugu guk, erne, emaitzak aztertzeko eta euskarazko edukien kalitatea eta kopurua aldarrikatzeko. Eta horregatik tematzen naiz ni protesta egitearen kontuarekin.  Batzuetan alferrik izango da. Euskarazko eduki baten kritikak ez du sortuko Squid Game telesailak eragindako eztabaida, baina ez gaitezen konformistak izan eta egin dezagun protesta gure hizkuntza-eskubideen alde.

Itzultzaile neuronalak eragindako kexak

Maite Imaz Leunda

Eusko Jaurlaritzako Hizkuntza Politikako Sailburuordetzan lanean ari naizenez geroztik, herritarrek ingurune digitala dela-eta noizean behin bidaltzen dituzten kexak jasotzea ere egokitzen zait, eta kexa horiek ITZULI itzultzaile automatiko neuronalaren jarduerarekin izaten dute zerikusia batzuetan.

ITZULI itzultzaile neuronala 2019an jarri zuten herritarren eskura, eta, besteak beste, IDABA Eusko Jaurlaritzako itzulpenen datu-basearen erabilerak behera egin zuen. Ordura arte, EJko teknikariek bazuten IDABAra jotzeko ohitura, administrazioko fraseologia edo terminologia kontsultatzera, eta zegokion terminorako ordainik topatzen ez zutenean edo ordain bat baino gehiago topatzen zituztenean, DUDANET hizkuntza-zalantzak argitzeko zerbitzura ere jotzen zuten. Itzultzaile neuronala zabaldu zenean, ohiturak aldatu egin ziren: IDABAren erabilerak behera egin zuen.

Orain dela ia urtebete kexatu zen pertsona batek zioenez, discapacitado/a itzultzerakoan minusbaliatu eman zuen eta termino hori oso gaizki zegoen, desgaitasuna idatzi behar baita, desgaitasuna duen pertsona edo desgaitasunen bat duen pertsona. Kexaren helburua zen itzulpen tresna eguneratzea eta hobetzea.

Proba egin genuen, eta konturatu ginen ITZULI orokorra zela okerreko terminoa ematen zuena, ITZULI juridiko-administratiboak desgaitu ematen baitzuen. Gaur ere proba egin dut, kexa eragin zuen esaldi berarekin, eta ezindu eman dit bietan, orokorrean eta juridiko-administratiboan: ezindu ez da minusbaliatu bezain aldrebesa, baina ez da terminorik egokiena ere.

Ni saiatzen naiz azaltzen itzultzaile automatiko neuronalek ez dutela gizakiak bezala lan egiten, probabilitateetan eta algoritmoetan oinarritzen direla, gizakiek baino askoz ere azkarrago itzultzen dutela, baina esaldiz esaldi, testuingurua ezagutu gabe, eta akatsak egiten dituztela; ez dituztela terminoak askotan ondo ematen, ez dituztela sinonimoak bereizten; itzultzaile neuronalek datu asko behar dituztela entrenatzeko, eta zaila dela nola funtzionatzen duten kontrolatzea eta ulertzea; eguneratzea ez dela itzulpen-memoria bat eguneratzea bezain gauza sinplea; urtean behin edo bitan elikatzen eta eguneratzen dituztela, corpus elebidunak eta ordenagailu sendoak erabilita; corpusak bolumen nahikotxo izan behar duela, prozesuak bere denbora behar izaten duela eta bukatu ondoren probak egin behar direla kalitatea hobetu dela egiaztatzeko. Eta esaten diet itzultzaile automatiko neuronalak itzulitakoak beti-beti posteditatu behar direla. Baina ez dakit inor konbentzitzea lortzen ote dudan.

Aste honetan beste kexa bat jaso dugu eta betiko erantzuna eman diot, baina oraingo honetan poz pixka bat eragin dit kexak: Tutore klinikoak eta beste hainbat langilek (erizaina, hidroterapiako zaintzaileaโ€ฆ) itzultzerakoan, ITZULIk el tutor clรญnico y otros trabajadores (enfermeras, cuidadoras de hidroterapia itzuli du. Generoa kontuan hartu behar lukeela dio kexa egin duenak.

Nik proba egin dudanean, egiaztatu dut ITZULI orokorraren emaitza dela kexa eragin duena. ITZULI juridiko-administratiboak el tutor clรญnico y otros profesionales (enfermeros, cuidadores de hidroterapiaโ€ฆ eman dit. Ez dakit maskulino generikoa zuzenagoa den edo maskulino eta femenino estereotipatuak ematea bezain okerra den.

Poz pixka bat eragin didana kontsulta euskaratik gaztelaniara egina zegoela ikustea izan da. Itzulpengintzan ibiliak garenok susmoa izaten dugu neuronalaren erabilera euskararen kalterako izaten dela sarriegi.

Euskara hizkuntza ofizial bihurtu zenez geroztik, nabarmen ugaritu da euskara idatziaren zein ahozkoaren presentzia, eta ugaltze hori, hein handi batean, itzulpengintzari esker izan da. Itzultzaileek ekarpen handia egin dute administrazio-hizkera finkatu ahal izateko; euskarazko testu administratiboen eta teknikoen fraseologia eta terminologia itzulpengintzaren eskutik jorratu dira, neurri handi batean, urte hauetan guztietan. Eta hizkuntza finkatzeko prozesua ez da oraindik bukatu.

Itzultzaile automatiko neuronalen erabilera nagusitu denez geroztik, ordea, arrisku nabarmenak ikusten ditugu: itzultzaileen eta interpreteen bitartez euskarak orain arte irabaziak dituen espazioak adimen artifizialarekin sortutako hizkuntza-teknologiek ordeztekoa; eta horrek, jakina, kalte handia eragiten dio euskararen erabilerari eta kalitateari.

Baina euskara gehiago erabiltzeko eta euskarak espazio berriak irabaz ditzan aukera ere eskaintzen du itzultzaile automatiko neuronalak. Udalerri Euskaldunen Mankomunitateko udal batzuek beren langileen eskura jarri dituzte itzulpen neuronaleko tresnak, euskaraz sortutako testuak gaztelaniara eta beste hizkuntzetara automatikoki itzuli ahal izateko; edo barrurako den agiriren batek hizkuntza-eskakizunen derrigortasun-araudia betetzetik salbuetsita dagoen langileren bati eragiten dionean, eta langile horrek euskara-gaitasun nahikoa ez badu, udal-funtzionamendua ez trabatzeko itzulpen-tresna elektronikoetara jo dezan.

Nolanahi ere, tresna elektronikoak erabili ala ez, sustatu behar dena kalitatezko euskararen erabilera da.

Maritxu nora zoaz adimen artifizial horrekin?

Santi Leonรฉ

Proba egin nuen, baina ez dut frogarik (bai, nahita hasi dut horrela artikulua, proba eta froga elkarrengandik hurbil paratzeko): ez naiz oroitzen noiz egin nuen, ezta zein itzultzaile automatikotan ere. Badakit aski famatu zela sortu zelarik, mundu guziak โ€•tira, mundu gehienakโ€• erraten baitzuen arras ongi funtzionatzen zuela, eta segur aski horregatik berretsi nahi izan nuen hala ote zen. Baina, berriz diot, ez dut nire probaren frogarik, eta, hortaz, zilegi da testu honen irakurleek pentsatzea anekdota asmatu dudala; zilegi bekit niri honelako arrapostua ematea balizko irakurle sinesgogor horri: se non รจ vero, รจ ben trovato.

Nolanahi den ere, kontua da itzultzaile famatu hartan ondoko hitz hauek sartu nituela (edo, nahiago baduzu, irakurle mesfidati hori, artikulu hau idazte aldera hitz hauek sartu nituela asmatzea erabaki dudala): โ€œMaritxu nora zoaz, eder galant hori?โ€, eta itzultzaile automatiko hark honela bihurtu zidala esaldia: โ€œยฟA dรณnde vas maricรณn, guapo, guapo?โ€.

Kontatutakoa geratu zela sinetsi ala ez, uste dut mezua aski argi dagoela: denok ditugu โ€•ditukegu idaztekotan egon naiz, baina ez nuke gure hizkuntza zaila are gehiago zaildu nahiโ€• horrelako anekdotak edo istorioak; memorian anitz bilatu gabe ere, aise ematen ahalko genuke itzultzaile automatikoek edo adimen artifizialak egindako akats edo itzulpen traketsen berri. Diseinatzaileek ere salatu dute adimen artifizialaren bidez sorturiko irudietan ohikoa dela โ€•edo ez dela arraroa bederenโ€• jendeak hiru beso edo neurriz kanpoko hortz kopurua izatea.

Akats horiek guziak salatzea ongi dago, bistan dena, baina, azken buruan, argudio teknikoak dira. Beraz, denborak aitzinera egin ahala, segur aski teknikak berak konponduko dituen kontuak, aintzat hartzen badugu, bertzalde, adimen artifiziala ikasteko eta hobetzeko gauza dela. Argudio teknikoek iraungitze data dute.

Itzulpengintzari eta bertzenazko giza jarduerei dagokionez, iruzur handi bat dago adimen artifizialaren abiapuntuan, nire ustez. Errana ziguten adimen artifizialak ez zuela lanposturik galtzea ekarriko, baina halaber errana ziguten โ€•koherentzia faltari inolako beldurrik izan gabeโ€• lanposturik galtzekotan, lan mekanikoetako postuak galduko liratekeela eta horri esker gizakiok astia izanen genukeela zeregin sortzaileago eta asegarriagoak egiteko. Alta bada, gaur egun diseinatzaileak eta itzultzaileak ikusten ditut kezkaturik adimen artifizialaren ondorioak direla-eta; alegia, bi langile multzo, zeinen lana ez baita preseski mekanikoa.

Beharbada apokaliptiko paratzen ari naiz, baina ez zait batere kostatzen irudikatzea mundu bat, zeinean adimen artifiziala arduratzen baita liburuak sortzeaz, liburuak itzultzeaz eta liburuen kritika egiteaz. Panorama horretara daraman bidea ongi hasia dago, nire ustez: problema ez baita noizbait adimen artifizialak itzultzaileak โ€•edo diseinatzaileak, edo idazleakโ€ฆโ€• ez-beharrezkotzat joko dituela, problema da dagoenako badela horrelako jendilajea erredundantetzat eta ez-desiragarritzat jotzen duenik.

Itzulpengintza giza jarduera gisa aldarrikatu beharko genuke, gizaki egiten gaituzten jardueretako bat gisa. Makina batek itzulpen perfektuen eta aitzakiarik gabeena eginda ere, akats larria litzateke itzulpengintza haren esku uztea. Azken batean, arrunt ikuspuntu murrizgarria da pentsatzea itzulpen baten maila teknikoa dela itzulpen batean jokoan dagoen gauza bakarra. Nire ustez, hizkuntzekin zerikusia dutena makinen esku uztea lehen pausoa bertzerik ez da giza sorkuntza eta hari loturiko kritika-gaitasuna gugandik ebasteko eta gu lan mekanikoetara kondenatzeko. Errana diguten horren kontrakoa egiteko, hain zuzen ere.

Adimen artifiziala euskaraz

Maite Imaz Leunda

Common Voice Mozilla Fundazioak (kode irekiko Mozilla proiektuaren arduradun den irabazi asmorik gabeko erakundeak) abiarazitako lankidetza-proiektua da, ahots-grabaziozko datu-base libre bat sortzeko, horrekin kode irekiko ahots ezagutzailea (speech-to-text motorra) lortzeko hainbat hizkuntzatan. Boluntarioek mikrofono batekin grabatzen dituzte esaldiak eta grabazioak beste erabiltzaile batzuek berrikusten dituzte. Transkribatutako esaldiak ahotsezko datu-base batean jasotzen dira, jabari publikozko lizentziapean. Lizentzia horrek ziurtatzen du edozein garatzailek datu-basea erabil dezakeela ahotsetik testurako aplikazioetarako, mugarik edo kosturik gabe.

Euskarari dagokionez, Librezale euskara informatikaren munduan bultzatzea helburu duen lantaldea hasi zen sustapena ematen eta grabazioak egiten. Geroago Eusko Jaurlaritzako Hizkuntza Politikako Sailburuordetzak bultzada ematea erabaki zuen eta hainbat urrats egin ziren 2023an; egitasmoaren aurkezpen publikoa egin zen Tabakaleran eta horren inguruko hainbat publizitate egitasmo: spota komunikabideetan, Euskal Irrati Telebistako Gaitu-eguna, Grabazio maratoia hiriburuetan eta hainbat herritan, erronka bideratu zen ahotsak biltzeko proiektua bultzatzeko.

Bultzadaren ondorioz, boluntarioen kopuruak goraldia izan zuen, baina geroztik geldi samar dago. Gaur egun 10.000 hiztunetik gora daude erregistratuta eta 665 ordu grabatuta. Ekimenaren berri etengabe eman beharra dago jendeak ekarpenak egin ditzan. Ahots asko eta askotarikoak behar dira, adin tarte, genero eta mota guztietakoak. Milaka ahots behar dira eta milaka grabazio ordu euskaraz.

Kode irekiko ahots ezagutzailea librea izatean, edonork, hemengo eragileek zein beste enpresa teknologiko handiek, erabili ahal izango du garapenak egiteko.

Adimen artifizialak ekar ditzakeen abantailak handiak dira. Euskal Herrian badira adimen artifiziala eta euskara jorratzen ari diren ikertzaileak; esaterako, ahozko desgaitasuna duten pertsonen komunikazioa erraztuko duten sintesi-teknologien garapenean, ahots pertsonalizatuen sintesia lortzeko; edo ahotsaren transkripzio automatiko elebidunak egingo dituen tresnak garatzen, ahozko jarduna bi hizkuntzatan egiten den kasuetarako; edo euskara ikasten ari direnentzako txatbotak, ikasleek makinekin euskarazko elkarrizketak eduki ahal izan ditzaten.

Adimen artifizialaren arriskuak ere nabarmenak dira, ordea, modu desegokian erabiliz gero. Itzultzaileen eta interpreteen lana arriskuan egon daiteke itzultzaile automatiko neuronalak eta transkribatzaile automatikoak lagungarri gisa erabili beharrean profesionalen lana ordezkatzeko erabiltzen badira. Behin eta berriz esan beharra dago teknologia berrien egitekoa ez dela soilik euskara ikusgarriago egitea eta zabaltzea, kalitatezko euskara erabiltzea eta zabaltzea baizik.

Baina bada erabilera desegokiarena baino arrisku handiagoa: adimen artifizialean euskara ez sartzea eta ingurune digitaletik kanpo geratzea, alegia. Adimen artifizialaren kontrako ahotsak entzuten dira esanez hizkuntza gutxituak babestu egin behar direla. Baina adimen artifizialari uko egitea eta adimen artifizialetik kanpo gelditzea ez da euskara babestea. Orain dela hamarkada batzuk ere baziren euskara batuaren kontra zeudenak euskalkiak babestu behar omen zirelako, baina euskara batua sortu ezean euskarak berak bizirik irautea zen jokoan zegoena.

Teknologia digitaletan ingelesa eta beste hizkuntza nagusi batzuk izaten ari diren bilakaera azkarra baldintza beretan egin ezin duten hizkuntzek desagertze digitalerako zorian eta arrisku larrian egon daitezke. Hizkuntza digitaletan dauden ezberdintasunak mehatxu larria dira hizkuntza-aniztasunarentzat.

Gaur egungo egoerari begira, irtenbide digital aurreratuetarako behar den euskararen corpus digitala oso txikia da. Euskarazko corpus digitala izatea estrategikoa da hizkuntza-eredu eta aplikazio digital aurreratuak garatzeko ezinbesteko abiapuntua delako, eta datuak estrategikoak dira teknologia garatzeko.

Adimen Artifiziala hemen daukagu eta euskaraz egiten ez badu euskal hiztunek beste hizkuntza batzuetara joko dute. Hizkuntza gutxitu batek bere egiten ez duen esparrua inguruko hizkuntza hegemonikoek bereganatzen dute.

Adimen artifiziala: interpreteen akabera ote?

Maitane Uriarte Atxikallende

Denok dakigu adimen artifizialaren eta oro har teknologiaren bilakaerarekin lanpostu batzuk desagertuko direla. Tira, beharbada desagertu-desagertu ez, baina funtzio horiek pertsonek bete ordez, makinek egingo dituzte, denborarekin. Terminator-en garaiak iritsi bitartean, askoren artean beldurra da nagusi, eta interpreteak ez gara salbuespena.

Interpreteok askotan galdetu izan diogu geure buruari adimen artifizialak lana kenduko ote digun eta apokalipsia noiz iritsiko zaigun. Beteranoek beraiek ikusiko ez dutela diote, baina gazteoi tokatuko zaigula. Bien bitartean, adimen artifizialarekin egindako saiakerei adi gabiltza, emaitzak nolakoak diren ikusten eta, batez ere, bezeroen gogobetetasunari erreparatzen. Izan ere, niretzat hortxe dago koska: bezeroak adimen artifizialak emandako itzulpenarekin konformatzen direnean eta patriketatik sos gutxiago kentzen dizkiela ikusten dutenean, orduan etorriko da hezur-haragizko interprete askoren akabera. Nik ez diot adimen artifizialak egindako itzulpenak txarrak direnik, ez horixe, baina ez du kasuen % 100ean funtzionatzen. Aldibereko interpretazioaren kasuan, adimen artifizialak itzulpenak egiten ditu baina ez du jatorrizko bertsioaren รฑabardura oro giza burmuinak bezala interpretatzen. Zer egingo du adimen artifizialak hizlariak esaldiak bukatu gabe uzten dituen guztietan, metaforak eta hitz-jokoak agertzen direnean, esaldiak luzeak direnean eta xede-hizkuntzan elementuak josteko aldez aurreko jakintza behar denean? Eta niretzat berebizikoa den zerbait: zer gertatuko da hizlariak emozioak transmititzen dituenean edo hartzaileekin konektatu nahi duenean? Pantaila batean agertuko da itzulpena, eta, kasurik onenean, ahots robotiko batek emango du itzulpena, Monegroseko basamortua baino lauagoa den ahots batek. Agur emozioak transmititzearen eta kultura zein errealitate desberdinetako jendea konektatzearen magiari. Hala ere, arestian esandakora bueltatuz, bezeroa horrekin konformatzen bada, batez ere merkeago ateratzen zaiolakoโ€ฆ bost axola aldibereko interpretazioaren magia.

Momentuz, gauza batekin kontsolatuko naiz. Aldibereko interpretazio-kasuetarako adimen artifiziala hizkuntza handiekin elikatzen ari dira gehienbat, eta euskararekin emaitza โ€œonargarriakโ€ ikusi arte denbora luzea igaroko dela esango nuke. Interpreteok saiakerei adi gabiltza, eta, behin, adimen artifizialarekin gaztelaniatik euskarara eskainitako interpretazio-zerbitzu baten argazkiak bidali zizkiguten. Gure iritzi zintzoa ezagutu nahi? โ€œTierra trรกgame, hau auzo-lotsaโ€. Edo tira, makina hark pantailan erakutsiko lukeen bezala, โ€œLurra irents nazazu, esto es vergรผenza de barrioโ€. Hortxe utziko dut. Eta ez diot nik bakarrik, areto hartan zeuden euskal hiztunak ere amorru bizian atera omen baitziren.

Itzuli beharreko testu idatzien eta interpretatu beharreko ahozko ekoizpenaren arteko aldea begien bistakoa den bezalaxe, adimen artifizialak baterako eta besterako suposa lezakeen arriskua ere halakoa da. Gehienetan, testu idatziak ondo idatzita egoten dira eta, beraz, errazagoa da horiek adimen artifizialarekin itzuli eta emaitza onargarria โ€“eta batzuetan, oso onaโ€“ ematea; ahozko ekoizpenaren kasuan, berriz, jatorrizkoa ez da perfektua izaten โ€“inork ez duelako idazten duen bezala hitz egitenโ€“ eta, gainera, interpreteok sarritan esan ohi dugu euskal hizlari askori erretorika-eskolak falta zaizkiola. Ahozko ekoizpenaren kasuan, adimen artifizialik onena ere zora daitekeela esango nuke, eta horri arestian adierazitako emozioen transmisioaren afera gehitu behar zaio.

Laburbilduz, momentuz interpretazioaren kasuan eta batez ere euskarazko interpretazioaren kasuan salbatzen garela esango nuke, baina denborak erakutsiko digu lurrak irentsiko gaituen ala ez.