Itzultzaile neuronalak eragindako kexak

Maite Imaz Leunda

Eusko Jaurlaritzako Hizkuntza Politikako Sailburuordetzan lanean ari naizenez geroztik, herritarrek ingurune digitala dela-eta noizean behin bidaltzen dituzten kexak jasotzea ere egokitzen zait, eta kexa horiek ITZULI itzultzaile automatiko neuronalaren jarduerarekin izaten dute zerikusia batzuetan.

ITZULI itzultzaile neuronala 2019an jarri zuten herritarren eskura, eta, besteak beste, IDABA Eusko Jaurlaritzako itzulpenen datu-basearen erabilerak behera egin zuen. Ordura arte, EJko teknikariek bazuten IDABAra jotzeko ohitura, administrazioko fraseologia edo terminologia kontsultatzera, eta zegokion terminorako ordainik topatzen ez zutenean edo ordain bat baino gehiago topatzen zituztenean, DUDANET hizkuntza-zalantzak argitzeko zerbitzura ere jotzen zuten. Itzultzaile neuronala zabaldu zenean, ohiturak aldatu egin ziren: IDABAren erabilerak behera egin zuen.

Orain dela ia urtebete kexatu zen pertsona batek zioenez, discapacitado/a itzultzerakoan minusbaliatu eman zuen eta termino hori oso gaizki zegoen, desgaitasuna idatzi behar baita, desgaitasuna duen pertsona edo desgaitasunen bat duen pertsona. Kexaren helburua zen itzulpen tresna eguneratzea eta hobetzea.

Proba egin genuen, eta konturatu ginen ITZULI orokorra zela okerreko terminoa ematen zuena, ITZULI juridiko-administratiboak desgaitu ematen baitzuen. Gaur ere proba egin dut, kexa eragin zuen esaldi berarekin, eta ezindu eman dit bietan, orokorrean eta juridiko-administratiboan: ezindu ez da minusbaliatu bezain aldrebesa, baina ez da terminorik egokiena ere.

Ni saiatzen naiz azaltzen itzultzaile automatiko neuronalek ez dutela gizakiak bezala lan egiten, probabilitateetan eta algoritmoetan oinarritzen direla, gizakiek baino askoz ere azkarrago itzultzen dutela, baina esaldiz esaldi, testuingurua ezagutu gabe, eta akatsak egiten dituztela; ez dituztela terminoak askotan ondo ematen, ez dituztela sinonimoak bereizten; itzultzaile neuronalek datu asko behar dituztela entrenatzeko, eta zaila dela nola funtzionatzen duten kontrolatzea eta ulertzea; eguneratzea ez dela itzulpen-memoria bat eguneratzea bezain gauza sinplea; urtean behin edo bitan elikatzen eta eguneratzen dituztela, corpus elebidunak eta ordenagailu sendoak erabilita; corpusak bolumen nahikotxo izan behar duela, prozesuak bere denbora behar izaten duela eta bukatu ondoren probak egin behar direla kalitatea hobetu dela egiaztatzeko. Eta esaten diet itzultzaile automatiko neuronalak itzulitakoak beti-beti posteditatu behar direla. Baina ez dakit inor konbentzitzea lortzen ote dudan.

Aste honetan beste kexa bat jaso dugu eta betiko erantzuna eman diot, baina oraingo honetan poz pixka bat eragin dit kexak: Tutore klinikoak eta beste hainbat langilek (erizaina, hidroterapiako zaintzaileaโ€ฆ) itzultzerakoan, ITZULIk el tutor clรญnico y otros trabajadores (enfermeras, cuidadoras de hidroterapia itzuli du. Generoa kontuan hartu behar lukeela dio kexa egin duenak.

Nik proba egin dudanean, egiaztatu dut ITZULI orokorraren emaitza dela kexa eragin duena. ITZULI juridiko-administratiboak el tutor clรญnico y otros profesionales (enfermeros, cuidadores de hidroterapiaโ€ฆ eman dit. Ez dakit maskulino generikoa zuzenagoa den edo maskulino eta femenino estereotipatuak ematea bezain okerra den.

Poz pixka bat eragin didana kontsulta euskaratik gaztelaniara egina zegoela ikustea izan da. Itzulpengintzan ibiliak garenok susmoa izaten dugu neuronalaren erabilera euskararen kalterako izaten dela sarriegi.

Euskara hizkuntza ofizial bihurtu zenez geroztik, nabarmen ugaritu da euskara idatziaren zein ahozkoaren presentzia, eta ugaltze hori, hein handi batean, itzulpengintzari esker izan da. Itzultzaileek ekarpen handia egin dute administrazio-hizkera finkatu ahal izateko; euskarazko testu administratiboen eta teknikoen fraseologia eta terminologia itzulpengintzaren eskutik jorratu dira, neurri handi batean, urte hauetan guztietan. Eta hizkuntza finkatzeko prozesua ez da oraindik bukatu.

Itzultzaile automatiko neuronalen erabilera nagusitu denez geroztik, ordea, arrisku nabarmenak ikusten ditugu: itzultzaileen eta interpreteen bitartez euskarak orain arte irabaziak dituen espazioak adimen artifizialarekin sortutako hizkuntza-teknologiek ordeztekoa; eta horrek, jakina, kalte handia eragiten dio euskararen erabilerari eta kalitateari.

Baina euskara gehiago erabiltzeko eta euskarak espazio berriak irabaz ditzan aukera ere eskaintzen du itzultzaile automatiko neuronalak. Udalerri Euskaldunen Mankomunitateko udal batzuek beren langileen eskura jarri dituzte itzulpen neuronaleko tresnak, euskaraz sortutako testuak gaztelaniara eta beste hizkuntzetara automatikoki itzuli ahal izateko; edo barrurako den agiriren batek hizkuntza-eskakizunen derrigortasun-araudia betetzetik salbuetsita dagoen langileren bati eragiten dionean, eta langile horrek euskara-gaitasun nahikoa ez badu, udal-funtzionamendua ez trabatzeko itzulpen-tresna elektronikoetara jo dezan.

Nolanahi ere, tresna elektronikoak erabili ala ez, sustatu behar dena kalitatezko euskararen erabilera da.

Maritxu nora zoaz adimen artifizial horrekin?

Santi Leonรฉ

Proba egin nuen, baina ez dut frogarik (bai, nahita hasi dut horrela artikulua, proba eta froga elkarrengandik hurbil paratzeko): ez naiz oroitzen noiz egin nuen, ezta zein itzultzaile automatikotan ere. Badakit aski famatu zela sortu zelarik, mundu guziak โ€•tira, mundu gehienakโ€• erraten baitzuen arras ongi funtzionatzen zuela, eta segur aski horregatik berretsi nahi izan nuen hala ote zen. Baina, berriz diot, ez dut nire probaren frogarik, eta, hortaz, zilegi da testu honen irakurleek pentsatzea anekdota asmatu dudala; zilegi bekit niri honelako arrapostua ematea balizko irakurle sinesgogor horri: se non รจ vero, รจ ben trovato.

Nolanahi den ere, kontua da itzultzaile famatu hartan ondoko hitz hauek sartu nituela (edo, nahiago baduzu, irakurle mesfidati hori, artikulu hau idazte aldera hitz hauek sartu nituela asmatzea erabaki dudala): โ€œMaritxu nora zoaz, eder galant hori?โ€, eta itzultzaile automatiko hark honela bihurtu zidala esaldia: โ€œยฟA dรณnde vas maricรณn, guapo, guapo?โ€.

Kontatutakoa geratu zela sinetsi ala ez, uste dut mezua aski argi dagoela: denok ditugu โ€•ditukegu idaztekotan egon naiz, baina ez nuke gure hizkuntza zaila are gehiago zaildu nahiโ€• horrelako anekdotak edo istorioak; memorian anitz bilatu gabe ere, aise ematen ahalko genuke itzultzaile automatikoek edo adimen artifizialak egindako akats edo itzulpen traketsen berri. Diseinatzaileek ere salatu dute adimen artifizialaren bidez sorturiko irudietan ohikoa dela โ€•edo ez dela arraroa bederenโ€• jendeak hiru beso edo neurriz kanpoko hortz kopurua izatea.

Akats horiek guziak salatzea ongi dago, bistan dena, baina, azken buruan, argudio teknikoak dira. Beraz, denborak aitzinera egin ahala, segur aski teknikak berak konponduko dituen kontuak, aintzat hartzen badugu, bertzalde, adimen artifiziala ikasteko eta hobetzeko gauza dela. Argudio teknikoek iraungitze data dute.

Itzulpengintzari eta bertzenazko giza jarduerei dagokionez, iruzur handi bat dago adimen artifizialaren abiapuntuan, nire ustez. Errana ziguten adimen artifizialak ez zuela lanposturik galtzea ekarriko, baina halaber errana ziguten โ€•koherentzia faltari inolako beldurrik izan gabeโ€• lanposturik galtzekotan, lan mekanikoetako postuak galduko liratekeela eta horri esker gizakiok astia izanen genukeela zeregin sortzaileago eta asegarriagoak egiteko. Alta bada, gaur egun diseinatzaileak eta itzultzaileak ikusten ditut kezkaturik adimen artifizialaren ondorioak direla-eta; alegia, bi langile multzo, zeinen lana ez baita preseski mekanikoa.

Beharbada apokaliptiko paratzen ari naiz, baina ez zait batere kostatzen irudikatzea mundu bat, zeinean adimen artifiziala arduratzen baita liburuak sortzeaz, liburuak itzultzeaz eta liburuen kritika egiteaz. Panorama horretara daraman bidea ongi hasia dago, nire ustez: problema ez baita noizbait adimen artifizialak itzultzaileak โ€•edo diseinatzaileak, edo idazleakโ€ฆโ€• ez-beharrezkotzat joko dituela, problema da dagoenako badela horrelako jendilajea erredundantetzat eta ez-desiragarritzat jotzen duenik.

Itzulpengintza giza jarduera gisa aldarrikatu beharko genuke, gizaki egiten gaituzten jardueretako bat gisa. Makina batek itzulpen perfektuen eta aitzakiarik gabeena eginda ere, akats larria litzateke itzulpengintza haren esku uztea. Azken batean, arrunt ikuspuntu murrizgarria da pentsatzea itzulpen baten maila teknikoa dela itzulpen batean jokoan dagoen gauza bakarra. Nire ustez, hizkuntzekin zerikusia dutena makinen esku uztea lehen pausoa bertzerik ez da giza sorkuntza eta hari loturiko kritika-gaitasuna gugandik ebasteko eta gu lan mekanikoetara kondenatzeko. Errana diguten horren kontrakoa egiteko, hain zuzen ere.

Adimen artifiziala euskaraz

Maite Imaz Leunda

Common Voice Mozilla Fundazioak (kode irekiko Mozilla proiektuaren arduradun den irabazi asmorik gabeko erakundeak) abiarazitako lankidetza-proiektua da, ahots-grabaziozko datu-base libre bat sortzeko, horrekin kode irekiko ahots ezagutzailea (speech-to-text motorra) lortzeko hainbat hizkuntzatan. Boluntarioek mikrofono batekin grabatzen dituzte esaldiak eta grabazioak beste erabiltzaile batzuek berrikusten dituzte. Transkribatutako esaldiak ahotsezko datu-base batean jasotzen dira, jabari publikozko lizentziapean. Lizentzia horrek ziurtatzen du edozein garatzailek datu-basea erabil dezakeela ahotsetik testurako aplikazioetarako, mugarik edo kosturik gabe.

Euskarari dagokionez, Librezale euskara informatikaren munduan bultzatzea helburu duen lantaldea hasi zen sustapena ematen eta grabazioak egiten. Geroago Eusko Jaurlaritzako Hizkuntza Politikako Sailburuordetzak bultzada ematea erabaki zuen eta hainbat urrats egin ziren 2023an; egitasmoaren aurkezpen publikoa egin zen Tabakaleran eta horren inguruko hainbat publizitate egitasmo: spota komunikabideetan, Euskal Irrati Telebistako Gaitu-eguna, Grabazio maratoia hiriburuetan eta hainbat herritan, erronka bideratu zen ahotsak biltzeko proiektua bultzatzeko.

Bultzadaren ondorioz, boluntarioen kopuruak goraldia izan zuen, baina geroztik geldi samar dago. Gaur egun 10.000 hiztunetik gora daude erregistratuta eta 665 ordu grabatuta. Ekimenaren berri etengabe eman beharra dago jendeak ekarpenak egin ditzan. Ahots asko eta askotarikoak behar dira, adin tarte, genero eta mota guztietakoak. Milaka ahots behar dira eta milaka grabazio ordu euskaraz.

Kode irekiko ahots ezagutzailea librea izatean, edonork, hemengo eragileek zein beste enpresa teknologiko handiek, erabili ahal izango du garapenak egiteko.

Adimen artifizialak ekar ditzakeen abantailak handiak dira. Euskal Herrian badira adimen artifiziala eta euskara jorratzen ari diren ikertzaileak; esaterako, ahozko desgaitasuna duten pertsonen komunikazioa erraztuko duten sintesi-teknologien garapenean, ahots pertsonalizatuen sintesia lortzeko; edo ahotsaren transkripzio automatiko elebidunak egingo dituen tresnak garatzen, ahozko jarduna bi hizkuntzatan egiten den kasuetarako; edo euskara ikasten ari direnentzako txatbotak, ikasleek makinekin euskarazko elkarrizketak eduki ahal izan ditzaten.

Adimen artifizialaren arriskuak ere nabarmenak dira, ordea, modu desegokian erabiliz gero. Itzultzaileen eta interpreteen lana arriskuan egon daiteke itzultzaile automatiko neuronalak eta transkribatzaile automatikoak lagungarri gisa erabili beharrean profesionalen lana ordezkatzeko erabiltzen badira. Behin eta berriz esan beharra dago teknologia berrien egitekoa ez dela soilik euskara ikusgarriago egitea eta zabaltzea, kalitatezko euskara erabiltzea eta zabaltzea baizik.

Baina bada erabilera desegokiarena baino arrisku handiagoa: adimen artifizialean euskara ez sartzea eta ingurune digitaletik kanpo geratzea, alegia. Adimen artifizialaren kontrako ahotsak entzuten dira esanez hizkuntza gutxituak babestu egin behar direla. Baina adimen artifizialari uko egitea eta adimen artifizialetik kanpo gelditzea ez da euskara babestea. Orain dela hamarkada batzuk ere baziren euskara batuaren kontra zeudenak euskalkiak babestu behar omen zirelako, baina euskara batua sortu ezean euskarak berak bizirik irautea zen jokoan zegoena.

Teknologia digitaletan ingelesa eta beste hizkuntza nagusi batzuk izaten ari diren bilakaera azkarra baldintza beretan egin ezin duten hizkuntzek desagertze digitalerako zorian eta arrisku larrian egon daitezke. Hizkuntza digitaletan dauden ezberdintasunak mehatxu larria dira hizkuntza-aniztasunarentzat.

Gaur egungo egoerari begira, irtenbide digital aurreratuetarako behar den euskararen corpus digitala oso txikia da. Euskarazko corpus digitala izatea estrategikoa da hizkuntza-eredu eta aplikazio digital aurreratuak garatzeko ezinbesteko abiapuntua delako, eta datuak estrategikoak dira teknologia garatzeko.

Adimen Artifiziala hemen daukagu eta euskaraz egiten ez badu euskal hiztunek beste hizkuntza batzuetara joko dute. Hizkuntza gutxitu batek bere egiten ez duen esparrua inguruko hizkuntza hegemonikoek bereganatzen dute.

Adimen artifiziala: interpreteen akabera ote?

Maitane Uriarte Atxikallende

Denok dakigu adimen artifizialaren eta oro har teknologiaren bilakaerarekin lanpostu batzuk desagertuko direla. Tira, beharbada desagertu-desagertu ez, baina funtzio horiek pertsonek bete ordez, makinek egingo dituzte, denborarekin. Terminator-en garaiak iritsi bitartean, askoren artean beldurra da nagusi, eta interpreteak ez gara salbuespena.

Interpreteok askotan galdetu izan diogu geure buruari adimen artifizialak lana kenduko ote digun eta apokalipsia noiz iritsiko zaigun. Beteranoek beraiek ikusiko ez dutela diote, baina gazteoi tokatuko zaigula. Bien bitartean, adimen artifizialarekin egindako saiakerei adi gabiltza, emaitzak nolakoak diren ikusten eta, batez ere, bezeroen gogobetetasunari erreparatzen. Izan ere, niretzat hortxe dago koska: bezeroak adimen artifizialak emandako itzulpenarekin konformatzen direnean eta patriketatik sos gutxiago kentzen dizkiela ikusten dutenean, orduan etorriko da hezur-haragizko interprete askoren akabera. Nik ez diot adimen artifizialak egindako itzulpenak txarrak direnik, ez horixe, baina ez du kasuen % 100ean funtzionatzen. Aldibereko interpretazioaren kasuan, adimen artifizialak itzulpenak egiten ditu baina ez du jatorrizko bertsioaren รฑabardura oro giza burmuinak bezala interpretatzen. Zer egingo du adimen artifizialak hizlariak esaldiak bukatu gabe uzten dituen guztietan, metaforak eta hitz-jokoak agertzen direnean, esaldiak luzeak direnean eta xede-hizkuntzan elementuak josteko aldez aurreko jakintza behar denean? Eta niretzat berebizikoa den zerbait: zer gertatuko da hizlariak emozioak transmititzen dituenean edo hartzaileekin konektatu nahi duenean? Pantaila batean agertuko da itzulpena, eta, kasurik onenean, ahots robotiko batek emango du itzulpena, Monegroseko basamortua baino lauagoa den ahots batek. Agur emozioak transmititzearen eta kultura zein errealitate desberdinetako jendea konektatzearen magiari. Hala ere, arestian esandakora bueltatuz, bezeroa horrekin konformatzen bada, batez ere merkeago ateratzen zaiolakoโ€ฆ bost axola aldibereko interpretazioaren magia.

Momentuz, gauza batekin kontsolatuko naiz. Aldibereko interpretazio-kasuetarako adimen artifiziala hizkuntza handiekin elikatzen ari dira gehienbat, eta euskararekin emaitza โ€œonargarriakโ€ ikusi arte denbora luzea igaroko dela esango nuke. Interpreteok saiakerei adi gabiltza, eta, behin, adimen artifizialarekin gaztelaniatik euskarara eskainitako interpretazio-zerbitzu baten argazkiak bidali zizkiguten. Gure iritzi zintzoa ezagutu nahi? โ€œTierra trรกgame, hau auzo-lotsaโ€. Edo tira, makina hark pantailan erakutsiko lukeen bezala, โ€œLurra irents nazazu, esto es vergรผenza de barrioโ€. Hortxe utziko dut. Eta ez diot nik bakarrik, areto hartan zeuden euskal hiztunak ere amorru bizian atera omen baitziren.

Itzuli beharreko testu idatzien eta interpretatu beharreko ahozko ekoizpenaren arteko aldea begien bistakoa den bezalaxe, adimen artifizialak baterako eta besterako suposa lezakeen arriskua ere halakoa da. Gehienetan, testu idatziak ondo idatzita egoten dira eta, beraz, errazagoa da horiek adimen artifizialarekin itzuli eta emaitza onargarria โ€“eta batzuetan, oso onaโ€“ ematea; ahozko ekoizpenaren kasuan, berriz, jatorrizkoa ez da perfektua izaten โ€“inork ez duelako idazten duen bezala hitz egitenโ€“ eta, gainera, interpreteok sarritan esan ohi dugu euskal hizlari askori erretorika-eskolak falta zaizkiola. Ahozko ekoizpenaren kasuan, adimen artifizialik onena ere zora daitekeela esango nuke, eta horri arestian adierazitako emozioen transmisioaren afera gehitu behar zaio.

Laburbilduz, momentuz interpretazioaren kasuan eta batez ere euskarazko interpretazioaren kasuan salbatzen garela esango nuke, baina denborak erakutsiko digu lurrak irentsiko gaituen ala ez.

Hizkuntza-teknologiak eta sedentarismo kognitiboa

Igone Zabala Unzalu

Adimen artifizialaren garapenak gizakion bizimoduari ekarriko dizkion onura eta arriskuei buruzko eztabaidan, bada gogoeta-ildo bat biziki interesgarria iruditzen zaidana, alegia, teknologien garapenak gure bizimodua erraztearekin batera dakarkigun gaitasun-galerarena. Ildo horretatik, Sigmanek eta Bilinkisek[1] diote egun teknologia berrien ondorioz funtsezko zenbait gaitasun galtzeko arriskua dugula gizakiok. Kontzentratzeko gaitasuna, irakurmena, hizkuntzaren erabilera egokia eta pentsamendu logiko-matematikoa kognizioaren oinarrizko zutabetzat hartzen dituzte, eta sedentarismo kognitibo deritzote kalkulu errazak egiteko, arreta mantentzeko edota problema zail bat ebatzi nahian denbora-tarte batez ahalegina egiteko gaitasuna galtzeari. Egun, teknologia berriek ataza ugari azkar eta ahalegin handirik gabe egiten laguntzen digute, baina ahalegin intelektuala eta adimena kitzikatzen duten jarduerak murrizteko arriskua ere badakarte. Hizkuntzaren erabilera egokia lantzeko garrantzitsua da ahalegin intelektual nabarmena eskatzen digun gogoeta metalinguistikoa.

Garbi dago euskara bezalako hizkuntza gutxituak teknologien garapenaren lasterketan atzean geratuz gero erabat handituko dela desagertzeko arriskua. Tresna digitalak solaskide ditugu gero eta gehiago, solaskide onak, gainera. Telefonoaren, tabletaren edota ordenagailuaren aplikazio gehienekin euskaraz aritu gaitezke egun. Lorpen izugarria da, dudarik gabe, baina zenbat euskaldunek egiten dute ahalegina lehenetsitako hizkuntza modura euskara jartzeko? Gure artean erabiltzen ditugun webgune, plataforma eta aplikazio gehienek gaztelania edo ingelesa eskaintzen digute lehenetsitako hizkuntza modura. Hartara, hizkuntza aldatzeko ahalegina egin behar dugu euskaraz aritu nahi dugun erabiltzaileok, baina nire ikasleen artean, adibidez, oso gutxi dira beren gailu eta aplikazioetan hizkuntza nola aldatu dakitenak, eta are gutxiago euskara lehenesteko ahalegina egiten dutenak. Lehenetsitako hizkuntza modura euskara agertuko balitzaigu beti, ziur naiz euskaldun gehienok ez genukeela hizkuntza aldatuko, eta euskara ulertzeko gauza ez direnek, aldiz, berehala bilatuko luketela interfazea edo aplikazioa ulertzen duten hizkuntza batean jartzeko modua.

Aspaldiko lankide batek ikasleei testuak eskuz idazteko eskatzen zien, ortografia-zuzentzailearen laguntzarik gabe testu zuzenak idazteko gaitasuna gara zezaten. Adituek diote eskuz idazteak eragina duela garapen kognitiboan eta motrizitatean, baita irakurmenaren jabekuntzan ere, baina, egun, adin batetik aurrera gehienetan ez du zentzurik testuak eskuz idazteak. Guk ikasleei zuzentzaile automatikoa beti aktibatuta izateko esaten diegu lehen egunetik, eta horren laguntza aprobetxatzeko, betiere proposamenekin kritiko izanda eta zuzentzailearen mugak ezagututa. Zuzentzaileak laguntzen digu zenbait akatsez ohartzen, baina, aldi berean, kritiko izan behar dugu egiten dizkigun proposamenekin, zenbaitetan gure testuingururako desegokiak baitira. Hortaz, zuzentzaile automatikoak gogoeta metalinguistikoa eskatzen diguten hizkuntza lantzeko laguntzaile onak direla esan daiteke. Hala eta guztiz ere, askotan ikusten ditugu ikasleak ordenagailu-gelan testu osoa gorriz azpimarratuta ari direla idazten, edota zuzentzailea aktibatu gabe idatzitako txostena bidaltzen digutela. Klik pare bat egiteko nagia eragiten dien sedentarismoa ote? Jadanik 30 urte bete dituen gure Xuxen maiteari buruz esan daitekeena da txiki-txikia dela oraindik, eta, webgunean besterik esaten bada ere, ez duela zuzentzen ez gramatika ez eta puntuazioa ere. Suposatzen dut interes edo finantzabide falta dagoela garapen ezaren atzean, baina uste dut erabat garatutako Xuxen laguntza paregabea izan zitekeela euskaldunen hizkuntza-ezagutza handitzeko.

Bitartean, sare neuronalek, hizkuntza-ereduek eta txatbotek aurrea hartu diote Xuxeni. Itzultzaile neuronalek laguntza paregabea ematen digute testu elebidunak sortzeko euskaldunok maiz izaten dugun lan nekezerako. Idatzi behar dugun gutun edo txosten hori euskaraz sor dezakegu lasai, eta beste hizkuntzetako bertsiorako itzultzaile neuronalen laguntza baliatu. Badakigu itzulpena ontzat emateko sakonki berrikusi behar dugula, baina orri zuriari aurre egitea baino askoz ere erosoago egiten zaigu. Gure ikasleek, aldiz, denetariko erabilera desegokiak egiten dituzte. Batzuek lanen bat egiteko ingelesez irakurri behar dituzten artikuluak itzultzaile neuronaletik pasa, eta ematen dien itzulpena erabiltzen dute zuzenean lana egiteko, ulertzeko ahalegin handirik egin gabe, askotan erabat kazkarra den itzulpena erabiliz. Beste batzuek itzultzaile neuronalera jotzen dute hitz baten ordaina bilatzeko, hiztegietara jo beharrean, euskarazko testu bat idazten edo berrikusten ari diren bitartean. Edota, testua idatzi ahala, euskaraz pentsatzeko zaila egiten zaien esaldiren bat erdaraz pentsatu eta itzultzailetik pasatzen dute euskaratzeko. Ez bakarrik ikasleek, irakasleek eta administrazio-langileek ere gero eta gehiago jotzen dute itzultzaile neuronalera euskaraz eman behar duten dokumentua, irakasmateriala edo artikulua euskaratzeko. Jakina, horrelako erabiltzaileek gehienetan beren kabuz idatziko luketena baino testu zuzenagoa lortzen dute itzultzaileari esker, baina askotan ez dute gaitasunik itzultzailearen emaitza berrikusteko, eta ontzat ematen dituzte ikuspuntu semantiko-pragmatiko eta diskurtsibotik erabat okerrak diren testuak. Irakurmena, pentsamendu kritikoa eta hizkuntza-erabilera egokirako gaitasunak erabiltzeari eta garatzeari uzten diote horiek guztiek, eta horrela nekez egingo dute aurrera euskararen ezagutzan.

Txatbotak lan akademikoak edo azterketak egiteko erabiltzea sedentarismo kognitiborako urrats kualitatiboa da, ezer irakurri, ulertu, pentsatu eta ekoitzi gabe testu koherente, zuzena eta egokia lortzeko aukera ematen baitute. Nolanahi ere, hizkuntza-ereduetan oinarritutako teknologiek, egokiro erabiliz gero, hizkuntza-gaitasuna garatzen ere lagundu dezakete. Testuak laburtzen, sinplifikatzen edota testu-generoa eta erregistroa aldatzen ere laguntzen digute, betiere instrukzio egokiak ematen badizkiegu.

Ariketa txiki bat egin dut Xuxenek eta ChatGPTk testuak zuzentzeko duten gaitasuna alderatzeko. Hasteko, testu labur hau kargatu dut onlineko Xuxenen:

Zenbait emakumeek ez diete bularrarik ematen haurrari, nahi ez dutelako edo bestelako arrazoien bat eraginda. Esne-artifiziala ez da amarena bezain osatua, baina elikagai egokia da, beraz, lasai egon daitezke.

Bi akats identifikatu ditu Xuxenek: bularrarik -> bularrik ortografia-akatsa dela dio, eta esne-artifiziala hiztegian ez daukala. Ez du zuzendu ez gramatika, ez puntuazioa, ez ortotipografia ere, eta zuzendu dituen bi akatsen diagnosia ere ez du ondo egin.

Ondoren, doako ChatGPTren bertsio batean kargatu dut testua, eta eskatu diot zuzentzeko eta zuzendutakoak zerrendatzeko. Hona hemen haren erantzuna:

Erabat zuzendu du testua, azalpenak nahiko traketsak badira ere. Gogoeta metalinguistikoa sustatzeko ariketa egokia izan daiteke ikasleei eskatzea horrelako zuzenketetatik abiatuta diagnosiak eta azalpenak findu ditzaten, edota posible diren beste aukera zuzen batzuk proposa ditzaten. Espero izatekoa da laster horrelako zuzentzaileak integratuta edukiko ditugula gure gailuetan.

Hiztegiak eta corpusak, aldiz, gero eta gutxiago baliatuko dituzte erabiltzaile arruntek, emaitzak interpretatzeko askoz ere ahalegin kognitibo handiagoa egin behar baita. Hortaz, itzultzaileek, zuzentzaileek eta hizkuntzalariek baino ez ditugu erabiliko gure jakin-mina asetzeko edota ikerketak egiteko. Gainerakoan, erabiltzaile arruntei ahaleginik txikiena eskatzen dieten aplikazio interaktiboak garatzeko erabiliko dituzte corpus eta hiztegietako datuak hizkuntza-teknologietako adituek. Testu akademikoak egokiro sortzeko, ordea, kalitatezko testu akademikoekin entrenatu behar dira hizkuntza-ereduak, eta testu horiek alorrez alorreko ezagutza semantiko-pragmatikoa duten adituek baino ezin dituzte sortu. Hortaz, gurpil zoroan behin betiko ez katramilatzeko, nahitaezkoa da adituak sedentarismo kognitiboan harrapatuta ez geratzea, eta gero eta kalitate handiagoko testu akademikoak idaztea.


[1] Mariano Sigman eta Santiago Bilinkis (2023) Artificial. La nueva inteligencia y el contorno de lo humano. Bartzelona: Debate.

Hizkuntza, bigarren mailako

Elizabeteย Manterola Agirrezabalaga

Adimen artifiziala eta itzulpen automatikoa ahoz aho darabiltzagun honetan, hona hemen amorragarri bezain etsigarria iruditu zaidan pasadizo bat.

Herritarren iritzia jakiteko prozesu parte-hartzaile bat jarri du abian erakunde publiko batek. Agidanez, auzune bateko aisialdi eremu bat birgaitzeko asmoa dute, eta hainbat enpresak landutako proiektu teknikoak jaso dituzte. Aurkeztu diren proiektu guztien artean onenak aukeratu eta hautatutakoak ikusgai jarri nahi dituzte, horien artean gustukoena hauta dezaten herritarrek. Hautatutako proiektuen egileei A1 tamainako kartelak osatzeko eskatu die erakundeak, egin asmo duten eraldaketa urbanistikoaren berri herritarrei emateko: infografiez, irudiz, planoz zein marrazkiz hornitutako kartelak osatu dituzte, baita azalpenak ematen dituzten testuz ere. Behin kartelak jasota, jendaurrean jarri ditu erakundeak, eta berehala hasi da herritarren joan-etorria, eta hasi dira hasi iritzi-trukeak. Baikorrenek topatu dute gustuko proposamenik. โ€œBegira zer plaza ederra geratuko denโ€. โ€œHori da hori ideia ona kioskoa bazter horretan jartzeaโ€. โ€œEzin aukeraturik nabil baten edo bestearen arteanโ€. Ezkorrenek badute betiko kexa: โ€œhalakok ez du nahikoa leku utzi umeentzako jolastokirakoโ€; โ€œbeste horretan ageri den aterpea ez ote txikiegia?โ€; โ€œbatek berak ere ez du nahikoa berdegunerik, porlana nagusi denetan ere!โ€.

Lanbidez itzultzailea den herritar bat ere pasa da proposamenak ikustera eta zur eta lur geratu da lehenengoa begiratzen hasi orduko. Kartelaren goiko aldean ageri diren irudiak ikusi, eta azpian ageri den azalpena irakurtzen hasi orduko kopeta zimurtu du. Lehenengo esaldia irakurrita ez du ezer ulertu. Bigarrenez irakurrita ere ezin konprenitu. Hurrengo esaldiarekin igoala pasa zaio. Aurrerago egin testuan, eta, posible ote? Galdera baten hasieran alderantzizko galdera ikurra? Ezin izan du testua irakurtzen segi. Eskandalatuta, albo banatara begiratu eta parean dutena ulertu duten galdegin die aldamenekoei. โ€œIrudiak besterik ez ditut begiratu eta ez diot idatzitakoari erreparatuโ€, bota dio batak; โ€œoraindik ez dut begiratu ere eginโ€, besteak. Asaldatuta, boto papera patrikan gorde eta alde egin du itzultzaileak erakusgelatik.

Kartel hori jendaurrean erakusgai egotea nola litekeen posible pentsatuz itzuli da etxera. Zantzu guztien arabera, proposamena egin duen enpresak ez du proiektua euskaraz sortu. Eta proiektua euskaratzeko saiakera egin du โ€“hala eskatu baitzaie jendaurrean jartzekoโ€“, saiakera edo, ezin baita esan sortu dutena euskarazko testu bat denik. Gaur egun eskura ditugun euskarazko itzultzaile automatikoek kartelean zegoen emaitza baino dezente hobea eskaintzen dute. Hortaz, zer tresna demonio erabiliko ote zuten? Enpresarekin amorratu da itzultzailea, eta erakunde publikoarekin etsitu gero. Hiri-antolamendua jardunbide duen enpresa batek hizkuntza bigarren mailako elementu jo izana ez zaio onargarri. Baina larriagoa iruditu zaio euskaraz lan egiteko hautua egin duen erakunde publiko batek halako testu ulergaitz bat erakusgai jarri izana, zer eta jendearen iritzia jasotzeko!

Kasurik hoberenean, herritarrek, gure itzultzailearen modura, testuaren kalitate badaezpadakoa identifikatuko dute eta pentsatuko dute enpresak ez duela egoki jardun testua sortzean. Kasurik okerrenean, baina, euskaraz irakurtzera ohituta ez daudenek edo euskaraz alfabetatu gabeek testua irakurtzean pentsatuko dute euskaraz irakurtzeko gaitasun nahikorik ez dutela azalpenak behar bezala ulertzeko, eta horrek atzenduko ditu euskaraz irakurtzera beste okasioren batean ere. Modu batera zein bestera, kalte besterik ez irakurleoi halako jardunbideek.

Teknologia azkar doa aurrera, eta eskertzekoa da ditugun baliabideak izatea. Horiek behar bezala erabiltzeko adimena lantzea falta zaigu baina sarritan. Segi dezagun bide horretan lanean.

Eskoletako gurasoak eta itzultzaile neuronalak

Kike Amonarriz Gorria

Azken urte hauetan, gurasoei zuzenduriko hitzaldi asko ematea egokitu zait, hala euskaldunei, nola erdaldunei. Hauetako hainbat Haurren aurrean, helduak heldu egitasmoaren testuinguruan kokatu dira, beste batzuk, eskolan aurrera eramaten ari ziren euskararen inguruko lanketan, edo besterik gabe, gaia interesgarria iruditzen zitzaielako antolatu zituzten.

Euskaldunei zuzenduriko hitzaldietan erabili ohi dudan izenburu orokorra Guraso euskaldunak euskararen erabileraren oinarri eta motor izan da. Hitzaldi hauen helburu nagusia gurasoak ikastetxeen euskararen aldeko langintzan inplikatzea izaten da, eta zehazki, Gurasoen Euskara Batzordea edo, gutxienez, gaiaz arduratuko den talde bat antolatzea. Ukitzen diren gaien artean, euskararen egoera orokorra, hizkuntzaren inguruan hezkuntzan gaur egun ditugun erronkak, gurasoen egitekoa, eskolari eta hezkuntza-komunitate osoari begirako ildo nagusi batzuk eta proposamen zehatz posible batzuk.

Erdaldunei zuzenduriko hitzaldietan erabili ohi dudan goiburua, berriz, honako hau da: Mi hij@ estudia en euskera y yo no sรฉ. ยฟCรณmo le puedo ayudar?

Hitzaldiei ekin baino lehen post-it-ak banatzen ditut bertaratuen artean, eta eskatzen diet bertan idazteko gaiaren inguruan dituzten galderak, zalantzak, ilusioak, hausnarketak edo hitzaldian zehar jorratzea nahiko lituzketen gaiak. Bi dira guraso erdaldunei zuzenduriko hitzaldi guztietan azaltzen diren galderak: etxeko lanetan nola lagundu, eta ea ona den dakiten euskara apurra (eta โ€œtxarraโ€ eransten dute batzuek) seme-alabekin erabiltzea, haien kezka baita ea seme-alabek ez ote dituzten errepikatuko egiten dituzten akatsak.

Bi gaien inguruko azalpenak eta aholkuak ematerakoan itzulpenen gaiak garrantzi berezia hartzen du. Eta azken hiru urte hauetan berrogei eskola baino gehiagotatik pasa ondoren, ohartu naiz gaia ez dela lantzen gurasoekin. Ez da behar bezala komunikatzen eta guraso gehienek ez dute gaur egun dohainik erabil daitezkeen tresna eta gailuen berririk. Google-k eskaintzen dituen aukerak ezagutzen dituzte, baina hortik aurrerakoak guztiz ezezagunak zaizkie ia denei. Oso esanguratsua da itzultzaile neuronalen berri ematen dudanean gehienek erreferentziak apuntatu egiten dituztela edo diapoari argazkia ateratzen diotela. Ez dute informazio hori. Edo beste era batera esanda, ez zaie iristen eskoletako barne-komunikazio kanaletatik.

Hitzaldietan gurasoek itzulpenen edo baliabide teknikoen inguruan zer nolako galderak egiten dituzten ikusteko, hona jasotakoen lagin bat: 

  • ยฟEs fiable el traductor de Google (Lens) para ayudar a mis hijos? (Portugalete)
  • ยฟHay alguna app o plataforma para ayudar a los niรฑos a hacer los deberes? (Portugalete)
  • ยฟSon รบtiles los traductores digitales? (Portugalete)
  • ยฟCual puede ser uno de los mejores traductores instantรกneos de texto y sobre todo a travรฉs de foto? (Iruรฑea)
  • Cuando me dicen mis hijas quรฉ significa una cosa, ยฟes bueno utilizar el traductor del mรณvil? (Noain)
  • Herramientas no digitales de apoyo (Noain)
  • Traductores, internet… (Azkoien)
  • Algรบn traductor fiable para buscar (Donostia)
  • ยฟEs bueno que lo traduzcan antes, si no lo entienden bien? (Donostia)

Euskal Herriko lau kornerretan bildutako galdera hauek argi islatzen dute itzulpengintzarekiko eta euskaratik itzulpen egokiak eskuratzeko dauden aukeren inguruko guraso gehienen ezjakintasuna, ezinegona eta gaiarekiko segurtasun falta.

Eta uste dut, gurasoak lasaitzeko, haien seme-alabei laguntza egokiagoa eman diezaieten, eskoletako hezkuntza-dinamiketan eta bizitzan gehiago eta erosoago parte har dezaten, euskararen erabilera susta dadin eta euskarara gehiago hurbil daitezen, oso onuragarria litzatekeela zer tresna dituzten erabilgarri jakinaraztea, eta hizkuntzen erabilera eskola-komunitatearen barne-bizitzan nola kudeatuko den azaltzea.

Nire ustez, komenigarria litzateke gurasoekiko harrera-protokoloetan edo ikasturte hasieratan gurasoekin egiten diren bileretan itzulpenekin zerikusia duten aspektu hauen inguruko oinarrizko informazioa eskaintzea:

  • Euskaratik edo euskarara doan itzultzeko sarean eskuragarri dauden gailu, aplikazio eta baliabideen zerrenda ematea, berauek erabiltzeko oinarrizko irizpideekin.
  • Bileretan edo batzarretan, hizkuntzak nola erabiliko diren azaltzea, eta euskarazko parte-hartzeak ulertu ahal izateko izango dituzten aukerak zehaztea.
  • Seme-alaben ikasketak jarraitu ahal izateko, ikasi dutenaren edo etxeko lanen inguruko itzulpenen bat eskatzen zaienean (euskaratik etxeko hizkuntzara), gurasoek aintzat hartu behar dituzten oinarrizko aspektuak argitzea: itzultzea ez dela ariketa automatiko erraz bat, askotan haurrek ez dutela jakingo hitzaren ordaina zein den, etab.
  • Seme-alaben ikasketak jarraitzen dituzten bitartean, itzulpen-ariketa hauen bidez, beraien euskararen ezagutza hobetu eta zabaldu dezaketela, eta haien oinarrizko hiztegia ere osatzen joan daitezkeela ikusaraztea.
  • Argi adieraztea egoera hauetaz baliatu beharko luketela, euskararekiko haien interesa agertzeko eta baita familiako hizkuntza(k) lantzeko ere, batez ere, familiako hizkuntza gaztelania, frantsesa edo ingelesa ez den kasuetan.

Ohar hauek etxeko lanen inguruko azalpenen testuinguruan ematen dizkiet hitzaldietan. Etxeko lanena guraso askorentzat kezka iturri nabarmena da, eta beti saiatzen naiz zama handitzat hartzen duten gai honen pisua erlatibizatzen. Hitzaldia hasi orduko galdera hau egiten diet: โ€œZuei gurasoek asko lagundu zizueten etxeko lanekin?โ€. Ia denek ezetz erantzuten dute, eta orduan esaten diet: โ€œBada, pertsona normalak eta jatorrak dirudizue! Beraz, nahiz eta etxeko lanetan gurasoen laguntza ez jaso, pertsona normalak atera gaitezke!โ€. Eta, ondoren, bigarren galdera egiten diet: โ€Gai hau dela eta, guraso euskaldunekiko desabantaila handian zaudetela iruditzen zaizue?โ€. Hor, aldiz, gehienek baietz erantzuten dute. Eta orduan, etxeko lanen inguruan dauden jarrera desberdinak azaltzen ditut, zertarako diren, zer-nolako onurak eta zer-nolako desabantailak ikusten zaizkien, eta besteak beste, etxeko lanak ikasleek egin behar dituztela, zalantzak tutoreekin argitu behar dituztela, eta laguntzeko ditugun aukerak uste baino murritzagoak direla: gaiak ez ditugulako ezagutzen, ariketak egiteko moduak aldatu direlako, ez delako komeni laguntzea, etab.

Etxeko lanetan laguntzeko dituzten aukerak eta mugak zedarritu ondoren, guraso gehienek lasaitasun handia hartu ohi dute, eta guraso euskaldunekiko desabantailaren neurria ez dute horren handitzat jotzen. Euskaratik itzulpen egokiak modu erosoan jasotzeko aukeren berri izateak asko laguntzen du ikuspegi aldaketa honetan.

Guzti honegatik iruditzen zait horren garrantzitsua eskoletan gaia sistematikoki lantzea gurasoekin, eta bereziki, erdaldunekin.

Itzultzaile automatiko neuronalak eta itzulpen-memoriak

Maite Imaz Leunda

Orain dela 24 urte idatzi nuen lehenengo artikulua itzulpen-memoriak kudeatzeko programei buruz. Garai hartan euskararako itzultzaile automatikorik ez zegoen eta nik ez nuen uste euskaraz lana txukun egingo zuen itzultzaile automatikorik ezagutzera iritsiko nintzenik. Itzulpen-memoriak kudeatzeko programek liluratu egin ninduten ematen zituzten erraztasun guztiengatik.

Programa ordenagailuan instalatu zidatenean, 1997an, goitik behera irakurri nituen jarraibideak lanean hasi aurretik. Segurtasun handia eman zidan horrek, beti gustatu izan baitzait erabiltzen ari naizen programa edo aplikazioa kontrolpean izatea. Gaizki sentitzen naiz zertan ari naizen garbi eduki gabe itsumustuan nabilenean.

Itzulpen-memoriak kudeatzeko programek itzulitako testuak esaldika edo segmentuka parekatuta gordetzeko aukera ematen zutenez, bi hizkuntzatan dauden segmentu-pareen biltegia sor zitekeen nahiko erraz. Itzulpen-memoriaren aplikazioak bilaketak egiteko modua asko arindu zuen eta guztiz erabilgarria bihurtu zen itzultzaileon eguneroko lanerako. Berdin-berdinak ziren esaldiez gain, antzekoak bilatzeko aukera ere ematen zuen. Horrekin batera, terminologiako datu-basean begiratzen zuen itzuli beharreko esaldi horretako hitzak edo terminoak azaltzen diren. Bilaketa bikoitz horren emaitzak pantailan azaltzen zizkigun, nahiko azkar, eta komeni zitzaigun lekuan erraz kopiatzeko moduan. Dokumentu osoak aztertzeko aukera ere ematen zuen, dokumentua ireki beharrik gabe memorian zenbat zegoen itzulita ikusteko.

Antzeko dekretuak eta ebazpenak, urtero errepikatzen diren deialdiak behin eta berriz itzultzen aritu beharra, behin eta berriz lan bera egin beharra ekidin zuten itzulpen-memoriek. Testu itzuli berri baten bertsio berri bat azken orduko aldaketekin baina aldaketak non zeuden markatu gabe etortzen zenean ere testu osoa alderatu beharra ekidin zuten itzulpen-memoriek. Aurretik gauzak nolakoak ziren gogoan izateko adina dugunok ondo dakigunez, mugarria izan zen itzulpen-memoriak kudeatzeko programak itzultzaileen ordenagailuetan instalatu eta lan-jardunean txertatzea.

Hitzak, hitz multzoak edo terminoak kontsultatzeko aukera iruditzen zitzaidan guztietan erabilgarriena, hasieran biltegiratutako esaldi pareak gehiegi ez zirenean, batez ere. Itzulpen-memorian itzuli beharreko esaldi batentzat ordainik ez egon arren, esaldi horretan azaltzen zen hitz bat, edo hitz multzo bat, itzulita egon behar zuen susmoa izanez gero, kontsulta egin zitekeen, eta itzulpen-memoriak hitz edo hitz multzo hori jasota zeukaten esaldi pareen zerrenda ematen zigun; hori hiztegian begiratzea baino lagungarriagoa izan zitekeen batzuetan egokiena zen hitza aukeratzeko orduan, hitza edo terminoa testuinguruan kontsultatzeko aukera ematen baitzuen.

Gerora, itzulpenen datu-base dokumentala ipini ziguten. Nahiz eta datu-base dokumentalean kontsultatzeak denbora gehiago eskatu, emaitzen testuingurua hobeto ikusteko parada eskaintzen du, esaldiaz haratago dokumentu osoa ikus daiteke eta.

Hori dena egiten zuten eta egiten dute orain ere. Itzulpen-memoriak ez dira desagertu itzultzaileen ordenagailuetatik. Itzulpen-memoriak eguneroko lanaren bitartez elikatzen dira, testuak itzuli ahala memorian gordetzen dira eta, horrekin batera, lehendik zegoena zuzentzeko aukera ematen du. Gaztelaniazko esaldiaren euskarazko ordaina esaldi bat baino gehiagotan ematen denean ere arazorik gabe gordetzen du.

Lerrokatzaile automatikoaren bitartez ere elikatu daiteke itzulpen-memoria, jatorrizko testua eta itzulpena hartu eta nahiko modu automatikoan esaldiz esaldi parekatuz.

Itzultzaileak badu memoriak kudeatzeko aukera ere; zerbait gaizki badago, hitzen baten ortografia aldatzen bada edo terminologia eguneratzen bada, itzulpen-memoria osoa aldatzeko aukera ematen du; ordezkapen globalak nahiz banan banakoak egin daitezke. Itzulpen-memoria osoa ikusteko eta memoria batetik bestera transferitzeko aukera ere ematen du.

Gustuko nuen itzultzaile soil izanda programa osoa kontrolpean nuela sentitzeak; horrek ere segurtasuna ematen zidan. Programak itzultzaile guztioi ipini eta itzulpen-memoriak ugarituz joan ziren neurrian eskertu genuen informatikarien laguntza, jakina, baina teorian itzulpen-memoriena itzultzaileak bere kabuz bere ordenagailuan kudea dezakeen programa da.

Itzultzaile automatiko neuronalarekin ez da gauza bera gertatzen. Neuronala ez da nire ordenagailuan erabateko kontrolpean daukadan zerbait. Itzultzaile neuronala ez da erabili ahala elikatzen eta ezin ditugu zuzenketa puntualak momentuan egin.

Itzultzaile neuronalak urtean behin edo bitan elikatzen eta eguneratzen dituzte, corpus elebidunak erabilita, eta ordenagailu sendoekin egiten da hori. Corpusak bolumen nahikotxo izan behar du, prozesuak bere denbora behar izaten du eta bukatu ondoren probak egin behar dira kalitatea hobetu dela egiaztatzeko, hala ez bada, emaitza hobeak eman beharrean okerragoak ematen baditu, atzera egin eta lehengoratu egin beharko da eta. Komenigarria da, beraz, itzultzaile automatiko neuronalarekin egindako eta posteditatutako itzulpenak itzulpen-memorietan jasotzea, itzultzaileen kasuan ohikoena den moduan, eta itzulpen-memorietako corpus elebidun horiek erabiltzea (zenbat eta corpus handiagoa, hobe) itzultzaile automatiko neuronala elikatzeko eta eguneratzeko.

Itzultzaile neuronalak ez du aukerarik ematen hiztegi terminologiko jakin batzuk aukeratzeko itzulpen-prozesuari ekin aurretik. Kontu handiz begiratu behar da terminologia posteditatzerakoan. Hitzak edo terminoak kontsultatzeko ere ez dute itzulpen-memoriek bezain ondo lan egiten; itzultzaile neuronala ez da egokia hitz solteak eta terminoak kontsultatzeko, sinonimoak ez ditu bereizten askotan (preciso y exacto zehatza eta zehatza itzultzen dute) eta, arestian esan bezala, terminoak ere ez ditu egoki ematen beti. Hitzak eta terminoak kontsultatzeko hiztegiak eta datu-base terminologikoak daude, eta baita glosarioak, datu-base dokumentalak eta itzulpen-memoriak ere.

Itzuli itzultzaile neuronalak Elhuyar hiztegira bideratzen du zuzenean hitz solte bat kontsultatzen denean. Itzultzeko pantailan bertan Elhuyar hiztegia eta Euskalterm terminologia-banku publikoa integratuta dauzka, horietan kontsultak arin egin ahal izateko. Elia itzultzaile neuronalak hitz batzuentzat aukera bat baino gehiago proposatzen ditu, eta kurtsorea hitzaren gainean ipinita probabilitateetan oinarrituta egin duen bilaketan topatu dituen beste aukera batzuk ere ikus daitezke.

Itzultzaile automatiko neuronala ondo integra daiteke itzultzaile profesionalen lan-prozesuan. Ez ditu ordezten itzulpen-memorietan urteetan bildutako esaldi pareek eman ditzaketen emaitzak, ez hiztegiek eta glosarioek eman dezaketena ere. Ondo legoke probabilitateetan oinarrituta egindako bilaketa bakoitzak (segmentu bakoitzak) zenbateko fidagarritasuna duen adierazten duen portzentajea erakutsiko balu itzultzaile neuronalak, itzulpen-memoriak kudeatzeko programek antzekotasun-portzentajeak erakusten dituzten bezala, zuzenketarako edo postediziorako pista gehiago edukitzeko.

Nolanahi ere, emaitza onak izateko ezinbestekoa da, derrigorrezko betebeharra, kalitatezko elikagaia ematea, bai itzulpen-memoriak kudeatzen dituzten programei, bai itzultzaile automatiko neuronalei.

Uda honetan ikasi ditudan kontu batzuk

Itziar Otegi Aranburu

Amaitu da uda, eta udazkena presaka etorri da. Udan zehar ikasi ditudan hitz eta esapide batzuk ekarri nahi ditut hona, zertzelada moduan.

Edizio-distantzia

Uda hasieran Orozkoko baserri batean egokitu nintzen, ilustratzailez inguratuta. Han ari ginen, mahai baten bueltan, bakoitza bere lanean murgilduta eta berriketan, eta batek bota zuen: โ€œDeskuidatzen bagara, itzultzaileek bezala amaituko dugu, eta gure lana makinaren akatsak zuzentzera mugatuko daโ€. Isilik irentsi nuen zimikoa, papererantz are gehiago makurtuta. Zentzu batean, zuzen daude, gure lanaren alderdi (gero eta handiago) bat horretan datza, itzulpen automatikoaren akatsak zuzentzean. Jakin dut goian adierazitako indizea erabiltzen dela itzulpen automatikoaren kalitatea neurtzeko; alegia, zenbat giza esku-hartze behar diren itzulpen automatiko jakin bat giza itzulpena bezain ona izan dadin, eta distantzia hori ahalik eta txikiena izan dadin lanean ari direla.

Ludita

Teknologiaren aurrerapenen kontra dagoen pertsonari esaten omen zaio ludita, eta industria-iraultzaren (lehenengo industria-iraultzaren) garaitik omen dator, artisau ehungileak lanik gabe utziko zituzten makina ehungailuak suntsitzen hasi zirela eta. Kontuz ibili behar da zer esaten duzun teknologiaz; berehala jotzen zaituzte luditatzat.

Determinismo teknologikoa

โ€œErrusiar mendi batean goazelarik, alferrik da atzerantz indarka nekatzea; ez du ezertarako balioโ€, esan zidan beste mahai baten bueltan nire lagun Charlesek, laurogei urteak atzean utzi dituen arren โ€“edo utzi dituelakoโ€“ bizitzari beldurrik gabe begiratzen dionak. Gustatzen zait, metafora, baina ez dakit oso konforme nagoen. Batetik, inork ez dit galdetu errusiar mendira igo nahi dudan edo ez, eta, bestetik, gu denak orain errusiar mendian egotea ez da fenomeno meteorologiko baten ondorio, ez da halabeharrez gertatu, eta iruditzen zait โ€œadimen artifizialarena geldiezina daโ€ esaldian badagoela fatalismo puntu bat, determinismo teknologiko deritzon horren aurrean amore emate bat. David Bayles eta Ted Orlandek Arte y miedo liburuan fatalismoaz ematen duten definizioa datorkit gogora; alegia, beldurraren beste bariante bat dela fatalismoa, patua gure esku egon daitekeen arren gure eskuak patuaren gainean eragiteko ahulegiak izatearen beldurra.

Zentauroak vs ziborgak

Uztailean, Elhuyarko lagunek antolaturiko udako ikastaroan izan nitzen, Itzulpengintza eta teknologia: aurrera eskuz esku, aurrera aurrez aurre. Gauza interesgarri asko entzun nituen han. Besteak beste, askoz hobea dela jarrera proaktiboa hartzea, erreaktiboa baino. Horretan nabil, errusiar mendiari tamaina hartu nahian, beste asko bezalaxe. Genevako Unibertsitatekoek, adibidez, adimen artifizial sortzailearen gainean zer jarrera duten azaldu dute duela gutxi: alde daude, eta gida bat argitaratu dute unibertsitatean adimen artifizial sortzailea arduraz eta egoki erabiltzeko. Hainbat atal ditu gidak, batzuk zinez jakingarriak, batez ere adimen artifizialaren sorreraz eta eboluzioaz eta oinarrizko kontzeptuez โ€“niretzat, cookieak onartzean zer arraio ari naizen onartzen oraindik ere ez dakien honentzat, oso lagungarriaโ€“. Metodologiaren atalean, azaldu dute informazioa nola bildu duten, eta, idazteko orduan, ChatGPT4 erabili dutela laguntza gisa.

Ondo ulertu badut, zentauro-jokabidea litzateke hori: gizakiak lan batzuk egingo lituzke, eta makinak beste batzuk. Bestea ziborg-jokabidea omen da, zeinetan ez baitago bereizterik nork egin duen zer, hain daude fusionaturik gizakia eta makina lan-fluxuan. Oso itxura ona hartzen diot gidari, baina denbora eta patxada beharko nituzke behar bezala aztertu eta iritzi bat eratzeko, eta, nik denbora eta patxada eskatzen ditudan bitartean, hortxe dabil errusiar mendia orduko 300 kilometroko abaila zoroan gora eta behera eta ezker-eskuin inori patxadarik eman gabe. Mafaldaren hartatik, gustura esango nuke nik ere โ€œgeldi ezazue hau; jaitsi egin nahi dutโ€. Iritzi bat eratu artean behintzat.

Kakaztea (enshittification)

Joxe Rojasek azaldu zuen kontzeptu hori ikastaroan. Hemen dago azalduta, baina, labur esateko, plataforma teknologiko handien deriba azaltzen du. Ez dakit egokia den, baina niri, nolabaiteko zabalkuntza semantiko bidez, bestelako kakazte bat ekartzen dit gogora. Konturatu bainaiz ez dela, berez, teknologia jakin bat, edo adimen artifiziala bere horretan, arazoak sortzen dituena โ€“salbuespenak salbuespen, eta utzidazue hor ere zuhurtzia bati eusten momentuzโ€“; baizik eta, teknologia horrekin batera, nolabait gainjarrita, edo, hobeto esanda, azpijarrita, datorren beste zerbait. Ikastaroan, hitzaldietako batzuek ezinegon lauso bat eragin zidaten. Lankide batek lagundu zidan argitzen, kafea hartzen ari ginela esan baitzuen hitzaldi batzuei kutsu โ€œneoliberalaโ€ zeriela. Teknologiari eta adimen artifizialari buruzko diskurtsoan, maiz, bi alderdi nahasten dira: bat teknologiari dagokiona, eta bestea, berriz, mundu-ikuskera bati dagokiona โ€“berezkoa edo hartua, kontzientea edo ezโ€“. Adibidez, hizlari batek bideo umoretsu bat jarri zuen, interpretazio automatikoaren beharra ilustratzeko: Erresuma Batuko ikastetxe bateko zuzendariak guraso bat ekarrarazten du, semearen portaera kaxkarraz hitz egiteko. Etorkinak dira, zuzendariak ez daki aita horren hizkuntza, eta aita ez da ingelesez moldatzen. Semeak egin behar ditu interprete-lanak, beraz. Imajinatuko duzue zer gertatzen denโ€ฆ semeak goitik behera aldatzen ditu zuzendariaren esanak, eta aita poz-pozik irteten da bileratik, semea heroia dela sinetsita. Gauzak zer diren, oso antzeko bideo bat ikusi nuen orain dela urte batzuk, Letren Fakultatean, Interpretazio Sozialaren Oinarriak ikastaroa egin nuenean. Interpretazio sozialaren beharra ilustratzeko jarri zuten bideo hori orduko hartan. Denbora-tarte honetan, automatiko hitzak ordeztu du sozial hitza esaldi horretan.

Agian badago arrazoi onik horretarako, naif samarra izango da igual ikastetxeetako hizkuntza-arazoak giza interprete bidez konpon daitezkeenik pentsatzea, baina, halako arrazoibiderik ez zenez egin, batetik besterako bidea, nolabait, ezkutuan geratu zen, izebergaren azpiko aldea bezala.

Bestalde, beharbada batzuek ziborg gisa ikusten gaituzte dagoeneko, oso ondo bereizi gabe entzungailuetatik sartzen zaien ahots hori gizaki batena den edo makinarena, eta horregatik hasi dira batzuk interpreteei eskatzen on call egon daitezela 24/7, eta (kasik) doan lan egin dezatela. Negargarria.

Etorkizunaren kontrako babesa (future-proof)

Teknologiaren eremuan sortu zen future-proof esapidea: nola diseinatu software bat, eboluzio teknologikoaren ondorioz berehala zaharkitua eta baztertua ez geratzeko moduan. Unibertsitate-ikasketen testuinguruan iritsi zait niri: nola diseinatu itzulpengintza eta interpretazioko ikasketak, azkar eta noranzko ezezagunetan aldatzen ari den mundu batean berehala zaharkituta eta baztertuta ez geratzeko moduan. Ez dut erantzunik, baina ez esan esapidea ez denik itzela. Future-proof hitzak, bulletproof edo waterproof hitzen molde berekoa baita, berekin dakar etorkizunaren kontra babestu nahia, balen kontra bezala.

Ikastaroaren amaieran elkarteen ordezkariek esan zituztenetatik atera daitezke gure lan-etorkizunari eusteko ideia batzuk: saretzea, eta gure lanari ikusgaitasuna ematea. APTIC elkarteko ordezkariak kontenedore batzuk erretzeaz hitz egin zuen โ€“metaforikokiโ€“. Nire ustez, erre beharreko lehen kontenedore metaforikoa izenarena da, hizkuntzaren langile garen aldetik. Aditu batzuek argudiatu dute adimen artifiziala ez dela ez adimentsua, ez artifiziala, gizakiaren lan luze metatua dagoela oinarrian. Adimen artifizial sortzaile izenak erabat ezkutatzen du egiaz zer den. Konputazio kognitiboa edo ikaskuntza interaktiboko sistema ikusi ditut sarean, baina, niri neuri, gehiago gustatu zait Lorea Argarateri irakurri diodana: adimen kolektiboa, โ€œguk dakiguna zurrupatu baituโ€.

Gauzei izen egokia ematea, beraz, eta saretzea, eta gure lanari ikusgaitasuna ematea. Horrez gain, ezagutza eta denbora, patxadaz erabaki ahal izateko adimen kolektiboko tresnen aurrean zer jarrera hartu: zer, nola eta zertarako erabili, zer auzi etiko dakartzan erabilera horrek, eta egoki erabiltzeko irizpideak ezarri eta zabaldu. Hori iruditzen zait izan litekeela jarrera proaktibo adimentsu bat hartzea, nork bere eremuan.

Genero alborapena eta itzultzaile automatikoak

Elizabeteย Manterola Agirrezabalaga

Adimen artifiziala gure egunerokoan barru-barruraino sartu zaigun honetan, Elhuyarren eta EHUko TRALIMA-ITZULIK ikerketa taldearen artean landu dugun proiektu baten berri emango dut idatzi honetan. Euskaratik gaztelaniarako norabidean itzultzaile automatikoek eskaintzen duten emaitza aztertu nahi izan dugu, genero alborapenik ba ote den ikusteko. Elhuyarreko Klara Ceberio, Itziar Cortรฉs eta Eneko Sagarzazu eta EHUko TRALIMA-ITZULIK ikerketa taldeko Aitziber Elejalde, Zuriรฑe Sanz, Naroa Zubillaga eta ni neu aritu gara proiektu honetan lanean. Idatzi hau nik sinatzen badut ere, zazpion artean eginiko lanaren emaitza dakart.

Genero-alborapena arazo ezaguna da itzultzaile automatikoen alorrean. Tresna horiek elikatzeko erabiltzen diren adibideetatik ikasten dutenez, algoritmoek testuetan dauden alborapen eta estereotipoak ikasten eta errepikatzen dituzte. Arazo hori are nabarmenagoa da genero gramatikalik markatzen ez duten hizkuntzetatik generoa markatzen duten hizkuntzetara itzultzean, konparazio batera, euskaratik gaztelaniarako noranzkoan.

Itzulpen automatikoen emaitzetan sakondu asmoz, euskaratik gaztelaniara testuak itzultzean IAk nola jokatzen duen begiratu dugu. Genero gramatikala markatu gabea duenez euskarak, itzultzean sarritan markatu beharra egokitzen baita. Esaterako, subjekturik ez dagoenean markatuta (etorri da), posible da markatu gabe uztea (ha venido), baina markatu beharra suertatzen da gaztelaniaz halabeharrez, maskulinoan ala femeninoan, euskaraz subjektua markatuta dagoen kasuetan (ikaslea etorri da –> El/la alumno/a ha venido), nahiz eta euskarazko esaldiak subjektu horren generoa zehaztu ez.

Itzultzaile automatikoek genero alborapenik egiten ote duten eta zer neurritan aztertzeko, maila lexikoko bi elementu hautatu ditugu: adjektiboak eta lanbide-izenak. Maskulinotzat jotzen diren lanbide eta adjektiboekin zerrenda bana osatu dugu eta beste zerrenda bana femeninotzat jotzen diren lanbide eta adjektiboekin. Dabilena corpusetik adibide errealak hartu eta corpus bat osatu dugu, euskarazko esaldiekin eta Eliak emandako esaldi horien gaztelaniazko itzulpenekin.

Esaldi kopuru zabal samarra aztertu dugu, adibide interesgarri ugari lortu, eta datu esanguratsu zenbait atera. Ez naiz baina emaitzak xehe-xehe ematen hasiko hemen, hau ez baita datu kuantitatiboak emateko toki aproposena. Azterketan atera dugun ondorio nagusi bat aurkeztuko dut horren ordez.

Jakina da itzultzaile automatikoek, gaur-gaurkoz, esaldi mailako emaitzak eskaintzen dituztela. Hau da, ez dute testua bere osotasunean kontuan izaten, eta horrek koherentzia arazoak sortzen ditu. Esaterako, kirolari batek marka berria egin duela esaten bada albiste batean eta testuan aurrerago esaten bada kirolari horrek gogor entrenatu duela lorpen horretara iristeko, makinak albiste hori gaztelaniara itzultzean itzul dezake kirolaria emakumezko modura lehen agerpenean eta gizonezko modura bigarrenean. Ez baitu testua bere osotasunean prozesatzen.

Gure proiektura itzuliz, euskarazko jatorrizko testuak eta itzultzaile automatikoaren emaitzak aztertzean, adibidea eta testuingurua izan ditugu eskura ikertzaileok. Itzultzaile automatikoak esaldika funtzionatzen duela jakitun, ez dugu testuingurua kontuan hartu. Nahiz eta guk geuk testuingurua eskura izan emaitzak aztertzean eta beste mota batzuetako ondorioak ateratzea izan dugun hortik.

Lau adibiderekin erakutsiko dut testuinguruaren auzia, adibide bat aztertu dugun kategoria bakoitzeko. Kolore grisez testuinguruko informazioa markatu dugu eta kolore beltzez aztergai izandako esaldia. Letrakera lodiz markatu dugu estereotipaturiko hitza, kasuan kasu.

Dabilena corpusetik ateratako adibideak
Maskulinotzat jotako adjektiboaKorrika egiteko oinak mugitu behar dira, baina horretarako buruak %100ean egon behar du, beti, lasterketa guztietan, eta Maite ona da horretan. Beti da lehiakorra, beti ematen du daukan dena.
Femeninotzat jotako adjektiboaEz zenuen Maddiren ama ezagutu, ezta? Koadrilako batek esaten duen moduan, TXEMA bat zen: Txortan Egiteko Moduko Ama. Polita, elegantea, karrerarekin, modernoa, sasoikoa… web porno bateko istorioetatik ateratakoa zirudien. Egunen batean horrelakoa izango zen Maddi: zoragarria.
Maskulinotzat jotako lanbideaLa pelota vasca. La piel contra la piedra film luzea egin eta lau urtera itzuli da Medem. Film hark zenbait kritika izan zituen eta urtebete inguruko nerbio beheraldia eragin zioten zinemagileari. Berak dioenez, ordea, dagoeneko osatu da erabat.
Femeninotzat jotako lanbideaVanessahirian geratu da eta supermerkatu batean lan egiten du. Hasieran kutxazain gisa arituzen eta orain dela gutxi postu administratibo bat eskaini dio zuzendaritzak.

Lehenengo adibidean, Maite ona dela aipatzen da testuinguruko esaldian, baina aztertu beharreko esaldian, horren ostekoan, subjektua omitituta dago eta aurreko esaldia irakurri gabe ezin da jakin nor den lehiakorra. Bigarren adibidean ere subjekturik ez da ageri aztergai izan dugun esaldian. Polita, elegantea, modernoa, sasoikoa aipatzen da, baina bi esaldi lehenagora jo behar dugu testua Maddiren amaz ari dela jakiteko. Hirugarrenean, zinemagilea aipatzen da aztertu dugun esaldian eta hor ere bi esaldi lehenago esaten da nor den. Kasu horretan, gainera, zinemagilearen abizena besterik ez da aipatzen: Medem. Irakurlearen kultur ezagutzak lagunduko du jakiten La pelota vasca dokumentala Julio Medemek zuzendu zuela, alegia gizonezko batek. Azkeneko kasuan, kutxazainak Vanessa izena duela eta hortaz femeninoa beharko lukeela testuinguruko esaldiak zehazten digu.

Eta nola jokatu du Eliak?

Maite es buena esan eta hurrengo esaldian siempre es competitivo esan du. Maddiren ama bonito, elegante, con carrera, moderno, de temporada omen da. Medemi erreferentzia egiten dion โ€œzinemagileโ€ lanbide-izena omititu egin da gaztelaniazko ordainean. Eta Vanessak cajero modura lan egin omen zuen hasieran. Hona hemen gaztelaniazko ordainak bere osotasunean. Jarraian ikus litezke itzulpenak osorik:

Goiko taulako esaldien itzulpenak, Eliak emanak
Maskulinotzat jotako adjektiboaPara correr hay que mover los pies, pero para ello la cabeza tiene que estar siempre al 100% en todas las carreras y Maite es buena. Siempre es competitivo, siempre parece lo que tiene.
Femeninotzat jotako adjektiboaยฟNo conociste a la madre de Maddi, no? Como dice una de las cuadrillas, era un TXEMA: Txortan Egiteko Ama. Bonito, elegante, con carrera, moderno, de temporada… parecรญa sacado de las historias de una web porno. Un dรญa Maddi fue asรญ, maravilloso.
Maskulinotzat jotako lanbideaLa pelota vasca. Medem vuelve cuatro aรฑos despuรฉs de su largometraje La piel contra la piedra. La pelรญcula contรณ con varias crรญticas que provocaron una decadencia nerviosa de un aรฑo. Pero dice que ya se ha completado totalmente.
Femeninotzat jotako lanbideaVanessa se queda en la ciudad y trabaja en un supermercado. Al principio trabajรณ como cajero y recientemente la direcciรณn le ha ofrecido un puesto administrativo.

Lau adibide soil eta lauetako batek ere ez du behar bezala asmatu, dela komunztadura arazoak medio, dela omisioagatik. Nahikoak dira ikusteko itzultzaile automatikoek ez dutela testua bere osotasunean kontuan izaten, ezta aurreko edo osteko esaldiak ere. Esaldi mailan funtzionatzen dute, eta esaldi barruan ere batzuetan komunztadura arazoak topa litezke, erreparatu esaterako bigarren adibideko azken esaldiari: Un dรญa Maddi fue asรญ, maravilloso.

Adimen artifiziala abiada bizian ari da aurrera egiten eta testuingurua kontuan izango duten gailuak sortuko dira etorkizun hurbil batean. Hala ere, testuinguruak ez digu beti argituko subjektuaren generoa, ezin beti emaitza perfekturik lortu. Zer egin edo nola jokatu bi generoentzat erabiltzen diren izen bereziekin? Amets, Itsaso, Lur? Eta erdal izen bereziekin? Zer egin, halaber, generoa berariaz zehaztu nahi ez den kasuekin? Hau da, anbiguotasuna nahita bilatzen den kasuekin? Giza adimena behar-beharrezkoa izango da halakoak behar bezala itzultzeko, ezinbestean.