Guk bezain gaizki itzultzen du

Gotzon Egia Goienetxea

(Hausnarketa puntu batzuk, adimen artifizialaren laguntzaz landutako itzulpenei buruz)

Makina bidezko itzulpenak

Gizakiok pentsatzeko erabiltzen dugun prozesamendu neuronala simulatzeko gaitasuna eduki arte, ordenagailuek oso itzulpen kaskarrak egiten zituzten. Orain, 2017az geroztik, ez daiteke halakorik esan: adimen artifizialean oinarritutako tresna neuronalek itzulpen egoki samarrak —batzuetan, oso egokiak!— sortzen dituzte, eta, okerrenean ere, kentzen diote itzultzaileari testu zati gehienak letraz letra idazteko lan gris eta astun hori.

Ausartuko naiz esatera: joan den mendearen azken hamarkadan, ordenagailuaz lan egiten ez zuen itzultzailea desagertzera kondenatuta zegoen bezala, XXI. mendean, tresna neuronal baten laguntzarik gabe nekez kudeatu eta bideratu daiteke itzulpengintza.

Itzultzailearen zeregina

Hori argi samar egon daitekeen arren, ez dut hain argi ikusten adimen artifizialak giza itzultzailea gero eta gehiago baztertu eta, finean, ordezteko kemena bereganatu dezakeenik. Itzultzailearen zeregina errotik aldatzen ari da —berehala joango naiz gai horretara—, ez dago zalantzarik, baina ez zait iruditzen itzultzailearen funtzio aldaketak inor ezustean harrapatuko zuenik, azken 50 urtetan etengabeko bestelakotze batean murgilduta bizi baita itzultzailea, besteak beste —eta batez ere—, teknologia aurrerabidearen eraginez. Nola esan, lanbideen artean gutxi izango dira, itzultzailea bezala, belaunaldi bakar baten lan bizialdian eskuzko idazketa > idazmakina mekanikoa > idazmakina elektrikoa > idazmakina elektronikoa > ordenagailua > ordenagailuz lagundutako itzulpena > itzulpen neuronala ibilbidearen mugarri —mugarri baino gehiago, arrakala!— bakoitzak ezarritako aldakuntza sakonetara egokitu behar izan duena.

Erne begiztara!

Esan dut: giza pentsamenduaren aztarnari jarraitzeko gaitasuna irabazi dutenean soilik, ez lehenago, ahal izan dituzte makinek itzulpen aratz eta txukunak egin.

Gizakien funtzionamendu neuronala antzeratzeko gaitasun hutsak, baina, ez die itzultzen erakutsi makinei. Izan ere, gugan bezala, makinetan ere hizkuntzak jakitea baldintza da, baina ez da aski itzulpenak egin ahal izateko: testuetatik ikasten dute makinek, testu masa erraldoiak behar dituzte. Aurrez A>B hizkuntzen norabidean itzulitako testu multzo zenbat eta handiagoak eman makinari, orduan eta hobeki ikasiko du norabide horretan itzulpen egokiak egiten.

Itzulpengintza neuronalaren hastapenetan, giza itzultzaileok aurrez egindako itzulpenak —ez bakarrik, baina batez ere— erabili ziren makinak entrenatzeko: aldizkari ofizialak, ETB1en eta ETB2ren albistegi paraleloak, eskumen librean zeuden itzulpen memoriak eta gisakoak.

Itzultzaile neuronalak hedatzen eta erabiltzen hasi zirenetik, gutxi gorabehera 2017az geroztik, testu masa handiak, oso handiak, itzuli dira ES>EU norabidean. Honez gero, beraz, pentsatzeko da egun makina neuronalen entrenamendua hobetzeko erabiltzen ari diren testu asko, gehienak ez badira, makina neuronal batek egindako itzulpen batean oinarrituta sortu izan direla. Joera hori, gainera, hasi besterik ez da egin, eta hemendik aurrera areagotu besterik ez daiteke egin, probabilitatez, itzulpen gero eta gutxiago izango baitira giza itzultzaile batek hutsetik sortutako testu batean oinarri hartutakoak.

Begien bistako arrisku bat dugu, beraz, erne ez bagaude makinak etengabe erreproduzitzen dituen hutsegite edo akatsak zuzentzeko: edo giza itzultzaileak ixten die bidea, edo makinak betikotuko ditu. Pentsa, gaurdaino itzultzaileak hizkuntzaren gainean ukan duen erantzukizuna handia izan bada, hemendik aurrera zenbaterainokoa izan daitekeen beraren funtzio kualitatiboa.

Wikipediaren adibidea

Itzulpen neuronalak errotiko aldaketa eragin dio euskal Wikipediari: editore kopuru txiki batek askoz ere ekoizpen bizkorragoa egin dezake gaur egun, makina bidez egindako itzulpenetan oinarrituta. Wikimedia Foundationek eta Elhuyar Fundazioak 2021eko urte amaieran izenpetu zuten hitzarmenari esker, ELIA izeneko itzulpen tresna neuronala integratuta dago editoreen tresnatan. Hala, artikulu bat sortu edo hobetzeko lanak askoz ere aiseago egiten ahal dira, beste hizkuntzetako artikuluetatik testuak euskaratuta.

Erne egotera behartuta dago editorea, nire ustez, makina maiz tronpatzen baita. Berriro esango dut: aurrerapen ikaragarria da, puntu zehatz batuetan makinak beti ongi egiten baitu. Esate baterako, izen propioak, leku izenak, mendeak, urteak eta datak, kopuruak eta gisakoak beti ongi ematen dituenez, ez dago arriskurik lapsus calami —edo, hobeki esanda, lapsus clavis— bat gertatzeko; pentsa, zenbateko aurrerapausoa den hori, entziklopedia batean. Era berean, esaldi deklaratibo gehienak —halakoak, pentsa daitekeen bezala, erruz dira testu entziklopedikoetan— ongi ematen ditu makinak, oro har.

Alabaina, entziklopedia batek bere-berea duen definizioaren eremuan, itzultzaile neuronalak akats sistematiko batzuk egiten ditu. Hutsegite horietako hiru dira, nire ustez, gaitzenak:

Nahasterik egon ez dadin, azaltzen ditudan adibide guztiak ELIA itzultzaile neuronalaren bidez euskaratuak dira, berariaz artikulu hau idazteko, eta inolako edizio lanik egin gabe; horrek ez du esan nahi, noski, itzulpen horiek Wikipediako artikuluetan horrela argitaratuta daudenik.

Aditzaren atzerakarga

Bistan denez, Wikipediaren artikulu guztiak definizio batekin hasten dira. Halakoetan, azaldu nahi den izaki edo gauzaren ezaugarriak guztiz era sinple eta laburrean ematea zaila izaten denez askotan, definizioa pixka bat luzatu beste biderik ez dago. Gure inguruko erdarek erlatibozko menderakuntza erabiltzen duten bezala, euskaraz beste molde batzuetara jo behar da: banaturik eman daiteke deskribapena, funtsaren aditz nagusia (gehienetan, aurkezpenezko da/izan zen soila) ahal bezain laster ipinita, eta komunztadura hutsezkoak, berriz, -a gehituak adibidez, «Afrikako zuhaixka bat da, lore gorrikoa, bizkor-bizkor hazten dena» edo «lapurtar idazle bat izan zen, bereziki antzerkia landu zuena», posposiozko erlatibo mugatuaz.

ELIA itzultzaile neuronalak, oraingoz, ez daki hori egiten, baizik, ahal duen guztietan, aditza esaldiaren azken burura eramaten du. Adibide batzuk:

ES – Un destornillador (atornillador o desatornillador) es una herramienta que se utiliza para apretar y aflojar tornillos y otros elementos de máquinas que requieren poca fuerza de apriete y que generalmente son de diámetro pequeño.EU – Bihurkina (bihurkina edo bihurkina) torlojuak eta estutze-indar gutxi behar duten eta, oro har, diametro txikikoak diren beste makinetako elementuak estutzeko eta askatzeko erabiltzen den tresna da.
EN – Drills are commonly used in woodworking, metalworking, construction, machine tool fabrication, construction and utility projectsEU – Zulagailuak, oro har, arotz-lanetan, metalurgian, eraikuntzan, makina-erreminten fabrikazioan, eraikuntzan eta proiektu erabilgarrietan erabiltzen dira.
EN – Fire making, fire lighting or fire craft is the process of artificially starting a fire.EU – Suteak, suteetako argiak edo su-nabea egitea sutea artifizialki hasteko prozesua da.
FR – Un cercle goudronné était un combustible composé de vieilles mèches ou de cordages usés qui étaient trempés dans du goudron, puis pliés avant d’être enroulés pour former un cercle.EU – Asfaltozko zirkulua metxa zaharrez edo erabilitako lokarriz osatutako erregaia zen, mundrunean murgiltzen ziren eta gero tolestu egiten ziren biribilkatu aurretik, zirkulu bat osatzeko.

Definizio konplexuetan, aditza esaldiaren amaierara eramateko ahalegina hainbesterako da, ezen adibide honetan galdu egiten baitzaio bidean:

CA – La Segona República espanyola fou el règim polític democràtic que va existir a Espanya entre el 14 d’abril de 1931 (data de la proclamació de la República, en substitució de la monarquia d’Alfons XIII i el sistema de la Restauració) i l’1 d’abril de 1939 (final de la Guerra Civil espanyola i que va donar pas a la dictadura colpista del general Franco).EU – Espainiako Bigarren Errepublika 1931ko apirilaren 14tik (Alfontso XIII.aren monarkiaren eta Berrezarkuntzaren ordez Errepublika aldarrikatu zen eguna) 1939ko apirilaren 1era (Espainiako Gerra Zibilaren amaiera eta Franco jeneralaren golpa-diktadura) bitartean Espainian izan zen erregimen politiko demokratikoa.

Bat > -a

Juan Garziak aspaldi idatzi zuen «bat erabili baino nahiago dugu hil» hura iltzaturik dauka ELIA itzultzaile neuronalak. Jakina, definizio gehienetan dago bat indeterminaziozkoa. ELIAk determinatuta ematen du ia beti:

CA – Un fogó portàtil és un fogó utilitzat per cuinar o escalfar aliments o líquids a l’aire lliure.EU – Sukalde eramangarria janaria edo likidoak aire zabalean prestatzeko edo berotzeko erabiltzen den sutegia da.
ES – Anna Bessonova (Kiev, Ucrania; 29 de julio de 1984) es una ex gimnasta rítmica ucraniana.EU – Anna Bessonova (Kiev, Ukraina; 1984ko uztailaren 29a) Ukrainako gimnasta erritmiko ohia da.
EN – New Orleans is a consolidated city-parish located along the Mississippi River in the southeastern region of the U.S. state of Louisiana.EU – New Orleans hiri-parrokia finkatua da, Mississippi ibaian zehar kokatua, Luisiana estatuaren hego-ekialdean.
FR – La pression est une grandeur physique qui traduit les échanges de quantité de mouvement dans un système thermodynamique, et notamment au sein d’un solide ou d’un fluide.EU – Presioa handitasun fisikoa da, eta higidura kantitatearen trukea sistema termodinamiko bihurtzen du, batez ere solido edo fluido batean.

Gainera, bat > -a mekanismoa, askotan, aditzaren atzerakargarekin batera konbinatzen da, emaitza ezin bihurriagoak sortzeko, aurreko ataleko adibide batzuetan ikusten den bezala. Berriro ere, esango nuke Wikipediaren definizioetarako, bat indeterminaziozkoa zedarri sendo bat dela: deskribapena banatzeko aurkezle izan daiteke, ezaugarri osagarriak erlatibozko -a gehituak bihurtuta, atzetik: «Afrikako zuhaixka bat da, lore gorrikoa, bizkor-bizkor hazten dena» edo «lapurtar idazle bat izan zen, bereziki antzerkia landu zuena».

Zenbait > hainbat

Hainbat ez dira batzuk, idatzi zuen Alfontso Mujikak foro honetan bertan, orain dela zortzi bat urte, zentzuz beteriko artikulu batean. ELIAk ez daki halakorik, modu sistematikoan bihurtzen baititu hainbat erdaretako zenbatzaile zehaztugabe gehienak:

FR – Certains d’entre eux ont ensuite été absorbés par l’Empire ottoman, tandis que d’autres bénéficièrent de divers types d’autonomie au cours des siècles.EU – Horietako batzuk gero Otomandar Inperioak xurgatu zituen, eta beste batzuk, berriz, hainbat autonomia-motaz baliatu ziren mendeetan zehar.
EN – People trying to escape the big cities carried their antisemitic values with them, spread the ideas throughout Russia, and caused more pogroms in different regions of Russia.EU – Hiri handietatik ihes egiten saiatzen ziren pertsonek beren balio antisemituak eramaten zituzten, ideiak Errusia osora zabaltzen zituzten, eta pogromo gehiago sortzen zituzten Errusiako hainbat eskualdetan.
ES – Diferentes máquinas de construcción: de izquierda a derecha: un buldócer, excavadoras, retroexcavadoras, cargadores frontales.EU – Hainbat eraikuntza makina: ezkerretik eskuinera: buldaltzer bat, hondeamakinak, atzerakako hondeamakinak, aurreko kargagailuak.
CA – Diferents elements, com les terres rares, han començat a augmentar la seva demanda com a resultat de les noves tecnologies que s’estan desenvolupant actualment.EU – Hainbat elementu, hala nola lur arraroak, eskaria handitzen hasi dira gaur egun garatzen ari diren teknologia berrien ondorioz.

Adibide honetan, itxura du ELIAk urrats bat egiten duela aurrera, interpretatuz asko direla, erdarako zenbatzaile zehaztugabeak aipatu nahi dituenak:

CA – Les pedreres entren dins d’un subtipus de mina a cel obert, obtenint principalment àrids de diversos tipus.EU – Harrobiak aire zabaleko meatze-azpimota batean sartzen dira, eta mota askotako agregakinak lortzen dituzte, batez ere.

Itzultzailearen zeregin erabakigarria

Hiru kasu besterik ez dira, testuinguru mugatu batekoak, baina uste dut aski adierazgarriak direla, ongi ulertzeko zein erabakigarri izango den itzultzaile erneen funtzioa itzultzaile neuronalaren garaian; funtzio kapital bat, adimen artifizialaren bidez itzultzen duten makinek hobeki ikas dezaten etorkizunean.

One Reply to “”

  1. Zuek hobeto.

    Begira nolako itzulpenak eman dizkidaten ELIAk eta Itzultzaile neuronalak. Hauxe itzulgaia:

    “Batzarreko parte hartzaile guztiek obarioetako mina izaten dute, batez ere hilekoa dutenean”

    Hauxe erantzuna:

    ELIAk:
    “Todos los participantes en la asamblea sufren molestias ováricas, especialmente cuando tienen menstruación”

    Itzultzaile neuronalak:
    “Todos los participantes en la asamblea sufren dolores ovarios, sobre todo cuando tienen la menstruación”

    Ez da joskera kontu hutsa (Itziar Otegiren ‘Senar duenak jaun du’ sarreraren ildoan).

    Zuek hobeto; dudarik ez, Gotzon.

    Atsegin dut

Utzi iruzkina