Elizabete Manterola Agirrezabalaga
Adimen artifiziala gure egunerokoan barru-barruraino sartu zaigun honetan, Elhuyarren eta EHUko TRALIMA-ITZULIK ikerketa taldearen artean landu dugun proiektu baten berri emango dut idatzi honetan. Euskaratik gaztelaniarako norabidean itzultzaile automatikoek eskaintzen duten emaitza aztertu nahi izan dugu, genero alborapenik ba ote den ikusteko. Elhuyarreko Klara Ceberio, Itziar Cortés eta Eneko Sagarzazu eta EHUko TRALIMA-ITZULIK ikerketa taldeko Aitziber Elejalde, Zuriñe Sanz, Naroa Zubillaga eta ni neu aritu gara proiektu honetan lanean. Idatzi hau nik sinatzen badut ere, zazpion artean eginiko lanaren emaitza dakart.
Genero-alborapena arazo ezaguna da itzultzaile automatikoen alorrean. Tresna horiek elikatzeko erabiltzen diren adibideetatik ikasten dutenez, algoritmoek testuetan dauden alborapen eta estereotipoak ikasten eta errepikatzen dituzte. Arazo hori are nabarmenagoa da genero gramatikalik markatzen ez duten hizkuntzetatik generoa markatzen duten hizkuntzetara itzultzean, konparazio batera, euskaratik gaztelaniarako noranzkoan.
Itzulpen automatikoen emaitzetan sakondu asmoz, euskaratik gaztelaniara testuak itzultzean IAk nola jokatzen duen begiratu dugu. Genero gramatikala markatu gabea duenez euskarak, itzultzean sarritan markatu beharra egokitzen baita. Esaterako, subjekturik ez dagoenean markatuta (etorri da), posible da markatu gabe uztea (ha venido), baina markatu beharra suertatzen da gaztelaniaz halabeharrez, maskulinoan ala femeninoan, euskaraz subjektua markatuta dagoen kasuetan (ikaslea etorri da –> El/la alumno/a ha venido), nahiz eta euskarazko esaldiak subjektu horren generoa zehaztu ez.
Itzultzaile automatikoek genero alborapenik egiten ote duten eta zer neurritan aztertzeko, maila lexikoko bi elementu hautatu ditugu: adjektiboak eta lanbide-izenak. Maskulinotzat jotzen diren lanbide eta adjektiboekin zerrenda bana osatu dugu eta beste zerrenda bana femeninotzat jotzen diren lanbide eta adjektiboekin. Dabilena corpusetik adibide errealak hartu eta corpus bat osatu dugu, euskarazko esaldiekin eta Eliak emandako esaldi horien gaztelaniazko itzulpenekin.
Esaldi kopuru zabal samarra aztertu dugu, adibide interesgarri ugari lortu, eta datu esanguratsu zenbait atera. Ez naiz baina emaitzak xehe-xehe ematen hasiko hemen, hau ez baita datu kuantitatiboak emateko toki aproposena. Azterketan atera dugun ondorio nagusi bat aurkeztuko dut horren ordez.
Jakina da itzultzaile automatikoek, gaur-gaurkoz, esaldi mailako emaitzak eskaintzen dituztela. Hau da, ez dute testua bere osotasunean kontuan izaten, eta horrek koherentzia arazoak sortzen ditu. Esaterako, kirolari batek marka berria egin duela esaten bada albiste batean eta testuan aurrerago esaten bada kirolari horrek gogor entrenatu duela lorpen horretara iristeko, makinak albiste hori gaztelaniara itzultzean itzul dezake kirolaria emakumezko modura lehen agerpenean eta gizonezko modura bigarrenean. Ez baitu testua bere osotasunean prozesatzen.
Gure proiektura itzuliz, euskarazko jatorrizko testuak eta itzultzaile automatikoaren emaitzak aztertzean, adibidea eta testuingurua izan ditugu eskura ikertzaileok. Itzultzaile automatikoak esaldika funtzionatzen duela jakitun, ez dugu testuingurua kontuan hartu. Nahiz eta guk geuk testuingurua eskura izan emaitzak aztertzean eta beste mota batzuetako ondorioak ateratzea izan dugun hortik.
Lau adibiderekin erakutsiko dut testuinguruaren auzia, adibide bat aztertu dugun kategoria bakoitzeko. Kolore grisez testuinguruko informazioa markatu dugu eta kolore beltzez aztergai izandako esaldia. Letrakera lodiz markatu dugu estereotipaturiko hitza, kasuan kasu.
| Dabilena corpusetik ateratako adibideak | |
| Maskulinotzat jotako adjektiboa | Korrika egiteko oinak mugitu behar dira, baina horretarako buruak %100ean egon behar du, beti, lasterketa guztietan, eta Maite ona da horretan. Beti da lehiakorra, beti ematen du daukan dena. |
| Femeninotzat jotako adjektiboa | Ez zenuen Maddiren ama ezagutu, ezta? Koadrilako batek esaten duen moduan, TXEMA bat zen: Txortan Egiteko Moduko Ama. Polita, elegantea, karrerarekin, modernoa, sasoikoa… web porno bateko istorioetatik ateratakoa zirudien. Egunen batean horrelakoa izango zen Maddi: zoragarria. |
| Maskulinotzat jotako lanbidea | La pelota vasca. La piel contra la piedra film luzea egin eta lau urtera itzuli da Medem. Film hark zenbait kritika izan zituen eta urtebete inguruko nerbio beheraldia eragin zioten zinemagileari. Berak dioenez, ordea, dagoeneko osatu da erabat. |
| Femeninotzat jotako lanbidea | Vanessahirian geratu da eta supermerkatu batean lan egiten du. Hasieran kutxazain gisa arituzen eta orain dela gutxi postu administratibo bat eskaini dio zuzendaritzak. |
Lehenengo adibidean, Maite ona dela aipatzen da testuinguruko esaldian, baina aztertu beharreko esaldian, horren ostekoan, subjektua omitituta dago eta aurreko esaldia irakurri gabe ezin da jakin nor den lehiakorra. Bigarren adibidean ere subjekturik ez da ageri aztergai izan dugun esaldian. Polita, elegantea, modernoa, sasoikoa aipatzen da, baina bi esaldi lehenagora jo behar dugu testua Maddiren amaz ari dela jakiteko. Hirugarrenean, zinemagilea aipatzen da aztertu dugun esaldian eta hor ere bi esaldi lehenago esaten da nor den. Kasu horretan, gainera, zinemagilearen abizena besterik ez da aipatzen: Medem. Irakurlearen kultur ezagutzak lagunduko du jakiten La pelota vasca dokumentala Julio Medemek zuzendu zuela, alegia gizonezko batek. Azkeneko kasuan, kutxazainak Vanessa izena duela eta hortaz femeninoa beharko lukeela testuinguruko esaldiak zehazten digu.
Eta nola jokatu du Eliak?
Maite es buena esan eta hurrengo esaldian siempre es competitivo esan du. Maddiren ama bonito, elegante, con carrera, moderno, de temporada omen da. Medemi erreferentzia egiten dion “zinemagile” lanbide-izena omititu egin da gaztelaniazko ordainean. Eta Vanessak cajero modura lan egin omen zuen hasieran. Hona hemen gaztelaniazko ordainak bere osotasunean. Jarraian ikus litezke itzulpenak osorik:
| Goiko taulako esaldien itzulpenak, Eliak emanak | |
| Maskulinotzat jotako adjektiboa | Para correr hay que mover los pies, pero para ello la cabeza tiene que estar siempre al 100% en todas las carreras y Maite es buena. Siempre es competitivo, siempre parece lo que tiene. |
| Femeninotzat jotako adjektiboa | ¿No conociste a la madre de Maddi, no? Como dice una de las cuadrillas, era un TXEMA: Txortan Egiteko Ama. Bonito, elegante, con carrera, moderno, de temporada… parecía sacado de las historias de una web porno. Un día Maddi fue así, maravilloso. |
| Maskulinotzat jotako lanbidea | La pelota vasca. Medem vuelve cuatro años después de su largometraje La piel contra la piedra. La película contó con varias críticas que provocaron una decadencia nerviosa de un año. Pero dice que ya se ha completado totalmente. |
| Femeninotzat jotako lanbidea | Vanessa se queda en la ciudad y trabaja en un supermercado. Al principio trabajó como cajero y recientemente la dirección le ha ofrecido un puesto administrativo. |
Lau adibide soil eta lauetako batek ere ez du behar bezala asmatu, dela komunztadura arazoak medio, dela omisioagatik. Nahikoak dira ikusteko itzultzaile automatikoek ez dutela testua bere osotasunean kontuan izaten, ezta aurreko edo osteko esaldiak ere. Esaldi mailan funtzionatzen dute, eta esaldi barruan ere batzuetan komunztadura arazoak topa litezke, erreparatu esaterako bigarren adibideko azken esaldiari: Un día Maddi fue así, maravilloso.
Adimen artifiziala abiada bizian ari da aurrera egiten eta testuingurua kontuan izango duten gailuak sortuko dira etorkizun hurbil batean. Hala ere, testuinguruak ez digu beti argituko subjektuaren generoa, ezin beti emaitza perfekturik lortu. Zer egin edo nola jokatu bi generoentzat erabiltzen diren izen bereziekin? Amets, Itsaso, Lur? Eta erdal izen bereziekin? Zer egin, halaber, generoa berariaz zehaztu nahi ez den kasuekin? Hau da, anbiguotasuna nahita bilatzen den kasuekin? Giza adimena behar-beharrezkoa izango da halakoak behar bezala itzultzeko, ezinbestean.

