Euskaraz sortutakoa gaztelaniara itzultzeko itzultzaile automatiko neuronala

Maite Imaz Leunda

Uda honetan komunikabideetan irakurri eta entzun dugun berria izan da Osakidetzak itzultzaile neuronal bat jarri duela martxan, historia klinikoak euskaratik gaztelaniara itzultzeko: ITZULBIDE du izena. Hasiera batean Donostialdeko erakunde sanitario integratuan (ESI) ipini dute, baina berandu baino lehen Osakidetzako sare guztietan erabilgarri egongo den itxaropenarekin.

Orain dela lau urte inguru hasi ziren proiektua garatzen, Osakidetzan euskara lan hizkuntza ere izan dadin. Dokumentazio estandarra ele bietan argitaratzen da Osakidetzan, baina dokumentazio klinikorako irizpide zehatzik ez dagoenez, joera gaztelaniaz egitekoa izan omen da orain arte. Felix Zubia mediku, irakasle eta dibulgatzaileak EITBko programa batean adierazi zuenez, Osakidetzaren 3. Euskara Planaren barruan dagoen zerbait da, bertan jasotzen baita euskarak lan hizkuntza ere izan behar duela.

Zubiaren esanetan, unibertsitatean prestatzen dira profesionalak euskaraz, badituzte beraz apunteak euskaraz, eta medikuntzako hiztegi terminologikoak ere landu dira, baina behin lanean hasitakoan, pazientearekin izandako harremana euskaraz izan arren, txosten klinikoak euskaraz idazteko baliabiderik ez dute izaten. Izan ere, geroago beste medikuren batek irakurri beharko du txosten hori eta baliteke euskaraz ez jakitea. Badira euskaraz lan egin nahi duten medikuak, baina euskara ulertzen ez dutenak ere badirenez, txosten klinikoak beti gaztelaniaz idatzi izan dira orain arte.

ITZULBIDEk bi norabideetan egiteko aukera eskaintzen du, baina helburua euskaratik gaztelaniara erabiltzea da, euskaraz lan egiteko eskubidea bermatzen baita horrela, eta baita pazienteak informazioa euskaraz jasotzekoa ere. Laburdurekin badu arazoren bat, ez ditu laburdura guztiak ondo atzematen, eta hori konpontzen ari dira.

Berri ona da euskarak espazio berriak irabaztea, orain arte gaztelania bakarrik erabili izan den eremuetan euskaraz egiteko aukerak jartzea, eta ni asko pozten naiz adimen artifizialean oinarritutako teknologia berriek euskara sustatzeko bideak irekitzen dituztenean.

Uda betean argitaratu zen, halaber, elcastellano.org gaztelania sustatzeko webgunean, medikuntzako itzulpen automatikoetan saihestu beharreko arriskuez ziharduen artikulu bat. Medikuntzako hizkera oso teknikoa eta zehatza izaten dela zioen, anbiguotasunetarako lekurik ez duena eta ñabardurak oso kontuan hartu behar dituena.

Adierazten zuen hitz edo termino baten itzulpen desegokiak oso ondorio larriak izan ditzakeela eta adibide gisa ipintzen zuen ingeleseko “stroke” hitza, gaztelaniara “ictus” edo “golpe” gisa itzuli behar den ezin duela asmatu neuronalak, edo zenbakizko adierazpenetan akatsak egitea zeinen larria izan daitekeen; gaizki jarritako hitz batek dena alda dezake: 0,5 eta 5 artean dosi bat nahasteak arriskuan jarri dezake paziente baten bizitza. Eta Itzultzaile automatiko batek inoiz itzuli behar ez lituzkeen dokumentuen artean sartzen zituen txosten klinikoak.

Orduan, elcastellano.org argitalpenean esaten denari kontra egitera ote dator ITZULBIDE? Ausartegia edo arriskutsua ote da hain eremu delikatuan itzultzaile automatiko neuronala erabiltzea?

ITZULBIDEri buruz zerbait gehiago ikasi nuen “Itzultzaile neuronalen eraginak euskararen erabileran” izeneko ikastaroan; hori ere udan izan zen, baina joan den urteko udan, 2024an. Olatz Perez de Viñaspre informatikari eta ikerlariari ondo ulertu banion, espezialitate eremu jakin horretako itzultzaile neuronal berezia osatu ahal izateko corpus orokor elebiduna sartzeaz gain, historia klinikoetako corpusa sartu zuten, gaztelaniaz, eta behar bezala anonimizatuta, datu pertsonalak ezkutatzeko. Medikuntzako hiztegi terminologikoak ere sartu zituzten. Ondoren, txosten klinikoak itzultzeko agindu eta itzulpenak zuzendu edo posteditatu ondoren horiekin osatutako txosten klinikoen corpus elebidunak sartu zituzten.

Orain dela 30 urte inguru itzulpengintza automatikoaz irakurri nuen liburu batean (W. John Hutchins & Harold S. Somers. An Introduction to Machine translation, 1992) garai hartako itzultzaile automatikoen artean METEO nabarmentzen zen. Orduko itzultzaile automatikoak arauetan oinarritzen ziren, ez zuten gaur egungo itzultzaile automatiko neuronalak bezain ondo egiten eta ez zirudien euskara bezalako hizkuntza batentzat arauetan oinarritutako eredu egokirik sortzea posible izango zenik.

Kanadan eguraldi parteak ingelesetik frantsesera itzultzeko jarri zen martxan METEO, 1976an: transferentzia lexikoa eta analisi sintaktikoa egiten zituen. Erabiltzen zuen hiztegia mugatua izatea eta norabide bakarrean egitea jotzen ziren arrakastatsua izateko gakotzat. Itzulpen automatikoaren aldeko adibiderik egokiena zen garai hartan METEO.

Gaur egungo ITZULBIDE lehengo mendeko METEOren parekoa izan daiteke agian. Eremu zehatz jakin baterako bereziki entrenatua, hizkuntza ez seguru asko eguraldi parteena bezain mugatua baina bai oso espezifikoa, eta norabide bakarrean erabiltzekoa, hasiera batean behintzat. Ezaugarri horiek izanda, tresna segurua izan daiteke.

Bada beste arrazoi bat segurua izango dela ziurtatuko duena, nire ustez. Euskaraz sortzen dugunok gaztelaniaratzeko itzultzaile automatiko neuronalak erabiltzen ditugunean ez gara botoi bati sakatuta konformatzen; zuzendu edo posteditatu egiten dugu. Gaztelaniazko testuaren estiloak ez gaituenean erabat asebetetzen ez dugu beti asmatuko txukuntzen edo ez dugu behar bada gaztelania naturalean nola ipini jakingo, baina ziurtatuko dugu testu biek gauza bera esaten dutela, jatorrizkoan esaten den guztia esaten dela itzulpenean, eta itzulpenean ez dela jatorrizkoan azaltzen ez denik esaten.

Gaztelaniatik euskaratu behar denean, ordea, askok pentsatzen dute botoi bati emanda nahikoa dela; klik bat egitea nahikoa dela euskararekiko betebehar guztiak gauzatzeko. Itxurari ematen zaio garrantzia, mamia kontuan hartu beharrean. Euskararen prestigio urria dago joera horren oinarrian.

Pentsatzen dut medikuntzako profesional euskaldunek euskaraz sortutako txosten klinikoak ez dituztela besterik gabe euskara hutsez gordeko ordenagailuan; hori egin aurretik emango diotela botoiari, irakurriko dela ITZULBIDEk emandako ordaina, ziurtatuko dutela gaztelaniara egindako itzulpena zuzena dela eta geroago etor daitekeen mediku erdaldunak ondo ulertuko duela.

Itzultzaile neuronalak eragindako kexak

Maite Imaz Leunda

Eusko Jaurlaritzako Hizkuntza Politikako Sailburuordetzan lanean ari naizenez geroztik, herritarrek ingurune digitala dela-eta noizean behin bidaltzen dituzten kexak jasotzea ere egokitzen zait, eta kexa horiek ITZULI itzultzaile automatiko neuronalaren jarduerarekin izaten dute zerikusia batzuetan.

ITZULI itzultzaile neuronala 2019an jarri zuten herritarren eskura, eta, besteak beste, IDABA Eusko Jaurlaritzako itzulpenen datu-basearen erabilerak behera egin zuen. Ordura arte, EJko teknikariek bazuten IDABAra jotzeko ohitura, administrazioko fraseologia edo terminologia kontsultatzera, eta zegokion terminorako ordainik topatzen ez zutenean edo ordain bat baino gehiago topatzen zituztenean, DUDANET hizkuntza-zalantzak argitzeko zerbitzura ere jotzen zuten. Itzultzaile neuronala zabaldu zenean, ohiturak aldatu egin ziren: IDABAren erabilerak behera egin zuen.

Orain dela ia urtebete kexatu zen pertsona batek zioenez, discapacitado/a itzultzerakoan minusbaliatu eman zuen eta termino hori oso gaizki zegoen, desgaitasuna idatzi behar baita, desgaitasuna duen pertsona edo desgaitasunen bat duen pertsona. Kexaren helburua zen itzulpen tresna eguneratzea eta hobetzea.

Proba egin genuen, eta konturatu ginen ITZULI orokorra zela okerreko terminoa ematen zuena, ITZULI juridiko-administratiboak desgaitu ematen baitzuen. Gaur ere proba egin dut, kexa eragin zuen esaldi berarekin, eta ezindu eman dit bietan, orokorrean eta juridiko-administratiboan: ezindu ez da minusbaliatu bezain aldrebesa, baina ez da terminorik egokiena ere.

Ni saiatzen naiz azaltzen itzultzaile automatiko neuronalek ez dutela gizakiak bezala lan egiten, probabilitateetan eta algoritmoetan oinarritzen direla, gizakiek baino askoz ere azkarrago itzultzen dutela, baina esaldiz esaldi, testuingurua ezagutu gabe, eta akatsak egiten dituztela; ez dituztela terminoak askotan ondo ematen, ez dituztela sinonimoak bereizten; itzultzaile neuronalek datu asko behar dituztela entrenatzeko, eta zaila dela nola funtzionatzen duten kontrolatzea eta ulertzea; eguneratzea ez dela itzulpen-memoria bat eguneratzea bezain gauza sinplea; urtean behin edo bitan elikatzen eta eguneratzen dituztela, corpus elebidunak eta ordenagailu sendoak erabilita; corpusak bolumen nahikotxo izan behar duela, prozesuak bere denbora behar izaten duela eta bukatu ondoren probak egin behar direla kalitatea hobetu dela egiaztatzeko. Eta esaten diet itzultzaile automatiko neuronalak itzulitakoak beti-beti posteditatu behar direla. Baina ez dakit inor konbentzitzea lortzen ote dudan.

Aste honetan beste kexa bat jaso dugu eta betiko erantzuna eman diot, baina oraingo honetan poz pixka bat eragin dit kexak: Tutore klinikoak eta beste hainbat langilek (erizaina, hidroterapiako zaintzailea…) itzultzerakoan, ITZULIk el tutor clínico y otros trabajadores (enfermeras, cuidadoras de hidroterapia itzuli du. Generoa kontuan hartu behar lukeela dio kexa egin duenak.

Nik proba egin dudanean, egiaztatu dut ITZULI orokorraren emaitza dela kexa eragin duena. ITZULI juridiko-administratiboak el tutor clínico y otros profesionales (enfermeros, cuidadores de hidroterapia… eman dit. Ez dakit maskulino generikoa zuzenagoa den edo maskulino eta femenino estereotipatuak ematea bezain okerra den.

Poz pixka bat eragin didana kontsulta euskaratik gaztelaniara egina zegoela ikustea izan da. Itzulpengintzan ibiliak garenok susmoa izaten dugu neuronalaren erabilera euskararen kalterako izaten dela sarriegi.

Euskara hizkuntza ofizial bihurtu zenez geroztik, nabarmen ugaritu da euskara idatziaren zein ahozkoaren presentzia, eta ugaltze hori, hein handi batean, itzulpengintzari esker izan da. Itzultzaileek ekarpen handia egin dute administrazio-hizkera finkatu ahal izateko; euskarazko testu administratiboen eta teknikoen fraseologia eta terminologia itzulpengintzaren eskutik jorratu dira, neurri handi batean, urte hauetan guztietan. Eta hizkuntza finkatzeko prozesua ez da oraindik bukatu.

Itzultzaile automatiko neuronalen erabilera nagusitu denez geroztik, ordea, arrisku nabarmenak ikusten ditugu: itzultzaileen eta interpreteen bitartez euskarak orain arte irabaziak dituen espazioak adimen artifizialarekin sortutako hizkuntza-teknologiek ordeztekoa; eta horrek, jakina, kalte handia eragiten dio euskararen erabilerari eta kalitateari.

Baina euskara gehiago erabiltzeko eta euskarak espazio berriak irabaz ditzan aukera ere eskaintzen du itzultzaile automatiko neuronalak. Udalerri Euskaldunen Mankomunitateko udal batzuek beren langileen eskura jarri dituzte itzulpen neuronaleko tresnak, euskaraz sortutako testuak gaztelaniara eta beste hizkuntzetara automatikoki itzuli ahal izateko; edo barrurako den agiriren batek hizkuntza-eskakizunen derrigortasun-araudia betetzetik salbuetsita dagoen langileren bati eragiten dionean, eta langile horrek euskara-gaitasun nahikoa ez badu, udal-funtzionamendua ez trabatzeko itzulpen-tresna elektronikoetara jo dezan.

Nolanahi ere, tresna elektronikoak erabili ala ez, sustatu behar dena kalitatezko euskararen erabilera da.

Adimen artifiziala euskaraz

Maite Imaz Leunda

Common Voice Mozilla Fundazioak (kode irekiko Mozilla proiektuaren arduradun den irabazi asmorik gabeko erakundeak) abiarazitako lankidetza-proiektua da, ahots-grabaziozko datu-base libre bat sortzeko, horrekin kode irekiko ahots ezagutzailea (speech-to-text motorra) lortzeko hainbat hizkuntzatan. Boluntarioek mikrofono batekin grabatzen dituzte esaldiak eta grabazioak beste erabiltzaile batzuek berrikusten dituzte. Transkribatutako esaldiak ahotsezko datu-base batean jasotzen dira, jabari publikozko lizentziapean. Lizentzia horrek ziurtatzen du edozein garatzailek datu-basea erabil dezakeela ahotsetik testurako aplikazioetarako, mugarik edo kosturik gabe.

Euskarari dagokionez, Librezale euskara informatikaren munduan bultzatzea helburu duen lantaldea hasi zen sustapena ematen eta grabazioak egiten. Geroago Eusko Jaurlaritzako Hizkuntza Politikako Sailburuordetzak bultzada ematea erabaki zuen eta hainbat urrats egin ziren 2023an; egitasmoaren aurkezpen publikoa egin zen Tabakaleran eta horren inguruko hainbat publizitate egitasmo: spota komunikabideetan, Euskal Irrati Telebistako Gaitu-eguna, Grabazio maratoia hiriburuetan eta hainbat herritan, erronka bideratu zen ahotsak biltzeko proiektua bultzatzeko.

Bultzadaren ondorioz, boluntarioen kopuruak goraldia izan zuen, baina geroztik geldi samar dago. Gaur egun 10.000 hiztunetik gora daude erregistratuta eta 665 ordu grabatuta. Ekimenaren berri etengabe eman beharra dago jendeak ekarpenak egin ditzan. Ahots asko eta askotarikoak behar dira, adin tarte, genero eta mota guztietakoak. Milaka ahots behar dira eta milaka grabazio ordu euskaraz.

Kode irekiko ahots ezagutzailea librea izatean, edonork, hemengo eragileek zein beste enpresa teknologiko handiek, erabili ahal izango du garapenak egiteko.

Adimen artifizialak ekar ditzakeen abantailak handiak dira. Euskal Herrian badira adimen artifiziala eta euskara jorratzen ari diren ikertzaileak; esaterako, ahozko desgaitasuna duten pertsonen komunikazioa erraztuko duten sintesi-teknologien garapenean, ahots pertsonalizatuen sintesia lortzeko; edo ahotsaren transkripzio automatiko elebidunak egingo dituen tresnak garatzen, ahozko jarduna bi hizkuntzatan egiten den kasuetarako; edo euskara ikasten ari direnentzako txatbotak, ikasleek makinekin euskarazko elkarrizketak eduki ahal izan ditzaten.

Adimen artifizialaren arriskuak ere nabarmenak dira, ordea, modu desegokian erabiliz gero. Itzultzaileen eta interpreteen lana arriskuan egon daiteke itzultzaile automatiko neuronalak eta transkribatzaile automatikoak lagungarri gisa erabili beharrean profesionalen lana ordezkatzeko erabiltzen badira. Behin eta berriz esan beharra dago teknologia berrien egitekoa ez dela soilik euskara ikusgarriago egitea eta zabaltzea, kalitatezko euskara erabiltzea eta zabaltzea baizik.

Baina bada erabilera desegokiarena baino arrisku handiagoa: adimen artifizialean euskara ez sartzea eta ingurune digitaletik kanpo geratzea, alegia. Adimen artifizialaren kontrako ahotsak entzuten dira esanez hizkuntza gutxituak babestu egin behar direla. Baina adimen artifizialari uko egitea eta adimen artifizialetik kanpo gelditzea ez da euskara babestea. Orain dela hamarkada batzuk ere baziren euskara batuaren kontra zeudenak euskalkiak babestu behar omen zirelako, baina euskara batua sortu ezean euskarak berak bizirik irautea zen jokoan zegoena.

Teknologia digitaletan ingelesa eta beste hizkuntza nagusi batzuk izaten ari diren bilakaera azkarra baldintza beretan egin ezin duten hizkuntzek desagertze digitalerako zorian eta arrisku larrian egon daitezke. Hizkuntza digitaletan dauden ezberdintasunak mehatxu larria dira hizkuntza-aniztasunarentzat.

Gaur egungo egoerari begira, irtenbide digital aurreratuetarako behar den euskararen corpus digitala oso txikia da. Euskarazko corpus digitala izatea estrategikoa da hizkuntza-eredu eta aplikazio digital aurreratuak garatzeko ezinbesteko abiapuntua delako, eta datuak estrategikoak dira teknologia garatzeko.

Adimen Artifiziala hemen daukagu eta euskaraz egiten ez badu euskal hiztunek beste hizkuntza batzuetara joko dute. Hizkuntza gutxitu batek bere egiten ez duen esparrua inguruko hizkuntza hegemonikoek bereganatzen dute.

Itzultzaile automatiko neuronalak eta itzulpen-memoriak

Maite Imaz Leunda

Orain dela 24 urte idatzi nuen lehenengo artikulua itzulpen-memoriak kudeatzeko programei buruz. Garai hartan euskararako itzultzaile automatikorik ez zegoen eta nik ez nuen uste euskaraz lana txukun egingo zuen itzultzaile automatikorik ezagutzera iritsiko nintzenik. Itzulpen-memoriak kudeatzeko programek liluratu egin ninduten ematen zituzten erraztasun guztiengatik.

Programa ordenagailuan instalatu zidatenean, 1997an, goitik behera irakurri nituen jarraibideak lanean hasi aurretik. Segurtasun handia eman zidan horrek, beti gustatu izan baitzait erabiltzen ari naizen programa edo aplikazioa kontrolpean izatea. Gaizki sentitzen naiz zertan ari naizen garbi eduki gabe itsumustuan nabilenean.

Itzulpen-memoriak kudeatzeko programek itzulitako testuak esaldika edo segmentuka parekatuta gordetzeko aukera ematen zutenez, bi hizkuntzatan dauden segmentu-pareen biltegia sor zitekeen nahiko erraz. Itzulpen-memoriaren aplikazioak bilaketak egiteko modua asko arindu zuen eta guztiz erabilgarria bihurtu zen itzultzaileon eguneroko lanerako. Berdin-berdinak ziren esaldiez gain, antzekoak bilatzeko aukera ere ematen zuen. Horrekin batera, terminologiako datu-basean begiratzen zuen itzuli beharreko esaldi horretako hitzak edo terminoak azaltzen diren. Bilaketa bikoitz horren emaitzak pantailan azaltzen zizkigun, nahiko azkar, eta komeni zitzaigun lekuan erraz kopiatzeko moduan. Dokumentu osoak aztertzeko aukera ere ematen zuen, dokumentua ireki beharrik gabe memorian zenbat zegoen itzulita ikusteko.

Antzeko dekretuak eta ebazpenak, urtero errepikatzen diren deialdiak behin eta berriz itzultzen aritu beharra, behin eta berriz lan bera egin beharra ekidin zuten itzulpen-memoriek. Testu itzuli berri baten bertsio berri bat azken orduko aldaketekin baina aldaketak non zeuden markatu gabe etortzen zenean ere testu osoa alderatu beharra ekidin zuten itzulpen-memoriek. Aurretik gauzak nolakoak ziren gogoan izateko adina dugunok ondo dakigunez, mugarria izan zen itzulpen-memoriak kudeatzeko programak itzultzaileen ordenagailuetan instalatu eta lan-jardunean txertatzea.

Hitzak, hitz multzoak edo terminoak kontsultatzeko aukera iruditzen zitzaidan guztietan erabilgarriena, hasieran biltegiratutako esaldi pareak gehiegi ez zirenean, batez ere. Itzulpen-memorian itzuli beharreko esaldi batentzat ordainik ez egon arren, esaldi horretan azaltzen zen hitz bat, edo hitz multzo bat, itzulita egon behar zuen susmoa izanez gero, kontsulta egin zitekeen, eta itzulpen-memoriak hitz edo hitz multzo hori jasota zeukaten esaldi pareen zerrenda ematen zigun; hori hiztegian begiratzea baino lagungarriagoa izan zitekeen batzuetan egokiena zen hitza aukeratzeko orduan, hitza edo terminoa testuinguruan kontsultatzeko aukera ematen baitzuen.

Gerora, itzulpenen datu-base dokumentala ipini ziguten. Nahiz eta datu-base dokumentalean kontsultatzeak denbora gehiago eskatu, emaitzen testuingurua hobeto ikusteko parada eskaintzen du, esaldiaz haratago dokumentu osoa ikus daiteke eta.

Hori dena egiten zuten eta egiten dute orain ere. Itzulpen-memoriak ez dira desagertu itzultzaileen ordenagailuetatik. Itzulpen-memoriak eguneroko lanaren bitartez elikatzen dira, testuak itzuli ahala memorian gordetzen dira eta, horrekin batera, lehendik zegoena zuzentzeko aukera ematen du. Gaztelaniazko esaldiaren euskarazko ordaina esaldi bat baino gehiagotan ematen denean ere arazorik gabe gordetzen du.

Lerrokatzaile automatikoaren bitartez ere elikatu daiteke itzulpen-memoria, jatorrizko testua eta itzulpena hartu eta nahiko modu automatikoan esaldiz esaldi parekatuz.

Itzultzaileak badu memoriak kudeatzeko aukera ere; zerbait gaizki badago, hitzen baten ortografia aldatzen bada edo terminologia eguneratzen bada, itzulpen-memoria osoa aldatzeko aukera ematen du; ordezkapen globalak nahiz banan banakoak egin daitezke. Itzulpen-memoria osoa ikusteko eta memoria batetik bestera transferitzeko aukera ere ematen du.

Gustuko nuen itzultzaile soil izanda programa osoa kontrolpean nuela sentitzeak; horrek ere segurtasuna ematen zidan. Programak itzultzaile guztioi ipini eta itzulpen-memoriak ugarituz joan ziren neurrian eskertu genuen informatikarien laguntza, jakina, baina teorian itzulpen-memoriena itzultzaileak bere kabuz bere ordenagailuan kudea dezakeen programa da.

Itzultzaile automatiko neuronalarekin ez da gauza bera gertatzen. Neuronala ez da nire ordenagailuan erabateko kontrolpean daukadan zerbait. Itzultzaile neuronala ez da erabili ahala elikatzen eta ezin ditugu zuzenketa puntualak momentuan egin.

Itzultzaile neuronalak urtean behin edo bitan elikatzen eta eguneratzen dituzte, corpus elebidunak erabilita, eta ordenagailu sendoekin egiten da hori. Corpusak bolumen nahikotxo izan behar du, prozesuak bere denbora behar izaten du eta bukatu ondoren probak egin behar dira kalitatea hobetu dela egiaztatzeko, hala ez bada, emaitza hobeak eman beharrean okerragoak ematen baditu, atzera egin eta lehengoratu egin beharko da eta. Komenigarria da, beraz, itzultzaile automatiko neuronalarekin egindako eta posteditatutako itzulpenak itzulpen-memorietan jasotzea, itzultzaileen kasuan ohikoena den moduan, eta itzulpen-memorietako corpus elebidun horiek erabiltzea (zenbat eta corpus handiagoa, hobe) itzultzaile automatiko neuronala elikatzeko eta eguneratzeko.

Itzultzaile neuronalak ez du aukerarik ematen hiztegi terminologiko jakin batzuk aukeratzeko itzulpen-prozesuari ekin aurretik. Kontu handiz begiratu behar da terminologia posteditatzerakoan. Hitzak edo terminoak kontsultatzeko ere ez dute itzulpen-memoriek bezain ondo lan egiten; itzultzaile neuronala ez da egokia hitz solteak eta terminoak kontsultatzeko, sinonimoak ez ditu bereizten askotan (preciso y exacto zehatza eta zehatza itzultzen dute) eta, arestian esan bezala, terminoak ere ez ditu egoki ematen beti. Hitzak eta terminoak kontsultatzeko hiztegiak eta datu-base terminologikoak daude, eta baita glosarioak, datu-base dokumentalak eta itzulpen-memoriak ere.

Itzuli itzultzaile neuronalak Elhuyar hiztegira bideratzen du zuzenean hitz solte bat kontsultatzen denean. Itzultzeko pantailan bertan Elhuyar hiztegia eta Euskalterm terminologia-banku publikoa integratuta dauzka, horietan kontsultak arin egin ahal izateko. Elia itzultzaile neuronalak hitz batzuentzat aukera bat baino gehiago proposatzen ditu, eta kurtsorea hitzaren gainean ipinita probabilitateetan oinarrituta egin duen bilaketan topatu dituen beste aukera batzuk ere ikus daitezke.

Itzultzaile automatiko neuronala ondo integra daiteke itzultzaile profesionalen lan-prozesuan. Ez ditu ordezten itzulpen-memorietan urteetan bildutako esaldi pareek eman ditzaketen emaitzak, ez hiztegiek eta glosarioek eman dezaketena ere. Ondo legoke probabilitateetan oinarrituta egindako bilaketa bakoitzak (segmentu bakoitzak) zenbateko fidagarritasuna duen adierazten duen portzentajea erakutsiko balu itzultzaile neuronalak, itzulpen-memoriak kudeatzeko programek antzekotasun-portzentajeak erakusten dituzten bezala, zuzenketarako edo postediziorako pista gehiago edukitzeko.

Nolanahi ere, emaitza onak izateko ezinbestekoa da, derrigorrezko betebeharra, kalitatezko elikagaia ematea, bai itzulpen-memoriak kudeatzen dituzten programei, bai itzultzaile automatiko neuronalei.

Latxa

Maite Imaz Leunda

Egunean Behin jokoan aritzeko ohitura dugunok atseginez ekin genion 15. denboraldiari, joan den astelehenean, denboraldi bat bukatu eta bestea hasi bitartean pasatzen diren asteetan zerbait falta zaigula iruditzen baitzaigu egunero minutu pare batez tribial estiloko galdera-erantzunen partida jokatzeko aukera errutina bihurtua dugunez geroztik.

Jokoa Codesyntax enpresak sortu zuen, 2019an: 10 galdera erantzun behar dira, egunean behin bakarrik, eguneko partida bakarra jokatzeko aukera ematen baitu, ahalik eta azkarren, puntuazio ona lortzeko ondo erantzuteaz gain bizkor erantzun behar baita.

Denboraldi honek, gainera, jokalari berri bat ekarri digu, beste inor ez bezalakoa: Latxa du izena eta lortzen duen emaitza ikusgai dago sailkapen orokorrean, norberaren emaitzaren ondoan. Euskarazko adimen artifizialeko garapen berria aplikazioaren mekanikarekin lotu dute CodeSyntax-eko garatzaileek eta Hizkuntza Teknologiako Euskal Zentroko (HITZ) Latxaren arduradunek.

Jokalari berri bat eta erronka berri bat. Lehenengo aste honetan Latxak baino emaitza hobea lortu dut, Latxak inork baino azkarrago erantzun arren, nik baino erantzun oker gehiago ematen baititu, oraingoz.

Deigarriena egin zitzaidana izan zen Latxak zeinen azkar egiten dituen partidak; zeinen azkar prozesatzen dituen sartuta dauzkan datu guztiak: 4-5 segundoan. Ezinezkoa da pertsona batek 10 galdera hain denbora laburrean erantzutea. Nire partidarik azkarrena 44 segundokoa izan da eta jokalari trebeek 27 segundo behintzat behar izaten dituzte. Beraz, oraingoz Latxari aurrea hartzen ari naiz baina hori Latxak ikasi ahala eta erantzun zuzen kopuru handiagoa lortu ahala bukatuko da.

Latxa LLM edo hizkuntza eredu handi bat da, adimen artifizialeko ekimenek oinarrian duten datu-base erraldoia, alegia. OpenAI-ren ChatGPT bertsioen oinarriak dira LLMak adibidez. LLM ereduek datu asko eta asko behar dituzte ondo funtzionatzeko. Adimen artifizialak ondo egin dezan ondo elikatu behar da.

Kezkak eta beldurrak eragiten ditu pentsatzeak makinei laguntzeko lan gehigarria hartu ondoren makinek guk baino hobeto egingo dutela lana eta agian gure lana desagerraraziko dutela. Baina adimen artifizialaren aldeko apustua egin ezean, zer gerta daiteke?

Joan den urtarrilaren 18an eta 19an izan zen Languages Lanean kongresuan, Bilbon, Jóhanna Vigdís Guðmundsdóttir islandiarrak globalizazioa nabarmendu zuen hizkuntzak desagerrarazteko arriskuen artean. Islandia biztanle gutxiko herrialdea denez, islandierak hiztun gutxi ditu, baina islandiarrak moldatu izan dira hizkuntza babesteko, islandiera hizkuntza nagusi bihurtuta arlo publikoan, hezkuntzan, komunikabideetan…, islandiarren hizkuntza eta kultura laudatuz, hizkuntzaren garrantziaz kanpainak eginez eta abar.

Baina globalizazioaren aurrean, hizkuntza-teknologiak eta adimen artifiziala sustatzeari ekin diote islandiera babesteko. Diru asko inbertitu dute islandierak adimen artifizialean presentzia izan dezan, hizkuntza babesteko finantzaketa ezinbestekoa dela sinetsita: corpusak, hizkuntza-teknologiak informatikariak, hizkuntzalariak. Eta, jakina, gizartearen babesa ere behar da.

OPEN AI adimen artifizialean aritu dira datuak sartzen eta entrenatzen, bai hizkuntzari dagokionez eta baita kulturari dagokionez ere, eta 2023ko martxoan ChatGPT 4 kaleratu zenean, islandieraz ere egiten zuen. Beren esperientzia baliabide gutxiko beste hizkuntza batzuetarako baliagarria izango dela espero dute.

Adimen artifizialaren gai honek emango digu hizpidea aurrerantzean.

Printzipioak

Maite Imaz Leunda

Orain dela urtebete pasatxo iritsi zen nire eskuetara Juan Irazusta. Pertsona, garaia eta idazlana liburu interesgarria. Juan Irazusta Alkizalete (1688-1772) alkizarra erretore izan zen Hernialden (1716-1752) eta Alkizan (1752-1772), eta baita idazle ere: Gaspar de Astete jesuitaren Catecismo de la doctrina cristiana itzuli zuen gaztelaniatik euskarara.

Hernialde ondokoa eta hernialdetar baten alaba izan arren, eta Hernialdeko Santa Kruz Apaizaren plazan dagoen ostatura igande eguerdiko tragoa hartzera makina bat aldiz joandakoa izan arren, ez nuen nik XVIII. mendeko erretore horren berririk.

Jakin-minez hasi nintzen liburua irakurtzen. Juan Irazusta hil zela 250 urte bete zirenean, 2022an, Alkizako Udalak bertako idazlea omentzeko egin nahi izan zuen eta Olatz Leturiaga Angoitia Hizkuntzalaritzako eta Euskal Ikasketetako ikerlariak idatzi zuen. Gaspar Astetek 1599an Madrilen idatzitako dotrina itzuli zuen euskarara Juan Irazustak, Hernialden erretore zegoela: Doctrina Christiana eguinzuana erdaraz Aita Gaspar Astete, Jesuitac. Ipinidu Eusqueraz don Juan de Irazusta Erretore Hernialdecoac.

Ondorengo urteetan Irazustak erabilitako euskararen kalitatea eta garbitasuna zalantzan jarri izan zuten. 1855ean salaketa bat bideratu zen Errezilgo, Albizturko eta Bidania-Goiazko artzapez-barrutitik dotrina “euskara txar eta lotsagarrian” idatzita zegoela-eta. Hala ere, liburuak 50 edizio inguru izan zituen, 1939an Lazkaoko beneditarrek atzena egin arte; eta Gipuzkoako neska-mutikoen dotrina nagusia izan zen XX. mendearen erdira arte. Irazustaren garaikide izan zen Manuel Larramendi maisuak ere ontzat jo zuen lana; akats bakarra omen zuen erdarazko hitz gehiegi erabiltzen zituela.

Dotrinari buruzko iruzkinak irakurtzen ari nintzela erabat ezaguna egin zitzaidan pasarte bat ikusi nuen.

Nor da jaungoycoa?
Da gauza bat esan eta pensatu alditequean excelenteena ta admirableena; Jaun bat infinitamente poderosoa, sabioa, justoa, principioa eta fiña gauza guztiena.

Gure ama zenak askotan aipatzen zuen pasarte hori, horixe baitzen adibide gisa erabiltzen zuen esaldia, txikitan makina bat gauza tutik ere ulertu gabe buruz ikasi zituela adierazteko. Nik ez dut inoiz pasartea buruz ikasi, baina ikusi orduko gogoratu nintzen amarekin, eta irudikatu ere egin nuen umetan, 1940 inguruan, bere jaioterrian, Beizaman, dotrina ikasten. Urteak pasa eta seme-alabak helduarora iritsita zituenean ere ez zuen lotzen amak principio hasierarekin edo iturburuarekin; are gutxiago fiña amaierarekin. Izan ere, beste zerbait adierazteko erabiltzen dugu fina.

Espainiako Errege Akademiaren hiztegian begiratuz gero, principio hitzarentzat 9 adiera behintzat azaltzen dira. Horietatik bosgarrenarentzat badugu euskaraz printzipio hitza, Euskaltzaindiaren Hiztegiaren arabera.

principio (DRAE)
5. Cada una de la prímeras proposiciones o verdades fundamentales por donde se empiezan a estudiar las ciencias o las artes.
Sin.: fundamento, tesis, ley, norma, regla, postulado, razonamiento.
printzipio (EH)
1  iz. Oinarrizko edo funtsezko egia edo legea, frogatzen ez dena edo beste arau edo adigaien iturburu gertatzen dena. Ik. hastapen 2; oinarri 2. Arkimedesen printzipioa.
2  iz. [Oharra: Euskaltzaindiak, printzipio-k euskara idatzian izan duen erabilera kontuan harturik, hitz hori ‘hasiera’ adieran ez erabiltzea gomendatzen du; ik. hasiera 1; haste; hastapen 1].

Dotrinak adierazi nahi zuenerako, beraz, ez digu balio printzipio hitzak euskaraz.

Elhuyar hiztegian ageri dira adiera gehiago: iturburu, (edanarekiko zaletasuna bere arazo guztien iturburua izan da) jatorri, sorburu / oinarri (filosofiaren oinarriak).

Gehiago ere kontatzen zigun amak printzipioa zela eta; hitza ezaguna zuten, erabiltzen zuten, baina ez Arkimedesen printzipioaz jarduteko, ez beste inorenaz ere. Ematen zioten adiera Espainiako Errege Akademiaren hiztegiko principio sarreraren zazpigarrena da:

principio
7. Alimento que se servía entre la olla o el cocido y los postres.

Gutxitan egokitu zait euskaraz printzipio adiera horretan entzutea, baina are gutxiago gaztelaniaz. Plácido Múgicaren hiztegian gaztelaniazko principio sarreraren seigarren adieran ageri da kontzeptu horren euskal ordaina:

principio
6. plato de carne, vianda = jaki; pr. de pescado = arraiki; de carne = araki

Dotrina irakatsi nahian zebilen apaizak galdetu omen zion mutiko bati zer zen printzipioa; mutikoak emandako erantzunarekin, ordea, ez omen zen gustura gelditu:

– “Printzipiyua da babarrunen eta gainean jaten dena”.

Ezagutzak terminologia behar du

Maite Imaz Leunda

Joan den azaroaren 3an Espainiako Terminologia Elkartearen (AETER) jardunaldia izan zen Euskaltzaindiak Donostian duen egoitzan. AETER hainbat pertsonak eta erakundek sortutako erakundea da, 1997an, Madrilen. Terminologiari eta espezialitate-hizkuntzei buruz ikertzeko eta espainierazko eta Espainiako gainerako hizkuntzetako terminologia-baliabideak prestatzeko eta kontsultatzeko interesa zuten erakunde horiek guztiek. UZEI terminologia eta lexikografia zentroa izan zen jardunaldiaren antolatzailea, AETER-eko kidea baita.

Entzun genituen hitzaldien artean interesgarria izan zen terminologia eleaniztunek etorkizunean izango duten garrantziaz jabetzeko erakutsi ziguten TERESIA metabilatzailea; espainieraz eta estatuko gainerako hizkuntza ofizialetan dauden terminologien topagune eta adimen artifizialerako teknologien ataria izateko asmoarekin eratutakoa, besteak beste, espainieraz eta estatuko bere testuinguruan erakusteko, baliozkotzeko eta hainbat ingurunetan eskuragarri jartzeko aukera emango du.

Katalanek aurkeztutako proiektu bat ere aipatu nahi nuke, euskararekin terminologian jardun izan dugunok Katalunian zer egiten duten oso kontuan izaten dugu eta. Prospektiba terminologikoa eta ezarpena: maileguak hedatzen aurrera egiteko estrategia izenarekin aurkeztu zuten Institut d’Estudis Catalans eta Bartzelonako Pompeu Fabra Unibertsitateko Iulaterm ikerketa-taldeak sustatutako proiektua.

Proiektuaren helburua oraindik katalanez erabiltzen ez ziren ingelesezko termino berrien hustuketa egitea zen, horretarako eremu anitzetako eta garai ezberdinetako erreferentziazko testuak erabilita; gero, baliokide egokiak bilatu behar zituzten katalanez, horrela, ingeleseko maileguen zabalkundeari aurrea hartzeko.

Lehenengo fasean (2018-2021) ingelesezko erreferentziazko eskuliburuak erabili zituzten: orain dela urte batzuetako eskuliburuak eta horien bertsio eguneratuak. Ondoren, bertsio zaharretako eta berrietako testu-corpusetatik abiatuta hustuketak egin zituzten, terminoen zerrendak lortu eta zerrenda horiek alderatu. Bigarren fasean (2022-2023) ingelesez dauden gai hauei buruzko aldizkari zientifikoetako artikulu osoen hustuketak egin zituzten: biokimika, mikrobiologia, ekonomia eta komunikazioa. Zerrenda guztiak alderatu ondoren neologia izateko hautagaiak eskuratu zituzten eta horiek bakoitzari zegokion gaiko adituekin egiaztatu eta berrikusi ondoren, katalanezko ordainak proposatu zituzten.

Metodologia egokia iruditu zaie terminologia neologikoa detektatzeko, datu-base terminologikoak elikatzeko (Cercaterm) eta ordainak garaiz proposatzeko, jakintza zabaltzen hasi berria denean, horrekin espero baitute katalanezko ordainak ezartzeko aukera gehiago izango dutela. Cercaterm kontsulta terminologiko eleaniztunak linean egiteko Termcatek eskaintzen duen tresna da; Termcateko Kontseilu Begiraleak normalizatutako terminoak kontsultatzeko aukera ematen du. Termcat, katalan hizkuntzako terminologia zentroa, 1985ean sortu zen Kataluniako Gobernuaren eta Institut d’Estudis Catalansen eskutik. Euskara ez da ageri Cercatermen baina, hala ere, euskal terminologoek asko jotzen dute bertara, kontzeptuen definizio eta informazio osagarri bila.

Terminorik gabe ez dago ezagutzarik.

Garai bakoitzak bere arriskuak itzulpenetan akatsak egiteko

Maite Imaz Leunda

Administrazioan lanean hasi nintzenean bihurtu zen ordenagailua eguneroko lan-tresna niretzat, orain dela 31 urte, ordura arte izan nituen langaiak lapitza, borragoma, paperezko hiztegiak eta idazmakina izan baitziren. Orain esku artean daukadan ordenagailu eramangarriarena baino antza handiagoa zeukan orduko ordenagailuak etxean geneukan Olivetti zaharrarena, baina lana asko errazten zidan, euskaratutako testu guztiak txukun antolatuta jasotzeko aukera ematen baitzidan. Jatorrizko testu guztiak paperean eskuratzen genituenez, kontu handia jarri behar zen itzulgaiak zenbaki eta izen propioz beteta zeudenean. Kopiatzea itzultzea baino errazagoa zen orduan ere, baina dena tekleatuz egin behar zenez, arreta handia jarri behar zen akatsik ez egiteko. Taulak berregitea ere ez zen lan makala izaten.

Dagoeneko itzulita zegoen testu bati aldaketatxo batzuk egin omen zizkiotela eta berriro itzultzaileongana heltzen zenean, jatorrizko testuaren bertsio zaharra eta bertsio berria  bata bestearen ondoan jarri eta alderatzea beste aukerarik ez zegoen, zer aldatu zuten markatuta ez baldin bazegoen; eta markatuta zegoenean ere bai, badaezpada, markatu gabeko aldaketak egon zitezkeen eta. Euskal Herriko Agintaritzaren Aldizkarira (EHAA) erreferentzia bila jotzeko, jakin beharra zegoen zein egunetan argitaratutako aldizkaria behar genuen, bestela alferrikakoa izango zen ezeren bila hastea eta.

Itzulpen guztiak hutsetik hasten ziren, bidaltzaileak erreferentzia gisa balio zezakeen antzeko testurik bidaltzen ez bazuen behintzat. Errepikatzen diren deialdi edo aginduren bat jaso eta neuk antzeko zerbait itzulia nuen susmoa nuenean, agian topatuko nuen ordenagailuan jasota neuzkan dokumentuen artean xede testua, kostata betiere, baina jatorrizko testurik ez. Eta beste itzultzaileren batek itzulitakoa izanez gero, ia ezinezkoa zen ezer topatzea. Eraginkorrena hutsetik hastea zen.

Laster etorri ziren testu zati luzeak erraz kopiatzeko aukera, gaizki kopiatutakoak ezabatzeko aukera eta nahi gabe ezabatutakoan atzera egiteko aukera. Posta elektronikoa ere iritsi zen eta horri esker hasi ginen, pixkanaka-pixkanaka gero eta gehiago, itzulgaiak formatu elektronikoan jasotzen. Jatorrizkoa formatu elektronikoan izatea aldaketa handia izan zen, itzuli beharreko dokumentuaren kopia bat egin, horren gainean itzuli, eta zenbakiak eta izen propioak tekleatu beharrik gabe itzulpena formatu berberean ematea ahalbidetzen zen eta.

Nire iritzian, aldaketarik garrantzitsuena 1996an iritsi zen, itzulpen-memoriak probatzen hasi ginenean; itzulpen-memoriekin bukatu ziren dagoeneko itzulitako testuen bertsio berriagoak aldaketatxo batzuekin iristen zirenean jatorrizko bi bertsioak kotejatzeak zekarren nekea. Itzulpen-memoriek berehala egiten zuten lan hori. Lehendik antzeko zerbait itzuli ote genuen susmoa benetakoa ote zen berehala egiaztatzen ziguten itzulpen-memoriek.

Ondoren, lanerako Internet erabiltzeko baimena iritsi zitzaigun, hasieran eragiten zituen susmoak gainditu ondoren, garai hartan lanerako lagungarri baino gehiago bestelako entretenimenduetan denbora galtzeko mehatxu gisa ikusten baitzuten askok. Bistakoa da informazioa eskuratzeko aukera biderkatu eta bizkortu egin zigula Internetek.

Orain oso gutxitan hasi behar izaten dugu hutsetik itzultzen. Itzulgai hutsa jasota ere, itzulpen-memoriek, datu-base dokumentalek edo Internetek zerbait ematen digu gehienetan. Baina orain itzultzeko lehen baino lan gutxiago iristen zaigu eta berrikusteko gehiago, eta berrikusi beharrekoa non eta nola itzuli ote den asmatzen izan ditugu lanak. Euskara ondo menderatzen duen norbaitek batek aurretik itzulitakoa aprobetxatu eta testu berria berak itzuli ote du? Itzultzaile automatiko neuronalak agian? Eta neuronala izan bada, posteditatu dute?

Orain itzultzaile automatiko neuronala bihurtu zaigu kezka iturri. Esango nuke arazo batzuk konpontzen dizkigula eta beste batzuk sortu.

Urtero egiten den deialdiren bat, lehenago urtea joan eta etorri osorik itzultzeko bidaltzen zigutena, orain itzulita berrikusteko bidaltzen badigute, gerta daiteke itzultzaile automatiko neuronalarekin egindako itzulpena izatea. Hori izango litzateke lehenengo okerra: itzultzaile automatiko neuronala erabili behar ez denean erabiltzea, lehendik giza itzultzaile batek itzulitakoa ez delako aintzat hartu eta itzultzaile automatiko neuronalarekin ordeztu delako.

Gerta daiteke, halaber, zuzenketarik edo postediziorik gabeko itzulpena izatea. Hori izango litzateke bigarren okerra. Itzultzaile neuronala erabiltzen bada, posteditatu egin behar da eta postedizioa itzultzaile automatiko neuronala erabili duenak egin behar du. Ez du balio postedizioa egiteko lana itzultzaile bati pasatzea. Horrek ez dio itzultzaileari lana aurreratzen, lanerako alferrikako trabak sortu baizik.

Itzultzaile automatiko neuronalaren akatsak oso erraz antzematen dira batzuetan; hanka sartzen duenean ez du disimulatzeko ahaleginik egiten.

Un documento preciso y exacto         Dokumentu zehatz eta zehatz bat

Eta gerta daiteke lehendik itzulita zegoena berreskuratzeko lana hartzea bezeroak, testu zati berriak itzultzeko bakarrik erabili izatea itzultzaile automatiko neuronala, eta batere postediziorik egin gabe testu osoa berrikusteko itzultzaileari bidaltzea. Horrelakoetan ez da lehenengo okerra gauzatzen, baina bai bigarren okerra eta areagotuta gainera. Ondo itzulitako testu luze batean neuronalak egindako tartekiak sartzen badira eta neuronalak akats nabarmenak egin baditu, itzultzaileari gehiago kostatuko zaio akats horiek topatzea. Zuzenketa sakona egiteko denborarik ez badu, akats horiek oharkabean joan daitezke. Bezeroari behin eta berriro esan behar zaio itzultzaile neuronal automatikoak itzulitakoa ezin zaiola itzultzaileari pasa posteditatzeko edo zuzentzeko, itzultzaileari lana gehitzen zaiolako horrela. Duela hiru hamarkada zenbakiak tekleatzen eta alderatzen pasatzen genuen denbora postedizioari eta zuzenketari eskaini beharko diogu orain.

Administrazio-testuen zuzenketaz

Maite Imaz Leunda

Edozein itzulpen-lan bukatzean oso komenigarria izaten da zuzentzaile bati pasatzea, lau begik bik baino gehiago ikusten dute beti eta. Administrazio-testuen zuzenketa-lanetan ibiltzen garenok komeriak izaten ditugu, askotan, zeri eman garrantzia eta zer zuzendu erabakitzerakoan. Zenbateraino zuzendu behar dugun erabakitzeko orduan testuaren garrantzia eta, batez ere, daukagun epea hartzen ditugu kontuan.

Lehenengo lana ortografia zuzentzailea eta lexiko- eta terminologia-egiaztatzailea pasatzea izaten da. Ondoren, goitik behera irakurtzeko denborarik ez badaukagu ere, testua osorik dagoela begiratu behar da, jatorrizko testua eta itzulitakoa elkarren ondoan jarrita, eta gauza nabarmenetan jarri arreta: zenbakiak, datak…

Batzuetan testu lagin bat irakurtzea nahikoa izango da testua fidagarria eta dagoen dagoenean argitaratzeko modukoa dela ikusteko. Beste batzuetan irakurketa sakonagoa merezi duela konturatuko gara eta, gutxienez, euskaraz ondo dagoela egiaztatu beharko dugu: gramatikari dagokionez zuzen idatzita dagoela, idazketa-akatsik ez dagoela, erregistroa, estiloa eta terminologia egokiak direla, eta zerbitzuan ezarrita dauzkagun irizpideak betetzen dituela.

Estiloaren gaia kontu handiz ibiltzekoa da. Nire ustez zuzenketak egiterakoan aldatzen den guztiak justifikatuta egon behar du. Eta garbi izan behar da ezezagun egiten zaigun guztia edo guk erabiliko ez genukeena ez dela beti eta nahitaez zuzendu beharrekoa. Izan ere, nahiko denbora ez diogulako eman ikusi ez ditugun akatsak betirako argitaratuta ikustea baino hanka-sartze larriagoa da ausartegi jokatzeagatik zuzenketan laprast egin eta testua zuzendu beharrean okertzea.

Baina, jakina, ondo irakurtzen den testu ulergarria izateak, euskaraz zuzen, egoki eta txukun egoteak, ez digu ziurtatzen itzulpena bera ondo dagoela, jatorrizko testuak eta xede-testuek gauza berbera esaten dutela, xede-testuan jatorrizkoan dagoen guztia azaltzen dela eta xede-testuak ez dioela jatorrizkoak ez dioen ezer. Hori guztia ziurtatzeko jatorrizko testua eta itzulitakoa alderatu beste irtenbiderik ez dugu.

Administrazioko testuak ez dira beregainak izaten; beti izaten dira beste arau batzuei egindako aipamenak. Dekretu batean lege izenak azaltzen zaizkigu, ebazpen, akordio edo agindu batek dekretu edo lege bat izaten du oinarrian, eta ediktu nahiz iragarkietan ere aurretik itzulita dauden lege edo arauak aipatzen dira. Aipuak etengabeak izan daitezke eta neurri handiagoan edo txikiagoan ager daitezke dokumentu osoan zehar. Batzuetan oinarrian dauden arauen artikulu osoak dira hitzez hitz azaltzen direnak.

Nik asko erreparatzen diot administrazio-testuetan koherentziari; Euskal Herriko Agintaritzaren Aldizkarian (EHAA) argitaratzekoak diren testuetan bereziki. Dagoeneko itzulita dauden arauak aipatzen direnean ondo kopiatuta dauden ziurtatzeko, zein aldizkaritan argitaratu ziren topatu eta iturrira jo beste aukerarik ez dago. Eta aipamena iturrian argitaratu zen bezalaxe ez badago, zuzendu egin behar da, ez kopiatzeko arrazoi sendoren bat dagoenean izan ezik. Jatorrizko itzulpenean akatsen bat egotea edo itzulpena zaharkituta egotea izan daitezke aldatzeko edo zuzentzeko arrazoi sendoak, baina lehendik emanda dagoena ondo baldin badago dagoen bezala utzi behar da.

“cuando hay que citar un pasaje publicado en el Diario Oficial, la traducción automática tiene exactamente el mismo valor que la traducción humana, a saber, ninguno. Todo traductor de esta casa sabe que, en un caso así, su primer deber es NO traducir, sino ir a buscar el acto citado y copiarlo letra por letra”

 Traducir con/como máquinas. PAULA ÁLVAREZ. Comisión Europea (Punto y coma, 170.zk. 2021)

Lehendik itzulita dagoena berrerabili beharrean itzultzaile automatiko neuronalera jotzeak ekar dezakeen arriskuaz ohartuta, Europako Batzordearen webgunean argi eta garbi adierazten dute eTranslation ez dela erabili behar Europar Batasuneko legedia itzultzeko, horrelakoetan benetako bertsioetara jo behar dela eta benetako bertsioak eskuragarri daudela haien webgunean.

Egokitu izan zaizkit iruzkinez betetako itzulpenak, iturrietako loturak ipinita eta iturriak aldatu badira zergatik aldatu diren azalduta dituztenak. Eskertzekoa da zuzentzaileari lanak horrela erraztea. Aldiz, iruzkinik ez eta iturrian dagoen itzulpena ez dela kontuan hartu ikusten dudanetan, pentsatzen dut itzultzaileak besterik gabe onartu duela memoriak eman diona, iturrian benetan dagoena horixe ote den ziurtatu gabe. Baina memoriak emandakoa iturrian dagoena izanda ere gerta daiteke itzultzaileak aldatu izana. Nire ustez hori ez da egin behar, lehen esan bezala, aldatzeko arrazoi sendorik ez baldin badago behintzat. Ondo dagoena aldatzen ibiltzeak ez du itzulpena hobetzen, anabasa sortzen baizik.

Terminologia-lanetan ibili nintzen garaian Dudanet bidez jasotzen genituen kontsulta batzuen oinarrian koherentzia-faltak zeuden; Eusko Jaurlaritzako teknikariak izaten ziren, Eusko Jaurlaritzako itzulpenen datu-base elebidunera sartzeko aukera daukatenez, bertara jo terminoak eta hitzak kontsultatzera eta maizegi ikusten zutenak termino baterako ordain bat baino gehiago azaltzen zirela. Orduan Dudanetera jotzen zuten egokia zein zen edo guk zein erabiltzen genuen galdetzeko. Ez dakit gaur egun joera berberarekin jarraitzen duten ala Itzultzaile automatiko neuronalera jotzen duten zalantzak argitzeko.

Hona azken aldian sarri samar zuzentzen dudan dekretu baten aipamena:

DECRETO 18/2020, de 6 de septiembre, del Lehendakari, de creación, supresión y modificación de los Departamentos de la Administración de la Comunidad Autónoma del País Vasco y de determinación de funciones y áreas de actuación de los mismos

18/2020 DEKRETUA, irailaren 6koa, lehendakariarena, Euskal Autonomia Erkidegoaren Administrazioko sailak sortu, ezabatu eta aldatzen dituena eta horien sail bakoitzaren egitekoak eta jardun-arloak finkatzen dituena.

(EHAA: 2020-09-07)

Txikikeria izan daiteke, baina niri iturriak errespetatzea garrantzitsua iruditzen zaidanez, zuzendu egiten dut beti. Aurretik izan zen dekretuan, aurreko legegintzaldian, horien agertzen da:

DECRETO 24/2016, de 26 de noviembre, del Lehendakari, de creación, supresión y modificación de los Departamentos de la Administración de la Comunidad Autónoma del País Vasco y de determinación de funciones y áreas de actuación de los mismos.

24/2016 DEKRETUA, azaroaren 26koa, Lehendakariarena, Euskal Autonomia Erkidegoaren Administrazioko sailak sortu, ezabatu eta aldatzen dituena eta horien egitekoak eta jardun-arloak finkatzen dituena.

(EHAA: 2016-11-26)

Badirudi 2020ko dekretua argitaratu behar zutenean itzultzaileak egokiago iritzi ziola horien zegoen tokian sail bakoitzaren ipintzeari. Ez dakit, ordea, gure itzulpen-memorietan 2016ko ordaina bakarrik dagoen jasota eta, zenbakiak modu automatikoan aldatzen dituenez, horixe den proposatzen duten forma bakarra. Itzultzaile neuronalak ere dekretu zaharreneko forma proposatzen du dekretu baterako zein besterako.

24/2016 DEKRETUA, azaroaren 26koa, Lehendakariarena, Euskal Autonomia Erkidegoaren Administrazioko sailak sortu, ezabatu eta aldatzen dituena eta horien egitekoak eta jardun-arloak finkatzen dituena.

18/2020 DEKRETUA, irailaren 6koa, Lehendakariarena, Euskal Autonomia Erkidegoaren Administrazioko sailak sortu, ezabatu eta aldatzen dituena eta horien egitekoak eta jardun-arloak finkatzen dituena

Itzultzaile juridiko-administratiboa (euskalsarea.eus)

Politika transbertsala

Maite Imaz Leunda

Orain dela gutxi egin diguten kontsulta baterako proposatu dugun erantzuna da politika transbertsala.

Administrazio-unitate batek berari dagokion jarduera-eremu jakinetik haratago jardunez, beste hainbat eremurengan eragina duten politikak garatzerakoan esaten da politika transbertsala egiten ari dela. Ez da zeharkako (zuzena edo aurrez aurrekoa ez den norabidean, edo zeharbidez egiten den) politika, arloartekoa baizik, Xabier Aristegietak foro honetan bertan adierazi zuenez.

Generoaren gaia dela eta, transversalidad de genero edo transversalització de gènere, katalanez, Cercaterm Kataluniako banku terminologikoaren sarrera honetan ikus daitekeenez, erabiltzen dira ingelesaren gender mainstreaming terminoaren ordain gisa. Gizonen eta emakumeen berdintasuna arlo guztiei dagokien zerbait denez, berdintasunaren aldeko politika arlo guztietan aplikatu beharreko zerbait dela adierazten da transbertsalitatea erabitzen denean.

transversalitat

Hauteskunde-kanpainan zehar partidu batzuk transbertsalak direla edo politika transbertsalak defenditzen dituztela ere entzungo dugu, ezkerraren eta eskuinaren bereizketa tradizionala alde batera utzi, eta bateko zein besteko joerak biltzen dituztela adierazi nahian edo.

Cabe resaltar que la noción de transversal también se emplea en el ámbito de la política. El transversalismo constituye una corriente que propone trascender la división entre derecha e izquierda, apostando por una nueva ideología que busca no vincularse con las ideas políticas preconcebidas.

Un movimiento político transversal, por lo tanto, incorpora tendencias de derecha y de izquierda en su propia plataforma ya que dice defender aquello que es más beneficioso para la sociedad en su totalidad, sin importar el origen ideológico de las propuestas.

http://definicion.de/transversal/#ixzz4B4RLgY2z

Gure ustez alderdi politiko horiek ez dira zeharkakoak, ez arloartekoak ere, transbertsalak baizik.

Euskaltzaindiaren Hiztegi Batuak ez du transbertsal jasotzen; Elhuyar hiztegiak bai, ekonomia-  eta politika-arloan, zeharkakoren sinonimo gisa, baina, zeharkako anbiguoa gertatzen da, polisemikoa da eta adiera posible bat baino dituenean, ulertzeko arazoak eragin ditzake. Zeharkako politika erabiltzen badugu, zer ari gara esaten?

zeharkako