Nola iritsi gara hona? Itzulpengintza automatikotik adimen artifizialera

Iรฑaki Alegria Loinaz

Ez badirudi ere, adimen artifiziala (AA) kontzeptu zaharra da, konputagailuen eta informatikaren hasieratik erabili den kontzeptua baita. Kalkulu matematikoetarako gaitasuna eta sailkatzeko gaitasuna izan ziren informatikaren hasieran ustiatu zirenak eta, ondorioz, geroxeago sortu zen adimen artifizial kontzeptutik kanpo geratu ziren.

AA terminoa definitzeko bi ikuspuntu desberdin erabili ohi dira: batetik hurbilpen teorikoa, giza adimena simulatuz egindako aplikazioak-eta (arazo handi batekin, ez baitzekiten, eta oraindik ez dakigu, oso ondo nola funtzionatzen duen giza adimenak); eta bestetik hurbilpen praktikoa, ordura arte konputagailuek gizakiek baino okerrago egiten zituzten problemak garaiko adimen artifizialaren eremuan sartuta. Itzulpengintza automatikoa eta xake jokoa izan ziren urte askotan adimen artifizialaren barruan ikerketa egiteko esparru entzutetsuenak. 1980ko hamarkadako garai hartan Turingen testa ere[1] asko aipatzen zen, zeinaren bidez giza epaileak saiatzen baitira bereizten ea erantzun bat gizaki batek ala makina batek emandakoa den. Programaren emaitzak pertsonenak bezain sinesgarriak direnean programak portaera adimenduna duela ondorioztatzen da.

Itzulpengintza automatikoaren (IA) garapena ere aspalditik dator. Hasierako emaitza batzuek optimismorako joera piztu zuten 1960ko hamarkadan, geroago beteko ez ziren itxaropenak eraginez (errusiar mendiarekin irudikatzen dira orduko itxaropenen eta diru-inbertsioen gorabeherak).

Hala ere, pixkanaka, eta batez ere helburu zehatzetarako erabilita, sistema arrakastatsu batzuk (Quebeceko Meteo sistema esaterako, 1981-2001) lortu ziren. RBMT (erregelatan oinarritutako IA)[2] teknologiarekin nahiko ondo bermatzen zen fidagarritasuna, baina naturaltasunaren aldetik huts egiten zuten. Turingen testa gainditzera nekez iristen ziren sistema haiek, eta horregatik edo azpilengoaiaren batean espezializatzen ziren edo tipologia bereko bi hizkuntzen arteko itzulpenean zentratu. Bestalde, oso sistema konplexuak bihurtzen ziren, eta zerbait zuzendu nahi zenean aldi berean beste zerbait okertzen zen. Dire quasi la stessa cosa liburuan Umberto Ecok sistema horien gabeziak erabiltzen dituitzulpengintzaren zailtasunak azaltzeko. 2011n Kataluniako El Periรณdico itzulpen automatikoaren laguntzarekin bi edizio (katalanez eta gazteleraz) argitaratzen hasi zenean piztu zen Euskal Herrian antzeko zerbait egiteko sukar moduko bat, baina euskararen eta gaztelaniaren tipologien arteko aldea dela-eta ezinezkoa zen hori kalitate minimo batekin egitea.

Ondo egiten ez zuten sistema horiek bi helbururekin erabili dira urtetan zehar:

  • Laguntza moduan, itzulpenaren lehen bertsio bat lortzeko, gero postedizio lana egiteko. Kalitate harekin itzultzaile profesional askok ez zuten erabiltzen, laguntza baino trabatzat hartuta, baina itzultzen adituak ez zirenentzat lagungarriak ziren.
  • Interneteko zabalkundearekin batera, jakiteko gutxi gorabehera zertaz doan beste hizkuntza batean dagoen testu bat. โ€œBestela itzuliko ez liratekeen testuenโ€ bertsio bat lortzen da horrela. Asimilazioa deitu ohi zaio erabilera horri.

Horrekin batera testu itzuliak biltzeko eta partekatzeko aukera asko zabaldu zen, eta hortik etorri zen itzulpen-memorien loraldia, eta IA estatistikoaren hasiera. IA estatistikoa (SMT, 2005)[3] IA neuronalaren aurrekaria izan zen, garai hartan oraindik garatu gabe baitzeuden neurona-sareak IAra egokitzeko behar ziren aurrerapen teknikoak eta konputazio-ahalmena. Horiek garatu zirenean etorri ziren IA neuronalaren (NMT, 2015) lehen sistemak[4]. Horretan guztian software librearen erabilera funtsezkoa izan zen, bestela garapena askoz motelagoa izango baitzen.

Kalitatearen aldetik NMT teknologia iraultza izan zen: RBMT sistemek huts egiten zuten esparruan NMT oso ona zen, naturaltasuna baita teknologia berri horren ezaugarririk behinena. Sistema horiek lehenik eta behin idazten ikasten dute, hizkuntzaren jarioaz jabetzen, eta gero hizkuntzen artean transferentzia egiten. Gauzak horrela, fidagarritasunean arazoak dituzte oraindik, eta hori oso arriskutsua da, ondo aztertu (posteditatu) gabe hanka sartze esanguratsuak sor baititzakete.

NMT sistemek, orokorrean, kalitate handia eskaintzen dute, baina, bestalde, teknologia konplexu eta garestia darabilte. Hori dela-eta enpresa handien eta inbertsio-funtsen eremua bihurtu dira, eta horren ondorioz arloko merkatuaren baldintzak aldatu dira (beste esparru batzuetan Amazon edo Uberrekin gertatu zen bezala). Gero eta ohikoagoa da itzulpengintzan ere plataformak izatea irabazle handienak, ohiko langileak prekarizatzen diren neurri berean.

Itzultzaileak halako krisian murgilduta zeudela, adimen artifizial testu-sortzailea (LLM, hizkuntza-eredu handiak, 2022) iritsi da. 2022ko azaroaren 30a jende askoren gogoan geratu da, egun horretan ChatGPT zabaldu zelako. Geroago beste batzuk agertu dira: Claude, DeepSeek, Perplexity… Halako programek testuak sortzeko eta galderei zein aginduei (itzultzeko aginduei ere) erantzuteko duten gaitasun izugarriak beste arlo asko irauli ditu: zuzenbidea, zuzenketa, kazetaritza… Itzulpengintzan ere ondo aritzen dira tresna horiek guztiak. NMTk baino are baliabide eta inbertsio handiagoa eskatzen dute eta ondorioz enpresa ahaltsuagoen mende daude. Areago, antzeko teknologiek iraultza ekarri dute irudi, bideo edo musika arloetan ere.

Gogoeta honen helburua ez da โ€œaskoren mina, zoroen atseginaโ€ eragitea, baina jabetu behar gara itzultzaileenarekin batera beste lanbide asko krisian daudela teknologia berri hauek direla-eta. Jokalari handi horien guztien aurka egitea zaila da, baina herritarrek aldarrikatu behar dugu gure erakundeek jokalari horien gehiegikerietatik babestu behar gaituztela, burujabetza teknologikoa eta datuen babesa sustatuz, oligopolio horren gehiegizko boterea murriztuz, eta produktibitatearen handitzeak denon onerako bideratuz. Itzulpengintzaren arloan, eta bereziki euskara tartean dagoenean, zeregin handia dute gure erakundeek: kalitatea eta bidezko praktikak bultzatzea eta gehiegikeriak debekatzea eta zigortzea.

Itzulpengintza automatikoaren tresnen kalitateari begira zalantzak daude zein teknologiak eskaintzen duen kalitate handiena, NMT ala LLM. Sistema biek emaitza onak ematen dituztela onartuta[5], batzuek argudiatzen dute LLMren emaitza gertuago dagoela giza itzultzaileek sortutakotik, baina baliabideak urriak direnean[6], badirudi NMT teknologiak emaitza hobeak lortzen dituela. Bestalde, merkatu globalean eskuragarri dauden LLM sistemen artean, badirudi Claude besteen gainean dagoela itzulpenaren atazari dagokionez[7], eta euskararekin ere pertzepzio bera dut nik ere.

Amaitu baino lehen, goraipatu nahi dut Euskal Herrian burujabetza teknologikoari eta datuen babesari begira Hitz zentroak, Elhuyarrek eta Vicomtechek egiten duten lana. Ildo horretan software librean oinarritutako Latxa LLM sistema[8] bultzatzea izan daiteke etorkizunari begira apustu interesgarri bat.


[1] https://eu.wikipedia.org/wiki/Turingen_testa

[2] https://eu.wikipedia.org/wiki/Erregeletan_oinarritutako_itzulpen_automatikoa

[3] https://eu.wikipedia.org/wiki/Itzulpengintza_automatikoaren_historia

[4] https://eu.wikipedia.org/wiki/Itzulpen_automatiko_neuronal

[5] https://aclanthology.org/2024.wmt-1.116/

[6] https://aclanthology.org/2025.r2lm-1.13.pdf

[7] https://arxiv.org/abs/2404.13813

[8] https://latxa.hitz.eus/txat/

Adimen artifizialari galdezka

Xabier Olarra

Itzultzailearentzat baliabide ona izan daitekeelakoan, hasi naiz tresna ditxosozkoa eguneroko lanean erabiltzen, itsu-itsuan uko egin beharrean โ€•itzultzaileoi lana kenduko omen digulako, besteak besteโ€•, zertarako izan daitekeen erabilgarria ikasi nahian.

Gehiegi ez luzatzeko, esango dut Iruรฑeko Udalak eta EIZIEk egindako hitzarmenaren ondorioz Minaberri bekaren mentoretzan ari naizela, Leire Errandonea itzultzen ari den Sauveur et fils liburuaren gainbegirale gisa edo.

Eta hona hemen itzulpen horrek dituen hainbat kosketan itzultzaileari agertu zitzaion esaldi bat, eta ondorioz emandako hainbat jirabuelta.

Hauek dira jatorrizko testua eta itzultzaileak emandako ordaina:

Ce lundi matin, Sauveur reรงut une jeune femme anorexique. ร‰liane, au nom prรฉdestinรฉ, ne venait pas consulter pour ce problรจme alimentaire quโ€™elle paraissait ignorer.
Astelehen goiz hartan, Sauveurrek emakume gazte bat hartu zuen kontsultan, anorexikoa. ร‰liane zuen izena โ€•izen predestinatuaโ€•, eta ez zen elikadura-arazo horregatik joana kontsultara, itxuraz bederen ez baitzekien bazuenik ere.

Itzultzailea ez zen konformatu itzulpen soila ematearekin (erabat zuzena izanda ere), eta arrazoien bila hasi zen, azalpen garbirik gabeko tarteki hori zergatik ote zegoen hor argitu nahian Eliane izenetik abiatuta.

Wiktionaryk bi hauek eman zizkon ร‰lianeren etimologiatzat:

– Latinezko Aelianatik eratorria, Aelius (plebeia gens) izenaren eratorri femeninotik alegia
– Baliteke zerikusia izatea honako honekin: hebreerazko Eli’Anah (ืึถืœึดื™ืขึทื ึธื”)rekin, literalki, ene jainkoak erantzun dit.

Bazirudien etimologiak ez zuela ezer asko laguntzen. Predestinazioak badu zerikusia Jainkoarekin, batez ere kalbinistenarekin. Baina amatasunarekin, eta anorexiarekin?

Bide horrek ezer askorik laguntzen ez zuela-eta, goiko itzulgai hori emanda, galdera hau egin nion ChatGPTri gaztelaniaz:

ยฟPor quรฉ la autora hace alusiรณn a la โ€œpredestinaciรณn a la anorexiaโ€ basรกndose en el nombre de Eliane?

Eta orojakilearen erantzuna:

En el documento, la autora menciona que Eliane tiene un “nombre predestinado” en relaciรณn con su anorexia. Esto se debe a que el nombre “Eliane” contiene la palabra “liane”, que en francรฉs significa “liana”, una planta delgada y alargada. (ยก!!!) La autora utiliza esta asociaciรณn para hacer un juego de palabras que conecta el nombre de Eliane con su condiciรณn de delgadez extrema debido a la anorexia. Es una forma literaria de resaltar la relaciรณn entre el nombre y el estado fรญsico de la paciente.

Ama Maria santisima!!!!! Nork esan du AAk ez duela irudimenik eta sormenik? Sobran ere baduela dirudi.

Hortik ezer askorik ez zegoela ateratzerik etsita, bide zaharrera jo nuen, eta galdera egin nion Googleri: Eliane + anorexia + embarazo (ez dakit zehazki nola galdetu nion).

Eta hona aurkitu nuen azalpen-tankera zeukan erantzuna:

ร‰liane Krtolitza
Quand manger fait souffrir(2018) liburuko artikulu baten izenburuan hau agertzen da:Accompagnement ร  la maternitรฉ d’une jeune femme anorexique/boulimique, Eliane Krtoliza eta Ouriel Rosenblum.

ร‰liane Krtolitza Psikologo-eme klinikoa da, neonatologiako eta haurgintzako psikoterapeuta, Bourgogne-Franche-Comtรฉ Unibertsitatean doktoretza egina.

Iruditzen zait erantzun hori askoz hobea dela. Nire nabigazio ilustragarri honen berri eman nion itzultzaileari, baina aholku garbirik eman gabe โ€œpredestinatuaโ€ hitza agertu izanaren ondorioz egin zezakeenaz: oin-oharra jarri edo testuan disimuluan integratu. Edo emandako itzulpena halaxe utzi eta irakurlearen bizkarrera bota azalpenak bilatzearen zama.

Eta gaur goizean, ea gaztelaniaz duela hilabete pare bat egindako galderari Chat GPTk zer erantzun ematen zion ikusi nahian, hona zer erantzun didan aurrekoan egindako galdera hura bera euskaraz eginda:

Idazleak ez du literalki esan nahi ร‰liane โ€œanorexiarako jaioaโ€ dagoela. โ€œAu nom prรฉdestinรฉโ€ esamoldea ironikoa eta sinbolikoa da.
ร‰liane izenak hainbat konnotazio ditu frantsesez eta tradizio erlijiosoan:
ร‰lie / Elias-etik dator, eta lotura du zeruarekin, espiritualtasunarekin, gorantz joatearekin.
– Sonoritatez arina eta โ€œaingeruzkoaโ€ da, ia gorputzetik askatua dirudien zerbait iradokitzen duena.
Anorexiak, maiz, gorputza ukatzea, arintasuna, desmaterializazioa eta perfekzio ideal bat bilatzea dakar. Horregatik, idazleak iradokitzen du izenak baduela nolabaiteko โ€œdestino sinbolikoโ€ bat: ร‰lianeren izenak iradokitzen duen espiritualtasun eta arintasun idealak bat egiten du anorexiaren logikarekin (gorputza ahalik eta gehien murriztea, โ€œarintzeaโ€).
Beraz:
– Ez da predestinazio teologikoa.
– Baizik eta ironia literarioa: izenak eta gaixotasunak duten esanahi sinbolikoaren arteko lotura azpimarratzea.

Chat GPTk lehengo lepotik burua: gure adiskide orojakilea Txorierrin barrena aingeruen, goiaingeruen eta abarren erreinura joan dela iruditzen zait.

Ondorioak:

1.- AAri ez zaio gustatzen tontotzat hartua izatea, eta amorrazioz bilatuko du erantzunen bat, zuzena, okerra edo erdipurdikoa.

2.- Erabilgarria izan liteke, oso, segun eta zertarako. Baina kontuz ibili beharra dago jasotzen diren erantzunekin.

3.- Esan didate AA galdetzailearekiko enpatiarako entrenatua dagoela, eta hark entzun nahi lukeenari traza hartuta ematen dituela erantzunak. (Ez dakit niri zer traza hartu didan. Seguru aski Arantzazuko mendi santuan denbora puska bat egina izatearena).

Eta gaurkoz hemen utziko dugu. Ez naiz hasiko pontifikatzen, hasiberriaren kategoriara ere iristen ez naizen erabiltzailea izanda.

P. D. Orain beste proba bat egingo dut, Espainiako epaileek galdeketetan erabiltzen duten estiloan: โ€œยฟY no es mรกs cierto queโ€ฆ? โ€œBaina ez al da zuzenagoa beste hau?โ€, Googlek emandako erantzuna ez ote den zuzenagoa galdetuz. Emaitzak hurrengoan.

Menos calienteโ€ฆ

Aitor Ugarte Arruebarrena

Dakizuenez, euskaraz ez daukagu gutxiagotasuneko konparazioak egiteko morfemarik, gaztelaniazko menos-en antzekorik, ez eta โ€˜menos + adjektiboโ€™ moduko egiturarik ereโ€ฆ Hori dela-eta, teorian, ezin dugu hitzez hitz itzuli honelako esaldi bat:

Este clima es menos caliente que el nuestro (gutxiago beroa?).

Hala ere, bilatzen hasita, tradizioan aurkitu ditzakegu horrelakoak ematen saiatu diren zenbait idazlariren adibide batzuk; esaterako, hor daukagu Espiritua izanen duzu irekiago, gutxiago nahasia eta freskoago (Pouvreau), bai eta berriagoak ere: Ez da horregatik gutxiago bitxia, hala ere, lerro zuzena ia batere ez agertzea animalien arkitekturan eta izadiarenean oro har (Juan Garzia).

Gehienetan, dena dela, gutxiagotasun hori adierazteko berdintasuna ukatzera jotzen dugu, edo antonimoaren areagotasuna seinalatzen dugu beste batzuetan. Hala, etxe bat beste bat baino โ€˜gutxiago garestiaโ€™ dela adierazteko, etxe hau ez da bestea bezain garestia edo etxe hau bestea baino merkeagoa da esan daiteke. Bigarren aukera hori ez da, ordea, beti egokia: guztiz pobreak diren pertsona biri buruz ez du zentzurik bata โ€˜bestea baino aberatsagoaโ€™ dela esateak.

Beste irtenbide bat ondoriozko egituraren bat erabiltzea da, ezezkoa hain zuzen: ez hainโ€ฆ

Klima hau ez da hain beroa, gurearen aldean.

Baina, horrek ere ez du beti arazoa konpontzen, eta, beraz, ez da irtenbide guztiz egokia kasu guztietan. Adibidez, zientzia-arloan, klimatologiari buruzko testu tekniko batean, segur aski un clima menos cรกlido ez da izango klima ez hain beroa edo ez hura bezain beroa.

Bestalde, itzulpena are gehiago zailtzen da tartean beste elementuren bat sartzen bada. Adibidez, nola itzuli honelako esaldi bat:

Espaรฑa es un paรญs cada vez menos democrรกtico.

Ez nekien nondik heldu esaldi horri, eta, proba bat egite aldera, itzultzaile neuronalean sartzea bururatu zitzaidan, eta emaitza hau eman zidan:

Espainia gero eta herrialde demokratikoagoa da.

Ez, ez da hori noski emaitza zuzenaโ€ฆ, guztiz kontrakoa baizik.

Irtenbide bat bilatzen hasita, eta buruari buelta batzuk eman ondoren, niri hau otu zitzaidan (agian aukera erradikalegia da; ez dakit, zuek esango duzueโ€ฆ):

Espainia gero eta herrialde ez-demokratikoagoa da.

Asegarria? Ez dakit, zuek ikusiโ€ฆ

Probatzeko, berriro ere, neuronalean sartu nuen sasiitzulpen hori, eta emaitza hau eman zidan:

Espaรฑa es un paรญs cada vez mรกs no democrรกtico.

Ez, ez da bete-betekoa, jakina. Ez du gainditu nik โ€˜urrezko probaโ€™ deitzen dudana; alegia, itzulpena kontrako norabidean sartu neuronalean (eu-es bada, es-eu) eta jatorrizkoa ematen badu, itzulpen hori balekoa da niretzat.

Arazoa aztertzen hasita, konturatu naiz ezezkotasun horretan dagoela koska; izan ere, ez– horrek beste zentzu bat ematen dio esaldiari, hau da, kontrako muturrerantz doan joera bat zabaltzen du eta gainera tonu gogorregia ematen dio esaldiari. Izan ere, kasu horretan, jatorrizkoaren esanahia ez da Espainia ez dela herrialde ez-demokratiko bat, baizik eta, nolabait demokratikoa izaten jarraitzen duen arren, ez dakit, โ€˜demokraziatasunโ€™-maila apalagoa duela orain. Beste hitz batzuetan, demokratikoa da oraindik herrialde hori, baina ez lehen bezain demokratikoa.

Balizko itzulpen hori salbatzekotan, hor ulertu beharko genuke zerbait abstraktuagoa dela โ€˜ez-demokratikoโ€™ hori, โ€˜desdemokratikoโ€™(?) edo esango bagenu bezala (herrialde desdemokratikoak edo indemokratikoak, horrelakorik balego; ez dut uste oraingoz dagoenik), baina ez dakit horretarako prest gauden. Izan ere, zenbat eta modu abstraktuagoan ulertu, orduan eta baliagarriagoa izango litzateke nire proposamen hori: โ€˜ebakuntza ez-urgenteakโ€™โ€ฆ Ebakuntza horiek ez-urgenteagoak dira, beste batzuen aldean.

Bukatzeko, beste proba bat egin dut neuronalean, esapide ihartu batekin (ezezagun hitzarekin hain zuzen ere):

Baina, marratxoa eransten badiogu (ez-ezagun), hau da emaitza:

Bingo! ร‰l (no ella) es menos conocido que yo.

Eta, azkenik, urrezko proba eginda, hau da lortu dudan emaitza:

Tira, probatzen jarraitu beharko duguโ€ฆ

Bezperako koplak sinesmenari

Amaia Astobiza Uriarte

Kandelario lario
hatxari ura dario
errotari uruna
hauxe da guk behar duguna

[Ahaztu barik: Leiho Morea ireki dugu Elhuyarren, eta hortxe gaude, zuen begira.]

Irudipena dut aspaldi ez dudala hona etxeko konturik ekarri, eta horrexekin hasiko ditut Santa Ageda bezperako nire koplak, zeren gabon-tximurrean (ikus OEH), urte berriaren egunerokoari indarrez ekiteko azken jatordutxoa jada eginak ginela, semeak Batxi1-eko Euskararako idatzitako testu bat egokitu zitzaidan parean. Ez nuen harekin aparteko ezer egin behar, nire telefonotik inprimagailura bidali eta ja, baina horretan igaro nituen segundo gutxietan itzulpen automatikoaren usaina hartu nien ia nahigabean begiztatu nituen bizpahiru lerroei. Itzulpenarena, edo are okerrago: AA-gailuren batek sortutako testuarena (eta ยซare okerragoยป diot ez itzulpen automatikoaren erabilera oro gaitzesten dudalako โ€•ez baitutโ€• edo AA-tresnen guztiz kontrakoa naizelako โ€•ez bainaizโ€•, baizik eta irakasleak โ€•diรฑot nikโ€• testua berak eta euskaraz sortzeko eskatu ziolako). Amatasunaz arduratzen den neurona saldoa atoan martxan jarri zen, eta guztiak bat etorri ziren: semeak oporrak jaten, lotan, marrazten eta gitarra jotzen igaro zituen, etxerako lanak guztiz alde batera utzita, eta orain, azken orduan, ezin denera iritsi. Beraz, horixe aipatu nion, konplizitatea erakutsi nahian edo, ยซZer, zezenak harrapatu zaitu, ezta?ยป.Esan banion, esan nion! Hitz bat edo beste Elhuyarren begiratu zuela (txalo-txalo) baina gainerakoan osorik berak sortutako testua zela eta beharbada nik uste dudana baino hobeto idazten duela eta zin dagizut zure bizitzagatik nik egin dudala!

[Ene badatxue. Semearen hormona gazteek talka egin dute zure hormona xahar apurrekin udagoieneko araldian basoan topeka dabilen orein adar zabal parearen antzera, ez soilik azpimarra gorriek itsututa, baizik eta baita zure bizitzak harentzat nerabezaro gorri honetan zer balio gutxi duen ohartuta.]

Enpin, oraindik ere jarraitzen duela zin egiten eta hori berak idatzi duela berresten. Eta hara, beharbada egia da eta ni naiz errealitatea ikusi nahi ez duena; alegia, agian nik uste baino maila handiagoan โ€•eta duda barik AHTaren erabateko ezarpena baino askoz lasterragoโ€• ari dira gure burmuinak AAren sorkuntza bitxietara egokitzen eta nominalizazio-segida amaigabe horiek berezkotasunez sortzeko eta irensteko gaitasuna garatzen (arazoa ez baita soilik lexikoaren galera), ez beharbada nirea lako garun zahartzen hasietan eta zaharxeagoetan, jada oliorik-eta birjinenak ere nekez leunduko dituenetan, baina bai, bistan-edo da, neska-mutil kintopekoen neurona-sare bizi-bizietan. Zeren ez, ez da semea halako idazkeraren aurrean muturra okertzen ez duen bakarra; batetik eta bestetik iristen zaizkigun albiste, komunikatu eta jakinarazpen kolore orotako eta askotarikoetan ere gero eta sarriago irakurtzen ditugu antzekoak, eta hemen โ€• ez du inork โ€• zirkinik egiten.

Eta azken horrek etxetik apur bat ateratzeko eta bigarren koplara jauzi egiteko bidea eman dit. Nire inguruko herri-mugimenduetan, oraintsu arte pertsona bat edo bi arduratzen ziren besteek idatzitako testuak txukuntzeaz edo denen artean mahai gainean jarritako ideiekin idatzi polit bat taxutzeaz. Oso denbora gutxian, baina, aurretik testugintzari jaramonik egin ez dion jendea ere idatziak sortzen-edo hasi da (honaino bikain), hau da, handik eta hemendik bildutako gaztelaniazko testu-zatiak elkarren ondoan jartzen eta gero botoi honi edo hari emanda automatikoki itzultzen eta azken emaitza hori taldera bidaltzen eta esaten ยซHau idatzi dut, begiratu nahi baduzu ereยป. Begiratu nahi baduzue ere. Begiratu. Nahi baduzue. E!

Hirugarren kopla, eta honekin despedidea. Sinesten hasita nago sinesmen-kontua dela. Alegia, sinetsi egin nahi dugula botoi dontsu horrek mirariak egingo dituela eta lehen arazotzat jotzen ez genituen kontuak ere berak konponduko dizkigula (eta ez da arraroa, hedabideak ere mezu hori zabaltzen ari baitira lau haizeetara, dela aurretik kontatutako izugarrikerien ondoren ikus-entzuleen arimak nolabait goxatzeko, dela sareetan beita-xerkan gabiltzan tripazorritsuon gosea asetzeko). Arestian ez zuen inork zalantzan jartzen testuak norbaitek txukundu behar zituela (ez begiratu, baizik eta zuzendu, orraztu, apaindu), eta zeregin hori ez zen arazo bat, ezpada โ€•beti arineketan eta azken orduanโ€• egin beharreko urrats bat. Orain, ordea, ba omen dugu lehen arazo ez zen zera hori konponduko digun botoitxo bat, eta, beraz, denok aitortzen diogu geure buruari itzulpenak egiteko gaitasun berezkoa. Etxean punta-puntako labe bat jartzeak automatikoki okin edo gozogile edo chef aparteko bihurtuko bagintu bezala. Eta bai, beharbada hasieran horixe pentsatuko dugu, ยซze ondo, aurrerantzean ogi egin berria gosalduko dut eta opil gluten bako samurrak prestatuko ditutยป, baina gero zer, zenbat irauten digu poz horrek, sinesmen horrek? Alabaina, kontua da jatekoa geuk ahoratzen dugula eta berehala ohartzen garela argazkiko opil bi dimentsiokoaren zaporea eta gure hirukoarena ez direla berdinak eta hobe dugula pizzak beharbada bai gerok egitea baina gozo-kontuak adituen esku uztea edo gutxienik ere haien babespean egitea, eta guk itzulitakoa, berriz, besteek sufritzen dutela, non eta ez dugun jendaurrean irakurri behar, eta ai-ai-ai, orduan komeriak zenbanahi.

[Maitemintzea bezala ere bada pixka bat, ezta? Maitemin ero hori, badakizue, hormona guztiak dantzan eta neurona bizkorrenak ere lotan jartzen dituena. Zu artean ere ondo bizi zinen, ez zeneukan inorekin maitemintzeko beharrik, baina hara, beste hori parean azaldu zaizu eta matx egin duzue eta orain ez duzu bera bako bizitzarik irudikatzen; are gehiago, nola bizi ote zinen zu lehen bera gabe, orain hain ezinbesteko eta hain zeurezko sentitzen duzun huraxe gabe? Dena du ona, guztiz da akatsik gabea. Eta bakarren batek aitzakiaren bat seinalatuta ere, horixe eta ez besterik da zure egia, zure sinestea; mauka ederra aurkitu duzula, alegia.]

Badator azken eupada, Santa Agedako kopla-kantuan ohikoa den legez. Lehengoan Kike Amonarrizek azaldu zigunez, Souleymane Bachir Diagne filosofo senegaldarrak dio ยซItzulpen-lana hizkuntza-menpekotasunaren ondorioei emandako erantzunetako batยป dela. Bada, automatizazio gaizki erabilia dela-eta ยซitzulpen-lana [emaitza] hizkuntza-menpekotasunaren ondorio DAยป esan behar genuke orain maiz, eta nahiz eta guk gure borroketan ยซelkarbizitzaren eta aniztasunaren alde eta supremazismoen aurkaยป erabili nahi dugun, susmoa dut ez ote dugun dena txarto ulertu โ€•edo esplikatuโ€• eta ez ote garen ari lehenaren aurka eta bigarrenaren alde erabiltzen.

Eup!

Euskara eremu digitalean

Asier Larrinaga Larrazabal

Aurtengo Euskararen Egunean, aro digitalean bizi garela gogorarazi nahi izan dugu EITB barruan aurrera eraman dugun ekimenean. Gure egungo bizimoduan, nahitaezkoak zaizkigu baliabide digitalak, eta euskaldunok baliabide horiek euskaraz behar ditugu. Albiste ona da baliabide horiek baditugula: mugikorretako eta ordenagailuetako sistema-eragileak, era guztietako hiztegi eta terminologi banku elektronikoak, zuzentzaile ortografikoak, itzultzaile neuronalak, adimen artifizialak, jokoak… Ezagutu eta ezagutarazi itzazu.

Mezu hori bera Instagramen zabaldu dute EITBko Euskara Zerbitzuko Maria Gamboa eta Leire Yue Ortubay lankideek.

Euskaltzaindia hizketan

Iker Zaldua Zabalua

Sentsorearen parabola asko erabiltzen ari naiz aspaldion. Norbanako bakoitzak ditu bere sentsoreak, berezkoak, eta zenbaitetan belarriko mina jartzen zaigu sentsoreak zerbait hauteman, eta barnean durundi zorabiagarria entzuten dugulako. Eta, gehienetan, zarata hori besteek ez dute entzuten, hain justu, bestelako sentsoreak dituztelako, eta gureak hauteman duena berean ez delako arduragarri.

Itzultzaileok, uste dut, hizkuntza balioanitzeko habetzat dugula: hizkuntza, niretzat, gehienbat jolasa da. Oso gogoko dut hizkuntzarekin jolasean aritzea, baina hizkuntza kultura da, hizkuntza lana da, hizkuntza harremana da, hizkuntza haserrea da, bizimodua da. Nire kasuan, sentsorea arras finduta dago euskarari dagokionez, milimetro txikienean kalibratuta. Eta azkenaldian nahi baino gehiagotan entzun dezaket soinua barrunbeetan.

Ataunen bizi naiz, Goierriren sakonean, Sakanaren eta Tolosaldearen artean, ustez, euskara osasuntsu eta bizi dagoen lurraldean. Eta kalera irten, eta bai, euskara nagusi da han-hemen, baina hegemonia hori galtzen ari da, eta dagoeneko ez da arraroa azpiko tabernan norbait gaztelaniaz edo beste erdara batzuetan entzutea. Eta hori ez da gaitz, aberasgarri ere izan liteke, bi baldintza betetzen badira: euskara bera oraindik plazan lasai eta alai ibiltzea, eta euskara hori ongi zaindua izatea. Bigarren horretan ari zait nire sentsorea jo eta jo. Semeak 9 urte ditu, alabak 14 urte ditu, eta bi belaunaldi horietan, tartekoetan, eta datozenetan sentsorea urduritzen dizkidaten gauzak entzuten ditut.

โ€œAita, ahal det jun parkea?โ€. Esaldi hori normal-normala da Ataungo nerabe eta haurren artean. Niri sentsorea martxan jartzen zait, eta berehala zuzentzen dut: โ€œAita, jun deiket (naike) parkea?โ€. Duela dagoeneko aste zenbait horixe esan nion semeari eskola-atarian, eta nire semearen ikaskide baten amak berehala ihardetsi zidan, txantxetan edo: โ€œEuskaltzaindia hizketan, kar, karโ€. Hor ohartu nintzen: haren sentsoreak ez du hauteman nireak hauteman duena, bereak akaso bestelako kalibrazioa duelako, eta agian semea une jakin horretan jaten ari denarekin piztuko zaio argi gorria. Baina, esaldi hori oharkabean igaroko da, eta horrenbestez, 9 urteko mutiko horrek naturaltasunez erabiltzen jarraituko du.

Gogoeta egin, eta ohartzen zara kalibrazio hau gutxiengo batek dugula, eta ziurrenera dugun lanbideagatik izango dela hein handi samar batean. Eta horrekin, dugun arriskuarekin ohartu naiz.

Euskararen ezagutza-maila igo egin omen da, hau da, gero eta gehiagok omen daki euskaraz. Baina, zer da euskaraz jakitea? Aski da diosal eta agur egiten jakitearekin? Aski da elkarrizketa bat ulertzeko moduan jarraitzearekin? Euskararen etorkizuna oso ilun ikusten dut, etxean ezkorra naizela esaten didate, baina, berriro diot, Ataunen bizi naiz, gure etxean euskaraz egiten da, ama-hizkuntza, aita-hizkuntza, euskara dute seme-alabek. Itzultzailea dute aita, euskal filologoa eta euskararen kontuekin berehala erresumintzen omen dena, eta halere, โ€œAhal det jan jogurre?โ€ esaten dute. Eta adi! Eskola-atarian, sei-zazpi elkarrekin jolasean ari direnean, zenbaitetan, gaztelaniaz hitz egiten dute, horietako batek euskara ez duelako ongi menderatzen, etxean ama-hizkuntza, edo aita-hizkuntza (edo biak), beste bat delako. Eta berriro diot, Ataunen bizi naiz. Baina, hor ez noa sartzera orain, ate handi samarra baita testu xume baterako.

Sentsorea ez da isiltzen, eta itzulpengintzan, lanean, sentsorea jo eta jo. Adimen Artifizialak egindako testuak zuzentzea egokitzen ari zait aspaldi, eta dagoeneko normalizatu egin ditugu euskarari ez dagozkion zenbait formula. Duela hilabete eskas, Euskaltzaindiak Donostian duen txoko zoragarrian hitz-aspertua egin genuen, Idoia Santamarรญak gidatuta, eta ohartu ginen geronek ere irentsi ditugula formula horietako zenbait eta sentsoreak jadanik ez digula abisu ematen. Adimen Artifizialaren harira sortzen ari den corpusa euskara eskasten ari da. Hainbat zenbatzailea joker-karta bilakatu zaigu karta-sortaren barruan, eta masiboki erabiltzen (eta onartzen, baitaratzen) hasi gara, zenbait, batzuk eta bestelakoak alboratuz, gure hiztegietatik baztertuz. Gauzatu aditza ere beste joker-karta bat da, eta masiboki erabiltzen (eta onartzen, baitaratzen) dugu, egin aditza bezain aditz sano eta jatorra alboratuz sarri. Lazkao Txikik berak esan zigun โ€œMartxa honetan aurki erderaz hitz egingo dugu euskaraz ari garelakoanโ€. Eta esango nuke dagoeneko ari garela erdaraz euskaraz ari garelakoan.

Adimen Artifiziala ari da euskara-eredu bat sortzen, ari gara euskara-eredu bat sortzen, eta aberastasuna lapurtzen ari gatzaizkio, lautzen ari gara erabat euskara, eta beti izan duen bizitasun hori lausotzen ari da, goizeko behe-lainoa desagertzen den moduan, konturatzerako. Nerabeek eta haurrek hori jasoko dute, eta errua leporatuko diegu, baina krimena gu ari gara egiten (baimentzen).

Duela zenbait urte, blog bat eratu nuen, โ€œGure hitz galduen bilaโ€ izenekoa. Aspalditxo, han utzi dut nonbait, alboratuta, eta egia esaten badizuet, pasahitza ere ahaztu dut (beste bat jasotzeko eskaera ere egin nuen, baina ez nuen lortu), baina uste dut hura berriro martxan jartzea ideia ona dela, eta, zoritxarrez, gero eta hitz gehiago sartuko ditut zakuan. Orduan, pentsatu egin behar izaten nuen, โ€œzein ote da haur nintzela maiz entzun eta orain batere erabiltzen ez den hitza?โ€.

Konpromisoa hartuko dut blogari berrekiteko, baina konpromisoa hartu dezagun guztiok hitz galdu gehiago ez sortzeko. Izan dadila zaila hitza hautatzea, pasa dezadala denboratxo bat hitz jakin bat bilatu arte.

Gure sentsorera iristen dena jakinarazi dezagun, ezin ditugu besteak behartu beren sentsoreak gure zenbakiekin kalibratzera, baina egin dezagun pedagogia โ€œEuskaltzaindia hizketanโ€ ez diezaguten esan haurrari zuzenketa txiki bat egin diogulako.

Bide batez, aipatu dudanaren lekuko testu hau bera izango da ziur aski: baietz hemen ere normalizatu ditugun (ditudan) formulak agertu, euskarari berez ez dagozkionak (eta ez da nahita egindakoa izan, halakorik badago)!

Abatarren plaza digitalaz

Estitxu Irisarri Egia

Beste behin ere, adimen artifiziala (AA). Esango nuke testu honek aurreko astean Itziar Otegik aipatzen zuen magia eta Ane Garmendia Alberdik apirilean eta Maite Imaz Leundak urtarrilean aipatutako ardura dakartzala berriz gogora. Pare bat kontu aztertu nahi izan ditut neure buruari jarri diodan erronkatxo honekin; batetik, Whisper AA darabilen TurboScribe doako bertsioak euskarazko audioak transkribatzeko zer gaitasun duen eta transkripzio horietatik abiatuta HeyGen eta Synthesia baliabideek eskaintzen dituzten zenbait ahotsek duten ahoskera behatzea.

HEOCen nondik norakoak irakurtzen nabilen honetan, eskuz idatzitako eskema bat audioan grabatu dut. Audioa 30 minutu baino gutxiagokoa bada, osorik transkriba dezake TurboScribe delakoak eta egunean tamaina horretako 3 audio transkriba ditzakegu ordaindu gabe. Transkripzioaren zehaztasuna finkatzeko aukera ematen digu tresna honek; horretarako, 3 animaliaren artean hautatu behar dugu: gepardoa, delfina edo balea. Gepardoa da aukerarik azkarrena, baina, badakizue, azkar eta ondo, usoak hegan. Balea da zehatzena. Transkribatu baino lehen audioaren hizkuntza zein den adierazi behar dugu eta zerrendan euskara ere azaltzen da. Hautatutako doako AAk honela transkribatu ditu nire jardunaren 3 bat minutu:

(0:00) Eok, emillatua geitabat, elduen euskal duntzerako oinarrizko kurrikuluma, kurrikulumaren oinarriak, hogeita mar garran horrialdea. (0:18) Gaitasun komunikatibora eta ekintzetara bideratutako ikuspegia da, ikaslea gizartera gehiada eta ekintzak interesekoak izango dira. (0:33) Ekintzak komunikatiboa da elementua, ekintzak mundu sozialarekin loturadua eta komunikatiboak izkuntzenen munduarekin.
(0:52) Kurrikulumaren oinarria ikaslearen autonomia ere bada eta izkuntza eta ekintzak komunikatiboa oso tasunak dira, oso tasun dinamikoak. (1:09) Iztunak kontuan izan behar ditu testu eta testuingurua. (1:14) Ekintzak komunikatiboak okial hortzeko, ekintzak komunikatibo guztiak ezin lan du eta autonomia eta estrategia da dira helburuak.
(1:37) Maliak onarrizko lerruna, onarrizko erabiltzaia, abat eta abi. (1:45) Eguneroko gai buruzko euskarazko testu lagurrak ulertzea eta oz eta idatziz euskar alkarera ginean erabiltzea. (1:55) Lagur eta simple bainagoki eta erabinkor.
(2:00) Lerruna horreratua, erabiltzaia horreratua, bebat eta bebi. (2:06) Ikasleak oikutik testuinguru gai eta egoera ezagunetan instrukzioak, kontak eta lagurrak eta azalpen testuak ulertzea. (2:17) Eta oz, zein idatziz euskaraz, zehaztasunez eta erabinkortasunez erabiltzea.
(2:26) Adituaren lerruna, erabiltzaia aditua, zebat eta zebi. (2:33) Eremu profesional, publiko, zein pertsonalean ikaslea gai da eragustietako informazioa euskaraz trukatzeko. (2:41) Eralando eta jantzian.
(2:45) Elburu orokorrak berrogitabat garran horri aldea. (2:50) Entzunena, abat gai izango da eguneroko harremanetan testu lagurren gaia eta komunikazioa asmoa identifikatzeko. (3:01) Hitzak eta zapideak ulertzeko, naiz edukiari buruzko hipoteziak egiteko.

Denbora pixka bat itxaron behar dugu adimen artifizialak transkripzioa eskaini arte. Formatu desberdinetan jaisteko aukera ematen digu: .pdf, .docx, .txt eta .srt. Bideoaren azken bertsioa argitaratu baino lehen ezinbestekoa da transkripzioa eta audioa bat datozela ziurtatzea eta transkripzioan egin beharreko aldaketak eta zuzenketak egitea. Izan ere, zuzentasunaren aldetik hainbat aldaketa egin behar ditugu: ortografia, gaizki zatitutako hitzak, gaizki ulertutako edota asmatutako hotsak, etab.

Abatarra eratzeko, HeyGen azkarragoa eta eskuzabalagoa izan da. Synthesiak 63 minutu behar izan ditu bideo labur bat prozesatzeko eta ez dit eman bideo bat baino gehiago sortzeko aukerarik eta ezta sortutako bideoa editatu eta berriz ere gordetzeko aukerarik ere. Doako profilak, antza, ez du gehiagorako ematen. Hortaz, ondo ziurtatu behar dugu azken bertsioa erabat zuzenduta dagoela. Lortu dudan bideoan denboraren erreferentziak entzuten dira, zuzenketa fonetiko-morfologikoak egin gabe daude, etab. Bideoaren lotura hauxe da, baina esango nuke kontua izan ezean ezingo duzuela ikusi, eta ez duenez bideoa jaisteko aukerarik ematen, ezin izan dut hemen gehitu.

Nahiz eta HeyGenen transkripzioan denborari erreferentzia egiten dioten zenbakiak agertu, ez ditu irakurtzen. Horrez gain, bideoa jaisteko aukera ematen du eta baita editatzekoa ere; hiru bertsio egin ahal izan ditut eta ez dit gordetzeko arazorik eman; hilean 3 bideo sortzeko aukera omen dago. Halere kontuan izan behar dugu gure abatarrek ezingo dutela 3 minututik gorako jardunik eskaini. Hauxe azken bertsioa, zuzenketekin eta azpidatziekin:

Fokua abatarren ahoskeran jarrita, basque azentua ezarri arren, hainbat zuzenketa eta aldaketa fonetiko eta prosodiko beharko lituzkete euskara errealagoa izan dadin. Hainbat oztopo antzeman daitezke, esate baterako: siglak irakurtzerako garaian, hatxearen ahoskeran, e eta a bokalak nahastean, s eta z kontsonanteak ahoskatzean eta batez ere hitzen azentuekin, silaben banaketarekin eta, oro har, euskal prosodiarekin. Aitortuko dut emaitza uste baino politagoa izan dela eta ezpainen mugimendua ahoskatzen denarekin koherentzian doala ikustea pila bat gustatu zaidala, eta abatarrek mugimenduak izatea ere positiboa iruditu zait. Hori bai, aurretik aipatutako oztopo horiek sistematik aldatzeko aukera balego, bikaina litzateke; momentuz, besterik ezean, transkripzioan edo gidoian zenbait aldaketa egin daitezke eskuz.

Orairen Kimu hizkuntza eredu txikiaren berri izan dugu orain dela gutxi. Dirudienez, Orai NLP Teknologia Elhuyarren adimen artifizialeko zentroak jarri du martxan aipatutako euskarazko txatbota. Hurrengo pausoa izango ote dira abatar euskaldunak? Euskaldunok lortuko dugu euskarak testuinguru horretan tokia eta garrantzia izan dezan? Erabilera arduratsua egingo dugu? Teknologiarekin beti egon dira erreparoak eta adimen artifizialarekin ere bai, baina alderdi asko erraz ditzake egunerokotasunean. Euskara, jalgi hadi plazara zioen hark; hau ere bada plaza, digitala, baina plaza.

Teknologia eta magia

Itziar Otegi Aranburu

Arthur C. Clark zientzia-fikzioko idazleak hiru โ€œlegeโ€ eman omen zituen bere bizian. Hirugarrena da ezagunena: Behar bezain aurreratua den teknologia oro magiatik bereizezina da.

Nago adimen artifizial izendapen badaezpadako horren atzean dagoen teknologia, edo teknologia multzoa, sarritan parekatzen dela magiarekin, nolabait magiaren parekotzat aurkezten โ€•edo hartzenโ€• dela. Izenak berak iradoki nahi luke halako zerbait, gizakiak sortua dela, artifizialki, baina giza esku-hartzerik gabe dabilela, bere kasa. Itzulpen automatiko izendapenak ere hori ematen du aditzera: automatikoki funtzionatzen duela, botoi bati emanda.

Eta, egia esan, hala dirudi. Botoi bati eman, edo agindu batzuk, eta hortxe azaltzen da, magiaz bezala, testu bat, edo irudi bat, edo itzulpen bat, lehen ezer ez zegoen tokian. Istant batean abiapuntutik helmugara iritsi bagina bezala da, baina bidean batere nekatu gabe. Hori egiten baitigu adimen artifizialak, bidea aurreztu, edo bidea ebatsi, nola begiratzen den.

Automatikotzat jotzen den horretan, baina, ezinbestekoak dira giza eskua eta adimena, fase guztietan, hasi hastapenean garatzen hasi ahal izateko beharrezkoa duen input โ€•jakintza eta lan kolektibo metatuโ€• guztiarekin, eta buka ematen duen output horren gainbegiratze eta zuzenketarekin, tartean ahaztu gabe programatzaile, garatzaile eta beste diziplina askotako adituen adimena, eskarmentua eta lana, nahiz eta batzuek, eskujokari eta ilusionistek beren trikimailuak nola, ezkutatu egin nahi lituzketen tartean diren beste esku guztien eginak, erabiltzaile oharkabeari sentiarazteko botoiari ematen dionean makinak egiten duena magia dela.

Botoi bati ematea erraza den arren, magiatik gutxi du kontuak. Mark Coeckelbergh-ek, ร‰tica de la inteligencia artificial[1] liburuan, honako hau dio datuen zientziaz eta deep learning edo ikasketa sakonaz ari delarik:

Los errores siempre son posibles, y la elecciรณn humana, el conocimiento y la interpretaciรณn son cruciales. Los humanos son necesarios para interpretar de manera significativa y dirigir la tecnologรญa hacia la bรบsqueda de diferentes factores y relaciones. Como subraya Boden (2016), la IA carece de nuestra comprensiรณn de la relevancia. Se deberรญa aรฑadir que tambiรฉn carece de entendimiento, experiencia, sensibilidad y sabidurรญa. Este es un buen argumento en defensa de la idea de que en teorรญa y en principio deben estar involucrados los humanos. Pero tambiรฉn existe un argumento empรญrico a favor de la inclusiรณn humana: en la prรกctica, los humanos estรกn involucrados. Sin los programadores ni los cientรญficos de datos, la tecnologรญa, simplemente, no funciona. Ademรกs, la experiencia humana y la de la IA a menudo se combinan, por ejemplo, cuando un mรฉdico acepta una terapia contra el cรกncer sugerida por una IA, pero tambiรฉn por su experiencia y su intuiciรณn de especialista.

Aurrerago, ahanzturan utzi ohi diren beste langile batzuk aipatzen ditu, hala nola adimen artifizialak funtzionatzeko beharrezkoak dituen โ€•eta gutxitan bistaratzen direnโ€• euskarri fisikoak egiteko mineralak erauzten dituztenak, hondakin elektronikoez arduratzen direnak, edo adimen artifiziala trebatzen dutenak; besteak beste, โ€œmehatzetako langileak, itsas garraiolariak edo klikaren langileak, datu multzoak etiketatzen dituztenakโ€. Esaldi biribil batekin ixten du auzia egileak: โ€œSi se deja fuera la intervenciรณn humana, las cosas pueden salir mal, carecer de sentido, o simplemente, resultar ridรญculasโ€.

Itzulpenaren arlora etorrita, erraz arrazoitu daiteke gauzak antzera direla hor ere: itzulpen automatizatua gainbegiratze eta zuzenketarik gabe ematen denean, esaterako, gauzak gaizki atera daitezke, zentzugabeak izan, edo, besterik gabe, barregarriak. Ez noa adibideak jarrita anekdotan erortzera. Ez dago beharrik, egunero ikusten dugu, nork bere lanean, eta askotan hitz egin da horretaz blog honetan. Berriki, adibidez, Maite Imazek[2] ITZULBIDE tresnari buruz idatzi zuen, zeina Osakidetzan mediku-txostenak euskaratik gaztelaniara itzultzeko erabiliko den batez ere. Honela amaitzen zuen Maite Imazek bere testua:

Pentsatzen dut medikuntzako profesional euskaldunek euskaraz sortutako txosten klinikoak ez dituztela besterik gabe euskara hutsez gordeko ordenagailuan; hori egin aurretik emango diotela botoiari eta ziurtatuko dutela gaztelaniara egindako itzulpena zuzena dela, geroago etor daitekeen mediku erdaldunak uler dezan.

Maite Imazek ziurtatze-lan horretan oinarritzen zuen bere konfiantza ITZULBIDEren segurtasunean:

Euskaraz sortzen dugunok gaztelaniaratzeko itzultzaile automatiko neuronalak erabiltzen ditugunean ez gara botoi bati sakatuta konformatzen; zuzendu edo posteditatu egiten dugu. (โ€ฆ) ziurtatuko dugu testu biek gauza bera esaten dutela, jatorrizkoan esaten den guztia esaten dela itzulpenean, eta itzulpenean ez dela jatorrizkoan azaltzen ez denik esaten.

Nik neuk irudipena dut, itzulpen automatizatuaz hitz egiten denean, iristen den mezua ez dela izaten โ€œTresna ona da, baina itzulpen egokiak eta desegokiak tartekatzen ditu; hau da, itzulpen onen tartean batzuk akastunak dira, eta, horrenbestez, giza gainbegiraketa ezinbestekoa daโ€. Iristen den mezua da automatikoki lan egiten duen makina beregain bat dela, edo, kasurik onenean, nahikoa dela esku-hartze minimo bat. Kontua ez da hutsala, horratik; inplikazio sakonak ditu.

ITZULBIDEren kasuan, adibidez, pentsatzekoa da Osakidetzak izango duela protokoloren bat tresnaren erabilerari buruz, ezarrita egongo direla moduak, prozedurak, denbora gehigarriak eta abar, zeren, bestela, ITZULBIDEren erabilera โ€•erabilera zuzenaโ€• mediku euskaldunen prestasunaren esku uztea litzateke. Erantzukizunaren galdera ere sortzen da; alegia, norena litzatekeen erantzukizuna itzulpen akastun baten ondorioz okerren bat gertatuko balitz, eta aldatzen ote den erantzukizun hori, eta zer zentzutan, medikuak itzulpena bere horretan emanez gero, besterik gabe botoiari sakatuta, edo, aitzitik, gainbegiratuta, gainbegiratzeko ardura hartuta.

Gorago eman dudan Mark Coeckelberghen aipu horretan bada esapide deigarri bat: dirigir la tecnologรญa. Los humanos son necesarios para (โ€ฆ) dirigir la tecnologรญa (โ€ฆ). Auzia, azken batean, horixe da: nork daukan eskutik kontua, gizakiak ala makinak. Nork gidatzen duen nor. Makina gizakiaren tresna ote den, edo gizakia makinaren tresna. Irudi luke azken horretarantz goazela; izan ere, joera da teknologiaren โ€•makinarenโ€• garapen itxuraz agorrezina goratzea, eta gizakiaren โ€•langilearenโ€• esku-hartzea minimizatzea, eta debaluatzea.

Jakin nahi nuke nola izango ote ziren gauzak orain baldin eta, hasieratik bertatik, gauzak beste modu batean egin izan balira. Hasieratik aitortu izan balitz โ€•ondorio guztietarakoโ€• adimen artifiziala ez zela sortu ere egin izango guztion ekarpena gabe, giza jakituria metatuaren zordun dela, gizakiaren lan adimentsua eta gogorra dagoela haren fase guztietan; hutsetik sortutako zerbait ez, baizik eta lan kolektibo itzel baten ondorio dela, eta, horrenbestez, teknologia horren onurak ere kolektiboa izan behar duela, guztion mesederako.

Inolaz ere ez langileen kalterako.


[1] Coeckelbergh, M. (2021). ร‰tica de la inteligencia artificial. Cรกtedra: Madril.

[2] Imaz, M. (2025). โ€œEuskaraz sortutakoa gaztelaniara itzultzeko itzultzaile automatiko neuronalaโ€. 31 eskutik bloga.

Makinaren eta gizakiaren arteko elkarrekintza

Elizabete Manterola Agirrezabalaga

Unibertsitateko eskoletan, kongresuetan zein jardunaldi akademikoetan; lagunartean, sektoreko lankideen artean zein kazetariekin; non ez dugu hizketagai izan teknologiaren garapen azkarra azkenaldian? Zaila da iritzi argirik izatea, ez baita erraza neurtzen norainoko gaitasunak dituzten esku-eskura ditugun trepeta horiek eta zenbaterainoko eragina izango duten gure egunerokoan. Kontua ez da orain arteko lan-dinamika baztertu eta makinen mende jartzea, makinak gure mesederako erabiltzea baizik.

Gizakiak berezkoa du egokitzeko gaitasuna, eta guri geuri iraultza teknologiko honen erdian, eta gure lanaren helburuak bazterrean utzi gabe, egoera berrietara egokitzea dagokigu. Eta ahal dela, ongi neurtu, ebaluatu eta hausnartutako erabakiak hartzea. Gakoa ez baita teknologia berrienen bitartez gizakiaren lana bere horretan ordezkatzea, baizik eta teknologia gizakiaren helburuetara ahalik eta modurik eraginkorrenean baliatzea. Hori horrela izanik, inportantea da gizakiaren eta makinaren arteko interakzioan jartzea arreta: zer nolako harremana sortzen da bien artean? Zer modutara balia dezakegu teknologia zereginik nekosoenak egin ditzan? Zertan behar da bai ala bai gizakiaren eskua eta, batez ere, adimena?

Galdera horiek buruan ekin genion ikerketa-proiektu bati duela zenbait hilabete. KSIgunek babestutako sei hilabeteko proiektu baten esparruan, Konexioak deialdiaren barruan, Elhuyarreko lantalde bat eta EHUko ikertzaile batzuk elkarlanean[1] aritu gara ikus-entzunezko sektoreari lotutako ikerlan batean, gaztelaniatik euskararako azpidazketa jomugan hartuta. Ezinbestekoa izan da sektoreko hainbat itzultzaileren parte-hartzea esperimentua gauzatzeko. Alderatu nahi izan ditugu eskuzko jardunbideak eta modu automatiko zein erdiautomatikoan eginikoak, itzultzaile edota transkripzio automatikorako tresnak baliatuta. Hain zuzen ere, Elhuyarrek garatutako Aditu eta barruan integratuta dagoen Elia baliatu ditugu. Bost multzotan banatu ditugu jardunbideak: 1) eskuzko modua, gizakiak ohikoak dituen azpidazketarako ohiko tresnak baliatuta sortzea azpidazketa; 2) transkripzio automatikoa baliatuta, gizakiak hori berrikusi, itzuli eta azpidatziak sortzea; 3) transkripzio automatikoa baliatuta gizakiak hura berrikustea eta hori gero itzulpen automatiko bitartez itzuli eta berrikustea; 4) transkripzio automatikoa sortu, emaitza itzultzaile automatikoak itzuli eta gizakiak berrikustea; 5) modu erabat automatikoa, transkripzio automatikoa eta itzulpen automatikoa baliatuta.

Ezin hemen emaitza kuantitatiboak banan-banan aletzen hasi, baina azpimarratzeko moduko bi datu eman nahi nituzke. Batetik, modu erabat automatikoa baztertzeko jardunbidea da gaur-gaurkoz gaztelaniatik euskararako azpidazketan. Gainerako lau jardunbideekin alderatuta, emaitza oso kaxkarrak eman ditu. Bestetik, jardunbide erdiautomatikoek emaitza positiboak eskaini dituzte, eta erabat eskuzkoak diren jardunbideekin alderatuta emaitza ez da hain txarra. Makinaren eta gizakiaren arteko elkarrekintzak ibilbide oparoa izan dezakeela pentsa liteke, hortaz. Jakina, gure proiektua oso mugatua izan da, bai iraupenez, bai aztertutako laginari eta itzultzaile kopuruari dagokionez, eta lortutako emaitza horietan sakondu beharra dago oraindik ere.

Emaitza kuantitatiboak, baina, ez dira kontuan izateko emaitza bakarrak. Itzultzaileen lan-jardunaren berri izatea ere ezinbestekoa da lan-dinamiken garapena eta jasangarritasuna ezagutu nahi izatera. Hori horrela izanik, hainbat galdera erantzuteko eskatu genien esperimentuan parte hartu zuten itzultzaileei. Jakin nahi izan genuen zenbateko denbora behar izan zuten zeregina gauzatzeko, zenbateko laguntza eskaini zien transkribapen automatikoak eta zenbaterainokoa itzultzaile automatikoak, zer oztopo sortu zizkien, zer tarifa aplikatuko lieketen halako itzulpen prozesuei, onartuko ote luketen halako enkargurik aurrerantzean.

Lortutako erantzunen bitartez, jakin dugu itzultzaileek nahiago dutela itzulpen automatikorik gabe lan egin halako enkarguetan, edo behintzat, ez itzulpen automatikoaren emaitza modu sistematikoan erabili. Alabaina, transkribapen automatikoari buruzko hautematea hobea da. Horretaz gain, azterketa kualitatiboan ikusi dugu, baita ere, itzultzaileak ez direla maiz posteditatzera mugatu, eta hutsetik sortu dituzte azpidatziak. Horrek erakusten du kalitatearen aldeko apustua.

Bestalde, eta langintzaren ikuspegitik, kontuan izateko azken kontu bat ere ekarri nahi dut hona: modu erdiautomatikoan lan egiteak nekea sortzen duela diote esperimentuan parte hartutako itzultzaile batzuek. Kontuan izateko iritzia, inondik ere, lanbidearen jasangarritasuna profesionalen ongizateari lotuta dagoen heinean.

Aztertu, neurtu eta ebaluatzen jarraitu beharra daukagu ikusteko itzultzaileak prest ote dauden prozesu erdiautomatizatuetan jarduteko, horien eraginkortasuna denboretan eta dirutan ez ezik prozesuetan duten eraginean ere azpimarra jarrita.


[1] Elhuyarreko lantaldean Klara Ceberio, Lide Azkue eta Eli Pociello aritu dira. EHUko TRALIMA/ITZULIK ikerketa taldean, berriz, Ana Tamayo, Naroa Zubillaga, Zuriรฑe Sanz eta Elizabete Manterola. Lankideei eskertu nahi diet idatzi hau osatu eta orrazteko eman didaten laguntza.

IZIen eta euskararen garapen jasangarria

Amaia Astobiza Uriarte

Duela hirurogei eta koska urte, gure amari zeharo zirrimarratu zitzaion auzo-eskolan ikasi eta mojetan dotoretutako idazkera, hainbeste takigrafiatu nahi izan baitzuen hain denbora gutxian, gaztetxoa izanda ere idazkari-lanetarako hautagairik onena zela erakutsi nahian. Jada ez gaude 1960ko hamarkada hartan, baina orain ere halatsu gabiltza hizkuntzarekin, aurrez tentuz ikasi eta ekinaren ekinez edertutakoa lipar batean narrasten, adimen artifizialeko tresnen bidez tarte txiki-txikian hainbeste testu sortu ahal izateak eragindako lilurak itsututa eta edukiaren nolakotasunarekiko kezka lan ondo eginaren eta errentagarritasunaren arteko zirrikitu beti lausoetan galduta. Eta ez, ez naiz ari soilik itzulpenez; kasu honetan, jatorrizko testuak ere zaku berean sartzen dira, edo aldamenekoan.

Izan ere, hortxe ari dira azken belaunaldiko AAk lehen belaunaldietako AAek sortutako testu eta itzulpenekin beren buruari jaten ematen (autofagiaโ€ฆ selektiboa ala ez-selektiboa?) eta elikatze-kate hori behin eta berriro errepikatzen. Eta, itxura batean, inor gutxiri axola zaio makinok hala elikatuta gero eta lexiko pobreagoa eta gero eta sintaxi gutxi gorabeheragokoagoa eta gero eta adierazpen-gaitasun gutxiagoko edukiak โ€”hizkuntzakโ€” sortzen ditugula eta eduki/hizkuntza kamustu horiek izango direla laster, adibidez, gai potoloen inguruan erabakitzeko erabiliko ditugun argudioen eta diskurtsoen oinarri.

Egoera horren aurrean, itzultzaileak, zuzentzaileak eta interpreteak (IZI) ere kezkatuta daude, gaude, noski, AArekin, ez bakarrik lanpostuak dantzan eta langileak larrugorri jartzen dituelako, beste sektore batzuetan bezala, baizik eta baita hizkuntzaren kalitatea โ€”eta, beraz, bihar-etziko euskara eta haren plaza guztietarako erabilgarritasunaโ€” kolokan jartzen duelako ere.

Arretatsuak gara oso IZIok: hizkuntzaren zehaztasunaz, zuzentasunaz eta egokitasunaz arduratzen gara, eta, lan-baldintza prekarioek horretarako marjina-izpi bat uzten badigute, baita aberastasunaz eta dotoreziaz ere, ez soilik hizkuntzari zor zaion errespetuagatik, baita testuen hartzaile diren herritarrei, bezeroei, pazienteeiโ€ฆ zor zaienagatik ere. Baina, hara, ez omen da hori merkatuak (ente oteitzar hori, abstraktua bezain pisuzkoa) behar duena, ezta merkatuak nahi duena ere. [Ohartxo bat marjinan, eskultorea aipatu dugunez: Oteizak esaten zuen, gutxi gorabehera, aurrera begira baina atzerantz zebilela idazten zuela, hau da, erroak oinarri, abangoardia helburu; beharbada buelta pare bat eman behar genioke ideia horri]

Zer nahi du merkatuak? Edukien Aroan, kontsumo azkarreko testuak eta horien itzulpenak nahi ditu, behin ikusi eta betiko ahaztekoak. Eta, jakina, edukiak efimeroak badira, bost axola merkatuari hizkuntza ere halakoxea bada, behin erabili eta botatzekoa. Euskararekiko โ€”edo hizkuntzekikoโ€” zinezko begirunerik edo engaiamendurik ez duen enpresa edo erakunde batean, finantzetako nork egingo du paseko testu horien kalitatearen alde? Administrazio publikoek ere egiten ez badute (eta hori beste IZI batzuek azaldu dezakezue nik baino hobeto), nola egingo dute errentagarritasun ekonomikoari soilik begiratzen diotenek?

Itzul gaitezen AA-makinetara. Kalteak kalte, jada ez ditu (ia) inork zalantzan jartzen haien abantaila askotarikoak. Behin hori onartuta, zer da hobe, gure ekonomiaren eta gure hizkuntzaren ikuspegitik: etxean garatzea ala kanpotik ekartzea? Guk bultzatzea erabilera arduratsua (hizkuntzaren kalitatea zainduz) ala dena balizko autorregulazioaren esku uztea (eta gora orotariko kamustasuna)? Eta guk eta guretik eta guretzat egin nahi badugu, nola egingo dugu?

Gehienok jakingo duzue: garapen jasangarrirako 17 helburuei beste bat gehitu zitzaien, hemezortzigarrena: Hizkuntza eta Kultura Aniztasuna. Horren barruan, 17 konpromiso, 102 ekimen, 188 jarduera daude zehaztuta, eta tira, ez naiz hasi banan-banan begiratzen, baina pentsatzekoa da horietakoren batean zerbait esango dela euskararen kalitateaz (zeren bestela ez dakit zer mordoilokeria espero dugun ยซkontserbatzea, kudeatzea eta transmititzeaยป edo ยซzabaltzea suspertze-bidean dauden eremuetaraยป). Bada, ondo letorkiguke horiei arretaz begiratzea, iruditzen baitzait hor badagoela erakunde publikoetara kontu eske joateko aski oinarri. Kontuak, ez bakarrik hizkuntzaren kalitatearen eta haren etorkizun jasangarri eta duinaren erantzukizunaren ingurukoak, baita bestelakoak ere; alegia, IZIon lan- eta bizi-baldintzei zuzenean eragiten dietenak: ekonomikoak.

Konplexuak eta eskekoaren sindromea gainetik astintzeko, betiko adibidea ekarriko dut, hain baita agerikoa. Automobilgintzaren sektoreak aurrera egiten badu ez da sinmรกs auto asko saltzen direlako, baizik eta gobernuek sektore hori zuzenean diruz injektatzen dutelako; urtero dirutza ikaragarria erabiltzen dutelako enpresak nazioartekotzen eta legeak haien beharretara makurtzen; eta baita, noski, tarteka-tarteka herritarroi ere dirua ematen digutelako autoak erosteko, ez zintzo portatu garelako, baizik eta negozioari eutsi behar zaiolako eta Europatik datozen ingurumen-legeak bete behar direlako. Eta ondo dago hori guztia, horretarako ordaintzen baititugu zergak; besteak beste, gizarteak osotasunean baliabide berekin (zurrut) eta abiadura ber bakarrean (dobla zurrut) aurrera egiteko, gizakion eta planetaren jasangarritasuna bermatzen ahalegintzeko eta herritarren bizitza prekarioak apur bat bizigarriago egiteko.

Baina zergak denok ordaintzen ditugunez gero, industria erraldoi horretatik kanpo geratzen garen sektoreok eta langileok ere gure aldeko ahalegin bera eskatu behar genieke administrariei. Eta eskatu behar genieke, baita, herritarron dirutxoak eta Administrazioaren ahaleginak ekitatiboagoki banatzeko eta dibertsifikatzeko gure sektoreko autonomo, enpresa eta erakundeen artean; izan ere, ez da ezinbestekoa โ€”ezta bidezkoa ereโ€” dena fabrika traktore handien eta haien morrontzako tailer txiki apurjaleen logikara makurtzea.

Beraz: nik etsiak jo gabeko teknikarien saldo bat jarriko nuke 18. GJHko konpromisoak lan-orritik harago eramaten eta (besteak beste) IZI sektorea eta euskara hauspotzen, bata ito eta bestea asmatiko kroniko bihurtu aurretik.