Makinaren eta gizakiaren arteko elkarrekintza

Elizabete Manterola Agirrezabalaga

Unibertsitateko eskoletan, kongresuetan zein jardunaldi akademikoetan; lagunartean, sektoreko lankideen artean zein kazetariekin; non ez dugu hizketagai izan teknologiaren garapen azkarra azkenaldian? Zaila da iritzi argirik izatea, ez baita erraza neurtzen norainoko gaitasunak dituzten esku-eskura ditugun trepeta horiek eta zenbaterainoko eragina izango duten gure egunerokoan. Kontua ez da orain arteko lan-dinamika baztertu eta makinen mende jartzea, makinak gure mesederako erabiltzea baizik.

Gizakiak berezkoa du egokitzeko gaitasuna, eta guri geuri iraultza teknologiko honen erdian, eta gure lanaren helburuak bazterrean utzi gabe, egoera berrietara egokitzea dagokigu. Eta ahal dela, ongi neurtu, ebaluatu eta hausnartutako erabakiak hartzea. Gakoa ez baita teknologia berrienen bitartez gizakiaren lana bere horretan ordezkatzea, baizik eta teknologia gizakiaren helburuetara ahalik eta modurik eraginkorrenean baliatzea. Hori horrela izanik, inportantea da gizakiaren eta makinaren arteko interakzioan jartzea arreta: zer nolako harremana sortzen da bien artean? Zer modutara balia dezakegu teknologia zereginik nekosoenak egin ditzan? Zertan behar da bai ala bai gizakiaren eskua eta, batez ere, adimena?

Galdera horiek buruan ekin genion ikerketa-proiektu bati duela zenbait hilabete. KSIgunek babestutako sei hilabeteko proiektu baten esparruan, Konexioak deialdiaren barruan, Elhuyarreko lantalde bat eta EHUko ikertzaile batzuk elkarlanean[1] aritu gara ikus-entzunezko sektoreari lotutako ikerlan batean, gaztelaniatik euskararako azpidazketa jomugan hartuta. Ezinbestekoa izan da sektoreko hainbat itzultzaileren parte-hartzea esperimentua gauzatzeko. Alderatu nahi izan ditugu eskuzko jardunbideak eta modu automatiko zein erdiautomatikoan eginikoak, itzultzaile edota transkripzio automatikorako tresnak baliatuta. Hain zuzen ere, Elhuyarrek garatutako Aditu eta barruan integratuta dagoen Elia baliatu ditugu. Bost multzotan banatu ditugu jardunbideak: 1) eskuzko modua, gizakiak ohikoak dituen azpidazketarako ohiko tresnak baliatuta sortzea azpidazketa; 2) transkripzio automatikoa baliatuta, gizakiak hori berrikusi, itzuli eta azpidatziak sortzea; 3) transkripzio automatikoa baliatuta gizakiak hura berrikustea eta hori gero itzulpen automatiko bitartez itzuli eta berrikustea; 4) transkripzio automatikoa sortu, emaitza itzultzaile automatikoak itzuli eta gizakiak berrikustea; 5) modu erabat automatikoa, transkripzio automatikoa eta itzulpen automatikoa baliatuta.

Ezin hemen emaitza kuantitatiboak banan-banan aletzen hasi, baina azpimarratzeko moduko bi datu eman nahi nituzke. Batetik, modu erabat automatikoa baztertzeko jardunbidea da gaur-gaurkoz gaztelaniatik euskararako azpidazketan. Gainerako lau jardunbideekin alderatuta, emaitza oso kaxkarrak eman ditu. Bestetik, jardunbide erdiautomatikoek emaitza positiboak eskaini dituzte, eta erabat eskuzkoak diren jardunbideekin alderatuta emaitza ez da hain txarra. Makinaren eta gizakiaren arteko elkarrekintzak ibilbide oparoa izan dezakeela pentsa liteke, hortaz. Jakina, gure proiektua oso mugatua izan da, bai iraupenez, bai aztertutako laginari eta itzultzaile kopuruari dagokionez, eta lortutako emaitza horietan sakondu beharra dago oraindik ere.

Emaitza kuantitatiboak, baina, ez dira kontuan izateko emaitza bakarrak. Itzultzaileen lan-jardunaren berri izatea ere ezinbestekoa da lan-dinamiken garapena eta jasangarritasuna ezagutu nahi izatera. Hori horrela izanik, hainbat galdera erantzuteko eskatu genien esperimentuan parte hartu zuten itzultzaileei. Jakin nahi izan genuen zenbateko denbora behar izan zuten zeregina gauzatzeko, zenbateko laguntza eskaini zien transkribapen automatikoak eta zenbaterainokoa itzultzaile automatikoak, zer oztopo sortu zizkien, zer tarifa aplikatuko lieketen halako itzulpen prozesuei, onartuko ote luketen halako enkargurik aurrerantzean.

Lortutako erantzunen bitartez, jakin dugu itzultzaileek nahiago dutela itzulpen automatikorik gabe lan egin halako enkarguetan, edo behintzat, ez itzulpen automatikoaren emaitza modu sistematikoan erabili. Alabaina, transkribapen automatikoari buruzko hautematea hobea da. Horretaz gain, azterketa kualitatiboan ikusi dugu, baita ere, itzultzaileak ez direla maiz posteditatzera mugatu, eta hutsetik sortu dituzte azpidatziak. Horrek erakusten du kalitatearen aldeko apustua.

Bestalde, eta langintzaren ikuspegitik, kontuan izateko azken kontu bat ere ekarri nahi dut hona: modu erdiautomatikoan lan egiteak nekea sortzen duela diote esperimentuan parte hartutako itzultzaile batzuek. Kontuan izateko iritzia, inondik ere, lanbidearen jasangarritasuna profesionalen ongizateari lotuta dagoen heinean.

Aztertu, neurtu eta ebaluatzen jarraitu beharra daukagu ikusteko itzultzaileak prest ote dauden prozesu erdiautomatizatuetan jarduteko, horien eraginkortasuna denboretan eta dirutan ez ezik prozesuetan duten eraginean ere azpimarra jarrita.


[1] Elhuyarreko lantaldean Klara Ceberio, Lide Azkue eta Eli Pociello aritu dira. EHUko TRALIMA/ITZULIK ikerketa taldean, berriz, Ana Tamayo, Naroa Zubillaga, Zuriñe Sanz eta Elizabete Manterola. Lankideei eskertu nahi diet idatzi hau osatu eta orrazteko eman didaten laguntza.

Euskal Herritik mundura

Amaia Lersundi Pérez

Duela gutxi berri bikaina jaso dugu euskal ikerlarion artean: Euskera aldizkaria JCR datu-basean indexatu dute. Agian ez da albiste handia hedabide handientzat, baina guretzat, euskaraz ikertzen eta idazten dugunontzat, mugarri esanguratsua da. Izan ere, maiz entzuten dugu euskaraz ezin dela goi mailako zientziarik egin, edo ekoizpen akademikoek balio izateko, derrigorrez ingelesez, gaztelaniaz, frantsesez edo beste edozein hizkuntza hegemoniko batean idatzi behar direla. Baina horrek ez du zertan hala izan. Euskaraz ikertzea ez da soilik aukera bat, eskubide bat ere bada. Eta horrelako lorpenek erakusten dute hizkuntza gutxitu batean egiten den zientzia ez dela bigarren mailako zientzia, eta bideak irekitzen dituzte beste aldizkari batzuk ere maila horretara heltzeko.

Euskera aldizkaria urte askoan aritu da euskara hutsean kalitatezko lan akademikoak argitaratzen, eta orain, indexatuta egonik, bertan argitaratutako edukiak nazioarteko datu-baseetan kontsultatu ahalko dira. Honek esan nahi du euskaraz idatzitako ikerketak ikusgarriagoak izango direla, balio handiagoa hartuko dutela akademikoki, eta, batez ere, euskara ikerketa-hizkuntza gisa legitimatzeko urrats sendo bat dela. Bide horretan, ezinbestekoa da unibertsitate, ikerketa-talde eta kalitatezko agentziek, batez ere, euskarazko ekoizpenari behar duen aitortza egitea, ikerlariek ere ausardiaz eutsi diezaioten euskarazko ekoizpenari.

Soberan dakigu euskaraz irakastea ez dela nahikoa: euskaraz pentsatu behar dugu, sortu, euskaraz zalantzan jarri, eta euskaraz argitaratu behar dugu. Hizkuntza batek bizirik iraun dezan, goi mailako diskurtsoak ere behar ditu, eta zientzia da horietako bat. Euskara akademikoki erabili, landu eta aberastu behar dugu, gure belaunaldiaren eta ondorengoen mesedetan. Horregatik, Euskera aldizkariaren indexazioa ospatzeaz gain, etorkizunari begira konpromisoa hartu behar dugu: euskarazko ikerketa sustatu eta defendatu, gure hizkuntzari ere ikerketa munduan bere lekua emanez.

Euskararen lexiko akademikoa

Igone Zabala Unzalu

Lexiko akademikoaren zerrendek testu akademikoen hiztegi-elementu bereizgarriak biltzen dituzte: hizkuntza baten maiztasun handieneko lexikoan ageri ez diren edo testu akademikoetan maiztasun bereizgarriaz erabiltzen diren hiztegi-elementuak. Hortaz, lexiko-zerrenda akademikoak diziplina artekoak izaten dira, eta diziplina bakoitzaren berariazko terminoak alde batera uzten dituzte[1]. Hasiera batean, halako zerrendak biltzeko helburua izan zen hizkuntzen helburu akademikoetarako irakaskuntzarako ikastaroak eta materialak prestatzea, baina berrikiago, testu akademikoen idazketarako laguntza-tresnak elikatzeko ere osatzen ari dira horrelako zerrendak[2]. HARTAvas proiektuan[3], euskarazko lexiko akademikoa erauzi dugu, kolokazio akademikoak identifikatzeko, eta idazketa akademikoari laguntzeko HARTA/TAILA tresna elikatzeko. Lortu dugun lexiko akademikoaren zerrenda oso baliagarri gertatu zaigu baita EHUko gradu guztietan eskaintzen diren euskarazko komunikazio akademiko-profesionaleko irakasgaietarako eta irakasleei eskaintzen zaizkien mintegietarako.

Lexiko akademiko esaten zaio edozein diziplinatako testu akademikoetan maiztasun bereizgarriaz erabiltzen den lexikoari. Hortaz, lexiko espezializatu edo terminologiatik bereizten da, terminoak diziplina bateko kontzeptu espezializatuak adierazteko erabiltzen diren hiztegi-elementu espezializatuak baitira. Euskarazko lexiko akademikoa erauzteko, HARTAeus corpus akademikoaren (3.484.162 hitz)[4] lemen maiztasunak alderatu ditugu Dabilena corpus orokorrean[5] (300.217.903 hitz) duten maiztasunarekin. Corpusaren lau domeinu nagusietan[6] eta testuen % 20 baino gehiagotan ageri diren hautagaiei corpusen arteko alderaketak egiteko erabiltzen den log-likelihood neurria aplikatu diegu. Ondoren, eskuz aukeratu ditugu lexiko akademikoaren zerrendarako errelebantetzat har daitezkeen elementuak. Horrela lortu dugu 846 elementuko zerrenda: 365 izen, 246 aditz, 182 adjektibo eta 53 adberbio.

Zerrenda horretako elementu gehienak inolako arazorik gabe erabiltzen dituzte egunero ikasleek eta irakasleek testu akademikoetan, baina badira etengabe nahasteak eta erroreak eragiten dituzten elementuak ere. Izenen artean, aipamen berezia behar du #pausu izenak. Izan ere, 670 agerraldi ditu corpusean, baina ez ‘atseden’ adierazteko, urrats (540 agerraldi) izenaren sinonimoa den pauso (632 agerraldi) erabili nahian baizik. Maiztasun handiz erabiltzen diren eta oso maiz oker erabilita agertzen diren beste izen batzuk dira froga eta proba. Zehaztasunari begira, garrantzitsua da bi izen horien esanahiak egokiro bereiztea, baina maiz ikusten eta entzuten da froga izena proba behar den testuinguruan. Antzera gertatzen da hazkuntza izenaren kasuan: ‘kultibo’ esan nahi badu ere, hazkunde edo haziera behar den testuinguruetan aurkitzen da oso maiz. Askotan nahastuta aurkitu ohi diren beste izen batzuk dira ikasketa ≠ ikerketa ≠ ikerkuntza; kantitate ≠ kopuru ≠ zenbaki; sorkuntza ≠ sorrera eta zehaztasun ≠ xehetasun.

A itsatsiak ere errore ugari eragiten ditu. Nabarmentzeko modukoak dira garrantzi, antz eta hipotesi izenak, a itsatsirik ez badute ere askotan a itsatsia balute bezala erabilita ikusten baitira (*garrantzia handia). Maiztasun handiz erabiltzen diren a itsatsidun zenbait izen, aldiz, a gabe erabiltzen dira askotan (*emaitz esanguratsuak). Horien artean aipagarrienak dira abantaila, desabantaila, emaitza, gabezia eta ordena. Bestalde, luzera izena *luzeera idatzita ikus daiteke maiz.

Adjektiboen artean, aipatzeko modukoak dira maiztasun handiz nahasten diren hauek: adierazgarri / esanguratsu; bera / berdin; eskas / urri; jakin / konkretu / zehatz / mugatu. Aditzen hautapen egokia egitea ere funtsezkoa da diskurtso akademikoa egokiro garatzeko, eta luze aritu gintezke aditzen erabilerari buruz, baina maiz nahastu ohi diren aditzen adibide batzuk baino ez ditugu emango: baimendu / ahalbidetu; baieztatu/ frogatu; behatu / ikusi; bereizi / desberdindu; burutu / egin; ekidin / saihestu; bilatu / aurkitu.

Hiztegi-elementu batzuk ezin dira okertzat hartu, baina desegokitzat har daitezke estilo zaindua eskatzen duten testu akademikoetarako. Aipatzeko modukoak dira hausnartu, hausnarketa, topatu, kontsideratu, suposatzen du eta ematen dira modukoak. Egokiagoak dira testu akademikoetarako, hurrenez hurren, gogoeta egin, gogoeta, aurkitu, -tzat hartu, dakar / eskatzen du eta gertatzen dira modukoak.

Erregistro akademikoez ari garenean, hiztegi-elementuen hautapena ez ezik, funtsezko aztergaia da hiztegi-elementu akademiko horiek testu akademikoetan ematen dituzten kolokazioak[7]. Kolokazioen finkapenaren atzean dago erabilera-maiztasun handia, azkenean diskurtso-komunitate baten norma bihurtzera eramaten dituena. Nolanahi ere, zenbaitetan diskurtso-komunitate akademikoetan erabilera-maiztasun handia duten konbinazioak ez dira hiztegietan edo estilo-liburuetan kodifikatuta ageri direnak. Adibidez, zenbait estilo-libururen eta hiztegiren arabera, urrats izena egin aditzarekin kolokatzen da (urratsak egin). HARTAeus corpusean, aldiz, urratsak eman eta pausoak eman konbinazioek baino ez dute gainditzen kolokaziotzat hartzeko langa. Erabileraren erabileraz finkatzen doazen joera idiosinkratikotzat har daitezke horiek, eta ez dirudi justifikatuta dagoenik testu akademikoetan urratsak egin kolokazioaren aldeko borroka sutsua egitea.

Ildo beretik, aipatu beharrekoa da izen akademikoekin konbinatzen diren zenbait aditzen erregimena, bereziki, jarraitu aditzarena[8]. Jarraitu aditzarekin kolokazioak osatzen dituzten izen akademikoetako batzuk dira pauso, protokolo, irizpide, prozedura, eredu, eskema, ordena eta egitura. Hiztegien arabera, datiboa hartzen du jarraitu aditzaren osagarriak (ereduari jarraitu diogu) baina corpus akademikoetan datiboa daramaten adibide bakan batzuk aurki badaitezke ere, kolokazioak erauzteko teknikak erabiliz, izen akademikoa absolutiboan duten kolokazioak baino ez dira azaleratzen (eredua jarraitu dugu).


[1] Coxhead, Averil. 2000. A new academic word list. TESOL Quartely 34 (2). 213-238.
Drouin, Patrick. 2007. Identification automatique du lexique scientifique transdisciplinaire. Revue Française de Linguistique Appliqué. 12 (2). 45-64.
Granger, Sylviane & Magali Paquot. 2015. Electronic lexicography goas local: Desing and structures of a need-driven online academic writing aid. Lexicographica: International Annual for Lexicography. 31 (1). 118-141.
García Salido, Marcos. 2021. Compliling an Academic Vocabulary List of Spanish. DOI:10.13140/RG.2.2.27681.33123

[2] Frankenberg-Garcia, Ana, Robert Lew, Jonathan C. Roberts, Geranti Paul Rees & Nirwan Sharma. 2018. Developing a writing assistant to help EAP writers with collocations in real time. ReCALL. 31 (1). 23-39.
García Salido, Marcos, Marcos García, Milka Villayandre & Margarita Alonso-Ramos. 2018. A Lexical Tool for Academic Writing in Spanish Based on Expert and Novice Corpora. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation, 260-265.

[3] Ministerio de Ciencia e Innovación erakundeak 2019ko deialdian finantziatuko Coruñako Unibertsitateko eta UPV/EHUko ikerketa-talde biren arteko proiektu koordinatua: PID2019-109683GB-C21 eta PID2019-109683GB-C22.

[4] HARTAeus corpusa Garaterm corpusean integratuta dago, eta kontsulta publikoetarako zabalik dago, bilaketa-interfaze aurreratuan, “Non” botoia sakatuta, eta “HARTAeus” aukeratuta. HARTA/TAILA tresnan ere badago corpusean bilaketak egiteko aukera.

[5] Lexiko akademikoa erauzteko kontraste-corpus modura erabili dugun Dabilena corpusa Elhuyarrek garatu du, eta Internetetik hartutako testuez osatuta dago.

[6] HARTAeus corpusak lau eremu nagusi ditu: Arteak eta Humanitateak, Biologia eta Osasun Zientziak, Gizarte Zientziak eta Zientzia Fisikoak.

[7] Kolokazio esaten zaie harreman sintaktikoa duten hitz-bikoteen konbinazioei. Konbinazio asimetrikoak direla esan daiteke bikotekideetako baten (oinarriaren base) hautapena haren esanahiaren arabera era askean egiten bada ere bestearen (kolokatuaren collocate) hautapena oinarriak murrizten duelako.

[8] Jarraiki aditza ez dugu kontuan hartu, askoz ere gutxiago erabiltzen baita testu akademikoetan, eta ez duelako gainditu lexiko akademikoaren zerrendetan sartzeko langa.

Iragana bihurtzea

Borja Ariztimuño López

Irulegiko Eskua jendaurrean aurkeztu zutenetik urte luzea igarota, oraindik ere argitu ezinik gabiltzala, egitekoaren konplexutasunak ageri-agerian uztea ezinbestekoa da, hasierako euforiak estalirik geratu ziren ohartarazpen eta zuhur-hitzak aldarrikatuz.

Gaurko sarreraren izenburua ez da nahikari edo eskari baten adierazpen traketsa, eta ez naiz “iragan denbora beti hobe” topikoaz arituko; ez eta iraganera bidaiatu ahal bai, baina hura aldatu ezinaren paradoxaz ere.

Blog honen testuinguruan uler bedi bihurtu aditza; ‘itzuli’, alegia, ‘translatatu’, ‘traduzitu’.

Izan ere, zer da testu zahar bat (areago idazkera [ia] ezezagunean idatzirikoa) ulertzea, geureagoa den hizkuntza-molde batera ekartzea baino?

Hala bada, zer behar du kontuan hartu itzultzaileak testu bat bihurtzerakoan? Lehenik eta behin, sorburu- eta helburu-hizkuntzak; hots, horiek ongi ezagutu behar ditu. Horrez gain, nork, norentzat eta zertarako idatzi duen ere jakitea komeni zaio (testuingurua), hitz, esapide eta molde guztiak egoki interpretatuko baditu. Orobatsu da, funtsean, epigrafista, filologo edo hizkuntzalari diakronikoek testu zahar eta antzinakoen aurrean beharko luketena.

Areago, sorburu-hizkuntza eta idazkera bera ezezagunak edo erabat identifikatu/dezifratu gabeak direnean, corpus zabala eta adibide elebidunak eskura izatea da desiragarriena; besteak beste, argudiaketa zirkularretan ez erortzeko.

Iberieraren kasuan, adibidez, ez dugu azpian dagoen hizkuntza egiazki ezagutzen, baina, halere, idazketa-sistema nahiko ongi (ez guztiz) ulertzera iritsi dira. Ez dago egiazko testu elebidunik, baina bai corpus nahiko zabala, zeinetan pertsona- eta leku-izen zenbaiten formak ziurtasunez identifikatu diren. Horiekin batera, zenbait atzizki posible eta, zalantza askoz handiagoz (ene ustez, bederen), aditz-formaren bat eta terminologia-kontu lauso batzuk.

Aldiz, historikoki ezagutzen dugun euskararen 1.500 urte lehenagoko ezaugarriez ezer gutxi dakigu (jakinen adiera hertsienean), harrietan zizelkaturiko elementu onomastikoetatik (zeharka, beraz) ondorioztatu ahal izan diren kontu batik bat fonetiko-fonologikoez gain. Zoritxarrez, barne-berreraiketak eta bestelako eraikuntza teorikoek ez digute esaten igarritako aitzin-hizkuntza hori noizkoa den.

Bestalde, Irulegiko Eskuaren azpian datzan hizkuntzaz hipotesiak besterik ezin genezake egin, idazkeraren berezitasunak eta bestelako ebidentzia negatiboek (“ez da/dirudi zeltiberiera edo iberiera”) uzten diguten heinean. Alabaina, hipotesi horiek baieztatzeko edo, gutxienez, argudio linguistikoez janzteko, corpus murritz eta bakanegia dugu lau lerro horietan. Ezagunak dira Rosetta harriaren eta B lineal delakoaren aurkikuntzak eta dezifratzeak, baina ez ohi da horrenbeste azpimarratzen horien atzeko historia eta kronologia. Ez zen magiarik jazo orduan, eta ez da halakorik gertatuko orain ere. Lan handia eta denbora nahikoa ezinbesteko osagaiak dira.

Horiek horrela, neure iritzia azaldu nahi nuke, dagoeneko idatzirik dagoen iraganaren iragarpen moduan: nago Irulegiko Eskuaren misterioa ez dela argituko harik eta lekukotasun gehiago agertu arte, gutxienez. Eta orduan ere, ziurrenik argitasuna ez da berehalakoan etorriko.

* * *

Iraganera itzultzeko motibo asko izan litzake pertsona batek; esaterako, eginiko hutsak ekiditea edo bidelagunez garaiz aldatzea. Hizkuntzalari gisa, bidelagun horiek izan daitezke ezagutzan oinarrituriko hipotesiak eta argudioak, hizkuntzak berak edota datuak ikusteko moduak (marko teorikoak). Horiek aldatzea errazagoa da, horretarako arrazoirik aurkituz gero, iraganerako itzulia erosoagoa eta emankorragoa izan dadin, iragana bihurtu (‘bihurritu’) gabe.

Unibertsitatean euskaraz

Igone Zabala Unzalu

Unibertsitatea funtsezkoa da euskararen garapen funtzionalerako, bertan jorratzen baitira alorrez alorreko denetariko gai espezializatuak eta, beraz, bertan garatzen baitira alor horietan aritzeko beharrezkoak diren hizkuntza-baliabideak. Gainera, unibertsitatean prestatzen dira gizarteak behar dituen denetariko aditu-profesional euskaldunak. Adituen diskurtso-komunitateak komunitate epistemiko-diskurtsiboak direla esaten da alorreko jakintza espezializatua ez ezik komunikatzeko testu-generoak eta hizkuntza-baliabideak ere partekatzen dituztelako[1]. Hartara, ikasleek unibertsitatean ikasten dituzte beren alorreko adituen komunitateko kide bihurtzeko behar dituzten testu-generoak eta erregistroak, hizkuntza erabiltzea eskatzen dieten askotariko jarduerei esker[2]. Hori dela eta, unibertsitateko ikasleei ziklo bat bukatzen duten bakoitzean, lan akademiko bat idazteko eta ahoz defendatzeko eskatzen zaie, adituen komunitateko kide bihurtzeko ezagutzak eta komunikazio-gaitasunak garatu dituztela frogatu dezaten: gradu amaierako lana (GrAL), master amaierako lana (MAL) edota doktoretza-tesia. Lan akademikoak ezin egokiagoak dira unibertsitateko ikasleek komunikazio-gaitasun akademikoak garatu ote dituzten aztertzeko bai eta euskararen erregistro akademikoak zenbateraino garatu eta egonkortu diren aztertzeko ere. Euskararen garapenerako funtsezkoa da unibertsitateko irakaskuntzan duen presentzia bermatzea edota areagotzea eta lan akademikoak euskaraz idaztea. Ideia hori aldarrikatzeko eta argudiatzeko beharrak eraman nau, hain zuzen ere, artikulu hau idaztera, nazioartekotzearekin lotutako helburuek euskararen garapenaren helburuekin talka egin lezaketela dirudien une honetan.

Jakina da egun ingelesak erabateko hegemonia duela komunikazio akademikorako lingua franca modura. Horrek gutxiagotasun-egoeran jartzen ditu hiztun ez-natiboak, beren lehen hizkuntza ez den batean irakurri, ikertu eta idatzi behar dutelako[3]. Hori dela eta, ingeles hizkuntzaren hiztun ez-natiboek hizkuntza-gaitasunak garatu behar dituzte hizkuntza horretan, eta ohikoa izaten da unibertsitateko ikasleak eta ikertzaileak herrialde anglofonoetara mugitzea beren prestakuntza osatzera. Areago, herrialde ez-anglofonoetako unibertsitate askok ingelesa sustatzen dute irakaskuntzarako eta lan akademikoetarako.

Gurean ere ezartzen ari diren politika horiek hainbat ondorio dituzte diskurtso espezializatuen garapenerako. Batetik, ikertzaile batzuek ez dute garatzen diziplinako komunikazio espezializaturako gaitasuna beren lehen hizkuntzan eta, bestetik, ingelesaren eraginak nabariki baldintzatzen ditu lekuan lekuko diskurtso espezializatuak[4]. Batzuen arabera, joera globalizatzaileak erregistro profesionalen galera nabarmena ekarri du hainbat herrialdetako kultura nazionaletan[5]. Europaren eremuan, aipatu beharrekoa da aleman hizkuntzaren akademiak (Gesellschaft für deutsche Sprache) unibertsitateei aspaldian helarazi ziela alemana funtzionalitate mugatuko hizkuntza bihurtzeko arriskuari buruzko kezka. Europako Iparraldeko Herrialdeetan ere, duela bi hamarkada jarri zuten abian ikerketa-egitasmo bat (Nordens språk som vetenskapssparåk ‘Hizkuntza nordikoak zientzia-hizkuntza’) haien hizkuntzen helburu zientifiko eta akademikoetarako erabilera defendatzeko, nahitaezkotzat jotzen baitzuten kulturaren eta zientziaren eremuan lehiakorrak izateko. Honela definitzen zuten hizkuntzaren erabilera-eremua[6]:

«A domain of language usage: a specialist field for which a language is capable of being used, i.e. it has at its disposal the necessary means of expression and is therefore of use within this domain. A specialist field can in casu be defined as the domain of a science, a practical occupation or a category at a suitable level of the international Universal Decimal Classification system.»

Eremuen konkista ez da itzulezina, eta atzera egiteko bi modu bereiz daitezke. Eremu-galera gertatzen da hizkuntza-komunitate batek espezialitate-alor baterako komunikazio-baliabide egokiak garatzeko orduan huts egiten duenean, eta oharkabean gertatu ohi da. Eremu-uztea, aldiz, kontzientea izaten da maiz, eta askotan gertatzen da nahiz eta eremu horretarako hizkuntza-baliabideak ondo garatuta egon, adibidez, arrazoi ekonomikoengatik.

Ingelesaren hegemonia dela eta, hizkuntza nazionalen estatusa duten zenbait hizkuntza garatuk testuinguru akademikoetan dituzten emankortasuna eta biziraupena arriskuan daudela onartuta, zer ez ote da gertatuko euskararen kasuan? Euskarak konkistatu al ditu eremu akademikoak? Askotariko hiztun-profiletakoak dira ikasle eta irakasle-ikertzaile euskaldunak, baina lan akademikoak edota irakaskuntzarako materialak euskaraz ekoizten dituzten ikasle eta aditu guztiek egin behar diete aurre zailtasun eta oztopo bereziei: batetik, berrikuspen bibliografikoa egiteko erabili behar dituzten artikulu eta liburuak, beren diskurtsoa garatzeko eredu modura erabiliko dituztenak, ingelesez idatzita daude gehienbat eta, bestetik, euskarazko eskola eta irakas-materialetatik jasotzen duten inputa asistematikoa eta hobetzeko modukoa izaten da maiz.

Bestalde, ez da ahaztu behar terminologiaren eta fraseologia akademikoaren garapenak nahitaezkoa duela diskurtso-komunitate akademikoek testuak eta komunikazio-egoerak partekatzea, baliabide horiek finkatzeko, eta horien ezagutza semantiko-pragmatikoa komunitatearen erabileren bereizgarri bihurtzeko. Alorrez alorreko terminologiek oraindik ere dituzten hutsune nabarmenak alde batera utzita, azken hiru urtean aurrera eraman dugun proiektuaren emaitza batzuk aipatuko ditut[7][8]. GrAL eta MAL lanez osatutako corpus konparagarriak osatu ditugu gaztelaniarako eta euskararako[9], eta diskurtso-formula eta kolokazio akademikoak erauzi eta aztertu ditugu bi hizkuntza horietan, testu akademikoen idazketarako laguntza-tresna elebiduna garatzeari begira[10]. Gure aurreikuspenen kontra, hizkuntza nagusietarako erabiltzen diren maiztasun- eta dispertsio-irizpideak aplikatuta, unitate fraseologikoen pareko zerrendak lortu ditugu euskararako eta gaztelaniarako, urte hauetan guztietan lortu den garapenaren seinale. Nolanahi ere, unitate fraseologiko zuzen eta egokiak ez ezik, zuzentzeko edota hobetzeko moduko zenbait unitate ere identifikatu ditugu. Bestalde, corpusera jotzen dugun bakoitzean konturatzen gara zaila dela oro har erabat zuzenak eta egokiak diren adibideak aurkitzea. Ondorio modura esan daiteke euskara akademikoaren garapenean aurrerapauso kualitatiboak egin direla baina bide luzea egin behar dela oraindik ere, eremu-galtze prozesu batean sartu nahi ez badugu behintzat.

Eremu espezializatuen konkistan aurrera segitzeko funtsezkoa da euskarak unibertsitatean duen presentzia babestea, baita lan akademikoak euskaraz idaztea ere. Kezkagarria litzateke, ordea, unibertsitatean sendotzen doazen nazioartekotze-politikek ikasle-irakasle euskaldunen hizkuntza-kontzientzia lausotzea eta, besteak beste, lan akademikoak ingelesez idaztera bultzatzea. Halako politikak eremu-uztea eragin lezake alor akademikoen konkista bukatu baino lehen.


[1] SWALES, John M. (1990). Genre Analysis. English in academic and research settings. Cambridge: Cambridge University Press.

[2] BIBER, Douglas (2006). University Language. A corpus-based study of spoken and written registers. Amsterdam: John Benjamins.

[3] VAN DIJK, Teum (1994). Academic Nationalism. Discourse and Society 5, 275-276.

[4] GOTTI, Maurizio (2012). Academic Identity Traits. A Corpus-Based Investigation. Bern, Switzerland: Peter Lang.

[5] SWALES, John M. (2000). Language for Specific Purposes. Annual review of Applied Linguistics 20, 59-76.

[6] LAURÉN, Christer, MYKING, Johan, eta PICHT, Heribert. (2002). Language and domains: a proposal for a domain dynamics taxonomy. LSP & Professional Communication, 2 (2).

[7] ARANZABE, Maria Jesus; GURRUTXAGA, Antton, eta ZABALA, Igone (2022). Compilación del corpus académico de noveles en euskera HARTAvas y su explotación para el estudio de la fraseología académica. Procesamiento del Lenguaje Natural, 69: 95–103.

[8] Ministerio de Ciencia e Innovación erakundeak 2019ko deialdian finantziatuko Coruñako Unibertsitateko eta UPV/EHUko ikerketa-talde biren arteko proiektu koordinatua: PID2019-109683GB-C21 eta PID2019-109683GB-C22.

[9] HARTAeus corpusa Garaterm corpusean (http://garaterm-corpusa.ixa.eus/ ) integratuta dago, eta kontsulta publikoetarako zabalik dago, Bilaketa-interfaze aurreratuan, “Non” botoia sakatuta, eta “HARTAeus” aukeratuta.

[10] Oraindik ere HARTA/TAILA tresna osatzen eta fintzen ari bagara ere, kontsulta-interfaze publikoa prest dago jadanik: http://harta.ixa.eus/