Euskararen lexiko akademikoa

Igone Zabala Unzalu

Lexiko akademikoaren zerrendek testu akademikoen hiztegi-elementu bereizgarriak biltzen dituzte: hizkuntza baten maiztasun handieneko lexikoan ageri ez diren edo testu akademikoetan maiztasun bereizgarriaz erabiltzen diren hiztegi-elementuak. Hortaz, lexiko-zerrenda akademikoak diziplina artekoak izaten dira, eta diziplina bakoitzaren berariazko terminoak alde batera uzten dituzte[1]. Hasiera batean, halako zerrendak biltzeko helburua izan zen hizkuntzen helburu akademikoetarako irakaskuntzarako ikastaroak eta materialak prestatzea, baina berrikiago, testu akademikoen idazketarako laguntza-tresnak elikatzeko ere osatzen ari dira horrelako zerrendak[2]. HARTAvas proiektuan[3], euskarazko lexiko akademikoa erauzi dugu, kolokazio akademikoak identifikatzeko, eta idazketa akademikoari laguntzeko HARTA/TAILA tresna elikatzeko. Lortu dugun lexiko akademikoaren zerrenda oso baliagarri gertatu zaigu baita EHUko gradu guztietan eskaintzen diren euskarazko komunikazio akademiko-profesionaleko irakasgaietarako eta irakasleei eskaintzen zaizkien mintegietarako.

Lexiko akademiko esaten zaio edozein diziplinatako testu akademikoetan maiztasun bereizgarriaz erabiltzen den lexikoari. Hortaz, lexiko espezializatu edo terminologiatik bereizten da, terminoak diziplina bateko kontzeptu espezializatuak adierazteko erabiltzen diren hiztegi-elementu espezializatuak baitira. Euskarazko lexiko akademikoa erauzteko, HARTAeus corpus akademikoaren (3.484.162 hitz)[4] lemen maiztasunak alderatu ditugu Dabilena corpus orokorrean[5] (300.217.903 hitz) duten maiztasunarekin. Corpusaren lau domeinu nagusietan[6] eta testuen % 20 baino gehiagotan ageri diren hautagaiei corpusen arteko alderaketak egiteko erabiltzen den log-likelihood neurria aplikatu diegu. Ondoren, eskuz aukeratu ditugu lexiko akademikoaren zerrendarako errelebantetzat har daitezkeen elementuak. Horrela lortu dugu 846 elementuko zerrenda: 365 izen, 246 aditz, 182 adjektibo eta 53 adberbio.

Zerrenda horretako elementu gehienak inolako arazorik gabe erabiltzen dituzte egunero ikasleek eta irakasleek testu akademikoetan, baina badira etengabe nahasteak eta erroreak eragiten dituzten elementuak ere. Izenen artean, aipamen berezia behar du #pausu izenak. Izan ere, 670 agerraldi ditu corpusean, baina ez ‘atseden’ adierazteko, urrats (540 agerraldi) izenaren sinonimoa den pauso (632 agerraldi) erabili nahian baizik. Maiztasun handiz erabiltzen diren eta oso maiz oker erabilita agertzen diren beste izen batzuk dira froga eta proba. Zehaztasunari begira, garrantzitsua da bi izen horien esanahiak egokiro bereiztea, baina maiz ikusten eta entzuten da froga izena proba behar den testuinguruan. Antzera gertatzen da hazkuntza izenaren kasuan: ‘kultibo’ esan nahi badu ere, hazkunde edo haziera behar den testuinguruetan aurkitzen da oso maiz. Askotan nahastuta aurkitu ohi diren beste izen batzuk dira ikasketa ≠ ikerketa ≠ ikerkuntza; kantitate ≠ kopuru ≠ zenbaki; sorkuntza ≠ sorrera eta zehaztasun ≠ xehetasun.

A itsatsiak ere errore ugari eragiten ditu. Nabarmentzeko modukoak dira garrantzi, antz eta hipotesi izenak, a itsatsirik ez badute ere askotan a itsatsia balute bezala erabilita ikusten baitira (*garrantzia handia). Maiztasun handiz erabiltzen diren a itsatsidun zenbait izen, aldiz, a gabe erabiltzen dira askotan (*emaitz esanguratsuak). Horien artean aipagarrienak dira abantaila, desabantaila, emaitza, gabezia eta ordena. Bestalde, luzera izena *luzeera idatzita ikus daiteke maiz.

Adjektiboen artean, aipatzeko modukoak dira maiztasun handiz nahasten diren hauek: adierazgarri / esanguratsu; bera / berdin; eskas / urri; jakin / konkretu / zehatz / mugatu. Aditzen hautapen egokia egitea ere funtsezkoa da diskurtso akademikoa egokiro garatzeko, eta luze aritu gintezke aditzen erabilerari buruz, baina maiz nahastu ohi diren aditzen adibide batzuk baino ez ditugu emango: baimendu / ahalbidetu; baieztatu/ frogatu; behatu / ikusi; bereizi / desberdindu; burutu / egin; ekidin / saihestu; bilatu / aurkitu.

Hiztegi-elementu batzuk ezin dira okertzat hartu, baina desegokitzat har daitezke estilo zaindua eskatzen duten testu akademikoetarako. Aipatzeko modukoak dira hausnartu, hausnarketa, topatu, kontsideratu, suposatzen du eta ematen dira modukoak. Egokiagoak dira testu akademikoetarako, hurrenez hurren, gogoeta egin, gogoeta, aurkitu, -tzat hartu, dakar / eskatzen du eta gertatzen dira modukoak.

Erregistro akademikoez ari garenean, hiztegi-elementuen hautapena ez ezik, funtsezko aztergaia da hiztegi-elementu akademiko horiek testu akademikoetan ematen dituzten kolokazioak[7]. Kolokazioen finkapenaren atzean dago erabilera-maiztasun handia, azkenean diskurtso-komunitate baten norma bihurtzera eramaten dituena. Nolanahi ere, zenbaitetan diskurtso-komunitate akademikoetan erabilera-maiztasun handia duten konbinazioak ez dira hiztegietan edo estilo-liburuetan kodifikatuta ageri direnak. Adibidez, zenbait estilo-libururen eta hiztegiren arabera, urrats izena egin aditzarekin kolokatzen da (urratsak egin). HARTAeus corpusean, aldiz, urratsak eman eta pausoak eman konbinazioek baino ez dute gainditzen kolokaziotzat hartzeko langa. Erabileraren erabileraz finkatzen doazen joera idiosinkratikotzat har daitezke horiek, eta ez dirudi justifikatuta dagoenik testu akademikoetan urratsak egin kolokazioaren aldeko borroka sutsua egitea.

Ildo beretik, aipatu beharrekoa da izen akademikoekin konbinatzen diren zenbait aditzen erregimena, bereziki, jarraitu aditzarena[8]. Jarraitu aditzarekin kolokazioak osatzen dituzten izen akademikoetako batzuk dira pauso, protokolo, irizpide, prozedura, eredu, eskema, ordena eta egitura. Hiztegien arabera, datiboa hartzen du jarraitu aditzaren osagarriak (ereduari jarraitu diogu) baina corpus akademikoetan datiboa daramaten adibide bakan batzuk aurki badaitezke ere, kolokazioak erauzteko teknikak erabiliz, izen akademikoa absolutiboan duten kolokazioak baino ez dira azaleratzen (eredua jarraitu dugu).


[1] Coxhead, Averil. 2000. A new academic word list. TESOL Quartely 34 (2). 213-238.
Drouin, Patrick. 2007. Identification automatique du lexique scientifique transdisciplinaire. Revue Française de Linguistique Appliqué. 12 (2). 45-64.
Granger, Sylviane & Magali Paquot. 2015. Electronic lexicography goas local: Desing and structures of a need-driven online academic writing aid. Lexicographica: International Annual for Lexicography. 31 (1). 118-141.
García Salido, Marcos. 2021. Compliling an Academic Vocabulary List of Spanish. DOI:10.13140/RG.2.2.27681.33123

[2] Frankenberg-Garcia, Ana, Robert Lew, Jonathan C. Roberts, Geranti Paul Rees & Nirwan Sharma. 2018. Developing a writing assistant to help EAP writers with collocations in real time. ReCALL. 31 (1). 23-39.
García Salido, Marcos, Marcos García, Milka Villayandre & Margarita Alonso-Ramos. 2018. A Lexical Tool for Academic Writing in Spanish Based on Expert and Novice Corpora. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation, 260-265.

[3] Ministerio de Ciencia e Innovación erakundeak 2019ko deialdian finantziatuko Coruñako Unibertsitateko eta UPV/EHUko ikerketa-talde biren arteko proiektu koordinatua: PID2019-109683GB-C21 eta PID2019-109683GB-C22.

[4] HARTAeus corpusa Garaterm corpusean integratuta dago, eta kontsulta publikoetarako zabalik dago, bilaketa-interfaze aurreratuan, “Non” botoia sakatuta, eta “HARTAeus” aukeratuta. HARTA/TAILA tresnan ere badago corpusean bilaketak egiteko aukera.

[5] Lexiko akademikoa erauzteko kontraste-corpus modura erabili dugun Dabilena corpusa Elhuyarrek garatu du, eta Internetetik hartutako testuez osatuta dago.

[6] HARTAeus corpusak lau eremu nagusi ditu: Arteak eta Humanitateak, Biologia eta Osasun Zientziak, Gizarte Zientziak eta Zientzia Fisikoak.

[7] Kolokazio esaten zaie harreman sintaktikoa duten hitz-bikoteen konbinazioei. Konbinazio asimetrikoak direla esan daiteke bikotekideetako baten (oinarriaren base) hautapena haren esanahiaren arabera era askean egiten bada ere bestearen (kolokatuaren collocate) hautapena oinarriak murrizten duelako.

[8] Jarraiki aditza ez dugu kontuan hartu, askoz ere gutxiago erabiltzen baita testu akademikoetan, eta ez duelako gainditu lexiko akademikoaren zerrendetan sartzeko langa.

Euskalkiak itzulpenetan

Isabel Etxeberria Ramírez

Itzulpenetako hizkeraren bereizgarriez ikertzen aritu direnek itzulpenetako estandarizazio edo neutralizaziorako joeraz hitz egin izan dute. Hipotesi horren arabera, itzultzaileek xede-hizkuntzaren erabilera estandarrerantz hurbiltzeko joera izaten dute, eta ondorioz itzulpenetako hizkera testu ez-itzulietakoa baino arauari lotuagoa izaten da. Arauari lotze hori, adibidez, erregistro neutroa lehenesten delako gertatzen da (batez ere behe erregistroko hitzak edo esapideak saihesten dira), edo hiperzuzentasunaren ondorioz (jatorrizko testuko akatsak zuzenduta ageri dira itzulpenetan), edo aldaera diatopikoak edo dialektalak baztertu eta aldaera estandarraren alde egiten delako.

Azken horri dagokionez, hau da, aldaera dialektalak testu itzulietan testu ez-itzulietan baino urriagoak izateari dagokionez, zenbait ikerketa interesgarri egin dira nazioartean. Olohanek (2003, 2004), adibidez, ingelesaren aldaera dialektalen presentzia txikiagoa aurkitu zuen ingelesera itzulitako testuetan ingelesez sortutakoetan baino, eta Corpas Pastorrek (2018) antzeko joera bat hauteman zuen espainolaren kasuan. Eta euskaraz? Galdetuko baligute ea non esperoko genituzkeen euskalkietakotzat jotzen diren hitz gehiago, euskarara itzulitako testuetan ala euskal idazleek idatzitakoetan, zer erantzungo genuke?

Blog honetan lehenago inoiz aipatu dudan bezala, euskarara itzulitako testuetako hizkeraren bereizgarriak aztertzen jardun dut nire doktorego-tesian, eta horretarako euskarara itzulitako literatur testuetako hiztegia eta euskaraz sortutako testuetakoa konparatu dut. Nire lehen helburuen artean ez zegoen euskalkiek testuotan zer presentzia duten aztertzea. Baina han eta hemen datuak biltzen hasi, eta bidera atera zait gaia. Eta datuak oso esanguratsuak dira. Adibide bat ekarriko dizuet hona.

Nire ikerlanean, besteak beste, koloreen eremu semantikoa aztertu dut. Blog honetan lehenago ere mintzatu naiz koloreez, eta oraingoan ere multzo hori baliatuko dut adibide gisa. Erabili dudan corpusa gutxi gorabehera Egungo Testuen Corpuseko literatura atala da: 2001 eta 2019 bitartean argitaratutako 1.149 liburu (451 itzulpen eta euskaraz sortutako 698 lan). Hiztegiak eta bestelako lan espezializatu batzuk kontsultatuta, koloreak euskaraz izendatzeko dauden hitzen zerrenda osatu nuen: guztira 120 termino. Ondoren, testu itzulietan eta testu ez-itzulietan hitz horietatik zein erabiltzen ziren begiratu nuen, baita zenbat aldiz erabiltzen ziren ere. 120 termino horietatik batzuk euskalki-markarekin jasota daude hiztegietan: blu eta gorrail hitzek, adibidez, iparraldeko marka daramate; xuri hitzak, iparraldekoa eta nafarrerakoa; azul hitzak, hegoaldekoa; laru eta beilegi hitzek, bizkaierakoa. Txuri eta baltz hitzak ez dira jasotzen Euskaltzaindiaren Hiztegian, baina uste dut bat etorriko garela denok txuri erdialdeko euskararekin eta baltz mendebaldekoarekin lotuta.

Lehen aurreratu dudan bezala, datuak argigarriak dira. Taula honetan, hitz horietako bakoitza zenbat aldiz ageri den jaso dut:

Testu ez-itzulietanTestu itzulietan
azul10117
baltz942
beilegi11148
blu890
gorrail368
laru5429
txuri807234
xuri851304

Datuak, noski, eskuzko garbiketa baten ondorio dira: azul hitzaren agerraldi asko División Azul izenari zegozkion, adibidez. Ikusten denez, hitz guztiak nabarmen gehiago erabiltzen dira euskal idazleen testuetan itzultzaileenetan baino. Itzulpenetan euskara estandarrekoak ez diren erabilerak saihestu egiten dira. Euskarako datuak, beraz, bat datoz beste hizkuntza batzuetan lortu diren emaitzekin: euskaraz ere estandarizaziorako joera bat nabari da itzulpenetan, itzulpen ez diren testuen aldean. Aldaera dialektalak urriagoak dira euskarara itzulitako testuetan euskaraz sortutakoetan baino.

Baina zenbakiak hotzak dira. Haien atzean dauden izen-abizenak aztertzen baditugu, beste irakurketa batzuk ere egin daitezke. Ez ditut hona ekarriko hitz horiek erabiltzen dituzten idazleen eta itzultzaileen izen-abizenak, testu hau sobera ez luzatzeko; baina inork jakin-mina balu, eska dezala lasai (iruzkin gisa erants nitzake). Hona hemen, bada, zenbakiez haragoko zenbait gogoeta:

1) Hitz horiek kasuan kasuko euskalkietako idazle/itzultzaileek bakarrik erabiltzen al dituzte? Egia da hitz horien agerraldien parte handi bat dena delako euskalkiko idazle/itzultzaileei zor zaiela, baina badira beste jatorri batzuetako lumak ere. Bizkaierakotzat jotzen den beilegi, adibidez, Xabier Amurizak, Urtzi Urrutikoetxeak, Joseba Sarrionandiak, Unai Elorriagak eta Sonia Gonzalezek erabiltzen dute, besteak beste, idazleen artean, eta Xabier Amurizak eta Iñigo Roquek, itzultzaileen artean. Baina mendebaldekoak ez direnen lumetan ere ageri da: Eider Rodriguez, Lander Garro, Harkaitz Cano edo Bernardo Atxaga, adibidez, idazleen artean, eta Joxe Austin Arrieta, Xabier Olarra edo Itziar Diez de Ultzurrun, itzultzaileen artean.

2) Alde handiarekin ez bada ere, badirudi norberarena ez den euskalkira jotzeko tentazioa handixeagoa dela itzultzaileen artean idazleen artean baino. Beilegi, laru eta gorrail, adibidez, beren euskalkikoa ez duten itzultzaile nahikotxotan ageri da; euskalki horretakoak ez diren idazleen artean ere ageri da, baina proportzio apalagoan.

3) Iparraldeko hitzen kasuan, agerraldi kopurua testu ez-itzulietan nabarmen handiagoa izatea Iparraldeko idazleen kopuruari zor zaio neurri handi batean. Egia da xuri (nafarrerakotzat ere jotzen dena) Hegoaldeko idazle nahikotxoren testuetan ere ageri dela, baina blu eta gorrail hitzen agerraldi gehienak Iparraldeko idazleei dagozkie. Testu ez-itzulien egileen artean Iparraldeko idazle nahikotxo daude: Michel Oronoz, Xipri Arbelbide, Bea Salaberri, Piarres Trounday, Ramuntxo Etxeberri, Daniel Landart, Txomin Peillen, Itxaro Borda, Pierre Mestrot, Mixel Thikoipe, Filipe Bidart, Katixa Dolhare-Zaldunbide…. Iparraldeko itzultzaileak, berriz, oso gutxi dira: Marzel Etxehandi, Jean Baptiste Orpustan, Elena Touyarou eta Piarres Xarriton. Horrek esplikatuko luke zergatik Iparraldeko hitzak nabarmen gehiago ageri diren testu ez-itzulietan (Iparraldeko idazle zerrenda luze samar batek idatzitako testuetan, hain zuzen), testu itzulietan baino (itzulpen guztien artean oso gutxi izanik Iparraldeko itzultzaileek eginak).

4) Emakumeak uzkurragoak dira euskalkietako hitzak erabiltzeko. Edo gutxiago ausartzen dira. Oso gutxi dira hitz hauek erabiltzen dituzten emakumezkoak. Noski, idazleen eta itzultzaileen artean gutxiengo dira emakumeak bestela ere. Baina, hala ere, hitzok erabiltzen animatzen diren emakumeak proportzioan are gutxiago dira. Azal dezagun. Gure corpuseko euskarazko 698 liburuak idatzi dituzten idazleen artean % 25 inguru dira emakumezkoak; 451 itzulpenak euskaratu dituzten itzultzaileen artean, aldiz, % 29 inguru. Bada, euskalkietako gure hitz guztien kasuan, hitzok erabili dituzten lumen artean % 25 eta % 29 baino gutxiago dira sistematikoki emakumezkoen lumak. Hau da, emakume idazleak eta itzultzaileak gizonak baino gutxiago dira, baina gainera hitzok erabiltzen dituzten emakume idazleak eta itzultzaileak gizon idazleak eta itzultzaileak baino are gutxiago dira. Eta oraingo honetan ez da alderik nabari idazleen eta itzultzaileen artean. Proportzio bertsuan uzten dituzte erabili gabe euskalkietako hitzak emakume idazleek eta emakume itzultzaileek.

Niri neuri, itzultzailea (eta emakumea) naizen neurrian, zer pentsatua ematen didate datu hauek. Beharbada itzultzaileen artean polimaitasun dialektala bultzatzeko kontzientziazio-kanpainaren bat abiatu beharko genuke.

Corpas Pastor, Gloria (2018). Laughing one’s head off in Spanish subtitles: a corpus-based study on diatopic variation and its consequences for translation. In Mogorrón Huerta, P. eta Albaladejo-Martínez, A. (ed.) Fraseología, Diatopía y Traducción / Phraseology, Diatopic Variation and Translation (32-71). John Benjamins.

Olohan, Maeve (2003). How frequent are the contractions? A study of contracted forms in the Translational English Corpus. Target, 15, 59-89.

Olohan, Maeve (2004). Introducing Corpora in Translation Studies. Routledge.