Euskararen lexiko akademikoa

Igone Zabala Unzalu

Lexiko akademikoaren zerrendek testu akademikoen hiztegi-elementu bereizgarriak biltzen dituzte: hizkuntza baten maiztasun handieneko lexikoan ageri ez diren edo testu akademikoetan maiztasun bereizgarriaz erabiltzen diren hiztegi-elementuak. Hortaz, lexiko-zerrenda akademikoak diziplina artekoak izaten dira, eta diziplina bakoitzaren berariazko terminoak alde batera uzten dituzte[1]. Hasiera batean, halako zerrendak biltzeko helburua izan zen hizkuntzen helburu akademikoetarako irakaskuntzarako ikastaroak eta materialak prestatzea, baina berrikiago, testu akademikoen idazketarako laguntza-tresnak elikatzeko ere osatzen ari dira horrelako zerrendak[2]. HARTAvas proiektuan[3], euskarazko lexiko akademikoa erauzi dugu, kolokazio akademikoak identifikatzeko, eta idazketa akademikoari laguntzeko HARTA/TAILA tresna elikatzeko. Lortu dugun lexiko akademikoaren zerrenda oso baliagarri gertatu zaigu baita EHUko gradu guztietan eskaintzen diren euskarazko komunikazio akademiko-profesionaleko irakasgaietarako eta irakasleei eskaintzen zaizkien mintegietarako.

Lexiko akademiko esaten zaio edozein diziplinatako testu akademikoetan maiztasun bereizgarriaz erabiltzen den lexikoari. Hortaz, lexiko espezializatu edo terminologiatik bereizten da, terminoak diziplina bateko kontzeptu espezializatuak adierazteko erabiltzen diren hiztegi-elementu espezializatuak baitira. Euskarazko lexiko akademikoa erauzteko, HARTAeus corpus akademikoaren (3.484.162 hitz)[4] lemen maiztasunak alderatu ditugu Dabilena corpus orokorrean[5] (300.217.903 hitz) duten maiztasunarekin. Corpusaren lau domeinu nagusietan[6] eta testuen % 20 baino gehiagotan ageri diren hautagaiei corpusen arteko alderaketak egiteko erabiltzen den log-likelihood neurria aplikatu diegu. Ondoren, eskuz aukeratu ditugu lexiko akademikoaren zerrendarako errelebantetzat har daitezkeen elementuak. Horrela lortu dugu 846 elementuko zerrenda: 365 izen, 246 aditz, 182 adjektibo eta 53 adberbio.

Zerrenda horretako elementu gehienak inolako arazorik gabe erabiltzen dituzte egunero ikasleek eta irakasleek testu akademikoetan, baina badira etengabe nahasteak eta erroreak eragiten dituzten elementuak ere. Izenen artean, aipamen berezia behar du #pausu izenak. Izan ere, 670 agerraldi ditu corpusean, baina ez ‘atseden’ adierazteko, urrats (540 agerraldi) izenaren sinonimoa den pauso (632 agerraldi) erabili nahian baizik. Maiztasun handiz erabiltzen diren eta oso maiz oker erabilita agertzen diren beste izen batzuk dira froga eta proba. Zehaztasunari begira, garrantzitsua da bi izen horien esanahiak egokiro bereiztea, baina maiz ikusten eta entzuten da froga izena proba behar den testuinguruan. Antzera gertatzen da hazkuntza izenaren kasuan: ‘kultibo’ esan nahi badu ere, hazkunde edo haziera behar den testuinguruetan aurkitzen da oso maiz. Askotan nahastuta aurkitu ohi diren beste izen batzuk dira ikasketa ≠ ikerketa ≠ ikerkuntza; kantitate ≠ kopuru ≠ zenbaki; sorkuntza ≠ sorrera eta zehaztasun ≠ xehetasun.

A itsatsiak ere errore ugari eragiten ditu. Nabarmentzeko modukoak dira garrantzi, antz eta hipotesi izenak, a itsatsirik ez badute ere askotan a itsatsia balute bezala erabilita ikusten baitira (*garrantzia handia). Maiztasun handiz erabiltzen diren a itsatsidun zenbait izen, aldiz, a gabe erabiltzen dira askotan (*emaitz esanguratsuak). Horien artean aipagarrienak dira abantaila, desabantaila, emaitza, gabezia eta ordena. Bestalde, luzera izena *luzeera idatzita ikus daiteke maiz.

Adjektiboen artean, aipatzeko modukoak dira maiztasun handiz nahasten diren hauek: adierazgarri / esanguratsu; bera / berdin; eskas / urri; jakin / konkretu / zehatz / mugatu. Aditzen hautapen egokia egitea ere funtsezkoa da diskurtso akademikoa egokiro garatzeko, eta luze aritu gintezke aditzen erabilerari buruz, baina maiz nahastu ohi diren aditzen adibide batzuk baino ez ditugu emango: baimendu / ahalbidetu; baieztatu/ frogatu; behatu / ikusi; bereizi / desberdindu; burutu / egin; ekidin / saihestu; bilatu / aurkitu.

Hiztegi-elementu batzuk ezin dira okertzat hartu, baina desegokitzat har daitezke estilo zaindua eskatzen duten testu akademikoetarako. Aipatzeko modukoak dira hausnartu, hausnarketa, topatu, kontsideratu, suposatzen du eta ematen dira modukoak. Egokiagoak dira testu akademikoetarako, hurrenez hurren, gogoeta egin, gogoeta, aurkitu, -tzat hartu, dakar / eskatzen du eta gertatzen dira modukoak.

Erregistro akademikoez ari garenean, hiztegi-elementuen hautapena ez ezik, funtsezko aztergaia da hiztegi-elementu akademiko horiek testu akademikoetan ematen dituzten kolokazioak[7]. Kolokazioen finkapenaren atzean dago erabilera-maiztasun handia, azkenean diskurtso-komunitate baten norma bihurtzera eramaten dituena. Nolanahi ere, zenbaitetan diskurtso-komunitate akademikoetan erabilera-maiztasun handia duten konbinazioak ez dira hiztegietan edo estilo-liburuetan kodifikatuta ageri direnak. Adibidez, zenbait estilo-libururen eta hiztegiren arabera, urrats izena egin aditzarekin kolokatzen da (urratsak egin). HARTAeus corpusean, aldiz, urratsak eman eta pausoak eman konbinazioek baino ez dute gainditzen kolokaziotzat hartzeko langa. Erabileraren erabileraz finkatzen doazen joera idiosinkratikotzat har daitezke horiek, eta ez dirudi justifikatuta dagoenik testu akademikoetan urratsak egin kolokazioaren aldeko borroka sutsua egitea.

Ildo beretik, aipatu beharrekoa da izen akademikoekin konbinatzen diren zenbait aditzen erregimena, bereziki, jarraitu aditzarena[8]. Jarraitu aditzarekin kolokazioak osatzen dituzten izen akademikoetako batzuk dira pauso, protokolo, irizpide, prozedura, eredu, eskema, ordena eta egitura. Hiztegien arabera, datiboa hartzen du jarraitu aditzaren osagarriak (ereduari jarraitu diogu) baina corpus akademikoetan datiboa daramaten adibide bakan batzuk aurki badaitezke ere, kolokazioak erauzteko teknikak erabiliz, izen akademikoa absolutiboan duten kolokazioak baino ez dira azaleratzen (eredua jarraitu dugu).


[1] Coxhead, Averil. 2000. A new academic word list. TESOL Quartely 34 (2). 213-238.
Drouin, Patrick. 2007. Identification automatique du lexique scientifique transdisciplinaire. Revue Française de Linguistique Appliqué. 12 (2). 45-64.
Granger, Sylviane & Magali Paquot. 2015. Electronic lexicography goas local: Desing and structures of a need-driven online academic writing aid. Lexicographica: International Annual for Lexicography. 31 (1). 118-141.
García Salido, Marcos. 2021. Compliling an Academic Vocabulary List of Spanish. DOI:10.13140/RG.2.2.27681.33123

[2] Frankenberg-Garcia, Ana, Robert Lew, Jonathan C. Roberts, Geranti Paul Rees & Nirwan Sharma. 2018. Developing a writing assistant to help EAP writers with collocations in real time. ReCALL. 31 (1). 23-39.
García Salido, Marcos, Marcos García, Milka Villayandre & Margarita Alonso-Ramos. 2018. A Lexical Tool for Academic Writing in Spanish Based on Expert and Novice Corpora. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation, 260-265.

[3] Ministerio de Ciencia e Innovación erakundeak 2019ko deialdian finantziatuko Coruñako Unibertsitateko eta UPV/EHUko ikerketa-talde biren arteko proiektu koordinatua: PID2019-109683GB-C21 eta PID2019-109683GB-C22.

[4] HARTAeus corpusa Garaterm corpusean integratuta dago, eta kontsulta publikoetarako zabalik dago, bilaketa-interfaze aurreratuan, “Non” botoia sakatuta, eta “HARTAeus” aukeratuta. HARTA/TAILA tresnan ere badago corpusean bilaketak egiteko aukera.

[5] Lexiko akademikoa erauzteko kontraste-corpus modura erabili dugun Dabilena corpusa Elhuyarrek garatu du, eta Internetetik hartutako testuez osatuta dago.

[6] HARTAeus corpusak lau eremu nagusi ditu: Arteak eta Humanitateak, Biologia eta Osasun Zientziak, Gizarte Zientziak eta Zientzia Fisikoak.

[7] Kolokazio esaten zaie harreman sintaktikoa duten hitz-bikoteen konbinazioei. Konbinazio asimetrikoak direla esan daiteke bikotekideetako baten (oinarriaren base) hautapena haren esanahiaren arabera era askean egiten bada ere bestearen (kolokatuaren collocate) hautapena oinarriak murrizten duelako.

[8] Jarraiki aditza ez dugu kontuan hartu, askoz ere gutxiago erabiltzen baita testu akademikoetan, eta ez duelako gainditu lexiko akademikoaren zerrendetan sartzeko langa.