Particularitățile afixelor în automatizarea procesului de derivare
Close
Articolul precedent
Articolul urmator
360 4
Ultima descărcare din IBN:
2024-01-01 15:37
SM ISO690:2012
. Particularitățile afixelor în automatizarea procesului de derivare. In: International Conference of Young Researchers , 5-6 noiembrie 2009, Chişinău. Chişinău: Centrul Editorial-Poligrafic al USM, 2009, Ediția 7, p. 94. ISBN 978-9975-70-901-9.
EXPORT metadate:
Google Scholar
Crossref
CERIF

DataCite
Dublin Core
International Conference of Young Researchers
Ediția 7, 2009
Conferința "International Conference of Young Researchers "
Chişinău, Moldova, 5-6 noiembrie 2009

Particularitățile afixelor în automatizarea procesului de derivare


Pag. 94-94

 
Institutul de Matematică şi Informatică al AŞM
 
 
Disponibil în IBN: 4 iunie 2021


Rezumat

Resursele lingvistice sînt importante la construcţia sistemelor de prelucrare a limbajului natural. Una din sarcinile de bază ale resurselor este îmbogățirea continuă a lor. Printre primele metodele de îmbogăţire a vocabularului a fost generarea automată a flexiunilor. Cea mai cunoscută abordare a flexionării automate este cea a lui Kimmo Koskeniemi, în modelul propriu morfologia pe două niveluri. Prima încercare de acoperire a morfologiei flexionare pentru limba română a fost modelarea FAVR în mediul Mac-ELU. Alte abordări ale flexionării automate pot fi găsite în lucrările lui Dan Cristea, Svetlana Cojocaru. Pornind de la abordarea generării automate a flexiunilor s-a încercat de a soluționa problema derivării automate. Totuși derivarea cu afixe, care este o altă metodă de îmbogățire a vocabularului, nu este, în comparație cu flexionarea, obligator și complet productivă [1]. În scopul stabilirii unor caracteristici cantitative ale unor afixe lexicale, extragerii cuvintelor derivate cu prefixe şi sufixe cît şi generării cuvintelor noi cu ajutorul regulilor de derivare s-a elaborat un complex de module în limbajul C în mediul de programare KDevelop în sistemul de operare Linux OpenSuse 10.3. [2]. Cu toate că cuvintele derivate trec o etapă de validare, totuși nu este posibil cu certitudine de afirmat care este procedura care validează cel mai bine cuvintele derivate generate automat. În lumina faptului că este imposibilă stabilirea corectă a validității cuvintelor cu ajutorul mijloacele Internetului, este important efortul de a elabora un dictionar de derivate [3], care permite stabilirea morfemelor derivatelor cu tipul lor (prefix, rădăcină sau sufix). Dicționarul de derivate electronic constă din peste 15.300 cuvinte derivate, 42 prefixe, 433 sufixe și pîna la 8000 rădăcini. Pentru stabilirea claselor de derivare s-au elaborat algoritmi care vor extrage derivatele separat pentru fiecare afix, apoi se va compara cu clasa de flexionare. Dincolo de aceasta, grație structurii intrărilor dicționarului s-a reușit de stabilit lista de alternanțe vocalice și fonetice pentru fiecare afix în parte. Dicționarul mai este util și pentru extragerea familiilor lexicale pentru rădăcini concrete. Totuși rămîne de menționat caracterul incert al afixelor. În cazul cercetărilor s-au evidențiat mai multe momente de incertitudine: nu xistă un marcator de prezență a afixelor, nu este clar care cuvinte derivate vor fi valide, există afixe care pot fi și prefixe și sufixe și mai mult rădăcini (de exemplu: anistoric, american, anișor). Astfel, tehnologiile limbajului natural reprezintă instrumente esenţiale pentru valorificarea şi îmbogăţirea vocabularului unei limbi ca ea să fie folosită în sistemele informatice.

Cuvinte-cheie
derivarea automată, afix, incertitudinea afixelor, dicționar electronic