Aspecte informatice &icirc;n procesul de derivare lexicală

Petic Mircea

Articolul precedent

Articolul urmator

286

Ultima descărcare din IBN:
2024-04-13 11:20

SM ISO690:2012

PETIC, Mircea. Aspecte informatice în procesul de derivare lexicală. In: International Conference of Young Researchers , 6-7 noiembrie 2008, Chişinău. Chişinău: Tipogr. Simbol-NP SRL, 2008, Ediția 6, p. 120. ISBN 978-9975-70-769-5.

EXPORT metadate:
Google Scholar
Crossref
CERIF

DataCite
Dublin Core

International Conference of Young Researchers
Ediția 6, 2008

Conferința "International Conference of Young Researchers "
Chişinău, Moldova, 6-7 noiembrie 2008

Aspecte informatice în procesul de derivare lexicală

Pag. 120-120

Petic Mircea

Institutul de Matematică şi Informatică al AŞM

Disponibil în IBN: 25 mai 2021

Descarcă PDF

Rezumat

Tehnologiile limbajului uman joacă un rol important în era informaţională. Aplicaţiile ce prelucrează limbajul natural presupun crearea, completarea şi folosirea resurselor lingvistice electronice. Aceste resurse ajută nu doar la construcţia sistemelor de prelucrare a limbajului natural, dar şi conţin mijloace de completare automată sau semiautomată a lor cu cuvinte generate în baza celor existente folosind legităţile respective bazate pe mijloace exclusiv interne de îmbogăţire a vocabularului. Una din metodele principale utilizate de aceste mijloace este derivarea cu afixe. În limba română aplicaţiile derivării automate s-au început cu modelarea FAVR în mediul Mac-ELU. care a avut ca scop acoperirea completă a morfologiei flexionare. Odată însă cu migrarea descrierii FAVR în acest mediu s-a abordat şi descrierea proceselor lexicale. Sub aspect derivativ, sufixele şi prefixele lexicale au un potenţial productiv mare. În scopul stabilirii unor caracteristici calitative şi cantitative ale unor afixe lexicale, extragerii cuvintelor derivate cu prefixe şi sufixe cît şi generării cuvintelor noi cu ajutorul regulilor de derivare s-a elaborat un complex de module în limbajul C în mediul de programare KDevelop în sistemul de operare Linux OpenSuse 10.3. În plus, s-au stabilit cîteva prefixe şi sufixe cu ajutorul cărora se pot genera un număr mai mare de cuvinte graţie regulilor de derivare lexicală. Derivatele noi care au fost validate sînt corecte din punct de vedere morfologic şi semantic. Procesul de validare a cuvintelor generate automat este unul important. Unul din procedeele de validare a derivatelor constă în verificarea manuală a fiecărui cuvînt generat în corespundere cu cerinţele regulilor morfologice şi semantice. Acest procedeu are atît plusuri, cît şi minusuri. Principalul avantaj constă în acordarea cuvîntului cu specificul limbii. Dezavantajul este ca validarea cuvîntului în acest mod trebuie să fie realizată de către un specialist în domeniu. Un alt procedeu de validare constă în verificarea prezenţei cuvintelor derivate în corpora. Fiecare cuvînt generat se verifică cu ajutorul unui motor de căutare din punct de vedere al existenţei lui în corpora a limbii română. În cazul de faţă s-a folosit motorul de căutare www.google.com pentru verificarea corectitudinii cuvîntului generat prin afixare în limba română. Astfel, tehnologiile limbajului natural reprezintă instrumente esenţiale pentru valorificarea şi îmbogăţirea vocabularului unei limbi ca ea să fie folosită în sistemele informatice.

Cuvinte-cheie
limbajul natural, derivarea automată, validarea cuvintelor