Aspecte informatice în procesul de derivare lexicală
Închide
Articolul precedent
Articolul urmator
338 8
Ultima descărcare din IBN:
2024-04-13 11:20
SM ISO690:2012
PETIC, Mircea. Aspecte informatice în procesul de derivare lexicală. In: International Conference of Young Researchers , 6-7 noiembrie 2008, Chişinău. Chişinău: Tipogr. Simbol-NP SRL, 2008, Ediția 6, p. 120. ISBN 978-9975-70-769-5.
EXPORT metadate:
Google Scholar
Crossref
CERIF

DataCite
Dublin Core
International Conference of Young Researchers
Ediția 6, 2008
Conferința "International Conference of Young Researchers "
Chişinău, Moldova, 6-7 noiembrie 2008

Aspecte informatice în procesul de derivare lexicală


Pag. 120-120

Petic Mircea
 
Institutul de Matematică şi Informatică al AŞM
 
 
Disponibil în IBN: 25 mai 2021


Rezumat

Tehnologiile limbajului uman joacă un rol important în era informaţională. Aplicaţiile ce prelucrează limbajul natural presupun crearea, completarea şi folosirea resurselor lingvistice electronice. Aceste resurse ajută nu doar la construcţia sistemelor de prelucrare a limbajului natural, dar şi conţin mijloace de completare automată sau semiautomată a lor cu cuvinte generate în baza celor existente folosind legităţile respective bazate pe mijloace exclusiv interne de îmbogăţire a vocabularului. Una din metodele principale utilizate de aceste mijloace este derivarea cu afixe. În limba română aplicaţiile derivării automate s-au început cu modelarea FAVR în mediul Mac-ELU. care a avut ca scop acoperirea completă a morfologiei flexionare. Odată însă cu migrarea descrierii FAVR în acest mediu s-a abordat şi descrierea proceselor lexicale. Sub aspect derivativ, sufixele şi prefixele lexicale au un potenţial productiv mare. În scopul stabilirii unor caracteristici calitative şi cantitative ale unor afixe lexicale, extragerii cuvintelor derivate cu prefixe şi sufixe cît şi generării cuvintelor noi cu ajutorul regulilor de derivare s-a elaborat un complex de module în limbajul C în mediul de programare KDevelop în sistemul de operare Linux OpenSuse 10.3. În plus, s-au stabilit cîteva prefixe şi sufixe cu ajutorul cărora se pot genera un număr mai mare de cuvinte graţie regulilor de derivare lexicală. Derivatele noi care au fost validate sînt corecte din punct de vedere morfologic şi semantic. Procesul de validare a cuvintelor generate automat este unul important. Unul din procedeele de validare a derivatelor constă în verificarea manuală a fiecărui cuvînt generat în corespundere cu cerinţele regulilor morfologice şi semantice. Acest procedeu are atît plusuri, cît şi minusuri. Principalul avantaj constă în acordarea cuvîntului cu specificul limbii. Dezavantajul este ca validarea cuvîntului în acest mod trebuie să fie realizată de către un specialist în domeniu. Un alt procedeu de validare constă în verificarea prezenţei cuvintelor derivate în corpora. Fiecare cuvînt generat se verifică cu ajutorul unui motor de căutare din punct de vedere al existenţei lui în corpora a limbii română. În cazul de faţă s-a folosit motorul de căutare www.google.com pentru verificarea corectitudinii cuvîntului generat prin afixare în limba română. Astfel, tehnologiile limbajului natural reprezintă instrumente esenţiale pentru valorificarea şi îmbogăţirea vocabularului unei limbi ca ea să fie folosită în sistemele informatice.

Cuvinte-cheie
limbajul natural, derivarea automată, validarea cuvintelor

DataCite XML Export

<?xml version='1.0' encoding='utf-8'?>
<resource xmlns:xsi='http://www.w3.org/2001/XMLSchema-instance' xmlns='http://datacite.org/schema/kernel-3' xsi:schemaLocation='http://datacite.org/schema/kernel-3 http://schema.datacite.org/meta/kernel-3/metadata.xsd'>
<creators>
<creator>
<creatorName>Petic, M.V.</creatorName>
<affiliation>Institutul de Matematică şi Informatică al AŞM, Moldova, Republica</affiliation>
</creator>
</creators>
<titles>
<title xml:lang='ro'>Aspecte informatice &icirc;n procesul de derivare lexicală</title>
</titles>
<publisher>Instrumentul Bibliometric National</publisher>
<publicationYear>2008</publicationYear>
<relatedIdentifier relatedIdentifierType='ISBN' relationType='IsPartOf'>978-9975-62-196-0</relatedIdentifier>
<subjects>
<subject>limbajul natural</subject>
<subject>derivarea automată</subject>
<subject>validarea cuvintelor</subject>
</subjects>
<dates>
<date dateType='Issued'>2008</date>
</dates>
<resourceType resourceTypeGeneral='Text'>Conference Paper</resourceType>
<descriptions>
<description xml:lang='ro' descriptionType='Abstract'><p>Tehnologiile limbajului uman joacă un rol important &icirc;n era informaţională. Aplicaţiile ce prelucrează limbajul natural presupun crearea, completarea şi folosirea resurselor lingvistice electronice. Aceste resurse ajută nu doar la construcţia sistemelor de prelucrare a limbajului natural, dar şi conţin mijloace de completare automată sau semiautomată a lor cu cuvinte generate &icirc;n baza celor existente folosind legităţile respective bazate pe mijloace exclusiv interne de &icirc;mbogăţire a vocabularului. Una din metodele principale utilizate de aceste mijloace este derivarea cu afixe. &Icirc;n limba rom&acirc;nă aplicaţiile derivării automate s-au &icirc;nceput cu modelarea FAVR &icirc;n mediul Mac-ELU. care a avut ca scop acoperirea completă a morfologiei flexionare. Odată &icirc;nsă cu migrarea descrierii FAVR &icirc;n acest mediu s-a abordat şi descrierea proceselor lexicale. Sub aspect derivativ, sufixele şi prefixele lexicale au un potenţial productiv mare. &Icirc;n scopul stabilirii unor caracteristici calitative şi cantitative ale unor afixe lexicale, extragerii cuvintelor derivate cu prefixe şi sufixe c&icirc;t şi generării cuvintelor noi cu ajutorul regulilor de derivare s-a elaborat un complex de module &icirc;n limbajul C &icirc;n mediul de programare KDevelop &icirc;n sistemul de operare Linux OpenSuse 10.3. &Icirc;n plus, s-au stabilit c&icirc;teva prefixe şi sufixe cu ajutorul cărora se pot genera un număr mai mare de cuvinte graţie regulilor de derivare lexicală. Derivatele noi care au fost validate s&icirc;nt corecte din punct de vedere morfologic şi semantic. Procesul de validare a cuvintelor generate automat este unul important. Unul din procedeele de validare a derivatelor constă &icirc;n verificarea manuală a fiecărui cuv&icirc;nt generat &icirc;n corespundere cu cerinţele regulilor morfologice şi semantice. Acest procedeu are at&icirc;t plusuri, c&icirc;t şi minusuri. Principalul avantaj constă &icirc;n acordarea cuv&icirc;ntului cu specificul limbii. Dezavantajul este ca validarea cuv&icirc;ntului &icirc;n acest mod trebuie să fie realizată de către un specialist &icirc;n domeniu. Un alt procedeu de validare constă &icirc;n verificarea prezenţei cuvintelor derivate &icirc;n corpora. Fiecare cuv&icirc;nt generat se verifică cu ajutorul unui motor de căutare din punct de vedere al existenţei lui &icirc;n corpora a limbii rom&acirc;nă. &Icirc;n cazul de faţă s-a folosit motorul de căutare www.google.com pentru verificarea corectitudinii cuv&icirc;ntului generat prin afixare &icirc;n limba rom&acirc;nă. Astfel, tehnologiile limbajului natural reprezintă instrumente esenţiale pentru valorificarea şi &icirc;mbogăţirea vocabularului unei limbi ca ea să fie folosită &icirc;n sistemele informatice.</p></description>
</descriptions>
<formats>
<format>application/pdf</format>
</formats>
</resource>