Clasele de marcheri de definiţii pentru analiza semantică a intrărilor DLRLC
Închide
Articolul precedent
Articolul urmator
10 0
SM ISO690:2012
BURCA, Eugenia. Clasele de marcheri de definiţii pentru analiza semantică a intrărilor DLRLC. In: International Conference of Young Researchers . Ediția 8, 11-12 noiembrie 2010, Chişinău. Chişinău: Tipogr. Simbol-NP SRL, 2010, p. 84. ISBN 978-9975-9898-4-8..
EXPORT metadate:
Google Scholar
Crossref
CERIF

DataCite
Dublin Core
International Conference of Young Researchers
Ediția 8, 2010
Conferința "International Conference of Young Researchers "
Chişinău, Moldova, 11-12 noiembrie 2010

Clasele de marcheri de definiţii pentru analiza semantică a intrărilor DLRLC


Pag. 84-84

Burca Eugenia12
 
1 Universitatea Agrară de Stat din Moldova,
2 Institutul de Matematică şi Informatică al AŞM
 
Disponibil în IBN: 5 mai 2021


Rezumat

În lucrarea de faţă a fost utilizată metoda de parsare bazată pe configuraţii SCD (Segmentare-Coeziune-Depentenţă) [1] pentru transformarea eficientă a intrărilor (ce conţin text neprelucrat) din Dicţionarul Limbii Ruse Literare Contemporane (DLRLC) în 20 volume [2] într-o resursă lingvistică indexabilă. Strategia care stă la baza acestei metode reuneşte două configuraţii diferite de parsare: una, care identifică şi extrage pentru fiecare intrare de dicţionar arborele de sensuri principale şi secundare şi altă configuraţie, care parsează fiecare nod din arborele de sensuri cu scopul de a clasifica definiţiile din dicţionar, ce descriu sensuri principale şi secundare. Un marcher reprezintă o graniţă pentru o categorie lingvistică specifică. Recunoaşterea marcherilor şi construirea arborelui de sensuri a unei intrări din DLRLC a fost realizată în lucrarea [3]. Clasele de marcheri folosite pentru identificarea arborelui de sensuri pentru sensuri principale sînt: cifrele romane (I., II., III.,...etc.), cifrele arabe urmate de punct (1., 2.,3.,... etc.), două bare oblice (//). Pentru sensuri secundare se utilizează: rombul gol („◊”), traversa („═‖), tilda („~‖), enumerarea literală - de tip litere chirilice, după care urmează paranteza rotundă ( а), б), в),...etc.). În urma analizei conţinutului semantic al sensurilor pentru intrările din DLRLC s-a depistat următorul set specific de clase de marcheri de definiţie: MorfDefs-definiţii morfologice; RegDefs- definiţii scrise cu font regular; BoldDefs- definiţii scrise cu bold; ItalDefs- definiţii scrise cu italic; SpecDefs- definiţii ce conţin specificaţii; SpSpecDefs- definiţii scrise cu litere spaţiate, ce conţin anumite specificaţii; DefExems- exemple la definiţii, cu scopul de a întregi sensul unei definiţii. Aceşti marcheri de definiţie coincid întru-totul cu marcherii definiţiilor propuşi pentru Dicţionarul Tezaur al Limbii Române[1].

Cuvinte-cheie
marcheri de sens şi de definiţii, resurse lingvistice, parsare, intrare de dicţionar, arbore de sensuri.