Clasele de marcheri de definiţii pentru analiza semantică a intrărilor DLRLC
Închide
Articolul precedent
Articolul urmator
313 0
SM ISO690:2012
BURCA, Eugenia. Clasele de marcheri de definiţii pentru analiza semantică a intrărilor DLRLC. In: International Conference of Young Researchers , Ed. 8, 11-12 noiembrie 2010, Chişinău. Chişinău: Tipogr. Simbol-NP SRL, 2010, Ediția 8, p. 84. ISBN 978-9975-9898-4-8..
EXPORT metadate:
Google Scholar
Crossref
CERIF

DataCite
Dublin Core
International Conference of Young Researchers
Ediția 8, 2010
Conferința "International Conference of Young Researchers "
8, Chişinău, Moldova, 11-12 noiembrie 2010

Clasele de marcheri de definiţii pentru analiza semantică a intrărilor DLRLC


Pag. 84-84

Burca Eugenia12
 
1 Universitatea Agrară de Stat din Moldova,
2 Institutul de Matematică şi Informatică al AŞM
 
 
Disponibil în IBN: 5 mai 2021


Rezumat

În lucrarea de faţă a fost utilizată metoda de parsare bazată pe configuraţii SCD (Segmentare-Coeziune-Depentenţă) [1] pentru transformarea eficientă a intrărilor (ce conţin text neprelucrat) din Dicţionarul Limbii Ruse Literare Contemporane (DLRLC) în 20 volume [2] într-o resursă lingvistică indexabilă. Strategia care stă la baza acestei metode reuneşte două configuraţii diferite de parsare: una, care identifică şi extrage pentru fiecare intrare de dicţionar arborele de sensuri principale şi secundare şi altă configuraţie, care parsează fiecare nod din arborele de sensuri cu scopul de a clasifica definiţiile din dicţionar, ce descriu sensuri principale şi secundare. Un marcher reprezintă o graniţă pentru o categorie lingvistică specifică. Recunoaşterea marcherilor şi construirea arborelui de sensuri a unei intrări din DLRLC a fost realizată în lucrarea [3]. Clasele de marcheri folosite pentru identificarea arborelui de sensuri pentru sensuri principale sînt: cifrele romane (I., II., III.,...etc.), cifrele arabe urmate de punct (1., 2.,3.,... etc.), două bare oblice (//). Pentru sensuri secundare se utilizează: rombul gol („◊”), traversa („═‖), tilda („~‖), enumerarea literală - de tip litere chirilice, după care urmează paranteza rotundă ( а), б), в),...etc.). În urma analizei conţinutului semantic al sensurilor pentru intrările din DLRLC s-a depistat următorul set specific de clase de marcheri de definiţie: MorfDefs-definiţii morfologice; RegDefs- definiţii scrise cu font regular; BoldDefs- definiţii scrise cu bold; ItalDefs- definiţii scrise cu italic; SpecDefs- definiţii ce conţin specificaţii; SpSpecDefs- definiţii scrise cu litere spaţiate, ce conţin anumite specificaţii; DefExems- exemple la definiţii, cu scopul de a întregi sensul unei definiţii. Aceşti marcheri de definiţie coincid întru-totul cu marcherii definiţiilor propuşi pentru Dicţionarul Tezaur al Limbii Române[1].

Cuvinte-cheie
marcheri de sens şi de definiţii, resurse lingvistice, parsare, intrare de dicţionar, arbore de sensuri.

Crossref XML Export

<?xml version='1.0' encoding='utf-8'?>
<doi_batch version='4.3.7' xmlns='http://www.crossref.org/schema/4.3.7' xmlns:xsi='http://www.w3.org/2001/XMLSchema-instance' xsi:schemaLocation='http://www.crossref.org/schema/4.3.7 http://www.crossref.org/schema/deposit/crossref4.3.7.xsd'>
<head>
<doi_batch_id>ibn-128933</doi_batch_id>
<timestamp>1713898092</timestamp>
<depositor>
<depositor_name>Information Society Development Instiute, Republic of Moldova</depositor_name>
<email_address>idsi@asm.md</email_address>
</depositor>
</head>
<body>
<collection>
<collection_metadata>
<full_title>International Conference of Young Researchers </full_title>
</collection_metadata>
<collection_issue>
<publication_date media_type='print'>
<year>2010</year>
</publication_date>
<isbn>978-9975-9898-4-8.</isbn>
</collection_issue>
<collection_article publication_type='full_text'><titles>
<title>Clasele de marcheri de definiţii pentru analiza semantică a intrărilor DLRLC</title>
</titles>
<contributors>
<person_name sequence='first' contributor_role='author'>
<given_name>Eugenia</given_name>
<surname>Burca</surname>
</person_name>
</contributors>
<publication_date media_type='print'>
<year>2010</year>
</publication_date>
<pages>
<first_page>84</first_page>
<last_page>84</last_page>
</pages>
</collection_article>
</collection>
</body>
</doi_batch>