New approaches to missing biomedical data recovery for machine learning
Închide
Conţinutul numărului revistei
Articolul precedent
Articolul urmator
329 6
Ultima descărcare din IBN:
2024-05-13 17:33
Căutarea după subiecte
similare conform CZU
004:[612.13:616.94] (1)
Știința și tehnologia calculatoarelor. Calculatoare. Procesarea datelor (4275)
Fiziologie. Fiziologie umană și comparată (736)
Boli transmisibile. Boli infecţionase şi contagioase, stări febrile (587)
SM ISO690:2012
IAPĂSCURTĂ, Victor, FIODOROV, Ion. New approaches to missing biomedical data recovery for machine learning. In: Journal of Engineering Sciences, 2023, vol. 30, nr. 1, pp. 106-117. ISSN 2587-3474. DOI: https://doi.org/10.52326/jes.utm.2023.30(1).09
EXPORT metadate:
Google Scholar
Crossref
CERIF

DataCite
Dublin Core
Journal of Engineering Sciences
Volumul 30, Numărul 1 / 2023 / ISSN 2587-3474 /ISSNe 2587-3482

New approaches to missing biomedical data recovery for machine learning

Noi abordări ale recuperării datelor biomedicale pentru învățarea automată

DOI:https://doi.org/10.52326/jes.utm.2023.30(1).09
CZU: 004:[612.13:616.94]

Pag. 106-117

Iapăscurtă Victor12, Fiodorov Ion1
 
1 Technical University of Moldova,
2 ”Nicolae Testemițanu” State University of Medicine and Pharmacy
 
 
Disponibil în IBN: 16 aprilie 2023


Rezumat

Missing data is a common problem for medical data sets, especially large ones. This issue is of major importance since it can influence the analysis and further use of the data, e.g., for machine learning purposes. There are various methods for recovering missing data.One such method is to remove observations with missing values, but this is not very usefulgiven the limited amount of data available. Another commonly used approach is the LastObservation Carried Forward (LOCF). But most such methods are not universal and may needadjustments to the data set at hand. This article describes the possibility of solving thisproblem in the case of multimodal time series of biomedical data coming from patients withsepsis. It describes and compares three approaches tailored to a sepsis dataset, which isanalyzed and finally used to build a sepsis prediction system based on clinical data routinelyrecorded in an intensive care unit.

Datele lipsă sunt o problemă comună pentru seturile de date medicale, în special pentru cele mari. Această problemă este de o importanță majoră, deoarece poate influența analiza și utilizarea ulterioară a datelor, de exemplu, în scopuri de învățare automată. Există abordări diferite pentru a trata datele lipsă. Una obișnuită este ștergerea observațiilor care conțin astfel de date, însă ea nu este aplicabilă atunci când volumul datelor este limitat. O altă abordare frecvent utilizată este “Last Observation Carried Forward (LOCF)”. Dar majoritatea acestor metode nu sunt universale și pot necesita ajustări la setul de date la îndemână. Această lucrare descrie posibilitatea abordării acestei probleme în cazul seriilor temporale multimodale de date biomedicale provenite de la pacienții cu sepsis. Ea descrie și compară trei abordări adaptate setului de date care este analizat și utilizat în cele din urmă pentru construirea unui sistem de predicție a sepsisului bazat pe date clinice înregistrate în mod obișnuit într-o unitate de terapie intensivă.

Cuvinte-cheie
multimodal biomedical time series data, missing values, data recovery, sepsis, machine learning,

serii temporale de date biomedicale multimodale, valori lipsă, recuperare date, sepsis, învăţare automată