loader

Πλήρως αυτοματοποιημένη επιμέλεια δεδομένων

Παρέχουμε μια πλήρως αυτοματοποιημένη υπηρεσία επιμέλειας δεδομένων, η οποία μπορεί να χρησιμοποιηθεί για τη βελτίωση της ποιότητας των ακατέργαστων κλινικών, γενετικών δεδομένων και δεδομένων τρόπου ζωής. Η υπηρεσία υποστηρίζει λειτουργίες για την εξαγωγή μεταδεδομένων, την ανίχνευση ακραίων τιμών, τον υπολογισμό δεδομένων και τον αποδιπλασιασμό.

img

Ευέλικτη απόδοση και κλίμακα

Τόσο οι συμβατικές μέθοδοι, όπως το z-score και το ενδοτεταρτημοριακό εύρος, όσο και οι προηγμένες μέθοδοι, όπως τα δάση απομόνωσης και οι ελλειπτικές καμπύλες Gauss, χρησιμοποιούνται για την ανίχνευση ανωμαλιών στα ακατέργαστα δεδομένα.

img

Προηγμένοι επεξεργαστές δεδομένων

Για την αντικατάσταση των τιμών που λείπουν χρησιμοποιούνται προηγμένοι υπολογιστές δεδομένων με βάση τα εικονικά προφίλ ασθενών που δημιουργούνται για κάθε πραγματικό ασθενή. Χρησιμοποιούνται μέθοδοι ανίχνευσης ομοιότητας και λεξιλογικοί ταιριαστές για τον εντοπισμό μεταβλητών με πανομοιότυπες κατανομές και κοινή σημασία. Χρήσιμα μεταδεδομένα παρέχονται στο χρήστη μαζί με λεπτομερείς αναφορές όπου τα ασυνεπή πεδία επισημαίνονται με χρωματική κωδικοποίηση.

curation

Pezoulas VC, Kourou KD, Kalatzis F, Exarchos TP, Venetsanopoulou A, Zampeli E, Gandolfo S, Skopouli F, De Vita S, Tzioufas AG, Fotiadis DI. Medical data quality assessment: On the development of an automated framework for medical data curation. Comput Biol Med. 2019 Apr;107:270-283. doi: 10.1016/j.compbiomed.2019.03.001. Epub 2019 Mar 7. PMID: 30878889.

image
Σχετικά με την επιμέλεια δεδομένων

Η αξιολόγηση της ποιότητας των δεδομένων έχει κερδίσει την προσοχή τα τελευταία χρόνια, καθώς όλο και περισσότερες εταιρείες και ιατρικά κέντρα υπογραμμίζουν τη σημασία ενός αυτοματοποιημένου πλαισίου για την αποτελεσματική διαχείριση της ποιότητας των μεγάλου όγκου δεδομένων τους. Ο καθαρισμός δεδομένων, γνωστός και ως επιμέλεια δεδομένων, βρίσκεται στην καρδιά της αξιολόγησης της ποιότητας των δεδομένων και αποτελεί βασική πτυχή πριν από την ανάπτυξη οποιασδήποτε υπηρεσίας ανάλυσης δεδομένων. Στην παρούσα εργασία, παρουσιάζουμε τους στόχους, τις λειτουργίες και τις μεθοδολογικές εξελίξεις ενός αυτοματοποιημένου πλαισίου για την επιμέλεια δεδομένων από ιατρική άποψη. Αρχικά περιγράφονται τα βήματα προς την ανάπτυξη ενός συστήματος για την αξιολόγηση της ποιότητας των δεδομένων καθώς και τα διεπιστημονικά μέτρα ποιότητας των δεδομένων. Στη συνέχεια παρουσιάζεται μια αρχιτεκτονική τριών επιπέδων που υλοποιεί αυτά τα βήματα. Έμφαση δίνεται στην ανίχνευση και τον εντοπισμό ασυνεπειών, ελλιπών τιμών, ακραίων τιμών και ομοιοτήτων, καθώς και στην τυποποίηση των δεδομένων, ώστε τελικά να καταστεί δυνατή η εναρμόνιση των δεδομένων. Πραγματοποιείται μελέτη περίπτωσης προκειμένου να καταδειχθεί η εφαρμοσιμότητα και η αξιοπιστία του προτεινόμενου πλαισίου σε δύο καθιερωμένες κοορτές με κλινικά δεδομένα που σχετίζονται με το πρωτοπαθές σύνδρομο Sjögren (pSS). Our results confirm the validity of the proposed framework towards the automated and fast identification of outliers, inconsistencies, and highly-correlated and duplicated terms, as well as, the successful matching of more than 85% of the pSS-related medical terms in both cohorts, yielding more accurate, relevant, and consistent clinical data. Τα αποτελέσματά μας επιβεβαιώνουν την εγκυρότητα του προτεινόμενου πλαισίου για τον αυτοματοποιημένο και γρήγορο εντοπισμό των ακραίων τιμών, των ασυνεπειών και των άκρως συσχετισμένων και διπλών όρων, καθώς και την επιτυχή αντιστοίχιση άνω του 85% των ιατρικών όρων που σχετίζονται με το pSS και στις δύο ομάδες, αποδίδοντας πιο ακριβή, συναφή και συνεπή κλινικά δεδομένα.