Иднина за дигитализација на таблата од големи податоци до паметни податоци

Минхен 04/01/2020

Графичка технологија: од големи податоци до паметни податоци?

Доколку податоците треба да бидат „паметни“, тие мора да бидат подготвени соодветно. Претходен проблем: Податоците се многу хетерогени, честопати неструктурирани и дремливи на различни локации во одделни бази на податоци (силоси за податоци). Покрај тоа, информациите обично не може да се пребаруваат или се многу тешки за пребарување.

таблата

За да се повратат скриените богатства и да се извлечат хипотези од нив, податоците мора да бидат достапни, интероперабилни и да се пребаруваат - само тогаш „Големите податоци“ можат да се трансформираат во „Паметни податоци“ преку употреба на современи ИТ решенија. Ова е токму она на што работи проектот „Графикони за борба против дијабетесот“ на Германскиот центар за истражување на дијабетес (ДЗД) во Минхен со помош на графичка технологија. Тимот се надева дека поврзаноста и систематската анализа на податоците ќе вклучат Хипотези за персонализирана превенција и терапија. Дури и со црвена тема како што се инфекции со Covid-19, технологијата за графикони може да воспостави врски што можеби останале скриени без овој метод. Во едно интервју, д-р. Александар Јараш, како работи.

Д-р Александар Јараш, Минхен

Д-р Јараш, во светот има многу голема база на податоци за дијабетес. Кој е проблемот со тоа?
Постојат податоци од различни дисциплини во основните истражувања, експерименти врз животни, од епидемиолошки студии на универзитети и клинички студии на универзитетски болници. Сепак, податоците генерирани на овој начин обично се снимаат во таканаречените силоси за податоци, т.е. во табелите на Excel, текстуални датотеки или, идеално, во базите на податоци. Овие податоци тогаш не се или само многу рудиментирано поврзани. Затоа е тешко да се воспостават врски помеѓу различни истражувачки проекти кои сите се справуваат со дијабетес на различни начини.

И тука влегува технологијата за графикони?
Се согласувам. Во базите на графикони, податоците се природно поврзани како таканаречени јазли и рабови. На пример: Заштедувам БМИ, висина и така натаму, јазолот на лицето на пациентот. Ако потоа се спроведе експеримент врз овој пациент, во кој, на пример, се зема крв и се мери вредноста на HbA1c, создавам нов јазол „цртање крв“. На ова ја зачувувам количината на примерок од крв, вредноста HbA1c, зачувана во фрижидер XY итн. Јазлите "Лице" и "Цртеж на крв" потоа се поврзани со работ. Потоа, јас директно можам да видам, на пример, каква вредност има HbA1c на човекот, каков BMI има и каде е зачуван примерокот. Сега можам да барам сличности меѓу луѓето и на тој начин да направам хипотези за врските. И колку повеќе податоци ја хранам графичката база на податоци, толку е поголема веројатноста да најдам корелации или обрасци.

Како ја користите оваа технологија во DZD?
На пример, за нашата локација, дисциплина и пребарување на разни видови експерименти и примероци. Нашиот член на одбор на ДЗД, проф. Мартин Храбо де Анџелис, имаше визија за „каталог на податоци“ во ДЗД. Со ова можеме релативно едноставно да утврдиме: Каде се чуваат податоците? Дали ми е дозволено дури и да работам со вас од причини за заштита на податоците? И колку примероци имам? Да речеме дека сакам да направам статистичка изјава за параметар во експеримент со глувци со 20 глувци. Но, бројот не е доволен за да се дадат статистички значајни изјави. Во базата на податоци за графикони можеше да се види дека 5.800 глувци со ист параметар се измерени на друга локација на DZD - и тогаш можам да ги спојам овие податоци.

Зарем системот не станува се повеќе збунувачки колку повеќе податоци се спојуваат?
Не Трикот е во тоа што имаме интерактивна површина што лекарите и научниците без компјутерски науки можат да ја користат за да се снајдат. Можете да ги лизнете јазлите и рабовите напред и назад, да ги расклопите за да видите детали и поврзани јазли, да ги преклопите за да ја видите големата слика. На овој начин, со комплетно нови анализи на податоци може да се работи интерактивно. Ако бројот на јазли и рабови стане значително поголем, можете исто така да испратите пребарувања до базата на податоци со многу едноставен јазик на пребарување.

Можете исто така да користите графичка технологија за да ги поврзете податоците од истражувањето за различни клинички слики?
Ова е следниот чекор. Бидејќи технологијата може да се користи универзално и лесно може да се прошири или модифицира. И компјутерската моќ на компјутерите сега е толку голема што може да се обработуваат огромни количини на податоци. Во моментов имаме пилот со други германски центри за здравствено истражување со 1,8 милијарди јазли и 3,9 милијарди рабови!

За што станува збор за овој пилот проект?
Станува збор за можни последици од дијабетес. На пример, еден е прилично агресивен рак на црниот дроб. Сега се поставува прашањето: Дали има податоци од пациенти или во животински модели што би предложиле дијабетес на рак или обратно? На пример, генетски дефект, фактор на животната средина, одреден животен стил? Можностите за примена на технологијата за графици се бесконечни. Затоа, таа ќе игра сè поважна улога во иднина.

Ви благодариме за интервјуто, д-р. Јараш!

Повеќе информации

Можете да прочитате повеќе за технологијата на графикони во D.U.T Report 2020 на страница 160 во написот „Мрежни податоци за идно истражување на дијабетес“ од Др. Александар Јараш, д-р. Астрид Глејзер и проф. Мартин Храбе де Ангелис.

Повеќе информации за проектот „Графикони за борба против дијабетесот“, кој беше награден со 2-то место на наградата bytes4diabetes, можете да најдете ОВДЕ.