Што е модел и зошто ни е потребен DHd-Blog

За интердисциплинарни недоразбирања на ДХД 2020 година

Моделите се математички формули што можам да ги користам за да ги тестирам односите во моите податоци. Со овој едноставен концепт на модел, пораснав како квантитативен социјален научник без многу полемики. До годинашната ДХД 2020 година, 7-та годишна конференција на Здружението за дигитални хуманистички науки во земјите што зборуваат германски јазик.

2020 година

Конференцијата започнува со дводневни практични сесии за време на кои присуствувам на работилницата „Пристрасност во множества податоци и модели за машинско учење“. Ние тестираме нула хипотези со статистички модели и алтернативни хипотези со помош на симулации во компјутерски модели. Моделите се математички формализирани и затоа совршено се вклопуваат во мојот сопствен концепт на модел. Останувам во мојата зона на удобност.

За време на паузата, влегувам во разговор со учесниците на другите работилници. Одеднаш реченици како: „Ние ги моделираме нашите податоци со TEI.“, Или „Нашиот модел е neo4j база на податоци“.
„Стандардите за анотација и базите на податоци не се модели“, си мислам, „Каде се пресметките?“. И пред сè: „Каде се истражувачките прашања врз основа на кои извршуваме одредени пресметки и ги оставаме другите зад себе?“ Малку сум збунет.

Во вторник навечер седам во Форумот на музеите Хајнц Никсдорф и ја слушам главното предавање на iaулија Фландерс за создавањето модели во дигиталните хуманистички науки (DHS). И одеднаш паѓа денарот. Може ли да разговараме еден покрај друг? Дека ние поинаку го дефинираме „моделот“? За мене модел е математички модел. За Julулија Фландрија и многу други членови на DHd, сепак, се чини дека тоа е модел на податоци. Тоа значи стандарди за обработка на податоци (на пр. Прибелешка) и застапеност (база на податоци).

Иако моето недоразбирање е решено, многу од предавањата во следните денови ме тераат да размислувам. Имам впечаток дека многу време и ресурси се посветуваат на креирање модели, но дека одговорот на истражувачките прашања во врска со содржината е на второто место. Токму тие контекстуални контексти не интересираат ние како научници. Како се однесуваат литературните фигури едни со други? Каква врска има едниот историски настан со другиот? Зошто театарските претстави се менуваат со текот на времето? Зошто композиторот користи еден мотив, а не другиот во ова парче?
Нашите податоци и математички модели се само алатки за да одговорат на истражувачки прашања поврзани со содржината. Затоа, на нашите истражувачки прашања треба да им се посвети поголемо внимание при развивање модели.

Би сакал да истакнам три точки што ми привлекоа внимание за ракувањето со моделите на DHd 2020.
(1) Зошто поимот модел е толку ретко разликуван? Дали сум единствениот што ме збунуваат различните дефиниции на модели или тоа е за другите?
(2) Зошто градиме огромни модели на податоци за кои треба да се заврши долго време? Затоа мора да чекаме долго пред конечно да одговориме на нашите истражувачки прашања.
(3) Зошто градиме огромни модели на податоци со тврдење дека се универзално употребливи? Не знаеме дали е навистина потребен голем напор за да одговориме на нашите истражувачки прашања.

Па, што треба да се направи? Еве го мојот мал субјективен, привремен список на желби.
(1) Треба да бидеме специфични кога го користиме терминот модел и точно да кажеме за кој тип на модел се мисли. Тоа ја олеснува комуникацијата во интердисциплинарна област како DH.
(2) Треба да изградиме мали модели специфични за апликации за податоци пред да започнеме со огромни, универзални модели на податоци. Првичните прашања од истражувањето можат да бидат адресирани навремено со намалена верзија на моделот на податоци.
(3) Ние треба да развиваме податоци и математички модели постепено и итеративно, наместо да ги градиме во една насока (принцип на водопад). После секое повторување, моделот може да се искористи за да се одговори на конкретно истражувачко прашање. Во зависност од тоа колку добро работи ова, моделот постојано се прилагодува. Ова е начинот на кој спречуваме огромен, макотрпно создаден модел да биде бескорисен за одговарање на истражувачко прашање.

Заклучок:
Прво, ДХ се интердисциплинарна област каде циркулираат различни поими на модели. Затоа, треба да правиме разлика помеѓу податоците и математичките модели.
Второ, ние сме научници затоа што сме заинтересирани за контекстуални односи. Ако нашиот фокус беше насочен кон создавање модели на податоци, ќе станевме развивачи на софтвер или менаџери на бази на податоци. Моделирањето не е цел само по себе, треба да биде средство за одговарање на истражувачки прашања.

Носители на стипендии за патувања на DHd 2020 - преглед и придонеси | DHd блог 12 март 2020 година

[…] Рамона ролери (ЕТХ Цирих) - @ramona_roller Што е модел и зошто ни е потребен? Во: DHd блог, 12 март 2020 година, https://dhd-blog.org/?p=13186. [...]

Фредерик Нојбер, 12 март 2020 година

Ви благодарам за оваа прекрасна статија на тема „модели“, на која веднаш скокам.

Според мое мислење, моделите на податоци не се ограничени на средство за претходна обработка на податоците. Формирањето на модел може да помогне во (интердисциплинарни) работни групи за да се создаде заедничко разбирање за сложените домени. Јас го разбирам самото моделирање како хеуристички процес во кој постојното знаење за некој објект (на пример, текст или слика) е проширено, доведено во прашање и изострено. Во овој поглед, јас го гледам * моделирањето како дел од истражувањето *, во кое се збогатува знаењето за некој предмет и се развиваат теории. Покрај тоа, моделите се основа на податоците што на крајот може да се проценат, а резултатите од евалуацијата (меѓу другото) произлегуваат од перспективата на претходното моделирање.

Поточно, моето гледиште за вашите точки/желби во однос на моделирањето:

(1) Да, треба да бидеме специфични за каков модел мислиме. Заедничко разбирање може да се појави, на пример, преку концептуален модел на „поимот модел“. Да, тоа е многу мета сега . но зошто да не?!

(2) Моделите на податоци не треба да имаат цел сами по себе, туку треба да имаат одредена цел и да го мапираат ова конкретно. Во светот на дигиталните ресурси, моделите на податоци, исто така, мора да бидат поврзани и повеќекратно, поради што има смисла употребата на стандарди и барањето за генерализација. Ако секој мисли само на себе кога се занимава со моделирање, нашата работа е на долг рок - да го кажам лежерно - за мачката. Пример: Благодарение на развојот на огромниот модел на ТЕИ, кодирани текстови од различни проекти сега можат да се соберат или разменат со релативно малку напор. Многу текстуални тела, кои денес ги вршат проценките по кои копнеете, се составени од помали корпуси (истото важи според мене и за базите на слики, итн.) Само замислете дека секој би користел свој формат/вокабулар овде - како сакате да го направите тоа некогаш да се приближите до големите податоци и да ги поставите навистина возбудливите прашања? Според мое мислење, ТЕИ е исто така добар пример за фактот дека знаењето за текстовите е специфицирано и изразено (јас секогаш велам дека вистинската вредност на ТЕИ е размислување за текстот и дефинициите, помалку за вокабуларот за кодирање).

(3) Повторувањето има смисла, а исто така мислам дека треба да се креираат големи модели на податоци од долу нагоре отколку одгоре-надолу.

Лично, најдов дека аспектот на „моделирање“ е недоволно застапен на овогодинешната конференција за ДД. Тоа може да биде затоа што сега имаме критична маса на податоци и алатки за истражување, а создавањето на податоците е на последното место. Како и да е, јас го гледам аспектот на моделирање како важен дел од DH и како критичен процес кој бара наука (што, патем, може да го користат и инженери за софтвер за истражување или менаџери за бази на податоци). Особено во проекти во кои хуманистичките науки и компјутерските научници работат заедно, честопати е потребна ДХ-личност со знаење за моделирање за да го пренесе доменот и истражувачкото прашање на најдобар можен начин и да го формализира во правилен формат или вокабулар. Речиси сите компании во дигиталните хуманистички науки, вклучително и проценка на големи количини на текст за да одговорат на истражувачки прашања, стојат или паѓаат на квалитетот на базата на податоци, што пак произлегува од неговото моделирање. Затоа, честопати пропуштав критички осврт на базата на податоци на многу предавања за евалуација на текст.

Теса Генгнагел, 12 март 2020 година

Ви благодариме за извештајот за искуство! Поради временските ограничувања, имам само неколку кратки коментари за ова (всушност треба да разгледате неколку реченици тука и да разјасните неколку недоразбирања):

1. Како што сугерира името, дигиталните хуманистички науки се фокусираат на хуманистичките и културните студии. Веќе постои огромен јаз во општествените науки. Јас велам дека без никаква проценка, тоа е така. Затоа, недоразбирањето е закопано само во самите дигитални хуманистички науки, туку и во различните специјалистички култури, т.е. во некои многу темелни методолошки и епистемолошки, ако не и целокупни научни теоретски дебати. Ова не можете ниту да го префрлите на дигиталните хуманистички науки ниту да ги решите во нив.

2. Дискусијата на тема „модел“ и „моделирање“ особено е стар хоби-коњ во DH, дури и ако немало значителен придонес на теоретско ниво од Вилард Мекарти 2005 година. Терминот често не се користи на нијансиран начин, тоа е вистина и тоа е проблем. Но, Нелсон Гудман веќе забележа во своето дело „Јазици на уметноста“ (1968/1976): „Малку поими се користат во популарниот и научен дискурс попромискуитетно од„ моделот “. Моделот е нешто за што треба да се восхитуваат или да се имитираат, образец, пример, тип, прототип, примерок, макета, математички опис - скоро сè, од гола русокоса до квадратна равенка - и може да носи на она што го моделира скоро секој однос на симболизацијата. “- Ова исто така не е специфичен DH-феномен или проблем. Оваа дефиниција на терминологијата е прилично пандемична кај многу субјекти и е само делумно позабележителна во ДХ затоа што или ако не постои заедничка техничка основа помеѓу соговорниците, т.е. мисла од основните теми, и нема заедничко прицврстување на ДХ јазик и Дадена е методологија.

3. Да се ​​каже дека од една страна има математички модели, а од друга страна има модели на податоци е далеку од ознаката и не опишува ниту научно и генерално валидно разбирање од една страна, ниту DH разбирање што треба да се разликува од него од друга страна. За жал, не можам да навлегувам во тоа подетално сега, но мислам дека е вредно што овој пост на блогот уште еднаш го потенцира проблемот во комуникацијата со науката, а DH се очигледно виновни за ова.