Кој статистички тест треба да го изберам Статистика на курсот за падови

Едноставни објаснувања, примери и задачи за испит

Оваа статија се заснова на општата статија за тоа како да тестираме хипотеза. Препорачувам да го прочитате и разберете овој напис претходно; ова го олеснува протокот на читање и разбирање на овој напис.

Табелата за избор на тест

Следната табела (кликнете на неа за поголема слика) ви покажува кој тест е погоден за одредено ниво на скала на целната и променливите што влијаат. ->

Објаснувањето за ова можете да го најдете во остатокот од овој напис. На самиот крај има неколку примери за вежби кои демонстрираат како да се користи оваа табела.

статистички

Прво утврдете го типот на вашата целна променлива, потоа видот на вашата променлива што влијае. Во оваа табела, тогаш ќе го најдете соодветниот метод за анализа на вашите податоци.

Брзо предупредување: За многу ситуации, изборот на вистински тест е многу лесен, и во основа постои само една опција. Во некои случаи, сепак, постојат неколку соодветни тестови што можат да се користат. Ако, на пример, има два можни теста, тогаш можеби едниот има предност што треба да прави помалку претпоставки за податоците (на пример, нормална дистрибуција), а другиот ќе има предност што подобро може да препознае реално постоечки ефект.

Во оваа табела собрав тестови кои според мене се или наједноставните или најдоброто решение за одредена група податоци - важно е да се има предвид дека ова не значи дека другите тестови автоматски се погрешни или полоши.

Објаснувањето на табелата

Постојат голем број тест процедури кои на прв поглед можат да изгледаат поразителни. Точниот тест што треба да се избере во одредена ситуација зависи од голем број прашања на кои мора да се одговори повторно во секоја ситуација.

Пребарување на слики на Google за „кој статистички тест“ или „кој статистички тест“ обезбедува многу различни дијаграми кои се со различни детали и започнуваат поинаку. Некои се насочени кон целите, односно првото прашање е „Што сакам да постигнам?“, А можните цели се, на пример, „Споредете ја средната вредност со хипотетичката вредност“. Другите дијаграми се засноваат на својствата на податоците. Овде започнува со прашањето „Која е целната променлива?“, Без разлика дали е номинална или континуирана, на пример. Според мое мислење, ова на почетокот е полесно, па затоа си ги поставуваме овие две прашања:

1.) Која е целната големина? -->>

Целната варијабла е карактеристика што ќе се промени како резултат на влијанието на променливите што влијаат. Тоа зависи од факторите на влијание. На пример, ако сакам да го докажам антихипертензивниот ефект на нов лек, тогаш мојата целна варијабла е крвен притисок, а варијаблата што влијае на тоа е лекот (на пр. Би имале две групи, едно лице без лек и едно лице со лек).

Сега утврдете кој тип (кое ниво на скала) е вашата целна големина:

2.) Кои се факторите кои влијаат?

--> Второ, мора да утврдиме дали воопшто имаме променлива што влијае, и ако има, каков вид скала има.

Важно: Со променливите што влијаат, не е важно каква дистрибуција имаат. Значи, дали променливата што влијае има нормално дистрибуирана или не е неважно за постапката за тестирање.

задачи

За секој од следниве случаи, утврдете кој тест е соодветен во секој случај. Прво идентификувајте ја целната големина и одреди го неговиот тип (номинален, реден и сл.). Потоа утврдете дали има една или повеќе променливи што влијаат и каков вид се тие. Потоа користете ја табелата за да го пронајдете соодветниот тест.

(Освен ако не е специфично забележано во вежбата, не можете да претпоставите нормална распределба на променливите.)

  • 1а) Целната вредност тука е бројот на цигари дневно. Овие се бројат податоци, така што целната големина е вообичаено намалена (исто така може да сметате дека е со скала во интервал). Факторот на влијание е точката во времето (пред/после), т.е. номинална променлива со две групи. Двете групи се спарени затоа што мерењата се поврзани: истите луѓе биле интервјуирани пред и по терапијата. Според табелата, соодветниот тест е тука Вилкоксон потпиша тест за ранг.
    • 1б) Во споредба со 1а), единственото нешто што се менува тука е фактот дека влијателната променлива веќе нема само две, туку неколку групи. Значи, според табелата, сега го користиме Фридман тест.
  • 2а) Тука сакате да тестирате едноставен дел. Има номинален исход од две групи и нема предиктор. Еве еден Тест за бином вистинскиот.
    • 2б) Сега сè уште нема променлива што влијае, но целната променлива сега има неколку групи. Тука користите еден Тест за добрина на соодветност на плоштадот Хи.
  • 3а) Тука имате номинална целна променлива со две категории и неколку влијателни променливи, континуирана и категорична. А. логистичка регресија е соодветно тука.
    • 3б) Исходот е постојан, но не е нормално распределен. Факторот на влијание е категоричен со две групи. Бидејќи двете групи (мажи и жени) не се спарени (како што би бил случајот пред/по групи, на пример), најдобро е да се земе една тука Тест Вилкоксон-Ман-Витни У.
    • 3в) Ако има повеќе од две групи, користете го тестот Вилкоксон-Ман-Витни У Тест Крускал-Волис.
  • 4) Со две континуирани или нормално распределени променливи може да се пресмета корелацијата помеѓу нив и Тест за корелација на Пирсон спроведе Алтернативно, тоа исто така би било можно линеарен модел (т.е. линеарна регресија).
  • 5) Исходот е нормално распределен и факторот на влијание е категоричен со две групи. Се вклопува тука Т-тест со два примерока.
  • 6) Целната варијабла е избраната страна, односно категорична променлива со неколку групи. Факторот на влијание, образовната квалификација, исто така е категоричен. Затоа се вклопува тука Тест за хи-квадрат. На Фишеров тест е исто така алтернатива. Се користи во случаи со помалку податоци, на пример, помалку од 1000 набудувања или ако барем една од клетките во крстостабот има помалку од 5 набудувања.
  • 7а) Тука се испитува влијанието на категоричната варијабла на влијание врз нормално дистрибуираната целна променлива. А. АНОВА е вистинската алатка за ова, можна е и алтернатива модел на линеарна регресија.
    • 7б) Ако има неколку фактори на влијание, еден се свртува кон повеќекратна линеарна регресија надвор.
  • 8а) Тука тестирате редна целна променлива (без да влијае на променливите) на средната вредност. А. Тест за знаци може да го тестира тоа.
    • 8б) Целната променлива е сè уште редна, но сега постои постојана варијабла што влијае. Може да се пресмета корелацијата на Спирмен ранг на овие две варијабли, а потоа и на Тест на Спирман трчај да тестираш за корелација.
  • 9а) Тоа е категорична целна променлива со две групи (висок крвен притисок да/не). Влијателната променлива има и две групи и е спарена, бидејќи истите луѓе се мерат во групата „пред“ и „после“. Значи, тука е Тест МекНемар во.
    • 9б) Ако целната големина е нормално дистрибуирана наместо категорична, вие водите една парен тест надвор.

3 размислувања за „кој статистички тест треба да изберам? "

Ме збунува вашиот пример за променливи со постојано влијание или задача 1: „Број на повици во разводна табла“ и „цигари на ден“ се дискретни вредности, зошто тие тука се појавуваат како континуирани или редни?