Анализа на моќноста бета грешка (грешка 2

При изведување Тестови за хипотеза ставаш еден Ништовна хипотеза и тестирајте ги на одредено ниво на значење α, обично 5%. Веројатноста за одбивање на вашата нулта хипотеза, иако важи, е така поставена на максимум 5%.

бета

Покрај алфа-грешката, постојат и други променливи кои влијаат на одредувањето на „квалитетот“ на вашиот тест:

  • Тип 2 грешка или бета грешка
  • Големина на ефектот
  • Големина на примерок

Вие го испитувате обемот на белите дробови на учениците. Знаете дека вашиот просечен волумен на белите дробови μ за висина од 170 см е четири литри и има позната варијанса. За да проверите дали натпреварувачкиот спорт го зголемува обемот на белите дробови на 4,5 литри, прво зедовте примерок од 120. Тогаш утврдивте во просек 4,4 литри. Со ова можете да претпоставите нормална дистрибуција за просекот над теоремата на централното ограничување.

Вашите хипотези се:

Распределбата за средната вредност е кафеава на графиконот и критичното подрачје во кое извршувате грешка од тип 1 е обележано со црвена боја. Сината линија ја покажува критичната вредност на вашиот тест.

Одлуката за тестот можете да ја донесете со помош на вашата пробна променлива на графиконот: Ако, нултата хипотеза не се отфрли, ако е, таа е отфрлена.

Зелената крива е дистрибуција подолу. Ако е точно, вклучена е зголемената просек и реализациите на примерокот значат прераспределба. И тука, екстремни вредности се можни на краевите од дистрибуцијата. Графиката покажува понатамошна можност за грешка во форма на бета грешка: де факто зголемениот волумен на белите дробови не може да се препознае како таков.

Бета грешка

Со твоето сигурно критична вредност големината на бета грешката се одредува како област под функцијата на зелената дистрибуција лево од. Критичката вредност, а со тоа и одвојувањето помеѓу критичната област и областа за прифаќање е прикажано на графиконот со сината линија.

Можете да видите на графиконот дека намалување на Грешка во алфа поместување на критичната вредност надесно. Ова директно ја зголемува бета грешката. Спротивно на тоа, зголемувањето на алфа-грешката предизвикува критичната вредност да се префрли налево и бета-грешката да се намали.

Моќта на статистичкиот тест

Во рамките на Моќност или моќност на тест ја разбира веројатноста за реално отфрлање на фактичка лажна нулта хипотеза, т.е. не правење бета грешка. Во примерот, ова значи утврдување на реалниот зголемен волумен на белите дробови во тестот. Се разбира, тестот на ниво α е помоќен и подобар, толку е помала придружната грешка.

Додека можете да ја поставите алфа-грешката на тест по своја волја, бета-грешката не може да се контролира директно. Но, покрај големината на α, тоа директно зависи од ефектот што треба да се провери и од големината на примерокот.

Ефектот

Во рамките на ефект се разбира разликата помеѓу двете можни средни вредности. Колку е поголем ефектот што треба да се тестира, толку е полесно да се разликуваат хипотезите едни од други. Пооддалечени се темињата на дистрибуциите и има помалку области на преклопување. Графички, зелената функција се поместува надесно со зголемувањето на ефектот. Бидејќи критичната вредност останува на своето место, областа под зелената функција лево од критичната вредност станува сè помала.

Влијание на големината на примерокот

Апсолутната големина на ефект на вашиот тест обично е дадена во смисла на содржина и методолошки не е променлива. Сепак, бидејќи одлуката за тестот ја донесувате со помош на стандардизирани вредности, стандардизираниот ефект може да се одреди со Големина на примерок се разликуваат Колку е поголем изборот на примерокот, толку е помала варијансата на просекот, толку е поголем стандардизираниот ефект и подалеку од десно се менува зелената функција:

За горенаведениот случај го дадовте ефектот, како и варијансата со .

Табелата го покажува влијанието на големината на примерокот врз стандардизираниот ефект:

Големина на примерок Варијанс на просекот: стандардизиран ефект:
n = 120 0,183 2.732
n = 500 0,089 5.618
n = 1000 0,063 7.937

На втората графика можете да видите како моќноста на тестот се зголемува со зголемување на n, бидејќи кривата подолу се префрла надесно: за n = 120 бета грешката бидејќи областа под жолтата крива до точката на пресек со е релативно голема; за n = 1000 како површина под сината кривина до точката на пресек со јасно помала и за n = 5000 незначително мала.

За дадена алфа и даден ефект, можете да влијаете на бета грешката со избирање на големината на примерокот, така што таа да не го надминува посакуваното ниво на грешка. Општо, важи следново: колку е поголем ефектот што сакате да го тестирате, полесно е да се препознае и колку е помала, можете да ја изберете големината на примерокот.

Со други зборови: колку е поголем примерокот, толку е помала варијансата на просекот на примерокот и толку е поголем стандардизираниот ефект. Сепак, зголемувањето на примерокот е секогаш поврзано со дополнителен напор и зголемени трошоци.

Анализа на моќност

На Анализа на моќност ја испитува интеракцијата на алфа и бета грешките, ефектот и големината на примерокот. Вообичаено е да се избере бета грешка четири пати поголема од алфа-грешката, така што, на пример, една од 20% е наменета за.

Пред да земете примерок, треба да ја одредите потребната или оптимална големина на примерокот, ако е можно. Постојат моќни програмски алатки со кои можете да извршите анализа на моќноста за овие размислувања. На пример, бесплатна алатка е GPower.