Статистика и теорија на веројатност - PDF бесплатно преземање

Статистика и теорија на веројатност Др. Јочен Келер 1

преземање

Содржина на денешното предавање Статистика и теорија на веројатност Резиме на претходното предавање Преглед на проценка и моделирање на χ Добрината на тестот за соодветност Колмогоров Смирнов Добрината на споредбите на моделот на погоден тест

Резиме на претходното предавање Ја разгледавме можноста да можеме да ги процениме параметрите на дистрибуцијата врз основа на набationsудувања/податоци. Што научивме? Дека параметрите на дистрибуцијата можат да се проценат со помош на пр. der: Метод на моменти MoM Метод на максимална веројатност MLM 3

Резиме на претходното предавање Проценка на точката Метод на моменти (ММ) Принципот на ММ е: Ние ги проценуваме параметрите со изедначување на аналитички пресметаните моменти со моментите на примерокот. m 1 n = xˆ 1 ini = 1 1 x fx (xμ, σ) λ = dx m 1 n = xˆ ini = 1 x fx (xμ, σ) λ = dx Ова доведува до k равенки што треба да се решат за k Параметри на проценка. 4-ти

Резиме на претходното предавање Метод на проценка на максимална веројатност (МЛМ) на параметрите и нивната дистрибуција Принципот на МЛМ е: Параметрите се проценуваат со максимизирање на веројатноста дека параметрите ги претставуваат набationsудувањата/податоците. n L (θ xˆ) = f (ˆ X xi θ) i = 1 l (θ x) = дневник (f (ˆ X xi θ)) мин (l (θ xˆ)) θ ni = 1 μ = Θ (1 1 C ΘΘ = HH ij θ, θ. Θ l (θxˆ) T n) = θ = θ θ i θ j 5

Преглед на проценка и развој на модели Различни видови на информации се користат кога се развиваат инженерски модели. Субјективна информација Информации за фреквенционист Субјективна хартија за веројатност Физичко разбирање Искуство Способност за проценка Дистрибуција семејство Фреквентистички податоци Параметри на дистрибуција Пробабилистички модел Примерок статистика Интервали на доверба Статистичко значење Метод на моменти Метод на максимална веројатност 6

Да претпоставиме дека избравме одредена дистрибутивна функција за моделирање на несигурноста на несигурен настан. Податоци физички закони дистрибуција семејство f x (x) цврстина на компресија параметри на дистрибуција на податоци конкретни μ, σ x Сега сакаме да го провериме изборот на нашата дистрибуција користејќи статистички тестови. 7-ми

Разгледани се два различни случаи: Верификација на 1: Дискретни функции на дистрибуција p x (x) CHI квадрат (χ) Тест x: Функции на континуирана дистрибуција Колмогоров Смирнов Тест f x (x) x 8

КВ квадрат тест за добрината на вклопувањето Идејата зад ова е дека разликите ε j помеѓу очекуваната и наб observedудуваната дистрибуција на податоци треба да бидат мали доколку избраното дистрибутивно семејство може добро да го опише примерокот. 10 9 8 ε j ε i Набationsудувања 7 6 5 4 3 1 0 0 5 5 30 30 35 35 Хистограм од набудувања Хистограм според очекуваните набудувања според избраната дистрибуција и неговите параметри јачина на притисок бетон (MPa) 9

Тест за добра способност за квадрат CHI Како што веќе знаеме, дискретна функција на дистрибутивна кумулативна дистрибуција на веројатност е дадена на следниов начин: i 1 = j = 1 Px () px () i j функција на густина на веројатност Функција на дистрибуција на кумулативна веројатност 10

Тест за квадрат CHI за добрината на вклопувањето Нека n е бројот на набудувања на дискретна случајна променлива X. Бројот на набудувања на X = xi т.е. N i е биномски распределена случајна променлива со следнава очекувана вредност и варијанса: [] [] EN = npx () = N ii pi, Var N = np (x) (1 p (x)) = N (1 p (x)) iii pi, i Очекуван број на набудувања на одредена вредност 11

Тест за CHI квадрат за добрината на вклопувањето Нека n е бројот на набудувања на дискретна случајна променлива X. Бројот на набудувања на X = xi т.е. N i е биномски распределена случајна променлива со следното очекување и варијанса: [] [] EN = npx () = N ii pi, Var N = np (x) (1 p (x)) = N (1 p (x)) iii pi, i Очекуван број на набудувања на одредена вредност Ако постулираниот модел е точен и n е доволно голем, тогаш е според теоремата на централната граница, разликата ε i се дистрибуира како стандард. ε = i N N oi, pi, pi, N (1 p (x)) i Наб Obsудуван број наб observудувања со одредена вредност 1

Тест за квадрат CHI за добрата соодветност Статистика и пресметка на веројатност Ако се сумираат квадратните разлики на наб observedудуваниот и очекуваниот број на набудувања, се добиваат: ε (NN) kk oi, pi, = εi = i = 1 i = 1 Npi, p xi ( 1 ()) CHI квадрат дистрибуиран со k 1 степен на слобода ε ε 1 број на набудувања 10 9 8 7 6 5 4 3 1 0 ε mk (Noi, Npi,) = N i = 1 pi, 0 1 3 ε 3 ε 4 хистограм од набудувања Хистограм на очекувани набудувања Број на несреќи месечно 13

CHI квадратниот тест за добрината на вклопувањето Сега е тестиран на ниво на значење α дали збирот на сите забележани квадратни разлики е веродостоен, т.е. е поставена нултата хипотеза H 0 дека избраната функција на дистрибуција го претставува наб observedудуваниот примерок. Процедуралното правило потоа чита P ε (m) Δ = α Алтернативната хипотеза H 1 е далеку помалку информативна бидејќи ги прифаќа сите други дистрибуции освен избраната дистрибуција. Δ α χ 1 v = k j е фракциона вредност на распределбата со степени на слобода. 14-ти

Тест за CHI квадрат за добрината на вклопувањето Го разгледуваме следниов пример: Ние ја претпоставуваме нормалната дистрибуција како функција на дистрибуција за 0 набудувања на цврстината на притисок на бетонот. Средната вредност и стандардната девијација е 33 Mpa 5 Mpa. Параметрите не се проценуваат од достапните набудувања. Нормалната дистрибуција е континуирана дистрибуција. Но, лесно може да се дискретизира! 15-ти

Дискретиран е CHI квадратниот тест за добрината на функцијата. Функцијата на густина на избраната функција за дистрибуција е дискретирана:

Дискретиран е CHI квадратниот тест за добрината на функцијата. Функцијата на густина на избраната функција за дистрибуција е дискретирана: Густина на веројатност 0,09 0,08 0,06 0,05 0,05 0,04 0,03 0,01 01 Избрана функција на дистрибуција 0 0 10 0 30 40 50 60 Бетон на јачина на притисок (МПа) Интервал 0 5: Φ Φ) 0 0,055 1. 10 Вкупен број на обиди 5 33 33 0 () (= = 5 5 17

Дискретиран е CHI квадратниот тест за добрината на функцијата Функцијата на густина на избраната функција на дистрибуција е дискретирана: Густина на веројатност Избрана функција на дистрибуција 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,0,01 0 0 10 0 30 40 50 60 Бетон на јачина на притисок (MPa) Број на набудувања 9 8 7 6 5 4 3 1 0 Очекуван хистограм 0 5 5 30 30 35 35 Бетон на цврстина на притисок (MPa) Интервал 0 5: Φ Φ) 0 0,055 1. 10 Вкупен број на тестови 5 33 33 0 () (= = 5 5 18

CHI квадратниот тест за добрата соодветност Наб observedудуваните и очекуваните хистограми сега можат да се споредат. 10 Број на набудувања 9 8 7 6 5 4 3 1 0 0 5 5 30 30 35 35 Хистограм од бетон (MPa) Хистограм од набудувања Хистограм од очекувани набудувања 19

CHI квадратниот тест за добрата соодветност Наб observedудуваните и очекуваните хистограми сега можат да се споредат. Поради малиот број примероци во долната област, двата пониски интервали се споени. Број на набудувања 10 9 8 7 6 5 4 3 1 0 0 5 5 30 30 35 35 Хистограм од набудување Хистограм од набудувања Број на набудувања 10 Хистограм на очекуваните 1 набудувања 0 9 8 7 6 5 4 3 0 30 30 35 35 Бетон со јачина на притисок (MPa) 0

Тест за CHI квадрат за добрината на пресметките за вклопување, на пример, статистички податоци и пресметки на веројатност Интервал xj (MPa) Број на набудувања N o, j Очекувани веројатности Очекуван број на набудувања N p, j, примерок статистика 0 30 5 0.96671 5.933415 0.14684 30 35 9 0.381169 7.65443 0.36537 35 6 0,344578 6,41155 0,0649 Збир 0,40987 ε NN k (o, jp, j) m = j = 1 N p, j На ниво на значење од 5% добиваме за CHI квадрат дистрибуција со N = 3 1 = степени на слобода од табелата: Δ = 5,99. Бидејќи 0,40987 е помал од 5,99, нултата хипотеза H 0 не може да се отфрли. 1

CHI квадратни тестови за добрината на вклопувањето Ако еден или повеќе (m) параметри на избраната дистрибуција се утврдени од истите податоци што биле користени за тестот, тогаш бројот на степени на слобода мора соодветно да се намали: v = k 1 j Под претпоставка дека варијансата е одредена од податоците, но не и од средната вредност, добиваме n = 3-1-1 = 1 степен на слобода.

Статистика и веројатност CHI квадрат тест за добрината на вклопувањето Ако претпоставиме нормална дистрибуција со следниве параметри: μ = 33,00 σ = 4,05 го добиваме следниов резултат: Интервал xj (MPa) Број на набудувања N o, j Очекувани веројатности p (xj) Очекувани Број на набудувања N p, j =, 0p (xj) примерок статистика 0 30 5 0.7453 5.485061 0.04896 30 35 9 0.381169 7.63373 0.48591 35 6 0.344578 6.891566 0.11534 збир 0.40689 На ниво на значење од 5% добиваме за CHI квадрат дистрибуција со N = 3 1 1 = 1 степен на слобода од табелата: Δ = 3,84. Бидејќи 0,40689 е помал од 3,84, нултата хипотеза H 0 не може да се отфрли. 3

Тест за добрина на вклопување Колмогоров Смирнов Идејата зад тестот Колмогоров Смирнов е оваа: Ако за набationsудувањата се земе предвид функцијата за збирна дистрибуција на веројатноста на избраната дистрибуција, тогаш максималната разлика помеѓу набудуваната и очекуваната функција на дистрибуција на кумулативна веројатност треба да биде мала. ε max ε max