Přehled vybraných parametrických a neparametrických testů ve statistice

J.Novotný, 15.6.2011

 

1.      krok

Testy normálního rozdělení (distribuce)

·      Shapirov-Wilkův test pro menší soubory (n<50)

·      Kolmogorov-Smirnovův test pro menší i větší soubory

·      Chí-kvadrát test (Χ2)

2.      krok

PARAMETRICKÉ TESTY

NEPARAMETRICKÉ TESTY

Testy

pro nezávislé výběry, nezávislé vzorky (nepárové hodnoty)

·      Studentův t-test  dvouvýběrový pro nepárové hodnoty (jednoduchá varianta ANOVA)

·      Jednovýběrový test pro srovnání s jednou hodnotou (např. referenční)

·      Složitější varianty ANOVA pro srovnání více průměrů

·      Snedekorův F-test

·      Wilcoxonův nepárový test (Mann-Whitneův U test) pro nezávislé vzorky (dvouvýběrový)

·      Mediánový test

·      Kolmogorov-Smirnovův test pro dva výběry

·      Kruskal-Wallisův test pro více než dva nezávislé výběry (TK)

Testy

pro závislé výběry, závislé vzorky (párové hodnoty)

·      Studentův t-test dvouvýběrový pro párové hodnoty

·      Wilcoxonův párový test pro závislé vzorky (jednovýběrový)

·      Friedmanův test (Friedmanova ANOVA) pro více než dva závislé výběry (TF)

·      Znaménkový test

·      McNemarův Χ2 test

Testy

korelace

·      Jednoduchá lineární korelační analýza (Pearsonův korelační koeficient r)

·      Lineární regrese

·      Nelineární regrese

·      ANOVA jako test závislosti jevu na jednom či více faktorech

·      Spearmannův test pořadové korelace (Spearmanův koeficient rs nebo R)

·      Chí-kvadrát test (Χ2)

·      Kendallův test pořadové korelace

 

1. Nejprve zjistit, zda změřené hodnoty splňují kritéria pro použití parametrických nebo neparametrických testů, pak vybrat vhodný test: Pro soubory s kvantitativními hodnotami (n>25) s normálním rozdělením a stejnými rozptyly použít parametrické testy. Pro ostatní soubory použít neparametrické testy. Neparametrické testy mají menší sílu - menší schopnost zamítnout H0, když není správná.

2. Stanovit hladinu významnosti (signifikace) α, např. 0.05 (5%), tj. pravděpodobnost chyby 1.druhu, tj. chybné zamítnutí (nepřijetí) pravdivé (správné) nulové hypotézy H0.

3. Provést vybraný test, tj. vypočíst testovací charakteristiku pro hodnocená data a příslušnou hladinu významnosti p. Při p<α → zamítnutí H0, při p> α → nezamítnutí (přijetí) H0.

4. Někdy lze pro hodnocení použít tzv. praktickou významnost (věcnou, logickou). Pro její hodnocení se stanoví kritérium podle znalostí a zkušeností v absolutní nebo relativní hodnotě, např. 0.10 (10%).

·   Analýza rozptylu (Analysis of Variance - ANOVA) má různé formy: např. pro hodnocení vlivu jednoho faktoru - srovnání průměrů  několika výběrů (jednoduché třídění), hodnocení vlivu dvou faktorů (dvojné třídění) a další.

·   Při testování vztahu (korelace, závislosti) mezi proměnnými se zjišťuje jeho druh (typ, např. lineární, exponenciální) a jeho těsnost. Samotný průkaz vztahu nevypovídá o příčině a důsledku.

·   Chí-kvadrát test2): Pro dva kvalitativní znaky (při n>40 musí být >3 hodnoty v každém znaku; při n=20-40 musí být >5 hodnoty v každém znaku); pro více kvalitativních znaků (kontingenční tabulka „k“ znaků u „m“ souborů).

Studie (výzkum):

·   teoretická – bez výběru a testování souboru (výběru) jedinců z populace; data jsou získána studiem literatury, archivů apod. (přehledové studie, metaanalýzy – analýza více studií jiných autorů); empirická (praktická) –  s využitím vlastní zkušenosti, s vlastním výběrem a testováním souboru (výběru) jedinců z populace; data jsou získána vlastním měřením nebo dotazováním apod.

·   kvalitativní – znaky nemají charakter číselných hodnot; kvantitativní – znaky mají charakter číselných hodnot; semikvantitativní (semikvalitativní) – znaky mají charakter číselných hodnot jen částečně, např. při použití jednoduché škály.

·   experimentální (pokus) – zjišťuje se působení (vliv) plánovaného kontrolovaného (experimentálního) činitele na vybraný soubor jedinců (experimentální). Její součástí by měl být i kontrolní (srovnávací) soubor, který není pod vlivem experimentálního činitele.

·   průřezová – je zjištěn stav jednoho nebo více vybraných vzorků populace jednorázově, jedním vyšetřením; longitudinální – vybraný soubor je vyšetřován opakovaně v průběhu času; dlouhodobé sledování.

·   prospektivní – s novým výběrem populace a jeho vyšetřováním, měřením; retrospektivní – zpracování již dříve zjištěných údajů.

·   pilotní – první průzkumná menší studie nového problému, k  doladění metodiky následující větší studie atd.