statistisk hypotesprövning
Mycket allmänt, en prövning av en nollhypotes om
en population eller en fördelning som sker
med hjälp av ett slumpmässigt urval.
Ett annat uttryck är signifikansprövning.
Ordet signifikans, med adjektivet signifikant, kommer av ett latinskt
ord som betyder beteckna, betyda. Ibland gäller prövningen en hypotes om
flera populationer (eller fördelningar); sådana fall förbigås här.
1. Klassisk hypotesprövning
Förenklat. Ett slumpmässigt urval ger ett observerat värde som jämförs
med det värde man väntar sig enligt en i förväg uppställd nollhypotes. Om
det observerade värdet avviker ”mycket” från det förväntade förkastas
hypotesen. Avviker det ”lite” förkastas hypotesen inte.
Förenklat exempel: Till ett personalkök levereras ett stort antal
konservburkar. Enligt leverantören varierar burkinnehållets vikt något
men är i genomsnitt 400 g för hela sändningen. Mottagaren betraktar
påståendet om medelvärdet 400 g som en
hypotes och vill pröva denna med hjälp av ett slumpmässigt urval.
25 burkar lottas ut ur sändningen. Man väger innehållet i
varje burk och beräknar medelvärdet för de 25 vikterna. Om medelvärdet
visar sig avvika ”mycket” från 400 g ska nollhypotesen förkastas, avviker
medelvärdet ”lite” ska den inte förkastas.
Antag för resonemangets skull de två fallen att medelvärdet avviker
”lite” respektive ”mycket” från hypotesen om 400 g som ett
genomsnitt för hela sändningen. Här är några sätt att formulera
resultatet.
”Liten” avvikelse. Hypotesen förkastas inte. Formuleringar:
Urvalsmedelvärdet avviker inte signifikant från 400. Signifikans
föreligger inte.
Avvikelsen ligger inom felmarginalen.
Avvikelsen är inte statistiskt säkerställd (statistiskt säker).
”Stor” avvikelse. Hypotesen förkastas. Formuleringar:
Urvalsmedelvärdet avviker signifikant från 400. Signifikans
föreligger.
Avvikelsen ligger utanför felmarginalen.
Avvikelsen är statistiskt säkerställd (statistiskt säker).
Resultatet bevisar inte om nollhypotesen om genomsnittet 400 g för hela
sändningen är sann eller inte. Ett säkert bevis förutsätter en
undersökning av vikterna för samtliga burkar, dvs. en totalundersökning
utförd med en helt korrekt mätmetod.
2. P-värdesmetoden (P-metoden)
Metod som är vanlig när hypotesprövningen görs med hjälp av ett
statistikprogram för dator. Programmet beräknar sannolikheten P att få
minst så stor skillnad som konstaterats mellan det observerade värde som
ett slumpmässigt urval ger och det värde som förväntas enligt en
nollhypotes, givet att nollhypotesen är sann. Beskrivningen är något förenklad; för en precisering, se i
Ordbok i statistik.
Användaren får sedan själv avgöra hur det erhållna P-värdet ska bedömas.
Allmänt kan sägas att om P är ”litet” förkastas nollhypotesen, är P
”stort” förkastas den inte.
Vanligt är att –
beroende på prövningens resultat – välja någon av varianterna nedan.
Anm: Tecknet * kallas asterisk [asteri´sk]; ordet av ett latinskt
ord som betyder stjärna.
|
P > 0,05 |
Icke-signifikant |
|
|
0,01 < P £ 0,05 |
Enstjärnig signifikans eller Signifikans* |
|
|
0,001 < P £ 0,01 |
Tvåstjärnig signifikans eller Signifikans** |
|
|
P £ 0,001 |
Trestjärnig signifikans eller Signifikans*** |
|
Mycket utförligt och med många figurer i Ordbok i statistik.
Åter |