statistisk hypotesprövning
Mycket allmänt, en prövning av en nollhypotes om en population eller en fördelning som sker med hjälp av ett slumpmässigt urval. Ett annat uttryck är signifikansprövning. Ordet signifikans, med adjektivet signifikant, kommer av ett latinskt ord som betyder beteckna, betyda. Ibland gäller prövningen en hypotes om flera populationer (eller fördelningar); sådana fall förbigås här.

1. Klassisk hypotesprövning
Förenklat. Ett slumpmässigt urval ger ett observerat värde som jämförs med det värde man väntar sig enligt en i förväg uppställd nollhypotes. Om det observerade värdet avviker ”mycket” från det förväntade förkastas hypotesen. Avviker det ”lite” förkastas hypotesen inte.

Förenklat exempel: Till ett personalkök levereras ett stort antal konservburkar. Enligt leverantören varierar burkinnehållets vikt något men är i genomsnitt 400 g för hela sändningen. Mottagaren betraktar påståendet om medelvärdet 400 g som en hypotes och vill pröva denna med hjälp av ett slumpmässigt urval.
    25 burkar lottas ut ur sändningen. Man väger innehållet i varje burk och beräknar medelvärdet för de 25 vikterna. Om medelvärdet visar sig avvika ”mycket” från 400 g ska nollhypotesen förkastas, avviker medelvärdet ”lite” ska den inte förkastas.
    Antag för resonemangets skull de två fallen att medelvärdet avviker ”lite” respektive ”mycket” från hypotesen om 400 g som ett genomsnitt för hela sändningen. Här är några sätt att formulera resultatet.

”Liten” avvikelse. Hypotesen förkastas inte. Formuleringar:

  • Urvalsmedelvärdet avviker inte signifikant från 400. Signifikans föreligger inte.
  • Avvikelsen ligger inom felmarginalen.
  • Avvikelsen är inte statistiskt säkerställd (statistiskt säker).

    ”Stor” avvikelse. Hypotesen förkastas. Formuleringar:

  • Urvalsmedelvärdet avviker signifikant från 400. Signifikans föreligger.
  • Avvikelsen ligger utanför felmarginalen.
  • Avvikelsen är statistiskt säkerställd (statistiskt säker).

    Resultatet bevisar inte om nollhypotesen om genomsnittet 400 g för hela sändningen är sann eller inte. Ett säkert bevis förutsätter en undersökning av vikterna för samtliga burkar, dvs. en totalundersökning utförd med en helt korrekt mätmetod.

    2. P-värdesmetoden (P-metoden)
    Metod som är vanlig när hypotesprövningen görs med hjälp av ett statistikprogram för dator. Programmet beräknar sannolikheten P att få minst så stor skillnad som konstaterats mellan det observerade värde som ett slumpmässigt urval ger och det värde som förväntas enligt en nollhypotes, givet att nollhypotesen är sann. Beskrivningen är något förenklad; för en precisering, se i Ordbok i statistik.

    Användaren får sedan själv avgöra hur det erhållna P-värdet ska bedömas. Allmänt kan sägas att om P är ”litet” förkastas nollhypotesen, är P ”stort” förkastas den inte.
        Vanligt är att – beroende på prövningens resultat – välja någon av varianterna nedan. Anm: Tecknet * kallas asterisk [asteri´sk]; ordet av ett latinskt ord som betyder stjärna.
     
      P > 0,05 Icke-signifikant  
      0,01 < P £ 0,05 Enstjärnig signifikans eller Signifikans*  
      0,001 < P £ 0,01 Tvåstjärnig signifikans eller Signifikans**  
      P £ 0,001 Trestjärnig signifikans eller Signifikans***  

    Mycket utförligt och med många figurer i Ordbok i statistik.

    Åter