Standardavvikelse och konfidensintervall

Blå fördelning: processen      Röd fördelning: medelvärden

Förberedelser
Det finns fem olika 'info'-knappar. Klicka på alla och läs instruktioner och kommentarer. Formeln för att beräkna ett konfidensintervall finns i de två PDF-dokumenten "%ConfInt" och "Konfidensintervall". Klicka upprepade gånger på knappen [Repetera] och notera hur medelvärdena fördelas på talaxeln.

Övning 1 – olika n
Varje gång man beräknar ett medelvärde har man ett värde på 'medelvärdesvariabeln'. Ändra "Stickprovsstorlek" (n) till litet värde 10 och tryck upprepade gånger på [Repetera]-knappen. Notera att den röda fördelning fick större standardavvikelse (blev 'bredare'). Öka n till 90 och då blir den röda fördelningen smalare (till ett högre pris, nämligen ökat antal mätningar).

Övning 2 – olika antal stickprov
Sätt "Antal stickprov" till ett högt värde, Notera att '+'-tecknen då fyller ut en stor del av den röda fördelningen. Om antal "Stickprov" sätts till litet, 4 ligger '+'-tecknen närmare medelvärdet. OBS att i en verklig situation har man ju bara ett stickprov och sålunda bara ett medelvärde.

Övning 3 – litet stickp

Konfidensintervall

Konfidensintervall är inom matematisk statistik en skattning av osäkerheten associerad med skattningar av populationsparametrar som har tagits fram med hjälp av stickprovsdata. Konfidensintervallet bestäms för en given konfidensgrad. Exempelvis kan ett konfidensintervall bestämmas för konfidensgraden 95&#;% vilken bestäms i förväg av användaren.

För att förstå innebörden av det som konfidensintervallet anger, betrakta en population för vilken man vill skatta någon förbestämd parameter utifrån stickprovsdata. Den givna populationen kommer att samplas upprepade gånger, varpå intervallskattningar för den givna parametern bestäms. Då är konfidensintervallet det intervall som kommer att innesluta populationsparametern för den andel av samplingarna som bestäms av konfidensgraden. Exempelvis om konfidensgraden är 95&#;% kommer konfidensintervallet innesluta populationsparametern 95&#;% av samplingarna.

Ett ensidigt konfidensintervall kommer att begränsa populationsparametern från ett håll, antingen från ovanifrån eller underifrån. Detta erbjuder alltså antingen en övre eller undre begränsning för populationsparameterns magnitud. Ett tvåsidigt konfidensint

Konfidensintervall

I vissa fall vid uppskattning av en okänd parameter duger inte punktskattning då ett uppskattningsvärde inte ger tillräckligt med information. Då kan man istället använda intervallskattning som också kallas konfidensintervall.

Punktskattning används nästan alltid i konfidensintervall så det är viktigt att du kan det innan du tar dig an detta kapitel.

Konfidensintervall

Intervallskattning baserar sig på en procentsats som definierar hur stor sannolikheten att resultatet av den slumpbaserade händelsen befinner sig inom intervallet. Denna procentsats kallas konfidensgrad. Om vi har en konfidensgrad på kommer vi alltså enbart av fallen att hamna utanför intervallet. Felrisken blir därmed och konfidensgraden

För att skapa ett konfidensintervall krävs, precis som vid punktskattningen, ett stickprov av utfallsvärden . Då konfidensintervallet beror på detta stickprov kommer därmed intervallers ändpunkter betraktas vara stokastiska variabler som är funktioner av stickprovet.

Precis som punktskattning kan beräkningarna skilja sig en aning beroende på given information. Oftast brukar den okända parametern som ska skattas vara normalfördelad eller chi2 fördelad . V

Se även: I alla statistiska analyser är det troligt att du arbetar med ett urval, snarare än med data från hela populationen. Ditt resultat kanske därför inte representerar hela populationen &#; och kan faktiskt vara mycket felaktigt om ditt urval inte var särskilt bra.

Du behöver därför ett sätt att mäta hur säker du är på att ditt resultat är korrekt och inte bara har uppstått av en slump. Statistiker använder två sammanlänkade begrepp för detta: konfidens och signifikans.

Denna sida förklarar dessa begrepp.

Statistisk signifikans

Begreppet signifikans har en mycket speciell innebörd inom statistiken. Det talar om hur sannolikt det är att ditt resultat inte har uppstått av en slump.

I diagrammet representerar den blå cirkeln hela populationen. När du tar ett urval kan ditt urval vara från hela populationen. Det är dock mer sannolikt att det är mindre. Om allt kommer från den gula cirkeln skulle du ha täckt en ganska stor del av populationen. Men du kan också ha otur (eller ha utformat ditt provtagningsförfarande på ett dåligt sätt) och bara ta ett prov från den lilla röda cirkeln. Detta skulle få allvarliga konsekvenser för huruvida ditt urval är representativt för h

.