en klokkekurve, også kendt som normalfordeling, er den mest almindelige type distribution for en variabel. Det accepteres som en fordeling, der forekommer naturligt i mange situationer. I en klokkekurve definerer det højeste punkt i buen middelværdien, hvilket er det højeste antal forekomster af et element. Sandsynligheden for forekomster falder mod begge sider af kurven. Du kan bruge en klokkekurve til at sammenligne forestillinger ved at udelukke ekstremer eller definere dine forventninger ved muligheden for, at et resultat ligger inden for et interval til venstre eller højre for midten. I denne vejledning, Vi vil vise dig, hvordan du opretter en klokkekurve i udmærke sig med et reelt brugsscenarie som et eksempel.
Hent projektmappe
grundlæggende
alt hvad du behøver er gennemsnittet (gennemsnittet) og standardafvigelsesværdierne for dit datasæt. Begge disse metrics kan beregnes ved hjælp af formlerne nedenfor.
i betragtning af disse to værdier følger normalt distribuerede værdier disse regler:
- det samlede areal under kurven er lig med 1 (100%)
- midten af klokkekurven er gennemsnittet af datapunktet
- (1-liter) omkring 68,2% af arealet under kurven falder inden for en standardafvigelse (gennemsnitlig standardafvigelse)
- (2-95.5% af arealet under kurven falder inden for to standardafvigelser (gennemsnitlig standardafvigelse 2 * )
- (3-99,7% af arealet under kurven falder inden for tre standardafvigelser (gennemsnitlig standardafvigelse på 3 * )
billede fra University of Virginia
oprettelse af en klokkekurve i udmærke
lad os tage et almindeligt eksempel og sige, at vi analyserer eksamensresultater for en klasse af studerende. Vi bruger en klokkekurve til at måle eksamensresultater for bedre sammenligning.
vi begynder med at beregne metrics for at generere en normal distribueret data, som vil generere vores kurve. Vi skal beregne:
- gennemsnit (gennemsnit) af værdierne.
- standardafvigelse af værdierne.
- 3-standardafvigelsesgrænser for før og efter gennemsnit.
- intervalværdi for normalt distribuerede datapunkter. Dette kræver også en bestemmelse af intervallpunkterne. Du kan vælge et hvilket som helst nummer, men husk det, flere intervaller betyder mere præcision.
Metrics
Begynd med at beregne gennemsnits-og standardafvigelsen for dataene. Du kan bruge AVEREAGE og STDEV.P-funktioner til beregning af henholdsvis middel-og standardafvigelsesværdierne.
næste trin er at beregne de 3 standardafvigelsesværdier for at indstille minimums-og maksimumsværdierne for 99,7% af dataene.
maksimum = 83.23 – 3 * 5.54 = 99.86
når vi har indstillet minimums-og maksimumsværdierne for vores kurve, skal vi generere intervallerne. Intervalværdierne vil være grundlaget for de normalt distribuerede værdier. For at beregne intervallerne er alt, hvad du skal gøre, at opdele området mellem minimums-og maksimumsværdierne efter intervalantal. I dette eksempel indstiller vi dette til 20, men du kan bruge et større antal til at øge antallet af datapunkter.
når intervalværdien er beregnet, kan du generere datapunkterne. For at gøre dette skal du indtaste minimumsværdien i en celle. Indtast derefter formlen lige under minimumsværdien for at tilføje intervalværdien til minimum. Her brugte vi cellereferencer (som J4), som hjælper med at udfylde datapunkterne let op til den maksimale værdi.
det næste trin er at beregne de normalt distribuerede værdier fra de genererede datapunkter. Du kan bruge normen.DIST funktion til at generere disse værdier.
Brug de udfyldte datapunkter som funktionens første argument. Middel-og standardafvigelsesværdierne er de næste argumenter. Afslut formlen med en falsk boolsk værdi for at bruge ikke-kumulativ type af denne funktion.
diagram
vi er næsten færdige! Vælg datapunkterne og normalfordelingsværdierne, og indsæt derefter et scatter-diagram. Brug den spredte version med glatte linjer til at oprette en klokkekurve.
diagrammet kan virke lidt væk først. Lad os se, hvordan du kan få det til at se bedre ud.
for at ændre titlen på diagrammet skal du dobbeltklikke på titlen og opdatere navnet.
dobbeltklik derefter på aksen og definer minimums-og maksimumværdier fra panelet Akseindstillinger for at fjerne det hvide rum på begge sider. Dette giver dit diagram en bedre klokkeform. Vi sætter værdier, der ligger lidt uden for vores datasæt. For eksempel 66 – 100 for værdier 66.30-99.86.
du kan forbedre dit diagram yderligere ved at tilføje standardafvigelsesværdierne.