Normalfordeling - oversikt, parametere og egenskaper

Normalfordelingen blir også referert til som Gaussisk eller Gauss-fordeling. Distribusjonen er mye brukt innen naturvitenskap og samfunnsvitenskap. Det blir gjort relevant av Central Limit Theorem Central Limit Theorem Den sentrale grensesetningen sier at utvalgsgjennomsnittet for en tilfeldig variabel vil anta en nær normal eller normal fordeling hvis utvalgsstørrelsen er stor, som sier at gjennomsnittene oppnådd fra uavhengig, identisk distribuerte tilfeldige variabler Tilfeldig variabel En tilfeldig variabel (stokastisk variabel) er en type variabel i statistikk hvis mulige verdier avhenger av utfallet av et bestemt tilfeldig fenomen, har en tendens til å danne normale fordelinger, uavhengig av hvilken type fordeling de blir samplet fra.

Normal distribusjon

Form av normalfordeling

En normalfordeling er symmetrisk fra toppen av kurven, der gjennomsnittlig middelverdi er et essensielt begrep i matematikk og statistikk. Generelt refererer et gjennomsnitt til gjennomsnittet eller den vanligste verdien i en samling av er. Dette betyr at de fleste av de observerte dataene er gruppert nær gjennomsnittet, mens dataene blir mindre hyppige når de er lenger unna gjennomsnittet. Den resulterende grafen vises som klokkeformet der gjennomsnitt, median og modus Mode A-modus er den hyppigst forekommende verdien i et datasett. Sammen med gjennomsnitt og median er modus et statistisk mål på sentral tendens i et datasett som har de samme verdiene og vises på toppen av kurven.

Grafen er en perfekt symmetri, slik at hvis du bretter den i midten, vil du få to like halvdeler siden halvparten av de observerbare datapunktene faller på hver side av grafen.

Parametere for normalfordeling

De to hovedparametrene for en (normal) fordeling er gjennomsnittet og standardavviket. Parametrene bestemmer formen og sannsynlighetene for fordelingen. Distribusjonens form endres når parameterverdiene endres.

1. Gjennomsnitt

Gjennomsnittet brukes av forskere som et mål på sentral tendens. Den kan brukes til å beskrive fordelingen av variabler målt som forhold eller intervaller. I en normalfordelingsgraf definerer gjennomsnittet plasseringen av toppen, og de fleste datapunktene er gruppert rundt gjennomsnittet. Eventuelle endringer i verdien av gjennomsnittet flytter kurven enten til venstre eller høyre langs X-aksen.

2. Standardavvik

Standardavviket Standardavvik Fra et statistisk synspunkt er standardavviket til et datasett et mål på størrelsen på avvikene mellom verdiene til observasjonene som er inneholdt, måler spredningen av datapunktene i forhold til gjennomsnittet. Den bestemmer hvor langt borte fra gjennomsnittet datapunktene er plassert og representerer avstanden mellom gjennomsnittet og observasjonene.

På grafen bestemmer standardavviket kurvens bredde, og det strammer eller utvider distribusjonsbredden langs x-aksen. Vanligvis gir et lite standardavvik i forhold til gjennomsnittet en bratt kurve, mens et stort standardavvik i forhold til gjennomsnittet gir en flatere kurve.

Eiendommer

Alle former for (normal) distribusjon har følgende egenskaper:

1. Det er symmetrisk

En normalfordeling kommer med en perfekt symmetrisk form. Dette betyr at fordelingskurven kan deles i midten for å produsere to like halvdeler. Den symmetriske formen oppstår når halvparten av observasjonene faller på hver side av kurven.

2. Gjennomsnittet, medianen og modusen er like

Midtpunktet til en normalfordeling er punktet med maksimal frekvens, noe som betyr at den har flest observasjoner av variabelen. Midtpunktet er også punktet der disse tre tiltakene faller. Tiltakene er vanligvis like i en perfekt (normal) fordeling.

3. Empirisk regel

I normalt distribuerte data er det en konstant andel avstand som ligger under kurven mellom gjennomsnitt og spesifikt antall standardavvik fra gjennomsnittet. For eksempel faller 68,25% av alle tilfeller innenfor +/- ett standardavvik fra gjennomsnittet. 95% av alle tilfeller faller innenfor +/- to standardavvik fra gjennomsnittet, mens 99% av alle tilfeller faller innenfor +/- tre standardavvik fra gjennomsnittet.

4. Skjevhet og kurtose

Skjevhet og kurtose er koeffisienter som måler hvor forskjellig en fordeling er fra en normalfordeling. Skjevhet måler symmetrien til en normalfordeling mens kurtosis måler tykkelsen på halen ender i forhold til halene til en normalfordeling.

Historie om normal distribusjon

De fleste statistikere gir æren til den franske forskeren Abraham de Moivre for oppdagelsen av normale distribusjoner. I den andre utgaven av "Sjanselæren" bemerket Moivre at sannsynlighetene knyttet til diskret genererte tilfeldige variabler kunne tilnærmes ved å måle området under grafen til en eksponentiell funksjon.

Moivres teori ble utvidet av en annen fransk forsker, Pierre-Simon Laplace, i "Analytisk teori om sannsynlighet." Laplaces arbeid introduserte den sentrale grenseenheten som beviste at sannsynligheten for uavhengige tilfeldige variabler konvergerer raskt til områdene under en eksponentiell funksjon.

Tilleggsressurser

Finance er den offisielle leverandøren av den globale Financial Modelling & Valuation Analyst (FMVA) ™ FMVA®-sertifisering. Bli med på 350 600 studenter som jobber for selskaper som Amazon, JP Morgan og Ferrari-sertifiseringsprogram, designet for å hjelpe alle med å bli en finansanalytiker i verdensklasse . For å fortsette å lære og fremme karrieren din, vil de ekstra finansressursene nedenfor være nyttige:

  • Central Tendency Central Tendency Sentral tendens er et beskrivende sammendrag av et datasett gjennom en enkelt verdi som gjenspeiler sentrum av datadistribusjonen. Sammen med variabiliteten
  • Hypotesetesting Hypotesetesting Hypotesetesting er en metode for statistisk slutning. Den brukes til å teste om en uttalelse angående en populasjonsparameter er riktig. Hypotesetesting
  • Kurtosis Kurtosis Kurtosis er et statistisk mål som definerer hvor sterkt halene i en distribusjon skiller seg fra halene til en normalfordeling. Med andre ord,
  • Poisson-distribusjon Poisson-distribusjon Poisson-distribusjonen er et verktøy som brukes i sannsynlighetsteoristatistikk for å forutsi mengden variasjon fra en kjent gjennomsnittlig forekomsthastighet, innen

Siste innlegg