Central Limit Theorem - Oversikt, historie og eksempel

The Central Limit Theorem (CLT) er et statistisk begrep som sier at prøvenes gjennomsnittfordeling av en tilfeldig variabel vil anta en nesten normal eller normal fordeling hvis utvalgsstørrelsen er stor nok. I enkle termer sier teoremet at samplingsfordelingen av gjennomsnittet middelverdi er et essensielt begrep i matematikk og statistikk. Generelt refererer et gjennomsnitt til gjennomsnittet eller den vanligste verdien i en samling tilnærminger til en normalfordeling når størrelsen på prøven øker, uavhengig av formen til den opprinnelige populasjonsfordelingen.

Central Limit Theorem (CLT) Diagram som viser konvergens til normalfordeling

Når brukeren øker antall prøver til 30, 40, 50, etc., vil grafen til prøveinnretningen bevege seg mot en normalfordeling. Utvalgsstørrelsen må være 30 eller høyere for at den sentrale grensesetningen skal opprettholdes.

En av de viktigste komponentene i teoremet er at gjennomsnittet av prøven vil være gjennomsnittet for hele befolkningen. Hvis du beregner gjennomsnittet av flere prøver av befolkningen, legger dem sammen og finner gjennomsnittet, blir resultatet estimatet av befolkningens gjennomsnitt.

Det samme gjelder når du bruker standardavvik Standardavvik Fra et statistisk synspunkt er standardavviket til et datasett et mål på størrelsen på avvikene mellom verdiene til observasjonene som finnes. Hvis du beregner standardavviket til alle prøvene i populasjonen, legger dem sammen og finner gjennomsnittet, blir resultatet standardavviket for hele populasjonen.

Hvordan fungerer sentralbegrensningssetningen?

Den sentrale grensesetningen danner grunnlaget for sannsynlighetsfordelingen. Det gjør det enkelt å forstå hvordan populasjonsestimater oppfører seg når de blir utsatt for gjentatt prøvetaking Type II Error I statistisk hypotesetesting er en type II-feil en situasjon der en hypotesetest ikke klarer å avvise nullhypotesen som er falsk. I andre . Når tegningen er tegnet i en graf, viser setningen formen på fordelingen som dannes ved hjelp av gjentatte populasjonsprøver.

Når prøvestørrelsene blir større, har fordelingen av midlene fra de gjentatte prøvene en tendens til å normalisere seg og ligne en normalfordeling. Resultatet forblir det samme uavhengig av hva den opprinnelige formen på distribusjonen var. Det kan illustreres i figuren nedenfor:

Central Limit Theorem (CLT) - Hvordan det oppstår

Fra figuren ovenfor kan vi trekke ut at til tross for at den opprinnelige formen på distribusjonen var ensartet, har den en tendens til en normalfordeling når verdien av n (prøvestørrelse) øker.

Bortsett fra å vise formen som prøven betyr, vil sentralgrense-setningen også gi en oversikt over gjennomsnittet og variansen til fordelingen. Utvalgssnittet av fordelingen er det faktiske populasjonsgjennomsnittet som prøvene ble tatt fra.

Variansen til prøvefordelingen er derimot variansen til populasjonen delt på n . Derfor, jo større prøvestørrelsen på fordelingen er, desto mindre er variansen til prøven.

Eksempel på Central Limit Theorem

En investor er interessert i å estimere avkastningen til ABC-aksjemarkedsindeksen som består av 100.000 aksjer. På grunn av den store størrelsen på indeksen Dow Jones Industrial Average (DJIA) Dow Jones Industrial Average (DJIA), også ofte referert til som "Dow Jones" eller bare "Dow", er en av de mest populære og mest anerkjente aksjemarkedsindekser, er ikke investoren i stand til å analysere hver aksje uavhengig, og velger i stedet å bruke stikkprøver for å få et estimat av den totale avkastningen til indeksen.

Investoren plukker ut stikkprøver av aksjene, med hvert utvalg som inneholder minst 30 aksjer. Prøvene må være tilfeldige, og eventuelle tidligere utvalgte prøver må byttes ut i påfølgende prøver for å unngå skjevhet.

Hvis den første prøven gir en gjennomsnittlig avkastning på 7,5%, kan den neste prøven gi en gjennomsnittlig avkastning på 7,8%. Med arten av randomisert prøvetaking, vil hver prøve gi et annet resultat. Når du øker størrelsen på utvalgsstørrelsen for hvert utvalg du velger, begynner utvalget å danne sine egne distribusjoner.

Fordelingen av prøveinnretningen vil bevege seg mot normal når verdien av n øker. Gjennomsnittlig avkastning av aksjene i prøveindeksen anslår avkastningen til hele indeksen på 100 000 aksjer, og gjennomsnittlig avkastning fordeles normalt.

Historien om sentralgrenseteoremet

Den opprinnelige versjonen av den sentrale grensesetningen ble laget av Abraham De Moivre, en franskfødt matematiker. I en artikkel publisert i 1733 brukte De Moivre normalfordelingen for å finne antall hoder som skyldes flere kast av en mynt. Konseptet var upopulært på den tiden, og det ble raskt glemt.

Imidlertid ble konseptet i 1812 gjeninnført av Pierre-Simon Laplace, en annen berømt fransk matematiker. Laplace introduserte normalfordelingskonseptet i sitt arbeid med tittelen "Théorie Analytique des Probabilités", der han forsøkte å tilnærme binomialfordeling med normalfordeling.

Matematikeren fant at gjennomsnittet av uavhengige tilfeldige variabler, når de økte i antall, har en tendens til å følge en normalfordeling. På den tiden vakte Laplaces funn om den sentrale grensesetningen oppmerksomhet fra andre teoretikere og akademikere.

Senere i 1901 ble den sentrale grensesetningen utvidet av Aleksandr Lyapunov, en russisk matematiker. Lyapunov gikk et skritt foran å definere konseptet generelt og bevise hvordan konseptet fungerte matematisk. De karakteristiske funksjonene han brukte for å gi teoremet ble tatt i bruk i moderne sannsynlighetsteori.

Relaterte målinger

Finance er den offisielle leverandøren av den globale Financial Modelling & Valuation Analyst (FMVA) ™ FMVA®-sertifisering. Bli med på 350 600 studenter som jobber for selskaper som Amazon, JP Morgan og Ferrari-sertifiseringsprogram, designet for å hjelpe alle med å bli en finansanalytiker i verdensklasse . For å fortsette å lære og fremme karrieren din, vil de ekstra finansressursene nedenfor være nyttige:

  • Bayes 'teorem Bayes' teorem I statistikk og sannsynlighetsteori er Bayes teorem (også kjent som Bayes 'regel) en matematisk formel som brukes til å bestemme den betingede
  • Central Tendency Central Tendency Sentral tendens er et beskrivende sammendrag av et datasett gjennom en enkelt verdi som gjenspeiler sentrum av datadistribusjonen. Sammen med variabiliteten
  • Loven om store tall Loven om store tall I statistikk og sannsynlighetsteori er loven om store tall en setning som beskriver resultatet av å gjenta det samme eksperimentet et stort antall
  • Total sannsynlighetsregel Total sannsynlighetsregel Total sannsynlighetsregel (også kjent som loven om total sannsynlighet) er en grunnleggende regel i statistikk knyttet til betinget og marginal

Siste innlegg