Bestemmelseskoeffisient - Definisjon, tolkning, beregning

Bestemmelseskoeffisienten (R² eller r-kvadrat) er et statistisk mål i en regresjonsmodell som bestemmer andelen varians i den avhengige variabelen som kan forklares med den uavhengige variabelen Uavhengig variabel En uavhengig variabel er en inngang, antagelse eller driver som endres for å vurdere dens innvirkning på en avhengig variabel (utfallet). . Med andre ord forteller bestemmelseskoeffisienten en hvor godt dataene passer til modellen (godhet av passform).

Bestemmelseskoeffisient

Selv om bestemmelseskoeffisienten gir noen nyttige innsikter angående regresjonsmodellen, bør man ikke bare stole på tiltaket i vurderingen av en statistisk modell. Den avslører ikke informasjon om årsakssammenhengen mellom de uavhengige og avhengige variablene Avhengig variabel En avhengig variabel er en som vil endres avhengig av verdien til en annen variabel, kalt den uavhengige variabelen. og det indikerer ikke korrektheten til regresjonsmodellen. Derfor bør brukeren alltid trekke konklusjoner om modellen ved å analysere bestemmelseskoeffisienten sammen med andre variabler i en statistisk modell.

Bestemmelseskoeffisienten kan ta alle verdier mellom 0 og 1. I tillegg blir den statistiske beregningen ofte uttrykt i prosent.

Tolkning av bestemmelseskoeffisienten (R²)

Den vanligste tolkningen av bestemmelseskoeffisienten er hvor godt regresjonsmodellen passer til de observerte dataene. For eksempel viser en bestemmelseskoeffisient på 60% at 60% av dataene passer til regresjonsmodellen. Generelt sett indikerer en høyere koeffisient bedre passform for modellen.

Det er imidlertid ikke alltid slik at en høy r-kvadrat er bra for regresjonsmodellen. Kvaliteten på koeffisienten avhenger av flere faktorer, inkludert måleenhetene til variablene, arten av variablene som brukes i modellen, og den anvendte datatransformasjonen. Noen ganger kan en høy koeffisient indikere problemer med regresjonsmodellen.

Ingen universell regel styrer hvordan man innlemmer bestemmelseskoeffisienten i vurderingen av en modell. Konteksten som prognosen eller eksperimentet er basert på er ekstremt viktig, og i forskjellige scenarier kan innsikten fra den statistiske beregningen variere.

Beregning av koeffisienten

Matematisk kan bestemmelseskoeffisienten bli funnet ved hjelp av følgende formel:

Formel

Hvor:

  • SS regresjon - summen av kvadrater på grunn av regresjon (forklart sum av kvadrater)
  • SS total - den totale summen av firkanter

Selv om begrepene "total sum av kvadrater" og "sum av kvadrater på grunn av regresjon" virker forvirrende, er variablens betydninger enkle.

Den totale summen av firkanter måler variasjonen i de observerte dataene (data brukt i regresjonsmodellering). Summen av kvadrater på grunn av regresjon måler hvor godt regresjonsmodellen representerer dataene som ble brukt til modellering.

Flere ressurser

Finance er den offisielle leverandøren av den globale Financial Modelling & Valuation Analyst (FMVA) ™ FMVA®-sertifisering. Bli med på 350 600 studenter som jobber for selskaper som Amazon, JP Morgan og Ferrari-sertifiseringsprogram, designet for å hjelpe alle med å bli en finansanalytiker i verdensklasse . For å fortsette å lære og fremme karrieren din, vil de ekstra finansressursene nedenfor være nyttige:

  • Grunnleggende statistikkbegreper i økonomi Grunnleggende statistikkbegreper for økonomi En solid forståelse av statistikk er avgjørende for å hjelpe oss med å bedre forstå økonomi. Videre kan statistikkonsepter hjelpe investorer å overvåke
  • Binomialfordeling Binomialfordeling Binomialfordeling er en vanlig sannsynlighetsfordeling som modellerer sannsynligheten for å oppnå ett av to utfall under et gitt antall parametere
  • Central Limit Theorem Central Limit Theorem The Central Limit Theorem sier at prøvenes gjennomsnitt av en tilfeldig variabel vil anta en nesten normal eller normal fordeling hvis utvalgsstørrelsen er stor
  • Regresjonsanalyse Regresjonsanalyse Regresjonsanalyse er et sett med statistiske metoder som brukes til estimering av sammenhenger mellom en avhengig variabel og en eller flere uavhengige variabler. Den kan brukes til å vurdere styrken i forholdet mellom variabler og for å modellere det fremtidige forholdet mellom dem.

Siste innlegg