Justert R-kvadrat - Oversikt, hvordan det fungerer, eksempel

Den justerte R-kvadraten er en modifisert versjon av R-kvadrat som står for prediktorer som ikke er signifikante i en regresjonsmodell. Med andre ord viser den justerte R-kvadraten om det å legge til flere prediktorer forbedrer en regresjonsmodell eller ikke. For å forstå justert R-kvadrat er det nødvendig med en forståelse av R-kvadrat.

Sammendrag:

  • Den justerte R-kvadraten er en modifisert versjon av R-kvadrat som justerer for prediktorer som ikke er signifikante i en regresjonsmodell.
  • Sammenlignet med en modell med tilleggsinngangsvariabler, indikerer en lavere justert R-kvadrat at tilleggsinngangsvariablene ikke gir verdi til modellen.
  • Sammenlignet med en modell med tilleggsinngangsvariabler, indikerer en høyere justert R-kvadrat at tilleggsinngangsvariablene gir verdien til modellen.

Hva er R-squared?

R-kvadratet, også kalt bestemmelseskoeffisienten Bestemmelseskoeffisient En bestemmelseskoeffisient (R² eller r-kvadrat) er et statistisk mål i en regresjonsmodell som bestemmer variansandelen i den avhengige, brukes til å forklare graden til hvilke inngangsvariabler (prediktorvariabler) som forklarer variasjonen av utgangsvariabler (predikerte variabler). Det varierer fra 0 til 1. For eksempel, hvis R-kvadrat er 0,9, indikerer det at 90% av variasjonen i utgangsvariablene er forklart av inngangsvariablene. Generelt sett indikerer en høyere R-kvadrat bedre passform for modellen. Tenk på følgende diagram:

Justert R-kvadrat

Den blå linjen refererer til linjen som passer best og viser forholdet mellom variabler. Linjen beregnes gjennom regresjonsanalyse Regresjonsanalyse Regresjonsanalyse er et sett med statistiske metoder som brukes for estimering av sammenhenger mellom en avhengig variabel og en eller flere uavhengige variabler. Den kan brukes til å vurdere styrken i forholdet mellom variabler og for å modellere det fremtidige forholdet mellom dem. og er tegnet der de loddrette avstandene (blå prikkede linjer) til de gule prikkene til linjen som passer best er minimert.

De gule prikkene refererer til plottet for inngangs- og utgangsvariabler. Inngangsvariabelen er plottet på x-aksen mens utgangsvariabelen er plottet på y-aksen. Grafen ovenfor består for eksempel av følgende datasett:

Justert R-kvadrat - Grafdata

De blå prikkede linjene refererer til avstanden til plottet for inngangs- og utgangsvariabler fra linjen som passer best. R-kvadratet er avledet fra avstanden til alle de gule prikkene fra linjen som passer best (den blå linjen). For eksempel vil følgende diagram illustrere en R-kvadrat på 1:

R-kvadrat 1

Problemer med R-kvadratet

R-kvadrat kommer med et iboende problem - tilleggsinngangsvariabler vil gjøre at R-kvadrat forblir det samme eller øker (dette skyldes hvordan R-kvadrat beregnes matematisk). Derfor, selv om tilleggsinngangsvariablene ikke viser noe forhold til utdatavariablene, vil R-kvadratet øke. Et eksempel som forklarer en slik hendelse er gitt nedenfor.

Forstå den justerte R-kvadraten

I hovedsak ser den justerte R-kvadraten på om flere inputvariabler bidrar til modellen. Tenk på et eksempel ved hjelp av data samlet inn av en pizzeeier, som vist nedenfor:

Eksempeldata

Anta at pizzaeieren kjører to regresjoner:

Regresjon 1: Pris på deig (inputvariabel), Pizzapris (outputvariabel)

Regresjon 1 gir en R-kvadrat på 0,9557 og en justert R-kvadrat på 0,9493.

Regresjon 2: Temperatur (inngangsvariabel 1), Pris på deig (inngangsvariabel 2), Pris på Pizza (utgangsvariabel)

Regresjon 2 gir en R-kvadrat på 0.9573 og en justert R-kvadrat på 0.9431.

Selv om temperaturen ikke skulle ha noen prediktiv effekt på prisen på en pizza, økte R-kvadraten fra 0,9557 (regresjon 1) til 0,9573 (regresjon 2). En person kan tro at regresjon 2 har høyere prediktiv kraft siden R-kvadrat er høyere. Selv om inngangsvariabelen for temperatur er ubrukelig i å forutsi prisen på en pizza, økte den R-kvadraten. Her kommer den justerte R-firkanten inn.

Den justerte R-kvadraten ser på om flere inputvariabler bidrar til modellen. Justert R-kvadrat i regresjon 1 var 0,9493 sammenlignet med justert R-kvadrat i regresjon 2 på 0,9493. Derfor er den justerte R-kvadraten i stand til å identifisere at inngangsvariabelen for temperatur ikke er nyttig for å forklare utgangsvariabelen (prisen på en pizza). I et slikt tilfelle vil den justerte R-firkanten peke modellskaperen til å bruke Regresjon 1 i stedet for Regresjon 2.

Eksempel på justert R-kvadrat

Tenk på to modeller:

  • Modell 1 bruker inngangsvariablene X1, X2 og X3 for å forutsi Y1.
  • Modell 2 bruker inngangsvariablene X1 og X2 for å forutsi Y1.

Hvilken modell skal brukes? Informasjon om begge modellene er gitt nedenfor:

Eksempel

Sammenligning av R-kvadrat mellom Model 1 og Model 2, forutser R-squared at Model 1 er en bedre modell ettersom den har større forklaringskraft (0.5923 i Model 1 vs. 0.5612 i Model 2).

Sammenlignet R-kvadrat mellom modell 1 og modell 2, forutser den justerte R-kvadraten at inngangsvariabelen X3 bidrar til å forklare utgangsvariabelen Y1 (0,4231 i modell 1 mot 0,3512 i modell 2).

Som sådan bør modell 1 brukes, da den ekstra X3-inngangsvariabelen bidrar til å forklare utgangsvariabelen Y1.

Tilleggsressurser

Finance tilbyr Financial Modelling & Valuation Analyst (FMVA) ™ FMVA®-sertifisering Bli med på 350 600 studenter som jobber for selskaper som Amazon, JP Morgan og Ferrari-sertifiseringsprogram for de som ønsker å ta karrieren til neste nivå. For å fortsette å lære og fremme karrieren din, vil følgende finansressurser være nyttige:

  • Grunnleggende statistikkbegreper for økonomi Grunnleggende statistikkbegreper for økonomi En solid forståelse av statistikk er avgjørende for å hjelpe oss med å bedre forstå økonomi. Videre kan statistikkonsepter hjelpe investorer å overvåke
  • High-Low Method vs. regresjonsanalyse High Low Method vs. regresjonsanalyse Den høye lave metoden og regresjonsanalysen er de to viktigste kostnadsestimeringsmetodene som brukes til å estimere mengden av faste og variable kostnader. Vanligvis må ledere dele blandede kostnader i sine faste og variable komponenter for å forutsi og planlegge for fremtiden.
  • Uavhengig variabel Uavhengig variabel En uavhengig variabel er en inngang, antagelse eller driver som endres for å vurdere dens innvirkning på en avhengig variabel (resultatet).
  • Typer av finansiell analyse Typer av finansiell analyse Finansiell analyse innebærer å bruke økonomiske data for å vurdere selskapets resultater og komme med anbefalinger om hvordan det kan forbedres fremover. Finansanalytikere utfører primært sitt arbeid i Excel, ved hjelp av et regneark for å analysere historiske data og lage anslag Typer av finansiell analyse

Siste innlegg