Flere lineære regresjoner - oversikt, formel, hvordan det fungerer

Flere lineære regresjoner refererer til en statistisk teknikk som brukes til å forutsi utfallet av en variabel basert på verdien av to eller flere variabler. Det er noen ganger kjent som multippel regresjon, og det er en utvidelse av lineær regresjon. Variabelen som vi vil forutsi er kjent som den avhengige variabelen, mens variablene vi bruker for å forutsi verdien av den avhengige variabelen Avhengig variabel En avhengig variabel er en som vil endres avhengig av verdien til en annen variabel, kalt den uavhengige variabelen. er kjent som uavhengige eller forklarende variabler.

Flere lineære regresjonerFigur 1: Flere lineære regresjonsmodellspådommer for individuelle observasjoner (Kilde)

Sammendrag

  • Flere lineære regresjoner refererer til en statistisk teknikk som bruker to eller flere uavhengige variabler for å forutsi resultatet av en avhengig variabel.
  • Teknikken gjør det mulig for analytikere å bestemme variasjonen i modellen og det relative bidraget til hver uavhengige variabel i den totale variansen.
  • Flere regresjoner kan ha to former, dvs. lineær regresjon og ikke-lineær regresjon.

Flere lineære regresjonsformler

Flere lineære regresjoner - formel

Hvor:

  • yi er den avhengige variabel eller forutsagte
  • β0 er y-skjæringspunktet, dvs. verdien av y når både xi og x2 er 0.
  • β1 og β2 er regresjonskoeffisientene som representerer endringen i y i forhold til en enhetsendring i henholdsvis xi1 og xi2 .
  • βp er stigningskoeffisienten for hver uavhengige variabel
  • ϵ er modellens tilfeldige feil (gjenværende) betegnelse.

Forstå flere lineær regresjon

Enkel lineær regresjon gjør det mulig for statistikere å forutsi verdien av en variabel ved hjelp av tilgjengelig informasjon om en annen variabel. Lineær regresjon prøver å etablere forholdet mellom de to variablene langs en rett linje.

Multipel regresjon er en type regresjon der den avhengige variabelen viser et lineært forhold med to eller flere uavhengige variabler. Det kan også være ikke-lineær , der de avhengige og uavhengige variablene Uavhengig variabel En uavhengig variabel er en inngang, antagelse eller driver som endres for å vurdere dens innvirkning på en avhengig variabel (utfallet). ikke følg en rett linje.

Både lineær og ikke-lineær regresjon sporer et bestemt svar ved å bruke to eller flere variabler grafisk. Imidlertid er ikke-lineær regresjon vanligvis vanskelig å utføre, siden den er opprettet fra antagelser avledet fra prøving og feiling.

Antakelser om flere lineære regresjoner

Flere lineære regresjoner er basert på følgende antagelser:

1. En lineær sammenheng mellom de avhengige og uavhengige variablene

Den første antagelsen om multippel lineær regresjon er at det er et lineært forhold mellom den avhengige variabelen og hver av de uavhengige variablene. Den beste måten å sjekke de lineære forholdene er å lage spredningsplotter og deretter visuelt inspisere spredningsdiagrammer for linearitet. Hvis forholdet som vises i spredningsdiagrammet ikke er lineært, må analytikeren kjøre en ikke-lineær regresjon eller transformere dataene ved hjelp av statistisk programvare, for eksempel SPSS.

2. De uavhengige variablene er ikke sterkt korrelert med hverandre

Dataene skal ikke vise multikollinearitet, som oppstår når de uavhengige variablene (forklarende variabler) er sterkt korrelert med hverandre. Når uavhengige variabler viser multikollinearitet, vil det være problemer med å finne ut den spesifikke variabelen som bidrar til variansen i den avhengige variabelen. Den beste metoden for å teste for antagelsen er metoden Variance Inflation Factor.

3. Avviket til restene er konstant

Flere lineære regresjoner antar at feilmengden i restene er lik på hvert punkt i den lineære modellen. Dette scenariet er kjent som homoscedasticity. Ved analyse av dataene, bør analytikeren plotte de standardiserte restene mot de forutsagte verdiene for å avgjøre om poengene er fordelt rett over alle verdiene til uavhengige variabler. For å teste antagelsen, kan dataene plottes på et scatterplot eller ved hjelp av statistisk programvare for å produsere et scatterplot som inkluderer hele modellen.

4. Uavhengighet av observasjon

Modellen forutsetter at observasjonene skal være uavhengige av hverandre. Enkelt sagt antar modellen at verdiene til restene er uavhengige. For å teste for denne antagelsen bruker vi Durbin Watson-statistikken.

Testen vil vise verdier fra 0 til 4, hvor en verdi fra 0 til 2 viser positiv autokorrelasjon, og verdier fra 2 til 4 viser negativ autokorrelasjon. Midtpunktet, dvs. en verdi på 2, viser at det ikke er noen autokorrelasjon.

5. Multivariat normalitet

Multivariat normalitet oppstår når residualer blir normalt fordelt. For å teste denne antagelsen, se på hvordan verdiene til restene fordeles. Det kan også testes ved hjelp av to hovedmetoder, dvs. et histogram med en overlagret normalkurve eller metoden Normal sannsynlighetsplott.

Flere ressurser

Finance tilbyr Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ -sertifisering Certified Banking & Credit Analyst (CBCA) ™ akkreditering er en global standard for kredittanalytikere som dekker økonomi, regnskap, kredittanalyse, kontantstrømanalyse, covenant modellering, lån tilbakebetaling og mer. sertifiseringsprogram for de som ønsker å ta karrieren til neste nivå. For å fortsette å lære og utvikle kunnskapsbasen din, kan du utforske de relevante relevante finansressursene nedenfor:

  • Prognosemetoder Prognosemetoder Topp prognosemetoder. I denne artikkelen vil vi forklare fire typer inntektsprognosemetoder som analytikere bruker for å forutsi fremtidige inntekter.
  • Poisson-distribusjon Poisson-distribusjon Poisson-distribusjonen er et verktøy som brukes i sannsynlighetsteoristatistikk for å forutsi mengden variasjon fra en kjent gjennomsnittlig forekomsthastighet, innen
  • Tilfeldig variabel Tilfeldig variabel En tilfeldig variabel (stokastisk variabel) er en type variabel i statistikk hvis mulige verdier avhenger av utfallet av et bestemt tilfeldig fenomen
  • Regresjonsanalyse Regresjonsanalyse Regresjonsanalyse er et sett med statistiske metoder som brukes til estimering av sammenhenger mellom en avhengig variabel og en eller flere uavhengige variabler. Den kan brukes til å vurdere styrken i forholdet mellom variabler og for å modellere det fremtidige forholdet mellom dem.

Siste innlegg