bassheel.pages.dev









Hur gör man bivariat analys

Bivariat analys kan hjälpa oss att bedöma hur mycket enklare det blir att predicera ett värde för en av våra variabler (vanligen den beroende variabeln) om vi känner till värdet av den andra variabeln (vanligen den oberoende variabeln).

Korrelation samt regressionsanalys

I detta på denna plats avsnittet bör oss titta närmare vid dem båda besläktade begreppen korrelation samt regressionsanalys. tillsammans hjälp från dessa term kunna oss hitta samband inom serier från observationsvärden, vilket oss inom sin tur förmå nyttja till för att erhålla ett förbättrad medvetande på grund av dem fenomen likt oss undersöker inom olika sammanhang.

Korrelation

Vi bestämmer oss till för att utföra enstaka studie var oss den inledande måndagen inom varenda tidsperiod beneath en helt års period beräknar antalet personer vid enstaka tågperrong mellan klockan 9 samt 10.

då året existerar slut således sammanställer oss resultaten inom ett tabell i enlighet med nedan.

I en spridningsdiagram låter man den en variabeln, kallad den förklarande variabeln, finnas längs x-axeln, samt den andra variabeln, responsvariabeln, finnas längs y-axeln. inom vårt modell existerar vilken tidsperiod detta existerar den förklarande variabeln samt antalet räknade personer vid perrongen responsvariabeln.

Hur man utför ett bivariat undersökning enstaka kvantitativ samt ett kvalitativ variabel.

på grund av varenda tillgängligt värde vid den förklarande variabeln markerar oss in dess motsvarande värde till responsvariabeln (i vårt fall existerar mot modell en från värdena vid den förklarande variabeln "mars" samt motsvarande värde vid responsvariabeln 105 personer). Utifrån denna serie observationsvärden kunna oss sedan undersöka ifall detta finns något samband mellan vilken kalendermånad detta existerar samt antalet personer liksom befunnit sig vid perrongen.

Detta fullfölja oss inledningsvis genom för att rita in våra observationsvärden inom en spridningsdiagram.

Markerar oss vid detta sätt varenda par från värden vid den förklarande variabeln samt responsvariabeln inom en spridningsdiagram, därför ser detta inom vårt modell ut vid nästa sätt:

Utifrån en spridningsdiagram kunna man sedan erhålla enstaka perception angående om detta finns något samband, alternativt korrelation, mellan den förklarande variabeln samt responsvariabeln.

Om observationsvärdena likt man besitter markerat inom spridningsdiagrammet ligger samlade runt ett tänkt linje tillsammans positiv lutning, således säger man för att detta finns ett positiv korrelation mellan den förklarande variabeln samt responsvariabeln.

Detta existerar fallet på grund av följd vilket markerats inom diagrammet nedan.

Om dem observationsvärden likt man markerat däremot ligger samlade runt ett tänkt linje tillsammans ett negativ lutning, därför kallar man detta enstaka negativ korrelation mellan den förklarande variabeln samt responsvariabeln, vilket oss ser en modell vid inom diagramet nedan.

I en fall likt vårt modell inom start från avsnittet, var detta varken verkar finnas enstaka positiv alternativt negativ korrelation mellan variablerna, säger man för att korrelation saknas samt oss är kapabel då dra slutsatsen för att detta utifrån våra observationsvärden ej tycks finnas något samband mellan vilken tidsperiod detta existerar samt hur flera personer vilket befinner sig vid perrongen.

Något likt existerar viktigt för att anlända minnas då oss fullfölja korrelationsundersökningar, existerar för att bara till för att detta finns enstaka korrelation mellan dem variabler oss tittar vid, således behöver detta ej finnas en orsakssamband.

I detta denna plats avsnittet bör oss titta närmare vid dem båda besläktade begreppen korrelation samt regressionsanalys.

tillsammans med detta menar oss för att även ifall detta finns enstaka korrelation mellan variablerna, därför förmå detta finnas någon ytterligare variabel liksom ej finns tillsammans med inom vår utvärdering, liksom redogör varför våra variabler samvarierar.

Om oss mot modell fullfölja ett analys var oss jämför ålder tillsammans förekomst från ett viss sjukdom, därför är kapabel detta existera därför för att detta finns ett kraftfull positiv korrelation mellan hur äldre ett individ existerar samt hur vanligt förekommande sjukdomen existerar.

Dock kunna oss ej utan vidare dra slutsatsen för att detta existerar upphöjd ålder såsom orsakat sjukdomen, då detta kunna finnas andra faktorer liksom agerar in, mot modell levnadsvanor, förekomst från andra sjukdomar, kostvanor tidigare inom existensen, etc. Därför bör man existera försiktig tillsammans med för att dra slutsatser ifall för att man funnit en orsakssamband, då man egentligen bara förmå äga funnit ett korrelation mellan dem studerade variablerna.

Regressionsanalys

Vi kunna utifrån en spridningsdiagram var oss ser en linjärt samband (antingen positiv alternativt negativ korrelation) förklara sambandet tillsammans med ett linjär modell alternativt tillsammans andra mening förklara sambandet tillsammans med hjälp från räta linjens ekvation vid formen

$$f(x) = kx + m$$

När oss söker efter ett linjär modell såsom beskriver sambandet mellan våra variabler, kallar man detta linjär regression alternativt regressionsanalys.

vad oss söker existerar alltså ett linje såsom våra markerade punkter avviker således lite ifrån liksom möjligt.

Hur man fullfölja enstaka bivariat regressionsanalys inom SPSS.

besitter oss en spridningsdiagram därför förmå oss på grund av grabb rita in enstaka sådan ungefärlig linje samt sedan ta reda vid linjens k-värde samt m-värde, vid identisk sätt liksom oss gjort tidigare utifrån kända punkter. Den räta linjens ekvation såsom oss försöker för att anlända fram mot kallas den maximalt anpassade ekvationen samt existerar den linje var avvikelsen ifrån dem markerade punkterna/mätvärdena inom diagrammet existerar således små såsom möjligt.

För för att ett fåtal fram enstaka därför detaljerad linjär anpassning såsom möjligt, använder man sig mot modell från liknande inbyggda funktioner till för att utföra linjär regression liksom finns vid flera grafritande miniräknare.

När man genom regressionsanalys väl besitter funnit enstaka ekvation såsom därför gott detta går beskriver detta statistiska underlag vilket man besitter, kunna man sedan nyttja denna raka modell mot för att förutse vad man kommer för att erhålla till värden nära andra mätpunkter.


Medellängden vid svenska barn

I spridningsdiagrammet nedan besitter oss markerat in medellängden (responsvariabel; längs y-axeln) vid svenska små människor inom åldrarna 1-16 tid (den förklarande variabeln; längs x-axeln).

Som oss förmå titta sålunda verkar detta finnas enstaka positiv linjär korrelation mellan åldern samt den genomsnittliga längden.

Därför är kapabel oss försöka för att hitta enstaka linjär modell till sambandet tillsammans med hjälp från enstaka linjär regressionsanalys.

Vi börjar tillsammans med för att dra ett rät linje såsom ligger vid en sådant sätt för att avvikelsen mellan sträcka samt punkterna blir således små såsom möjligt.

När oss idag besitter ett rät linje markerad inom vårt spridningsdiagram, förmå oss, liksom på grund av vilken ytterligare rät linje vilket helst, studera från koordinaterna på grund av numeriskt värde slumpmässiga punkter längs sträcka.

Dessa punkter behöver ej artikel någon från dem punkter liksom oss markerat inom diagrammet; punkterna längs sträcka likt oss läser från får även gärna ligga ner ett god bit ifrån varandra längs linje, således för att eventuella avläsningsfel blir mindre betydelsefulla.

I spridningsdiagrammet ovan äger oss markerat dem båda punkterna (4; 102,5) samt (15; 172).

När oss väl besitter funnit koordinaterna till numeriskt värde punkter längs sträcka, använder oss dessa till för att beräkna lutningen vid vår linje:

$$k=\frac{172-102,5}{15-4}=\frac{69,5}{11}\approx6,3$$

I nästa steg kalkylerar oss räta linjens ekvation inom dess totalitet, tillsammans med hjälp från antingen k-formen alternativt enpunktsformen.

Vi använder oss denna plats från k-formen, sätter in dem kända koordinaterna på grund av enstaka från punkterna längs linje samt får ut konstanttermen m:

$$f(x)=kx+m$$

$$172=\frac{69,5}{11}\cdot 15+m$$

$$m=172-\frac{69,5\cdot 15}{11}\approx77$$

När oss för tillfället känner mot värdet vid såväl riktningskoefficienten k likt konstanttermen m, äger oss vår sökta räta linjes ekvation:

$$f(x)=6,3x+77$$

Detta existerar alltså detta raka samband liksom oss äger funnit mellan ålder, x, samt genomsnittlig längd, y, utifrån vårt statistiska material.

Som oss skrev tidigare således förmå man nyttja ett linjär regression på grund av för att förutse framtida värden, detta önskar yttra inom vårt modell vilken längd ungar inom allmänhet kommer för att äga nära olika åldrar.

oss kunna utifrån detta raka sambandet förutse ungefär hur utdragen enstaka 13-åring är:

$$f(13)=6,3\cdot 13+77=158,9\,cm$$

En linjär regression, ifall analysen äger utförts riktig, stämmer väl inom detta intervall oss undersökt samt ofta även ett bit utanför detta, dock ju längre försvunnen ifrån detta intervall oss fått den raka regressionen ifrån, desto sämre fungerar ofta modellen.

Hur fullfölja man enstaka regressionsanalys?

Skulle oss nyttja vår raka modell ovan på grund av för att ta reda vid hur utdragen enstaka 50-åring existerar, därför får oss detta till

$$f(50)=6,3\cdot 50+77=392\,cm$$

En 50-åring från normallängd skulle i enlighet med den denna plats modellen alltså existera ca 3,92 meter utdragen, vilket visar vid för att modellen ej existerar tillämpbar vid vuxna människor (eftersom människor normalt slutar för att växa vid längden inom 18-20årsåldern).

Det existerar även troligt för att vår raka modell existerar dålig vid för att förutse riktigt unga barns längd, mot modell då barnet existerar nyfött, detta önskar yttra 0 tid gammalt (vilket oss även är kapabel ana oss mot ifall oss tittar inom spridningsdiagrammet på grund av åldern 1 år).

i enlighet med vår modell bör en 0 kalenderår gammalt ungar äga enstaka längd vid 77 cm, dock inom själva verket existerar genomsnittslängden till nyfödda unge ca 50 cm.


Vi avslutar tillsammans för att visa inom en modell hur oss kunna låta GeoGebra producera ett linjär modell ovan sambandet åt oss.

Ett konditori sålde semlor beneath åtta veckor mellan januari samt mars samt förde statistik ovan hur priset vid semlor påverkade försäljningen.

Tabellen nedan visar resultatet.

Priset per semla (kr)Antal avyttrade semlor 
361009
64440
72383
45660
54635
42732
39875
60618

Anpassa enstaka rät linje mot mätpunkterna, ange linjens ekvation samt vilken sorts korrelation sambandet visar.


  • hur  fullfölja man bivariat analys

  • Lösning:
    Vi börjar tillsammans med för att öppna GeoGebra, oss kommer denna gång nyttja Geogebra classic samt öppna en kalkylblad samt föra in värdena inom tabellen således på denna plats.

    Sedan markerar oss varenda våra värden samt klickar vid stapeldiagrammet längst bort upp samt väljer Tvåvariabels regressionsanalys vilket oss kunna titta inom bilden nedan.

    Då får oss upp en spridningsdiagram likt ser ut vilket följande:

    För för att producera vår raka modell, därför väljer oss Linjär inom rullgardinsmenyn

    Då skapas vår linje inom spridningsdiagrammet direkt samt längs ner kunna oss studera från linjens ekvation.

    Så svaret blir alltså för att linjens ekvation mot vår raka modell existerar ungefär (avrundat mot heltal) \(f(x) = -15x + 1436\) samt oss är kapabel titta för att sambandet motsvarar ett negativ korrelation.


    Sammanfattning

    Korrelation beskriver samband, både inom styrka samt riktning 

    Regressionsanalys existerar för att oss försöker beskriva sambandet tillsammans med enstaka linjär modell tillsammans med hjälp från räta linjens ekvation vid formen \(f(x) = kx + m \)

    Läs sidan på andra språk