Raporti i analizës së korrelacionit. Korrelacionet në tezat në psikologji

Konceptet bazë të analizës së korrelacionit

Ka disa lloje lidhjet midis variablave:

Varësia e korrelacionit supozon konsistencën e ndërsjellë të ndryshimeve në sasitë e ndryshueshme, si dhe faktin që këto ndryshime mund të maten një herë ose në mënyrë të përsëritur (në këtë rast flasim për dendësinë e lidhjeve midis variablave, por jo për marrëdhëniet shkak-pasojë); për shembull, në shoqërinë moderne ruse, sa më e lartë të jetë mosha, aq më i ulët është statusi shoqëror i një personi; manifestimet individuale të gerontokracisë nuk e cenojnë këtë model.

Ndikimi funksional supozon se ndryshimet në variablin e pavarur shoqërohen me ndryshime gjithnjë e më të përshpejtuara në variablin e varur (marrëdhëniet shkakësore regjistrojnë ndikimin e ndryshores së pavarur në varur); për shembull, sa më radikale të ketë një person pikëpamje politike, aq më shumë nuk e pranon regjimin ekzistues politik; në të njëjtën kohë, nuk mund të argumentohet se sa më shumë që një person e vlerëson negativisht pushtetin, aq më radikale ka pikëpamjet e tij.

Varësia funksionale - lidhja e variablave, që do të thotë se një ndryshim në një variabël ndikon në një ndryshim në një tjetër, i cili nga ana tjetër ndikon në variablin e parë, d.m.th. këto janë lidhje ndërveprimi; për shembull, ndërgjegjësimi i një personi për politikën lidhet drejtpërdrejt me interesin për të; Sa më shumë interesohet një person për politikën, aq më shumë e kupton atë.

Marrëdhënia mund të jetë jolineare dhe jo monotonike.

Cilido qoftë lloji i lidhjes ndërmjet variablave përfundimisht rezulton të jetë, është e nevojshme të siguroheni që ajo ekziston në parim. Analiza e korrelacionit përdoret për të sqaruar ndërveprimin dhe tendencat në karakteristikat e fenomenit që studiohet.

Faza fillestare e zhvillimit të saj konsiderohet të jetë periudha e viteve 1870-1880, dhe autori i konceptit të "koeficientit të korrelacionit" është Francis Galton. Zhvillimet më serioze në fushën e analizës së korrelacionit në kapërcyellin e shekujve 19-20. interpretuar nga Karl Pearson. Tradicionalisht, analiza e korrelacionit përdoret për të testuar një hipotezë në lidhje me varësinë statistikore të dy ose më shumë variablave. Si ndihmë, analiza e korrelacionit mund të përdoret për të testuar përshtatshmërinë e hipotezave eksperimentale dhe për të përfshirë variabla në analizat e faktorëve dhe regresionit. Analiza e korrelacionit kryhet duke krahasuar dhe kontrastuar seritë e shpërndarjes të ndërtuara në bazë të grupimeve të bazuara në karakteristika të ndryshme.

Korrelacioni - prania e një marrëdhënie statistikore midis karakteristikave, kur çdo vlerë specifike e një karakteristike X korrespondon me një vlerë të caktuar U (ose një kompleks vlerash të shpërndarjes së serisë K). Analiza e korrelacionit sqaron marrëdhënien funksionale midis sasive të ndryshueshme, e cila karakterizohet nga fakti se çdo vlerë e njërës prej tyre korrespondon me një vlerë shumë specifike të tjetrës. Megjithatë, analiza e korrelacionit nuk nënkupton identifikimin e marrëdhënieve shkakësore, prandaj, kur interpretohen rezultatet, formulimet si "ndryshueshme X ndikon në variablin y" ose "ndryshueshme X varet nga ndryshorja y" e papranueshme.

Të dallojë Dhomë Avulli Dhe korrelacione të shumta. Korrelacioni i çiftëzuar karakterizon llojin, formën dhe dendësinë e lidhjeve midis dy karakteristikave, të shumëfishta - midis disa.

Varësia e korrelacionit ndodh më shpesh kur një fenomen është nën ndikimin e një numri të madh faktorësh që veprojnë me forca të ndryshme, prandaj ekzistojnë masa të veçanta të korrelacionit, të quajtura koeficientët e korrelacionit. Koeficientët (në statistikë numri i tyre i përgjithshëm arrin në dhjetëra) tregojnë shkallën e ndërlidhjes midis dukurive ( dendësia e korrelacionit, ndonjëherë studiuesit flasin për intensiteti i lidhjes) dhe natyra e kësaj lidhjeje ( fokusi ). Komunikimi mund të jetë i drejtpërdrejtë dhe i kundërt. Për shembull, sa më i vjetër të jetë votuesi, aq më aktivisht ai merr pjesë në zgjedhje. Sa më i lartë të jetë niveli i të ardhurave të njerëzve, aq më pak ka gjasa që ata të marrin pjesë në zgjedhje si votues (feedback). Sa më i lartë të jetë koeficienti i korrelacionit midis dy variablave, aq më saktë mund të parashikoni vlerat e njërës nga vlerat e tjetrës. Natyra e lidhjes përcaktohet gjithashtu në kategoritë " monotone "(drejtimi i ndryshimit në një variabël nuk ndryshon kur ndryshon ndryshorja e dytë) dhe " jo monotonike " lidhje. Përveç vlerësimit të densitetit dhe drejtimit të komunikimit, është e nevojshme të merret parasysh besueshmëria (besueshmëria ) lidhjet.

Analiza e korrelacionit zgjidh vazhdimisht tre probleme praktike:

    përcaktimi i fushës së korrelacionit dhe hartimi i një tabele korrelacioni (në këtë rast është një tabelë e kombinuar);

    llogaritja e marrëdhënieve të korrelacionit të mostrës ose koeficientëve të korrelacionit;

    testimi i hipotezës statistikore të rëndësisë së marrëdhënies.

Koeficienti i korrelacionit nuk përmban informacion nëse marrëdhënia midis tyre është shkak-pasojë ose shoqëruese (e krijuar nga një shkak i përbashkët). Studiuesi duhet ta zgjidhë këtë pyetje në mënyrë të pavarur mbi bazën e ideve kuptimplota për strukturën, dinamikën e objekteve shoqërore që studiohen, korrelacionet midis karakteristikave që studiohen dhe të përdorë metoda të tjera të analizës statistikore (regresion, faktor, diskriminues, rrugë, etj. ). Por vlera e koeficientit na lejon të vlerësojmë densitetin e lidhjes si më të vogël (të parëndësishme) ose më të madhe. Me shenjën e koeficientit të korrelacionit për seritë rendore, mund të dallojmë nëse kjo marrëdhënie është e drejtpërdrejtë apo e anasjelltë (për seritë nominale, shenja e koeficientit nuk ka asnjë kuptim).

Për të vendosur një korrelacion midis dy karakteristikave, është e nevojshme të vërtetohet se të gjitha variablat e tjerë nuk ndikojnë në marrëdhënien midis dy variablave që janë objekt studimi. Ndryshe krijohet situata korrelacion i rremë. Sekreti i një korrelacioni të rremë qëndron në faktin se dy dukuri, lidhja e të cilave mbështetet zyrtarisht nga prania e një lidhjeje statistikore, kanë një shkak të përbashkët që prek njësoj secilin prej tyre.

Analiza e korrelacionit paraprihet nga një fazë llogaritjeje statistikat X 2 - Por në bazë të vlerës së përftuar statistikore X 2 nuk mund të themi asgjë për densitetin e lidhjes së variablave të analizuar. Për të zgjidhur këtë problem, është e nevojshme t'i drejtohemi koeficientëve të korrelacionit.

Mënyra tradicionale për të kryer analizën e korrelacionit është t'i referohemi koeficientit të korrelacionit Pearson (Pearson) R (në literaturë shënohet edhe me r).

Nëse, kur përshkruhet një objekt politik, përcaktohet vetëm prania ose mungesa e një karakteristike, ose nëse studiohet marrëdhënia midis karakteristikave alternative, atëherë tabelat e korrelacionit (tabelat e një karakteristike të konjuguar) janë 4-qelizore. Në këtë rast aplikoni Koeficient Yula (O) Dhe faktor kontingjent (f). Ato bazohen në parimin e bashkëngjitjes së ngjarjeve (vlerat e veçorive të objektit të studimit) dhe janë të përshtatshme për analizën e çdo veçorie (metrike, rendore dhe madje nominale).

Nëse shkallët nominale kanë më shumë vlera se dy, atëherë për të përcaktuar marrëdhënien midis karakteristikave, përdoren koeficientët e kontigjencës Pearson ( R ), Chuprov (7) dhe Kramer (TO). Në këtë rast, dimensioni i tabelës ka një kuptim të caktuar Me te, i cili shfaq vlerat e dy karakteristikave. Koeficientët Chuprov Dhe Kramer konsiderohen më “të rrepta” se Koeficienti i kontingjentit Pearson. Por meqenëse llogaritjet në to bazohen në statistikat x2, atëherë të gjitha kufizimet që lidhen me të zbatohen për këta koeficientë.

Koeficienti i korrelacionit të shumëfishtë (IV), që nganjëherë quhet koeficient përputhje, përdoret për të vlerësuar konsistencën e dy ose më shumë serive të vlerave të variablave të renditura.

Ekzistojnë dy mundësi për llogaritjen e koeficientëve të korrelacionit midis karakteristikave në paketën statistikore SPSS.

Analiza e korrelacionit

Korrelacioni- marrëdhënie statistikore ndërmjet dy ose më shumë variablave të rastësishëm (ose variablave që mund të konsiderohen si të tillë me një shkallë të pranueshme saktësie). Për më tepër, ndryshimet në një ose më shumë nga këto sasi çojnë në një ndryshim sistematik në një tjetër ose në sasi të tjera. Një masë matematikore e korrelacionit midis dy ndryshoreve të rastit është koeficienti i korrelacionit.

Korrelacioni mund të jetë pozitiv dhe negativ (është gjithashtu e mundur që të mos ketë lidhje statistikore - për shembull, për variablat e pavarur të rastësishëm). Korrelacion negativ - korrelacioni, në të cilin një rritje në një variabël shoqërohet me një rënie në një variabël tjetër, dhe koeficienti i korrelacionit është negativ. Korrelacion pozitiv - korrelacioni, në të cilin një rritje në një variabël shoqërohet me një rritje në një variabël tjetër dhe koeficienti i korrelacionit është pozitiv.

Autokorrelacioni - marrëdhënie statistikore midis variablave të rastësishëm nga e njëjta seri, por të marra me një zhvendosje, për shembull, për një proces të rastësishëm - me një zhvendosje kohore.

Le X,Y- dy ndryshore të rastësishme të përcaktuara në një hapësirë ​​probabiliteti. Pastaj koeficienti i korrelacionit të tyre jepet me formulën:

,

ku cov tregon kovariancë, dhe D është variancë, ose ekuivalente,

,

ku simboli tregon pritjen matematikore.

Për të paraqitur grafikisht një marrëdhënie të tillë, mund të përdorni një sistem koordinativ drejtkëndor me boshte që korrespondojnë me të dy variablat. Çdo palë vlerash shënohet me një simbol specifik. Ky grafik quhet "shpërndarje".

Metoda për llogaritjen e koeficientit të korrelacionit varet nga lloji i shkallës së cilës i përkasin variablat. Kështu, për të matur variablat me shkallë intervali dhe sasiore, është e nevojshme të përdoret koeficienti i korrelacionit Pearson (korrelacioni i momentit të produktit). Nëse të paktën një nga dy variablat është në një shkallë rendore ose nuk shpërndahet normalisht, duhet të përdoret korrelacioni i gradës së Spearman ose τ (tau) i Kendalit. Në rastin kur një nga dy variablat është dikotomike, përdoret një korrelacion pikë-biserial, dhe nëse të dy variablat janë dikotomikë: një korrelacion me katër fusha. Llogaritja e koeficientit të korrelacionit ndërmjet dy ndryshoreve jo dikotomike ka kuptim vetëm kur marrëdhënia ndërmjet tyre është lineare (njëdrejtimshe).

Koeficienti i korrelacionit Kendell

Përdoret për të matur çrregullimin e ndërsjellë.

Koeficienti i korrelacionit Spearman

Vetitë e koeficientit të korrelacionit

nëse marrim kovariancën si produkt skalar të dy ndryshoreve të rastit, atëherë norma e ndryshores së rastit do të jetë e barabartë me , dhe pasoja e pabarazisë Cauchy-Bunyakovsky do të jetë: . , Ku. Për më tepër, në këtë rast shenjat dhe k përputhen: .

Analiza e korrelacionit

Analiza e korrelacionit- metoda e përpunimit të të dhënave statistikore, e cila konsiston në studimin e koeficientëve ( korrelacionet) ndërmjet variablave. Në këtë rast, koeficientët e korrelacionit midis një çifti ose shumë çiftesh karakteristikash krahasohen për të vendosur marrëdhënie statistikore midis tyre.

Synimi analiza e korrelacionit- jepni disa informacione për një variabël duke përdorur një variabël tjetër. Në rastet kur është e mundur të arrihet një qëllim, variablat thuhet se janë korrelojnë. Në formën e tij më të përgjithshme, pranimi i hipotezës së një korrelacioni do të thotë se një ndryshim në vlerën e ndryshores A do të ndodhë njëkohësisht me një ndryshim proporcional në vlerën e B: nëse të dy variablat rriten, atëherë korrelacioni është pozitiv, nëse një ndryshore rritet dhe tjetra zvogëlohet, korrelacioni është negativ.

Korrelacioni pasqyron vetëm varësinë lineare të vlerave, por nuk pasqyron lidhjen funksionale të tyre. Për shembull, nëse llogaritni koeficientin e korrelacionit midis sasive A = sin(x) Dhe B = cos(x) , atëherë do të jetë afër zeros, d.m.th. nuk ka varësi ndërmjet sasive. Ndërkohë, sasitë A dhe B janë dukshëm të lidhura funksionalisht sipas ligjit sin 2 (x) + cos 2 (x) = 1 .

Kufizimet e analizës së korrelacionit

Grafikët e shpërndarjeve të çifteve (x,y) me koeficientët përkatës të korrelacionit x dhe y për secilën prej tyre. Vini re se koeficienti i korrelacionit pasqyron një marrëdhënie lineare (vija e sipërme), por nuk përshkruan një kurbë marrëdhëniesh (vija e mesme) dhe nuk është aspak i përshtatshëm për të përshkruar marrëdhënie komplekse, jolineare (vija e poshtme).

  1. Aplikimi është i mundur nëse ka një numër të mjaftueshëm rastesh për studim: për një lloj të veçantë, koeficienti i korrelacionit varion nga 25 në 100 palë vëzhgimesh.
  2. Kufizimi i dytë rrjedh nga hipoteza e analizës së korrelacionit, e cila përfshin varësia lineare e variablave. Në shumë raste, kur dihet me besueshmëri se ekziston një marrëdhënie, analiza e korrelacionit mund të mos japë rezultate thjesht sepse marrëdhënia është jolineare (e shprehur, për shembull, si një parabolë).
  3. Thjesht fakti i korrelacionit nuk ofron bazë për të pohuar se cili nga variablat i paraprin ose shkakton ndryshime, ose se variablat në përgjithësi janë të lidhura me njëri-tjetrin në mënyrë shkakësore, për shembull, për shkak të veprimit të një faktori të tretë.

Zona e aplikimit

Kjo metodë e përpunimit të të dhënave statistikore është shumë e popullarizuar në shkencat ekonomike dhe sociale (në veçanti në psikologji dhe sociologji), megjithëse fushëveprimi i aplikimit të koeficientëve të korrelacionit është i gjerë: kontrolli i cilësisë së produkteve industriale, metalurgjia, agrokimia, hidrobiologjia, biometria dhe të tjera.

Popullariteti i metodës është për shkak të dy faktorëve: koeficientët e korrelacionit janë relativisht të lehtë për t'u llogaritur, dhe përdorimi i tyre nuk kërkon trajnim të veçantë matematikor. Kombinuar me lehtësinë e tij në interpretim, lehtësia e aplikimit të koeficientit ka bërë që ai të përdoret gjerësisht në fushën e analizës së të dhënave statistikore.

Korrelacion i rremë

Shpesh, thjeshtësia joshëse e kërkimit të korrelacionit e inkurajon studiuesin të nxjerrë përfundime intuitive të rreme për praninë e një marrëdhënieje shkak-pasojë midis çifteve të karakteristikave, ndërsa koeficientët e korrelacionit vendosin vetëm marrëdhënie statistikore.

Në metodologjinë sasiore moderne të shkencave sociale, në fakt, ka pasur një braktisje të përpjekjeve për të vendosur marrëdhënie shkak-pasojë midis variablave të vëzhguar duke përdorur metoda empirike. Prandaj, kur studiuesit në shkencat sociale flasin për vendosjen e marrëdhënieve midis variablave që studiohen, nënkuptohet ose një supozim i përgjithshëm teorik ose një varësi statistikore.

Shiko gjithashtu

Fondacioni Wikimedia. 2010.

Shihni se çfarë është "Analiza e korrelacionit" në fjalorë të tjerë:

    Shih ANALIZA KORELACIONI. Antinazi. Enciklopedia e Sociologjisë, 2009 ... Enciklopedia e Sociologjisë

    Një degë e statistikave matematikore që kombinon metoda praktike për studimin e korrelacionit midis dy (ose më shumë) karakteristikave ose faktorëve të rastësishëm. Shih Korrelacionin (në statistikat matematikore)... Fjalori i madh enciklopedik

    ANALIZA KORELACIONI, një pjesë e statistikave matematikore që kombinon metoda praktike për studimin e korrelacionit midis dy (ose më shumë) karakteristikave ose faktorëve të rastësishëm. Shih Korrelacionin (shih KORELACIONIN (marrëdhënie reciproke ... fjalor enciklopedik

    Analiza e korrelacionit- (në ekonomi) një degë e statistikave matematikore që studion marrëdhëniet ndërmjet ndryshimit të sasive (korrelacioni është një raport, nga fjala latine correlatio). Marrëdhënia mund të jetë e plotë (d.m.th. funksionale) dhe jo e plotë,... ... Fjalor ekonomik dhe matematikor

    analiza e korrelacionit- (në psikologji) (nga latinishtja correlation ratio) një metodë statistikore për vlerësimin e formës, shenjës dhe afërsisë së lidhjes midis karakteristikave ose faktorëve që studiohen. Kur përcaktohet forma e një lidhjeje, merret parasysh lineariteti ose jolineariteti i saj (d.m.th., si mesatarisht... ... Enciklopedi e madhe psikologjike

    analiza e korrelacionit- - [L.G. Sumenko. Fjalor anglisht-rusisht për teknologjinë e informacionit. M.: Ndërmarrja Shtetërore TsNIIS, 2003.] Temat e teknologjisë së informacionit në përgjithësi analiza e korrelacionit EN ... Udhëzues teknik i përkthyesit

    analiza e korrelacionit- koreliacinė analizė statusas T sritis Kūno kultūra ir sportas apibrėžtis Statistikos metodas, kuriuo įvertinami tiriamųjų asmenų, reiškinių požymiai arba veiksnių santykiai. atitikmenys: angl. studimet e korrelacionit vok. Analizo korrelacionin, f;… … Përfundimi sportiv

    Një grup metodash të bazuara në teorinë matematikore të korrelacionit (Shih Korrelacionin) për zbulimin e një korrelacioni midis dy karakteristikave ose faktorëve të rastësishëm. K. a. të dhënat eksperimentale përfshijnë sa vijon... ... Enciklopedia e Madhe Sovjetike

    Seksioni i matematikës statistika, duke kombinuar praktike Metodat korrelative të kërkimit. varësitë midis dy (ose më shumë) karakteristikave ose faktorëve të rastësishëm. Shikoni Korrelacionin... Fjalori i madh enciklopedik politeknik

Në kërkimin shkencor, shpesh ekziston nevoja për të gjetur një lidhje midis rezultatit dhe variablave të faktorëve (rendimenti i një kulture dhe sasia e reshjeve, lartësia dhe pesha e një personi në grupe homogjene sipas gjinisë dhe moshës, rrahjeve të zemrës dhe temperaturës së trupit , etj.).

E dyta janë shenja që kontribuojnë në ndryshime në ato që lidhen me to (e para).

Koncepti i analizës së korrelacionit

Ka shumë Bazuar në sa më sipër, mund të themi se analiza e korrelacionit është një metodë që përdoret për të testuar hipotezën për rëndësinë statistikore të dy ose më shumë variablave nëse studiuesi mund t'i masë ato, por jo t'i ndryshojë ato.

Ekzistojnë përkufizime të tjera të konceptit në fjalë. Analiza e korrelacionit është një metodë përpunimi që përfshin studimin e koeficientëve të korrelacionit midis variablave. Në këtë rast, koeficientët e korrelacionit midis një çifti ose shumë çiftesh karakteristikash krahasohen për të vendosur marrëdhënie statistikore midis tyre. Analiza e korrelacionit është një metodë për studimin e varësisë statistikore midis ndryshoreve të rastësishme me praninë opsionale të një natyre funksionale strikte, në të cilën dinamika e një ndryshoreje të rastësishme çon në dinamikën e pritshmërisë matematikore të një tjetri.

Koncepti i korrelacionit të rremë

Gjatë kryerjes së analizës së korrelacionit, është e nevojshme të merret parasysh se ajo mund të kryhet në lidhje me çdo grup karakteristikash, shpesh absurde në raport me njëri-tjetrin. Ndonjëherë ata nuk kanë lidhje shkakësore me njëri-tjetrin.

Në këtë rast, ata flasin për një korrelacion të rremë.

Problemet e analizës së korrelacionit

Bazuar në përkufizimet e mësipërme, mund të formulohen detyrat e mëposhtme të metodës së përshkruar: të merrni informacion për një nga variablat e kërkuar duke përdorur një tjetër; të përcaktojë afërsinë e marrëdhënies ndërmjet variablave të studiuar.

Analiza e korrelacionit përfshin përcaktimin e marrëdhënies midis karakteristikave që studiohen, dhe për këtë arsye detyrat e analizës së korrelacionit mund të plotësohen me sa vijon:

  • identifikimi i faktorëve që kanë ndikimin më të madh në karakteristikën që rezulton;
  • identifikimi i shkaqeve të paeksploruara më parë të lidhjeve;
  • ndërtimi i një modeli korrelacioni me analizën parametrike të tij;
  • studimi i rëndësisë së parametrave të komunikimit dhe vlerësimi i intervalit të tyre.

Marrëdhënia ndërmjet analizës së korrelacionit dhe regresionit

Metoda e analizës së korrelacionit shpesh nuk kufizohet në gjetjen e afërsisë së marrëdhënies midis sasive të studiuara. Ndonjëherë ai plotësohet nga përpilimi i ekuacioneve të regresionit, të cilat përftohen duke përdorur analizën me të njëjtin emër dhe që paraqesin një përshkrim të varësisë së korrelacionit midis karakteristikës (veçorive) rezultuese dhe faktorit (faktorit). Kjo metodë, së bashku me analizën në shqyrtim, përbën metodën

Kushtet për përdorimin e metodës

Faktorët efektivë varen nga një deri në disa faktorë. Metoda e analizës së korrelacionit mund të përdoret nëse ka një numër të madh vëzhgimesh për vlerën e treguesve (faktorëve) efektivë dhe faktorëve, ndërsa faktorët në studim duhet të jenë sasiorë dhe të pasqyruar në burime specifike. E para mund të përcaktohet nga ligji normal - në këtë rast, rezultati i analizës së korrelacionit është koeficienti i korrelacionit Pearson, ose, nëse karakteristikat nuk i binden këtij ligji, përdoret koeficienti i korrelacionit të gradës Spearman.

Rregullat për përzgjedhjen e faktorëve të analizës së korrelacionit

Gjatë aplikimit të kësaj metode, është e nevojshme të përcaktohen faktorët që ndikojnë në treguesit e performancës. Ato përzgjidhen duke marrë parasysh faktin se duhet të ketë marrëdhënie shkak-pasojë midis treguesve. Në rastin e krijimit të një modeli korrelacioni shumëfaktorësh, zgjidhen ata që kanë një ndikim të rëndësishëm në treguesin që rezulton, ndërsa preferohet që në modelin e korrelacionit të mos përfshihen faktorë të ndërvarur me koeficient korrelacioni çift më shumë se 0,85, si dhe ata. për të cilat marrëdhënia me parametrin rezultant nuk është karakter linear apo funksional.

Shfaqja e rezultateve

Rezultatet e analizës së korrelacionit mund të paraqiten në formë teksti dhe grafike. Në rastin e parë ato paraqiten si një koeficient korrelacioni, në të dytën - në formën e një diagrami shpërndarjeje.

Në mungesë të korrelacionit midis parametrave, pikat në diagram janë të vendosura në mënyrë kaotike, shkalla mesatare e lidhjes karakterizohet nga një shkallë më e madhe e rendit dhe karakterizohet nga një distancë pak a shumë uniforme e shenjave të shënuara nga mediana. Një lidhje e fortë priret të jetë e drejtë dhe në r=1 grafiku me pika është një vijë e sheshtë. Korrelacioni i kundërt ndryshon në drejtimin e grafikut nga e majta e sipërme në të djathtën e poshtme, korrelacioni i drejtpërdrejtë - nga e majta e poshtme në këndin e sipërm të djathtë.

Paraqitja 3D e një komploti shpërndarjeje

Përveç shfaqjes tradicionale të grafikut të shpërndarjes 2D, tani përdoret një paraqitje grafike 3D e analizës së korrelacionit.

Përdoret gjithashtu një matricë scatterplot, e cila shfaq të gjitha parcelat e çiftuara në një figurë të vetme në një format matricë. Për n variabla, matrica përmban n rreshta dhe n kolona. Grafiku i vendosur në kryqëzimin e rreshtit të i-të dhe kolonës j-të është një grafik i variablave Xi kundrejt Xj. Kështu, çdo rresht dhe kolonë është një dimension, një qelizë e vetme shfaq një skemë të dy dimensioneve.

Vlerësimi i ngushtësisë së lidhjes

Afërsia e lidhjes së korrelacionit përcaktohet nga koeficienti i korrelacionit (r): i fortë - r = ±0,7 deri në ±1, mesatar - r = ±0,3 deri në ±0,699, i dobët - r = 0 në ±0,299. Ky klasifikim nuk është i rreptë. Figura tregon një diagram paksa të ndryshëm.

Një shembull i përdorimit të metodës së analizës së korrelacionit

Një studim interesant u ndërmor në Britaninë e Madhe. Ai i kushtohet lidhjes midis pirjes së duhanit dhe kancerit të mushkërive dhe u krye përmes analizës së korrelacionit. Ky vëzhgim është paraqitur më poshtë.

Të dhënat fillestare për analizën e korrelacionit

Grupi profesional

vdekshmërisë

Fermerët, pylltarët dhe peshkatarët

Minatorët dhe punëtorët e guroreve

Prodhuesit e gazit, koksit dhe kimikateve

Prodhuesit e qelqit dhe qeramikës

Punëtorët e furrave, farkave, shkritoreve dhe mullinjve të petëzimit

Punonjësit e elektronikës dhe elektronikës

Inxhinieri dhe profesione të ngjashme

Industritë e përpunimit të drurit

Lëkurëpunues

Punëtorët e tekstilit

Prodhuesit e rrobave të punës

Punëtorët në industrinë e ushqimit, pijeve dhe duhanit

Prodhuesit e letrës dhe printimit

Prodhuesit e produkteve të tjera

Ndërtuesit

Piktorë dhe dekorues

Drejtues të motorëve të palëvizshëm, vinça, etj.

Punëtorët që nuk përfshihen diku tjetër

Punonjësit e transportit dhe komunikacionit

Punëtorët e magazinës, magazinierët, ambalazhuesit dhe punëtorët e makinerive mbushëse

Punonjësit e zyrës

Shitësit

Punëtorët e sportit dhe rekreacionit

Administratorët dhe menaxherët

Profesionistë, teknikë dhe artistë

Ne fillojmë analizën e korrelacionit. Për qartësi, është më mirë të fillojmë zgjidhjen me një metodë grafike, për të cilën do të ndërtojmë një diagramë shpërndarjeje.

Ajo tregon një lidhje të drejtpërdrejtë. Megjithatë, është e vështirë të nxirret një përfundim i qartë bazuar vetëm në metodën grafike. Prandaj, ne do të vazhdojmë të bëjmë analizën e korrelacionit. Një shembull i llogaritjes së koeficientit të korrelacionit është paraqitur më poshtë.

Duke përdorur softuerin (MS Excel do të përshkruhet më poshtë si shembull), ne përcaktojmë koeficientin e korrelacionit, i cili është 0.716, që do të thotë një lidhje e fortë midis parametrave në studim. Le të përcaktojmë besueshmërinë statistikore të vlerës së fituar duke përdorur tabelën përkatëse, për të cilën duhet të zbresim 2 nga 25 çifte vlerash, si rezultat marrim 23 dhe duke përdorur këtë rresht në tabelë gjejmë r kritike për p = 0.01 (pasi këto janë të dhëna mjekësore, një varësi më strikte, në raste të tjera mjafton p=0.05), që është 0.51 për këtë analizë korrelacioni. Shembulli tregoi se r e llogaritur është më e madhe se r kritike dhe vlera e koeficientit të korrelacionit konsiderohet statistikisht e besueshme.

Përdorimi i softuerit gjatë kryerjes së analizës së korrelacionit

Lloji i përshkruar i përpunimit të të dhënave statistikore mund të kryhet duke përdorur softuer, në veçanti MS Excel. Korrelacioni përfshin llogaritjen e parametrave të mëposhtëm duke përdorur funksionet:

1. Koeficienti i korrelacionit përcaktohet duke përdorur funksionin CORREL (array1; array2). Array1,2 - qeliza e intervalit të vlerave të variablave rezultante dhe faktori.

Koeficienti i korrelacionit linear quhet gjithashtu koeficienti i korrelacionit Pearson, dhe për këtë arsye, duke filluar me Excel 2007, mund të përdorni funksionin me të njëjtat vargje.

Shfaqja grafike e analizës së korrelacionit në Excel bëhet duke përdorur panelin “Charts” me përzgjedhjen “Scatter Plot”.

Pas specifikimit të të dhënave fillestare, marrim një grafik.

2. Vlerësimi i rëndësisë së koeficientit të korrelacionit në çift duke përdorur T-testin e Studentit. Vlera e llogaritur e kriterit t krahasohet me vlerën e tabeluar (kritike) të këtij treguesi nga tabela përkatëse e vlerave të parametrit në shqyrtim, duke marrë parasysh nivelin e specifikuar të rëndësisë dhe numrin e shkallëve të lirisë. Ky vlerësim kryhet duke përdorur funksionin STUDISCOVER (probabilitet; shkallë_lirie).

3. Matrica e koeficientëve të korrelacionit të çiftit. Analiza kryhet duke përdorur mjetin Analiza e të Dhënave, në të cilin zgjidhet Korrelacioni. Vlerësimi statistikor i koeficientëve të korrelacionit të çiftit kryhet duke krahasuar vlerën e tij absolute me vlerën e tabeluar (kritike). Kur koeficienti i llogaritur i korrelacionit në çift e kalon atë kritik, mund të themi, duke marrë parasysh shkallën e dhënë të probabilitetit, se hipoteza zero për rëndësinë e marrëdhënies lineare nuk hidhet poshtë.

Së fundi

Përdorimi i metodës së analizës së korrelacionit në kërkimin shkencor na lejon të përcaktojmë marrëdhënien midis faktorëve të ndryshëm dhe treguesve të performancës. Është e nevojshme të merret parasysh se një koeficient i lartë korrelacioni mund të merret nga një çift absurd ose grup të dhënash, dhe për këtë arsye ky lloj analize duhet të kryhet në një grup mjaft të madh të dhënash.

Pas marrjes së vlerës së llogaritur të r, këshillohet ta krahasoni atë me r kritike për të konfirmuar besueshmërinë statistikore të një vlere të caktuar. Analiza e korrelacionit mund të kryhet manualisht duke përdorur formula, ose duke përdorur softuer, në veçanti MS Excel. Këtu mund të ndërtoni edhe një diagram shpërndarjeje me qëllim që të paraqesë vizualisht marrëdhënien midis faktorëve të studiuar të analizës së korrelacionit dhe karakteristikës që rezulton.

Themelues të teorisë së korrelacionit konsiderohen biometrikët anglezë F. Galton (1822-1911) dhe K. Pearson (1857-1936). Termi "korrelacion" do të thotë korrelacion, korrespondencë. Ideja e korrelacionit si ndërvarësi e variablave të rastit qëndron në themel të teorisë statistikore të korrelacionit - studimi i varësisë së variacionit të një tipari nga kushtet mjedisore. Disa shenja veprojnë si ndikuese (faktoriale), ndërsa të tjerat veprojnë si ndikuese dhe si efektive. Varësia ndërmjet karakteristikave mund të jetë funksionale dhe korrelative. Lidhjet funksionale karakterizohen nga korrespondenca e plotë midis një ndryshimi në një karakteristikë të faktorit dhe një ndryshimi në vlerën rezultante. Çdo vlerë e karakteristikës së faktorit korrespondon me një vlerë të caktuar të karakteristikës që rezulton. Nuk ka korrespondencë të plotë në korrelacionet midis ndryshimeve në faktorët dhe karakteristikat rezultante. Vetë shenja efektive është në një ndërveprim kompleks. Prandaj, rezultatet e analizës së korrelacionit janë të rëndësishme në këtë drejtim, dhe interpretimi i këtyre rezultateve në një formë të përgjithshme kërkon ndërtimin e një sistemi korrelacionesh. Ato karakterizohen nga një sërë shkaqesh dhe pasojash, dhe me ndihmën e tyre, një tendencë për ndryshimin e karakteristikave efektive kur përcaktohet vlera e karakteristikës së faktorit. Për shembull, produktiviteti i punës ndikohet nga faktorë të shkallës së përmirësimit të pajisjeve dhe teknologjisë, niveli i mekanizimit dhe automatizimit të punës, specializimi i prodhimit, qarkullimi i stafit, etj.

Në natyrë dhe shoqëri, dukuritë dhe ngjarjet ndodhin sipas natyrës së marrëdhënies korrelative, kur kur ndryshon vlera e një karakteristike, ka prirje që një karakteristikë tjetër të ndryshojë. Një marrëdhënie korrelacioni është një rast i veçantë i një marrëdhënie statistikore. Analiza e korrelacionit përdoret për të përcaktuar afërsinë e marrëdhënies midis fenomeneve, proceseve dhe objekteve.

Qëllimi i studimit është shpesh të vendosë një marrëdhënie (korrelacion) midis karakteristikave. Njohja e varësisë bën të mundur zgjidhjen e problemit kryesor të çdo kërkimi - aftësinë për të parashikuar dhe parashikuar zhvillimin e situatës kur ndryshon faktori ndikues. Duke përdorur korrelacionin, mund të jepni vetëm një vlerësim formal të marrëdhënieve. Prandaj, përpara se të vazhdohet me llogaritjen e koeficientëve të korrelacionit midis ndonjë karakteristike, është e nevojshme të përcaktohet teorikisht nëse ekziston një lidhje midis këtyre karakteristikave. Në fund të fundit, zyrtarisht statistikat mund të vërtetojnë lidhje joekzistente, për shembull, midis lartësisë së një ndërtese në qytet dhe rendimentit të grurit në ferma.

Lidhja ndërmjet dukurive (korrelacioni) përcaktohet me kryerjen e eksperimenteve dhe analizave statistikore. Korrelacioni nuk duhet të barazohet me kauzën. Megjithatë, duhet pasur parasysh se vërtetimi i një lidhjeje matematikore duhet të bazohet në një marrëdhënie reale midis dukurive. Për shembull, mineralizimi i ujit zvogëlohet nga veriu në jug të Bjellorusisë, dhe përmbajtja e lëndëve ushqyese në tokë zvogëlohet në të njëjtin drejtim. Një marrëdhënie pozitive e besueshme mund të merret midis treguesve në shqyrtim. Megjithatë, shkalla e mineralizimit të ujit nuk përcakton përmbajtjen optimale të lëndëve ushqyese në tokë. Përndryshe, në peizazhet e shkretëtirës, ​​pjelloria do të ishte maksimale, pasi këtu ka mineralizim maksimal të ujit (toka dhe ujërat nëntokësore janë të njelmëta), dhe kjo bie ndesh me të vërtetën. Prandaj, bërja e një lidhjeje të tillë në peizazhet e shkretëtirës është e pakuptimtë. Ju mund të gjeni qiranë më të mirë ditore të apartamenteve të niveleve të ndryshme të rehatisë nga pronarët pa komision në faqen e internetit piter.stay24.ru. Kërkimi i përshtatshëm do t'ju lejojë të gjeni lehtësisht apartamentin e duhur që i përshtatet kërkesave tuaja, duke shpenzuar një minimum kohe.

Çdo tregues i lidhjes shërben si një vlerësim i përafërt i varësisë në shqyrtim dhe nuk garanton ekzistencën e një vartësie të rreptë (funksionale). Mungesa e varësisë së rreptë në natyrë dhe shoqëri nxit vetërregullimin e proceseve, fenomeneve, sistemeve

Në drejtim, lidhja mund të jetë e drejtpërdrejtë ose e kundërt; nga natyra - funksionale ose statistikore (korrelacion); në madhësi - e dobët, e mesme ose e fortë; në formë - lineare dhe jolineare; nga numri i veçorive të ndërlidhura - të çiftuara dhe të shumëfishta.

Varësia funksionale është karakteristikë e formave gjeometrike dhe sistemeve teknike, kur çdo vlerë e një karakteristike korrespondon me vlerën e saktë të një tjetre. Ky është një shembull i marrëdhënies midis sipërfaqes së një drejtkëndëshi dhe gjatësisë së njërës prej anëve të tij. Një varësi e tillë është e plotë ose shteruese.

Ekzistojnë disa lloje të korrelacioneve në çift:

·paralel-korelativ, ose asociativ, kur të dyja karakteristikat ndryshojnë në mënyrë të ndërlidhur, pjesërisht nën ndikimin e shkaqeve dhe pasojave të përbashkëta (kufizimi i bimësisë dhe i dherave në forma të caktuara të relievit; zhvillimi industrial dhe rritja e popullsisë në lëndë të parë);

· subkauzale, kur një faktor vepron si një shkak i veçantë i një ndryshimi të konjuguar në një karakteristikë (lidhja e biomasës me reshjet; rritja e popullsisë dhe lindshmërisë);

· reciprokisht proaktive, kur shkaku dhe pasoja, duke qenë në një lidhje të qëndrueshme reciproke, ndikojnë vazhdimisht në njëri-tjetrin (lagështia e ajrit dhe reshjet).

Nëse një tipar ndikohet nga disa faktorë, atëherë duhet të vlerësohet korrelacioni i shumëfishtë. Korrelacioni i shumëfishtë shërben si bazë për identifikimin e marrëdhënieve midis karakteristikave, por kërkon normalitet të rreptë dhe drejtësi të shpërndarjes, kështu që përdorimi i tij mund të jetë i vështirë. Me rritjen e numrit të variablave, vëllimi i punës llogaritëse rritet në proporcion me katrorin e numrit të variablave. Në këtë rast, është më e vështirë të vlerësohet rëndësia e rezultateve, pasi gabimet në koeficientët e korrelacionit rriten. Në praktikë, në raste të tilla, kufizohet vetëm në studimin e faktorëve kryesorë. Sidoqoftë, natyra e ndikimit të faktorëve kryesorë në tipar studiohet në mënyrë më të detajuar dhe të saktë nga analiza e faktorëve.

Në punën praktike për të vendosur një korrelacion midis shenjave dhe fenomeneve, është e nevojshme t'i përmbaheni sekuencës së mëposhtme:

· në bazë të hulumtimit të kryer, paraprakisht përcaktohet nëse ka një lidhje midis karakteristikave në shqyrtim;

· nëse ekziston një lidhje midis tyre, vendosni formën, drejtimin dhe ngushtësinë e saj duke përdorur një grafik.

Së pari, përpilohen seritë variacionale të konjuguara, në të cilat duhet të përcaktohen argumenti x dhe funksioni y:

Një grafik është ndërtuar për opsionet e konjuguara, i cili ndihmon në përcaktimin e llojit të marrëdhënies midis argumentit dhe funksionit. Përpunimi i mëtejshëm i të dhënave eksperimentale ose statistikore varet nga forma e marrëdhënies së korrelacionit. Një varësi lineare përfshin llogaritjen e koeficientit të korrelacionit r, dhe një jolineare përfshin llogaritjen e raportit të korrelacionit η (Fig. 5.1). Shkalla e shpërndarjes ose variacionit të frekuencës në lidhje me vijën e regresionit në grafik tregon afërsisht afërsinë e lidhjes: sa më pak shpërndarje, aq më e fortë është lidhja (Fig. 5.2).

Analiza e korrelacionit zgjidh problemet e mëposhtme:

· vendosjen e drejtimit dhe formës së komunikimit,

· Vlerësimi i afërsisë së komunikimit,

·vlerësimi i përfaqësimit të vlerësimeve statistikore të marrëdhënies,

· përcaktimi i madhësisë së përcaktimit (pjesa e ndikimit të ndërsjellë) të faktorëve të ndërlidhur.

Oriz. 5.1. Forma e korrelacionit:

a - linear i drejtë; b - lineare inverse; c - parabalik; g - hiperbolike

Për të vlerësuar lidhjen, përdoren kriteret numerike (koeficientët) e mëposhtëm të lidhjes së korrelacionit:

koeficienti i korrelacionit (r) për varësinë lineare,

·raporti i korrelacionit (η) për varësinë jolineare,

koeficientët e regresionit të shumëfishtë,

·Koeficientët e korrelacionit linear të renditjes së Pearson ose Kendal.

Çdo ligj i natyrës ose i zhvillimit shoqëror mund të përfaqësohet nga një përshkrim i një grupi marrëdhëniesh. Nëse këto varësi janë stokastike dhe analiza kryhet në një kampion nga popullata e përgjithshme, atëherë kjo fushë e kërkimit lidhet me detyrat e studimit statistikor të varësive, të cilat përfshijnë korrelacionin, regresionin, variancën, analizën e kovariancës dhe analizën e tabelat e emergjencës.

    A ka një lidhje midis variablave në studim?

    Si të matet afërsia e lidhjeve?

Diagrami i përgjithshëm i marrëdhënies midis parametrave në një studim statistikor është paraqitur në Fig. 1.

Në figurën S është një model i objektit real në studim. Variablat shpjegues (të pavarur, faktor) përshkruajnë kushtet e funksionimit të objektit. Faktorët e rastësishëm janë faktorë, ndikimi i të cilëve është i vështirë të merret parasysh ose ndikimi i të cilëve aktualisht neglizhohet. Variablat që rezultojnë (të varura, të shpjeguara) karakterizojnë rezultatin e funksionimit të objektit.

Zgjedhja e metodës për analizimin e marrëdhënies kryhet duke marrë parasysh natyrën e variablave të analizuar.

Analiza e korrelacionit është një metodë e përpunimit të të dhënave statistikore që përfshin studimin e marrëdhënieve midis variablave.

Qëllimi i analizës së korrelacionit është të sigurojë disa informacione për një variabël duke përdorur një variabël tjetër. Në rastet kur është e mundur të arrihet një qëllim, variablat thuhet se janë të ndërlidhura. Korrelacioni pasqyron vetëm varësinë lineare të vlerave, por nuk pasqyron lidhjen funksionale të tyre. Për shembull, nëse llogaritni koeficientin e korrelacionit midis sasive A = sin(x) dhe B = cos(x), atëherë ai do të jetë afër zeros, d.m.th. nuk ka lidhje midis sasive.

Gjatë studimit të korrelacionit, përdoren qasje grafike dhe analitike.

Analiza grafike fillon me ndërtimin e një fushe korrelacioni. Një fushë korrelacioni (ose spatterplot) është një marrëdhënie grafike midis rezultateve të matjes së dy karakteristikave. Për ta ndërtuar atë, të dhënat fillestare vizatohen në një grafik, duke shfaqur çdo çift vlerash (xi, yi) si një pikë me koordinatat xi dhe yi në një sistem koordinativ drejtkëndor.

Analiza vizuale e fushës së korrelacionit na lejon të bëjmë një supozim për formën dhe drejtimin e marrëdhënies midis dy treguesve në studim. Sipas formës së lidhjes, varësitë e korrelacionit zakonisht ndahen në lineare (shih Fig. 1) dhe jolineare (shih Fig. 2). Me një varësi lineare, mbështjellja e fushës së korrelacionit është afër një elipsi. Marrëdhënia lineare e dy ndryshoreve të rastësishme është se ndërsa një ndryshore e rastësishme rritet, ndryshorja tjetër e rastësishme tenton të rritet (ose të ulet) sipas një ligji linear.

Drejtimi i marrëdhënies është pozitiv nëse një rritje në vlerën e një atributi çon në një rritje të vlerës së të dytit (shih Fig. 3) dhe negative nëse një rritje në vlerën e një atributi çon në një ulje të vlerës të dytë (shih Fig. 4).

Varësitë që kanë vetëm drejtime pozitive ose vetëm negative quhen monotonike.

KATEGORITË

ARTIKUJ POPULLOR

2023 "kingad.ru" - ekzaminimi me ultratinguj i organeve të njeriut