Raport de analiză a corelației. Corelații în tezele de psihologie

Concepte de bază ale analizei corelațiilor

Există mai multe tipuri relatii intre variabile:

Dependența de corelație presupune consistența reciprocă a modificărilor variabilelor, precum și faptul că aceste modificări pot fi măsurate o dată sau în mod repetat (în acest caz, se vorbește despre densitatea conexiunii variabilelor, dar nu despre relații cauzale); de exemplu, în societatea rusă modernă, cu cât vârsta este mai mare, cu atât statutul social al unei persoane este mai scăzut; manifestările individuale ale gerontocrației nu încalcă acest tipar.

Impact funcțional presupune că modificările variabilei independente sunt însoțite de schimbări din ce în ce mai accelerate ale variabilei dependente (relațiile cauză-efect fixează influența variabilei independente asupra dependentei); de exemplu, cu cât o persoană are opinii politice mai radicale, cu atât nu acceptă mai mult regimul politic existent; în același timp, nu se poate susține că, cu cât o persoană evaluează mai negativ autoritățile, cu atât are opinii mai radicale.

Dependenta functionala - relația variabilelor, ceea ce înseamnă că o modificare a unei variabile are un impact asupra unei modificări a alteia, care la rândul său afectează prima variabilă, i.e. acestea sunt legături de interacțiune; de exemplu, conștientizarea unei persoane cu privire la politică este direct legată de interesul ei pentru aceasta; Cu cât o persoană este mai interesată de politică, cu atât o înțelege mai mult.

Comunicarea poate fi neliniară și nemonotonă.

Indiferent de tipul de relație dintre variabile se dovedește a fi, trebuie să vă asigurați că există în principiu. Analiza corelației este utilizată pentru a determina interacțiunea și tendințele în caracteristicile fenomenului studiat.

Perioada 1870-1880 este considerată a fi stadiul inițial al dezvoltării sale, iar autorul conceptului de „coeficient de corelare” este Francis Galton. Cele mai serioase evoluții în domeniul analizei corelației la începutul secolelor XIX-XX. interpretat de Karl Pearson. În mod tradițional, analiza kbrelațională este utilizată pentru a testa ipoteza că două sau mai multe variabile sunt dependente statistic. Ca ajutor, analiza corelației poate fi utilizată pentru a testa validitatea ipotezelor experimentale și pentru a include variabile în analizele factoriale și de regresie. Analiza corelației se realizează prin compararea și compararea serii de distribuție construite pe baza grupărilor în funcție de diferite caracteristici.

Corelație - prezența unei relații statistice de caracteristici, atunci când fiecare valoare specifică a unei caracteristici X corespunde unei anumite valori La (sau un set de valori ale seriei K a distribuției). Analiza corelației relevă dependența funcțională dintre variabile, care se caracterizează prin faptul că fiecare valoare a uneia dintre ele corespunde unei valori destul de definite a celeilalte. Cu toate acestea, analiza corelației nu implică identificarea relațiilor cauzale, prin urmare, la interpretarea rezultatelor, afirmații precum „variabilă X afectează variabila la" sau „variabilă X depinde de variabila la" nu sunt permise.

Distinge baie de aburi Și corelații multiple. Corelația de perechi caracterizează tipul, forma și densitatea relației dintre două trăsături, multiple - între mai multe.

Dependența de corelație apare cel mai adesea acolo unde un fenomen este sub influența unui număr mare de factori care acționează cu forțe diferite, deci există măsuri speciale de corelare numite coeficienți de corelare. Coeficienții (în statistică, numărul lor total este calculat în zeci) arată gradul de interconectare a fenomenelor ( densitatea corelației, Uneori cercetătorii vorbesc despre intensitatea conexiunii) și natura acestei relații orientare ). Comunicarea poate fi directă și inversă. De exemplu, cu cât alegătorul este mai în vârstă, cu atât participă mai activ la alegeri. Cu cât nivelul veniturilor oamenilor este mai mare, cu atât sunt mai puțin înclinați să participe la alegeri în calitate de alegători (feedback). Cu cât este mai mare coeficientul de corelație între două variabile, cu atât mai precis poți prezice valorile uneia dintre ele din valorile celeilalte. Natura conexiunii este definită și în categoriile „ monoton ” (direcția de schimbare a unei variabile nu se schimbă atunci când a doua variabilă se schimbă) și „ nemonotonică " conexiune. Pe lângă evaluarea densității și direcției de comunicare, este necesar să se țină cont fiabilitate (autenticitate ) conexiuni.

Analiza corelației rezolvă în mod constant trei probleme practice:

    determinarea câmpului de corelare și compilarea unui tabel de corelație (în acest caz, este un tabel combinat);

    calcularea corelațiilor de eșantion sau a coeficienților de corelație;

    testarea ipotezei statistice a semnificaţiei relaţiei.

Coeficientul de corelație nu conține informații despre dacă această relație dintre ele este cauzală sau concomitentă (generată de o cauză comună). Cercetătorul trebuie să rezolve această întrebare independent pe baza unor idei semnificative despre structura, dinamica obiectelor sociale studiate, corelațiile dintre caracteristicile studiate, să folosească alte metode de analiză statistică (regresie, factorială, discriminantă, cale etc.). Dar valoarea coeficientului ne permite să evaluăm densitatea comunicării ca fiind mai mică (nesemnificativă) sau mai mare. După semnul coeficientului de corelație pentru seriile ordinale, putem spune dacă această relație este directă sau inversă (pentru seria nominală, semnul coeficientului nu poartă o încărcare semantică).

Pentru a stabili o corelație între două atribute, este necesar să se demonstreze că toate celelalte variabile nu afectează relația dintre cele două variabile care fac obiectul de studiu. În caz contrar, apare situația corelație falsă. Secretul unei corelații false este că două fenomene, a căror relație este susținută formal de prezența unei relații statistice, au o cauză comună care le afectează în mod egal pe fiecare dintre ele.

Analiza corelației este precedată de etapa de calcul statistici X 2 - Dar pe baza valorii obținute a statisticilor X 2 nu putem spune nimic despre densitatea conexiunii variabilelor analizate. Pentru a rezolva o astfel de problemă, este necesar să apelăm la coeficienții de corelație.

Modul tradițional de a efectua analiza corelației este utilizarea coeficientului de corelație Pearson (Pearson) R (în literatură, se notează și cu d).

Dacă, la descrierea unui obiect politic, se determină doar prezența sau absența unei trăsături, sau dacă se studiază relația dintre trăsăturile alternative, atunci tabelele de corelare (tabelele unei trăsături asociate) sunt de 4 celule. În acest caz se aplică coeficient Yula(O) Și factor de contingență (f). Ele se bazează pe principiul apariției în comun a evenimentelor (valorile caracteristicilor obiectului de studiu) și sunt potrivite pentru analiza oricăror caracteristici (metrice, ordinale și chiar nominale).

Dacă scalele nominale au mai mult de două valori, atunci pentru a determina relația dintre semne se folosesc coeficienții de contingență ai lui Pearson ( R ), Chuprov (7) și Kramer (LA). În acest caz, dimensiunea tabelului are o anumită valoare. Cu pe La, care afișează valorile a două caracteristici. Coeficienții Chuprov Și Kramer sunt considerate mai stricte decât Coeficientul de contingență al lui Pearson. Dar, deoarece calculele din ele sunt construite ținând cont de statisticile x 2, atunci toate restricțiile asociate se aplică și acestor coeficienți.

Coeficient de corelație multiplă (IV) care se numește uneori coeficient concordanţă, utilizat pentru a evalua consistența a două sau mai multe serii de valori clasate ale variabilelor.

Există două opțiuni pentru calcularea coeficienților de corelație între caracteristicile din pachetul statistic SPSS.

Analiza corelației

Corelație- relația statistică a două sau mai multe variabile aleatoare (sau variabile care pot fi considerate ca atare cu un grad acceptabil de acuratețe). În același timp, modificările uneia sau mai multor dintre aceste cantități conduc la o modificare sistematică a celeilalte sau a altor cantități. O măsură matematică a corelației a două variabile aleatoare este coeficientul de corelație.

Corelația poate fi pozitivă și negativă (de asemenea, este posibil să nu existe o relație statistică - de exemplu, pentru variabile aleatoare independente). corelație negativă - corelația, în care o creștere a unei variabile este asociată cu o scădere a unei alte variabile, în timp ce coeficientul de corelație este negativ. corelație pozitivă - o corelație în care o creștere a unei variabile este asociată cu o creștere a unei alte variabile, în timp ce coeficientul de corelație este pozitiv.

autocorelare - relație statistică între variabile aleatoare din aceeași serie, dar luate cu o schimbare, de exemplu, pentru un proces aleator - cu o schimbare în timp.

Lăsa X,Y- două variabile aleatoare definite pe același spațiu de probabilitate. Atunci coeficientul lor de corelare este dat de formula:

,

unde cov denotă covarianță și D este varianță sau echivalent,

,

unde simbolul reprezintă așteptarea matematică.

Pentru a reprezenta grafic o astfel de relație, puteți utiliza un sistem de coordonate dreptunghiular cu axe care corespund ambelor variabile. Fiecare pereche de valori este marcată cu un simbol specific. Un astfel de complot se numește „scatterplot”.

Metoda de calcul a coeficientului de corelare depinde de tipul de scară la care se referă variabilele. Deci, pentru măsurarea variabilelor cu intervale și scale cantitative, este necesar să se utilizeze coeficientul de corelație Pearson (corelația momentelor produsului). Dacă cel puțin una dintre cele două variabile are o scară ordinală sau nu este distribuită normal, trebuie utilizată corelația de rang a lui Spearman sau τ (tau) a lui Kendal. În cazul în care una dintre cele două variabile este dihotomică, se utilizează o corelație punctuală cu două serii, iar dacă ambele variabile sunt dihotomice, se utilizează o corelație cu patru câmpuri. Calculul coeficientului de corelație dintre două variabile nedihotomice are sens numai dacă relația dintre ele este liniară (unidirecțională).

Coeficientul de corelație Kendell

Folosit pentru a măsura dezordinea reciprocă.

Coeficientul de corelație al lui Spearman

Proprietățile coeficientului de corelație

dacă luăm covarianța ca produs scalar a două variabile aleatoare, atunci norma variabilei aleatoare va fi egală cu , iar consecinţa inegalităţii Cauci-Bunyakovsky va fi: . , Unde . Mai mult, în acest caz semnele și k potrivire: .

Analiza corelației

Analiza corelației- metoda de prelucrare a datelor statistice, care consta in studierea coeficientilor ( corelații) între variabile. În acest caz, coeficienții de corelație dintre o pereche sau mai multe perechi de caracteristici sunt comparați pentru a stabili relații statistice între ele.

Ţintă analiza corelației- furnizați câteva informații despre o variabilă cu ajutorul altei variabile. În cazurile în care este posibilă atingerea scopului, spunem că variabilele corela. În forma sa cea mai generală, adoptarea ipotezei prezenței unei corelații înseamnă că o modificare a valorii variabilei A va avea loc concomitent cu o modificare proporțională a valorii lui B: dacă ambele variabile cresc, atunci corelația este pozitivă dacă o variabilă crește și cealaltă scade, corelația este negativă.

Corelația reflectă doar dependența liniară a cantităților, dar nu reflectă conectivitatea lor funcțională. De exemplu, dacă calculăm coeficientul de corelație dintre valori A = sin(X) Și B = cos(X) , atunci va fi aproape de zero, adică nu există nicio dependență între cantități. Între timp, mărimile A și B sunt în mod evident legate funcțional conform legii sin 2 (X) + cos 2 (X) = 1 .

Limitele analizei corelațiilor

Grafice ale distribuțiilor de perechi (x,y) cu coeficienții de corelație x și y corespunzători pentru fiecare dintre ele. Rețineți că coeficientul de corelație reflectă o relație liniară (rândul de sus), dar nu descrie o curbă de relație (rândul din mijloc) și nu este deloc potrivit pentru a descrie relații complexe, neliniare (rândul de jos).

  1. Aplicarea este posibilă dacă există un număr suficient de cazuri de studiat: pentru un anumit tip de coeficient de corelație, acesta variază de la 25 la 100 de perechi de observații.
  2. A doua limitare rezultă din ipoteza analizei corelației, care include dependența liniară a variabilelor. În multe cazuri, când se știe în mod fiabil că dependența există, analiza corelației poate să nu dea rezultate pur și simplu pentru că dependența este neliniară (exprimată, de exemplu, ca o parabolă).
  3. Prin el însuși, faptul corelației nu oferă motive pentru a afirma care dintre variabile precede sau provoacă modificări sau că variabilele sunt în general legate între ele cauzal, de exemplu, datorită acțiunii unui al treilea factor.

Zona de aplicare

Această metodă de prelucrare a datelor statistice este foarte populară în științe economice și sociale (în special, în psihologie și sociologie), deși sfera de aplicare a coeficienților de corelare este extins: controlul calității produselor industriale, metalurgie, chimie agricolă, hidrobiologie, biometrie și altele.

Popularitatea metodei se datorează a două puncte: coeficienții de corelație sunt relativ ușor de calculat, aplicarea lor nu necesită pregătire matematică specială. Combinată cu ușurința de interpretare, ușurința de aplicare a coeficientului a condus la utilizarea pe scară largă a acestuia în domeniul analizei datelor statistice.

corelație falsă

Simplitatea adesea tentantă a cercetării de corelație încurajează cercetătorul să tragă concluzii intuitive false despre prezența unei relații cauzale între perechi de trăsături, în timp ce coeficienții de corelație stabilesc doar relații statistice.

În metodologia cantitativă modernă a științelor sociale, de fapt, s-a renunțat la încercările de a stabili relații cauzale între variabilele observate prin metode empirice. Prin urmare, atunci când cercetătorii din științe sociale vorbesc despre stabilirea unor relații între variabilele pe care le studiază, este implicată fie o presupunere teoretică generală, fie o dependență statistică.

Vezi si

Fundația Wikimedia. 2010 .

Vedeți ce este „Analiza corelației” în alte dicționare:

    Vezi ANALIZA CORELAȚIONALĂ. antinazi. Enciclopedia de Sociologie, 2009... Enciclopedia Sociologiei

    O secțiune de statistici matematice care combină metode practice pentru studiul corelației dintre două (sau mai multe) caracteristici sau factori aleatori. Vezi Corelație (în statistica matematică)... Dicţionar enciclopedic mare

    ANALIZA CORELATIEI, o sectiune de statistici matematice care combina metode practice de studiere a corelatiei dintre doua (sau mai multe) semne sau factori aleatori. Vezi Corelație (vezi CORELARE (conexiune reciprocă... Dicţionar enciclopedic

    Analiza corelației- (în economie) o ramură a statisticii matematice care studiază relația dintre mărimile în schimbare (raportul de corelație, din cuvântul latin correlatio). Relația poate fi completă (adică funcțională) și incompletă, ...... Dicţionar economic şi matematic

    analiza corelației- (în psihologie) (din latină corelatio ratio) o metodă statistică de apreciere a formei, semnului și strângerii relației dintre trăsăturile sau factorii studiati. La determinarea formei de comunicare, se ia în considerare liniaritatea sau neliniaritatea acesteia (adică, ca o medie ... ... Marea Enciclopedie Psihologică

    analiza corelației- - [L.G. Sumenko. Dicționar englez rus de tehnologii informaționale. M.: GP TsNIIS, 2003.] Subiecte tehnologia informației în general analiza corelației EN ... Manualul Traducătorului Tehnic

    analiza corelației- koreliacinė analizė statusas T sritis Kūno kultūra ir sportas apibrėžtis Statistikos metodas, kuriuo įvertinami tiriamųjų asmenų, reiškinių požymiai arba veiksnių santykiai. atitikmenys: engl. studii de corelare vok. Analyse der Korrelation, f;… … Sporto terminų žodynas

    Un set de metode bazate pe teoria matematică a corelației (vezi corelația) pentru detectarea unei corelații între două caracteristici sau factori aleatori. K. a. datele experimentale includ următoarele ...... Marea Enciclopedie Sovietică

    Sectiunea de matematica. statistici, combinând practicile. metode de cercetare a corelaţiei. dependențe între două (sau mai multe) semne sau factori aleatori. Vezi corelația... Marele dicționar politehnic enciclopedic

În cercetarea științifică, adesea devine necesar să se găsească o relație între variabilele rezultante și factori (randamentul unei culturi și cantitatea de precipitații, înălțimea și greutatea unei persoane în grupuri omogene în funcție de sex și vârstă, pulsul și temperatura corpului). , etc.).

Al doilea sunt semne care contribuie la schimbarea celor asociate acestora (primul).

Conceptul de analiză a corelației

Există un set Pe baza celor de mai sus, putem spune că analiza corelației este o metodă folosită pentru a testa ipoteza semnificației statistice a două sau mai multe variabile, dacă cercetătorul le poate măsura, dar nu le poate modifica.

Există și alte definiții ale conceptului luat în considerare. Analiza corelației este o metodă de procesare care examinează coeficienții de corelație dintre variabile. În acest caz, coeficienții de corelație dintre o pereche sau mai multe perechi de caracteristici sunt comparați pentru a stabili relații statistice între ele. Analiza corelației este o metodă de studiere a dependenței statistice dintre variabile aleatoare cu prezența opțională de natură funcțională strictă, în care dinamica unei variabile aleatoare conduce la dinamica așteptării matematice a alteia.

Conceptul de corelație falsă

Atunci când se efectuează o analiză de corelație, trebuie să se țină cont de faptul că aceasta poate fi realizată în raport cu orice set de caracteristici, adesea absurde unele în raport cu altele. Uneori nu au nicio legătură cauzală unul cu celălalt.

În acest caz, se vorbește despre o corelație falsă.

Probleme de analiză a corelației

Pe baza definițiilor de mai sus, putem formula următoarele sarcini ale metodei descrise: obținerea de informații despre una dintre variabilele dorite folosind cealaltă; determina apropierea relaţiei dintre variabilele studiate.

Analiza corelației presupune determinarea relației dintre caracteristicile studiate și, prin urmare, sarcinile de analiză a corelației pot fi completate cu următoarele:

  • identificarea factorilor care au cel mai mare impact asupra semnului rezultat;
  • identificarea cauzelor neexplorate anterior ale relațiilor;
  • construirea unui model de corelare cu analiza lui parametrică;
  • studiul semnificației parametrilor de comunicare și estimarea intervalului acestora.

Legătura dintre analiza corelației cu regresia

Metoda de analiză a corelației nu se limitează adesea la găsirea strângerii relației dintre cantitățile studiate. Uneori, acesta este completat de compilarea ecuațiilor de regresie, care sunt obținute folosind analiza cu același nume și care sunt o descriere a corelației dintre trăsăturile (factoriale) rezultante și factoriale (factoriale). Această metodă, împreună cu analiza luată în considerare, constituie metoda

Condiții de utilizare a metodei

Factorii de rezultat depind de unul sau mai mulți factori. Metoda analizei corelației poate fi utilizată dacă există un număr mare de observații asupra valorii indicatorilor (factorilor) efectivi și factorilor, în timp ce factorii studiați ar trebui să fie cantitativi și reflectați în surse specifice. Prima poate fi determinată de legea normală - în acest caz, coeficienții de corelație Pearson sunt rezultatul analizei de corelație, sau, dacă semnele nu respectă această lege, se folosește coeficientul de corelație a rangului Spearman.

Reguli de selectare a factorilor de analiză a corelației

La aplicarea acestei metode este necesar să se determine factorii care influențează indicatorii de performanță. Acestea sunt selectate ținând cont de faptul că trebuie să existe relații cauzale între indicatori. În cazul creării unui model de corelație multifactorială se selectează cei care au un impact semnificativ asupra indicatorului rezultat, în timp ce este de preferat să nu se includă în modelul de corelație factori interdependenți cu un coeficient de corelație de pereche mai mare de 0,85, precum și cei pentru care relaţia cu parametrul rezultat este indirectă.sau funcţională.

Afișează rezultatele

Rezultatele analizei corelațiilor pot fi prezentate sub formă de text și grafic. În primul caz, ele sunt prezentate ca un coeficient de corelație, în al doilea, ca un grafic de dispersie.

Dacă nu există o corelație între parametri, punctele de pe diagramă sunt situate aleatoriu, gradul mediu de conectare se caracterizează printr-un grad mai mare de ordine și se caracterizează printr-o distanță mai mult sau mai puțin uniformă a marcajelor marcate față de mediană. O conexiune puternică tinde spre o linie dreaptă și la r=1 diagrama de dispersie este o linie plată. O corelație inversă este caracterizată de direcția graficului din stânga sus la dreapta jos, una directă - din stânga jos în colțul din dreapta sus.

Reprezentarea 3D a unui grafic de dispersie (difuzare)

În plus față de prezentarea tradițională 2D scatterplot, în prezent este utilizată o reprezentare grafică 3D a analizei de corelație.

Este, de asemenea, utilizată o matrice de dispersie, care afișează toate diagramele pereche într-o singură cifră într-un format de matrice. Pentru n variabile, matricea conține n rânduri și n coloane. Diagrama situată la intersecția rândului i și coloanei j este un grafic al variabilelor Xi față de Xj. Astfel, fiecare rând și coloană este o dimensiune, o singură celulă afișează un grafic de dispersie a celor două dimensiuni.

Estimarea etanșeității comunicării

Etanșeitatea corelației este determinată de coeficientul de corelație (r): puternic - r = ±0,7 la ±1, mediu - r = ±0,3 la ±0,699, slab - r = 0 la ±0,299. Această clasificare nu este strictă. Figura arată o schemă ușor diferită.

Un exemplu de aplicare a metodei de analiză a corelației

Un studiu interesant a fost întreprins în Marea Britanie. Este dedicat relației fumatului cu cancerul pulmonar și a fost realizat prin analiză de corelație. Această observație este prezentată mai jos.

Date inițiale pentru analiza corelației

Grup profesional

mortalitate

Fermierii, pădurari și pescari

Mineri și muncitori la carieră

Producători de gaze, cocs și produse chimice

Producatori de sticla si ceramica

Muncitori în cuptoare, forje, turnătorii și laminoare

Lucrători în electricitate și electronică

Inginerie și profesii conexe

Productie prelucrarea lemnului

Tanatorii

Muncitori din textile

Producători de îmbrăcăminte de lucru

Lucrători din industria alimentară, a băuturilor și a tutunului

Producători de hârtie și imprimare

Producători de alte produse

Constructorii

Artiști și decoratori

Șoferi de motoare staționare, macarale etc.

Lucrători necuprinși în altă parte

Lucrători în transport și comunicații

Muncitori din depozit, depozitari, ambalatori și muncitori la mașini de umplere

muncitori la birou

Vânzători

Lucrători în servicii de sport și recreere

Administratori și manageri

Profesioniști, tehnicieni și artiști

Începem analiza corelației. Este mai bine să începem soluția pentru claritate cu o metodă grafică, pentru care vom construi o diagramă de împrăștiere.

Ea arată o legătură directă. Cu toate acestea, este dificil să trageți o concluzie fără ambiguitate bazată numai pe metoda grafică. Prin urmare, vom continua să efectuăm analize de corelație. Un exemplu de calcul al coeficientului de corelație este prezentat mai jos.

Folosind instrumente software (pe exemplul MS Excel, va fi descris mai jos), determinăm coeficientul de corelație, care este 0,716, ceea ce înseamnă o relație puternică între parametrii studiați. Să determinăm semnificația statistică a valorii obținute conform tabelului corespunzător, pentru care trebuie să scădem 2 din 25 de perechi de valori, ca rezultat obținem 23 și pentru această linie din tabel găsim r critic pentru p = 0,01 (deoarece acestea sunt date medicale este suficientă o dependență mai strictă, în alte cazuri p=0,05), care este 0,51 pentru această analiză de corelație. Exemplul a arătat că r calculat este mai mare decât r critic, valoarea coeficientului de corelație este considerată semnificativă statistic.

Utilizarea software-ului în analiza corelației

Tipul descris de prelucrare a datelor statistice poate fi realizat folosind software, în special, MS Excel. Corelația presupune calcularea următorilor parametri folosind funcții:

1. Coeficientul de corelație se determină folosind funcția CORREL (array1; array2). Array1,2 este o celulă a intervalului de valori ale variabilelor rezultate și factor.

Coeficientul de corelație liniară se mai numește și coeficientul de corelație Pearson și, prin urmare, începând cu Excel 2007, puteți utiliza funcția cu aceleași matrice.

Afișarea grafică a analizei de corelație în Excel se face folosind panoul „Diagrame” cu selecția „Grafic de dispersie”.

După specificarea datelor inițiale, obținem un grafic.

2. Evaluarea semnificației coeficientului de corelație cu ajutorul testului t Student. Valoarea calculată a criteriului t este comparată cu valoarea tabelară (critică) a acestui indicator din tabelul corespunzător de valori ale parametrului luat în considerare, ținând cont de nivelul de semnificație dat și de numărul de grade de libertate. Această estimare se face folosind funcția STUDIV(probabilitate; grade_de_libertate).

3. Matricea coeficienților de corelație perechi. Analiza se realizează cu ajutorul instrumentului „Analiza datelor”, în care este selectată „Corelație”. Evaluarea statistică a coeficienților de corelație de pereche se realizează prin compararea valorii absolute a acesteia cu valoarea tabelară (critică). Când coeficientul de corelație al perechii calculat îl depășește pe cel critic, putem spune, ținând cont de gradul de probabilitate dat, că ipoteza nulă despre semnificația relației liniare nu este respinsă.

In cele din urma

Utilizarea metodei de analiză a corelației în cercetarea științifică face posibilă determinarea relației dintre diverși factori și indicatori de performanță. În același timp, trebuie luat în considerare faptul că un coeficient de corelație ridicat poate fi obținut și dintr-o pereche sau un set absurd de date și, prin urmare, acest tip de analiză trebuie efectuat pe o matrice de date suficient de mare.

După obținerea valorii calculate a lui r, este de dorit să o comparăm cu r critic pentru a confirma semnificația statistică a unei anumite valori. Analiza corelației poate fi efectuată manual folosind formule sau folosind instrumente software, în special MS Excel. Aici puteți construi și o diagramă de împrăștiere (împrăștiere) în scopul unei reprezentări vizuale a relației dintre factorii studiați ai analizei de corelație și caracteristica rezultată.

Biometrienii englezi F. Galton (1822-1911) și K. Pearson (1857-1936) sunt considerați a fi fondatorii teoriei corelației. Termenul „corelație” înseamnă raport, corespondență. Ideea de corelație ca interdependență a variabilelor aleatoare stă la baza teoriei statistice a corelației - studiul dependenței unei variații caracteristice de condițiile de mediu. Unele semne actioneaza ca influentatoare (factoriale), altele - care sunt influentate, eficiente. Relațiile dintre caracteristici pot fi funcționale și corelaționale. Relațiile funcționale se caracterizează prin corespondență deplină între modificarea atributului factorului și modificarea valorii efective. Fiecare valoare a factorului-atribut corespunde unei anumite valori a atributului efectiv. Nu există o corespondență completă în corelațiile dintre modificarea factorului și atributul rezultat. Într-o interacțiune complexă este caracteristica efectivă în sine. Prin urmare, rezultatele analizei corelațiilor sunt importante în acest sens, iar interpretarea acestor rezultate în termeni generali necesită construirea unui sistem de corelații. Ele se caracterizează printr-o multitudine de cauze și efecte, iar cu ajutorul lor se stabilește o tendință de modificare a atributului rezultat atunci când valoarea atributului factorului se modifică. De exemplu, productivitatea muncii este influențată de factori ai gradului de îmbunătățire a tehnologiei și tehnologiei, nivelul de mecanizare și automatizare a muncii, specializarea producției, fluctuația personalului etc.

În natură și societate, fenomenele și evenimentele se desfășoară în funcție de natura corelației, când, odată cu modificarea valorii unui atribut, există tendința de a schimba celălalt atribut. O corelație este un caz special al unei relații statistice. Analiza corelației este utilizată pentru a stabili strângerea relației dintre fenomene, procese, obiecte.

Scopul studiului este adesea acela de a stabili relația (corelația) dintre semne. Cunoașterea dependenței face posibilă rezolvarea sarcinii cardinale a oricărei cercetări - capacitatea de a prevedea și de a prezice evoluția situației atunci când factorul de influență se schimbă. Corelația poate oferi doar o evaluare formală a relației. Prin urmare, înainte de a trece la calculul coeficienților de corelație între orice caracteristică, ar trebui să se stabilească teoretic dacă există o relație între aceste caracteristici. Într-adevăr, formal, statisticile pot dovedi relații inexistente, de exemplu, între înălțimea unei clădiri dintr-un oraș și randamentul grâului în ferme.

Relația dintre fenomene (corelația) este determinată prin înființarea de experimente, analiză statistică. Corelația nu trebuie echivalată cu cauzalitatea. Totuși, trebuie avut în vedere că demonstrarea unei legături matematice trebuie să se bazeze pe o relație reală între fenomene. De exemplu, mineralizarea apei scade de la nord la sudul Belarusului, iar conținutul de nutrienți din sol scade în aceeași direcție. Între indicatorii considerați se poate obține o relație semnificativă pozitivă. Totuși, gradul de mineralizare al apei nu determină conținutul optim de nutrienți din sol. În caz contrar, în peisajele deșertice, fertilitatea ar fi maximă, deoarece aici mineralizarea maximă a apei (solul și apa subterană este salmatră), iar acest lucru este contrar adevărului. Prin urmare, realizarea unei astfel de conexiuni în peisajele deșertice este lipsită de sens. Pe site-ul piter.stay24.ru găsiți cea mai bună închiriere zilnică de apartamente de diferite niveluri de confort de la proprietari fără comision. O căutare convenabilă vă va permite să găsiți rapid apartamentul potrivit cerințelor dvs., petrecând în același timp un minim de timp.

Orice indicator de conexiune servește ca o estimare aproximativă a dependenței avute în vedere și nu este o garanție a existenței unei subordonări rigide (funcționale). Absența dependenței rigide în natură și societate contribuie la autoreglarea proceselor, fenomenelor, sistemelor

În direcția de comunicare poate fi directă și inversă; prin natura - funcțional sau statistic (corelație); în mărime - slab, mediu sau puternic; în formă - liniară și neliniară; după numărul de semne corelate – pereche și multiple.

Dependența funcțională este tipică pentru forme geometrice, sisteme tehnice, când fiecare valoare a unui atribut corespunde valorii exacte a altuia. Acesta este un exemplu al relației dintre aria unui dreptunghi și lungimea uneia dintre laturile sale. O astfel de dependență este completă sau exhaustivă.

Există mai multe tipuri de corelații de perechi:

Paralel-corelativ, sau asociativ, atunci când ambele semne se modifică în conjuncție, parțial sub influența unor cauze și efecte comune (ilimitarea vegetației și a solurilor la anumite forme de relief; dezvoltarea industrială și creșterea populației la materii prime);

subcauzale, când un factor acționează ca o cauză separată a unei modificări asociate într-o trăsătură (relația dintre biomasă și precipitații; creșterea populației și fertilitatea);

anticipativ reciproc, atunci când cauza și efectul, fiind într-o relație reciprocă stabilă, se influențează constant reciproc (umiditatea aerului și precipitațiile).

Dacă o trăsătură este influențată de mai mulți factori, atunci trebuie evaluate mai multe corelații. Corelația multiplă servește ca bază pentru identificarea relațiilor dintre caracteristici, dar necesită normalitate strictă și dreptate a distribuției, astfel încât utilizarea sa poate fi dificilă. Pe măsură ce numărul de variabile crește, cantitatea de lucru de calcul crește proporțional cu pătratul numărului de variabile. În acest caz, este mai dificil de apreciat semnificația rezultatelor, deoarece erorile în coeficienții de corelație cresc. În practică, în astfel de cazuri, ele se limitează la studierea doar a factorilor principali. Cu toate acestea, natura influenței factorilor principali asupra trăsăturii este studiată mai detaliat și mai precis prin analiza factorială.

În lucrările practice privind stabilirea unei corelații între semne și fenomene, este necesar să se respecte următoarea secvență:

pe baza studiilor efectuate, se stabilește preliminar dacă există o legătură între semnele luate în considerare;

Dacă există o legătură între ele, stabiliți-i forma, direcția și etanșeitatea folosind un grafic.

La început sunt compilate serii variaționale conjugate, în care ar trebui determinate argumentul x și funcția y:

Un grafic este construit pentru opțiunile conjugate, ceea ce ajută la stabilirea tipului de relație dintre argument și funcție. Prelucrarea ulterioară a datelor experimentale sau statistice depinde de forma corelației. Dependența liniară presupune calculul coeficientului de corelație r, iar cel neliniar - raportul de corelație η (Fig. 5.1). Gradul de împrăștiere a frecvenței sau varianta relativă la linia de regresie de pe grafic indică aproximativ etanșeitatea conexiunii: cu cât împrăștierea este mai mică, cu atât conexiunea este mai puternică (Fig. 5.2).

Analiza corelației rezolvă următoarele sarcini:

Stabilirea direcției și formei de comunicare,

evaluarea etanșeității conexiunii,

evaluarea reprezentativității estimărilor statistice ale relației,

· determinarea mărimii determinării (cotei de influență reciprocă) a factorilor corelați.

Orez. 5.1. Forma de corelare:

a - linie dreaptă; b - liniar invers; c - parabalic; g - hiperbolic

Pentru evaluarea relației se folosesc următoarele criterii numerice (coeficienți) ai relației de corelație:

coeficient de corelație (r) cu o dependență liniară,

raportul de corelație (η) cu o dependență neliniară,

coeficienți de regresie multipli,

· coeficienții de rang de corelație liniară ai lui Pearson sau Kendal.

Orice lege a naturii sau dezvoltare socială poate fi reprezentată printr-o descriere a unui set de relații. Dacă aceste dependențe sunt stocastice, iar analiza este efectuată pe un eșantion din populația generală, atunci acest domeniu de cercetare se referă la sarcinile de studiu statistic al dependențelor, care includ corelația, regresia, varianța, analiza covarianței și analiza tabele de contingență.

    Există o relație între variabilele studiate?

    Cum se măsoară apropierea conexiunilor?

Schema generală a relației dintre parametri într-un studiu statistic este prezentată în fig. 1.

Figura S este un model al obiectului real studiat.Variabilele explicative (independente, factoriale) descriu condițiile de funcționare a obiectului. Factorii aleatori sunt factori a căror influență este greu de luat în considerare sau a căror influență este în prezent neglijată. Variabilele rezultate (dependente, explicate) caracterizează rezultatul funcționării obiectului.

Alegerea metodei de analiză a relației se realizează ținând cont de natura variabilelor analizate.

Analiza corelației - o metodă de prelucrare a datelor statistice, care constă în studierea relației dintre variabile.

Scopul analizei de corelație este de a oferi unele informații despre o variabilă cu ajutorul altei variabile. În cazurile în care este posibilă atingerea scopului, se spune că variabilele sunt corelate. Corelația reflectă doar dependența liniară a cantităților, dar nu reflectă conectivitatea lor funcțională. De exemplu, dacă calculăm coeficientul de corelație dintre valorile A = sin(x) și B = cos(x), atunci acesta va fi aproape de zero, adică. nu există nicio relație între cantități.

Când se studiază corelația, se folosesc abordări grafice și analitice.

Analiza grafică începe cu construirea unui câmp de corelație. Câmpul de corelație (sau graficul de dispersie) este o relație grafică între rezultatele măsurătorii a două caracteristici. Pentru a-l construi, datele inițiale sunt reprezentate pe un grafic, afișând fiecare pereche de valori (xi, yi) ca un punct cu coordonatele xi și yi într-un sistem de coordonate dreptunghiular.

Analiza vizuală a câmpului de corelație ne permite să facem o ipoteză despre forma și direcția relației dintre cei doi indicatori studiați. În funcție de forma relației, dependențele de corelație sunt de obicei împărțite în liniare (vezi Fig. 1) și neliniare (vezi Fig. 2). Cu o dependență liniară, anvelopa câmpului de corelație este aproape de o elipsă. Relația liniară a două variabile aleatoare este aceea că, atunci când o variabilă aleatoare crește, cealaltă variabilă aleatoare tinde să crească (sau să scadă) conform unei legi liniare.

Direcția relației este pozitivă dacă o creștere a valorii unui atribut duce la o creștere a valorii celui de-al doilea (vezi Fig. 3) și negativă dacă o creștere a valorii unui atribut duce la o scădere a valorii. al doilea (vezi Fig. 4).

Dependențele care au doar direcții pozitive sau numai negative se numesc monotone.

CATEGORII

ARTICOLE POPULARE

2023 "kingad.ru" - examinarea cu ultrasunete a organelor umane