Korelačná analýza stanovuje. Spearmanova korelačná analýza

Pri skúmaní prírody, spoločnosti, ekonomiky je potrebné brať do úvahy vzťah pozorovaných procesov a javov. Zároveň je úplnosť opisu nejakým spôsobom určená kvantitatívnymi charakteristikami príčinno-následkových vzťahov medzi nimi. Vyhodnotenie najvýznamnejších z nich, ako aj vplyvu niektorých faktorov na iné, je jednou z hlavných úloh štatistiky.

Formy prejavu vzájomných vzťahov sú veľmi rôznorodé. Ako dva najbežnejšie typy prideliť funkčné(úplné) a korelácia(neúplné) spojenie. V prvom prípade hodnota atribútu faktora presne zodpovedá jednej alebo viacerým hodnotám funkcie. Pomerne často sa funkčné spojenie prejavuje vo fyzike, chémii. V ekonomike je príkladom priamo úmerný vzťah medzi produktivitou práce a nárastom produkcie.

Korelácia (ktorá sa tiež nazýva neúplná alebo štatistická) sa pri hromadných pozorovaniach objavuje v priemere, keď dané hodnoty závislej premennej zodpovedajú určitému počtu pravdepodobných hodnôt nezávislej premennej. Vysvetlením je zložitosť vzťahov medzi analyzovanými faktormi, ktorých interakcia je ovplyvnená nezohľadnenými náhodnými premennými. Preto sa vzťah medzi znameniami prejavuje len priemerne, v množstve prípadov. S koreláciou každá hodnota argumentu zodpovedá náhodne rozdeleným hodnotám funkcie v určitom intervale.

Napríklad určité zvýšenie argumentu bude znamenať iba priemerné zvýšenie alebo zníženie (v závislosti od smeru) funkcie, zatiaľ čo konkrétne hodnoty pre jednotlivé jednotky pozorovania sa budú líšiť od priemeru. Tieto závislosti sú všadeprítomné. Napríklad v poľnohospodárstve to môže byť vzťah medzi výnosom a množstvom aplikovaného hnojiva. Je zrejmé, že tieto sa podieľajú na tvorbe úrody. Pre každé konkrétne pole, pozemok však rovnaké množstvo aplikovaných hnojív spôsobí rozdielne zvýšenie úrody, keďže v interakcii je množstvo ďalších faktorov (počasie, pôdne podmienky atď.), ktoré tvoria konečný výsledok. V priemere sa však takýto vzťah pozoruje - zvýšenie hmotnosti aplikovaných hnojív vedie k zvýšeniu výnosu.

V smere komunikácie sú rovný, keď sa závislá premenná zvyšuje so zvyšovaním faktora, a spiatočka, pri ktorom je rast druhého sprevádzaný poklesom funkcie. Takéto vzťahy možno nazvať aj pozitívne a negatívne, resp.

Čo sa týka ich analytickej formy komunikácie, existujú lineárne A nelineárne. V prvom prípade sa medzi označeniami v priemere objavujú lineárne vzťahy. Nelineárny vzťah je vyjadrený nelineárnou funkciou a premenné sú prepojené v priemere nelineárne.

Existuje ešte jedna pomerne dôležitá charakteristika spojení z hľadiska interagujúcich faktorov. Ak je charakterizovaný vzťah medzi dvoma charakteristikami, potom sa nazýva tzv parná miestnosť. Ak sa skúmajú viac ako dve premenné − viacnásobné.

Vyššie uvedené klasifikačné znaky sa najčastejšie nachádzajú v štatistickej analýze. Ale okrem vyššie uvedeného existujú aj priamy, nepriamy A falošný spojenia. Vlastne podstata každého z nich je zrejmá už z názvu. V prvom prípade sa faktory navzájom priamo ovplyvňujú. Nepriamy vzťah charakterizuje účasť niektorej tretej premennej, ktorá sprostredkúva vzťah medzi skúmanými znakmi. Nepravdivé spojenie je spojenie vytvorené formálne a spravidla potvrdené iba kvantitatívnymi odhadmi. Nemá kvalitatívny základ alebo je nezmyselná.

Líšia sa silou slabý A silný spojenia. Táto formálna charakteristika je vyjadrená špecifickými hodnotami a je interpretovaná v súlade so všeobecne uznávanými kritériami pre silu spojenia pre špecifické ukazovatele.

V najvšeobecnejšej podobe je úlohou štatistiky v oblasti štúdia vzťahov kvantifikovať ich prítomnosť a smerovanie, ako aj charakterizovať silu a formu vplyvu niektorých faktorov na iné. Na jeho riešenie sa používajú dve skupiny metód, z ktorých jedna zahŕňa metódy korelačnej analýzy a druhá - regresná analýza. Zároveň množstvo výskumníkov kombinuje tieto metódy do korelačno-regresnej analýzy, ktorá má určité opodstatnenie: prítomnosť množstva spoločných výpočtových postupov, komplementarita pri interpretácii výsledkov atď.

Preto v tejto súvislosti môžeme hovoriť o korelačnej analýze v širšom zmysle – keď je vzťah komplexne charakterizovaný. Zároveň existuje korelačná analýza v užšom zmysle – keď sa študuje sila spojenia – a regresná analýza, pri ktorej sa hodnotí jej forma a vplyv niektorých faktorov na iné.

Správne úlohy korelačná analýza sa redukujú na meranie blízkosti vzťahu medzi rôznymi znakmi, identifikáciu neznámych kauzálnych vzťahov a hodnotenie faktorov, ktoré majú najväčší vplyv na výsledný znak.

Úlohy regresná analýza spočívajú v oblasti stanovenia formy závislosti, určenia regresnej funkcie, pomocou rovnice na odhad neznámych hodnôt závislej premennej.

Riešenie týchto problémov je založené na vhodných technikách, algoritmoch, indikátoroch, ktorých použitie dáva dôvod hovoriť o štatistickom štúdiu vzťahov.

Treba poznamenať, že tradičné metódy korelácie a regresie sú široko zastúpené v rôznych štatistických softvérových balíkoch pre počítače. Jediné, čo výskumníkovi zostáva, je správne pripraviť informácie, zvoliť softvérový balík, ktorý spĺňa požiadavky analýzy, a byť pripravený interpretovať získané výsledky. Existuje mnoho algoritmov na výpočet komunikačných parametrov a v súčasnosti je sotva vhodné vykonávať takýto komplexný typ analýzy manuálne. Výpočtové postupy sú predmetom samostatného záujmu, avšak znalosť princípov skúmania vzťahov, možností a obmedzení určitých metód interpretácie výsledkov je predpokladom výskumu.

Metódy hodnotenia tesnosti spoja sa delia na korelačné (parametrické) a neparametrické. Parametrické metódy sú založené na použití spravidla odhadov normálneho rozdelenia a používajú sa v prípadoch, keď skúmaná populácia pozostáva z veličín, ktoré sa riadia zákonom normálneho rozdelenia. V praxi sa táto pozícia najčastejšie zastáva a priori. V skutočnosti sú tieto metódy parametrické a bežne sa nazývajú korelačné metódy.

Neparametrické metódy nekladú obmedzenia na zákon rozdelenia skúmaných veličín. Ich výhodou je aj jednoduchosť výpočtov.

Využitie štatistických metód pri spracovaní psychologických výskumných materiálov poskytuje skvelú príležitosť získať užitočné informácie z experimentálnych údajov. Jednou z najbežnejších štatistických metód je korelačná analýza.

Pojem „korelácia“ prvýkrát použil francúzsky paleontológ J. Cuvier, ktorý odvodil „zákon korelácie častí a orgánov zvierat“ (tento zákon umožňuje obnoviť vzhľad celého zvieraťa z nájdených častí tela ). Tento termín zaviedol do štatistiky anglický biológ a štatistik F. Galton (nie len „spojenie“ - vzťah a "akoby spojenie" - korelácia).

Korelačná analýza je test hypotéz o vzťahoch medzi premennými pomocou korelačných koeficientov, dvojrozmernej deskriptívnej štatistiky, kvantitatívnej miery vzťahu (spoločnej variability) dvoch premenných. Ide teda o súbor metód na zisťovanie korelácií medzi náhodnými premennými alebo znakmi.

Korelačná analýza pre dve náhodné premenné zahŕňa:

  • vytvorenie korelačného poľa a zostavenie korelačnej tabuľky;
  • výpočet výberových korelačných koeficientov a korelačných pomerov;
  • testovanie štatistickej hypotézy významnosti vzťahu.

Hlavným účelom korelačnej analýzy je identifikovať vzťah medzi dvoma alebo viacerými skúmanými premennými, ktorý sa považuje za spoločnú koordinovanú zmenu dvoch skúmaných charakteristík. Táto variabilita má tri hlavné charakteristiky: tvar, smer a pevnosť.

Forma korelácie môže byť lineárna alebo nelineárna. Lineárna forma je vhodnejšia na identifikáciu a interpretáciu korelácie. Pre lineárnu koreláciu možno rozlíšiť dva hlavné smery: pozitívny („dopredné spojenie“) a negatívny („spätná väzba“).

Sila spojenia priamo naznačuje, aká výrazná je kĺbová variabilita študovaných premenných. Funkčné prepojenie javov možno v psychológii empiricky odhaliť len ako pravdepodobnostné prepojenie zodpovedajúcich znakov. Vizuálne znázornenie povahy pravdepodobnostného vzťahu je dané bodovým diagramom - grafom, ktorého osi zodpovedajú hodnotám dvoch premenných a každý subjekt je bod.

Korelačné koeficienty sa používajú ako číselná charakteristika pravdepodobnostného vzťahu, ktorého hodnoty sa pohybujú v rozmedzí od –1 do +1. Po výpočtoch výskumník spravidla vyberie len najsilnejšie korelácie, ktoré sa ďalej interpretujú (tab. 1).

Kritériom pre výber „dostatočne silných“ korelácií môže byť buď absolútna hodnota samotného korelačného koeficientu (od 0,7 do 1), alebo relatívna hodnota tohto koeficientu, určená hladinou štatistickej významnosti (od 0,01 do 0,1), v závislosti od veľkosť vzorky. V malých vzorkách je pre ďalšiu interpretáciu správnejšie vybrať silné korelácie na základe hladiny štatistickej významnosti. Pre štúdie, ktoré sa vykonávajú na veľkých vzorkách, je lepšie použiť absolútne hodnoty korelačných koeficientov.

Úloha korelačnej analýzy sa teda redukuje na určenie smeru (pozitívneho alebo negatívneho) a formy (lineárneho, nelineárneho) vzťahu medzi rôznymi znakmi, meranie jeho tesnosti a nakoniec kontrolu hladiny významnosti získaných korelačné koeficienty.

V súčasnosti bolo vyvinutých mnoho rôznych korelačných koeficientov. Najpoužívanejšie sú r-Pearson, r- Spearman a τ - Kendall. Moderné počítačové štatistické programy v menu „Korelácie“ ponúkajú práve tieto tri koeficienty a na riešenie ďalších výskumných problémov sa ponúkajú metódy porovnávania skupín.

Výber metódy na výpočet korelačného koeficientu závisí od typu škály, do ktorej premenné patria (tabuľka 2).

Pre premenné s intervalom a s nominálnou stupnicou sa používa Pearsonov korelačný koeficient (korelácia súčinových momentov). Ak aspoň jedna z dvoch premenných má ordinálnu stupnicu alebo nie je normálne rozdelená, použije sa Spearmanova poradová korelácia, resp.

t-Kendall. Ak je jedna z dvoch premenných dichotomická, možno použiť bodovú dvojsériovú koreláciu (táto možnosť nie je dostupná v štatistickom počítačovom programe SPSS a namiesto nej možno použiť výpočet poradovej korelácie). V prípade, že sú obe premenné dichotomické, použije sa štvorpoľová korelácia (tento typ korelácie vypočíta SPSS na základe definície mier vzdialenosti a miery podobnosti). Výpočet korelačného koeficientu medzi dvoma nedichotomickými premennými je možný len vtedy, ak je vzťah medzi nimi lineárny (jednosmerný). Ak je spojenie napr. U-tvarovaný (nejednoznačný), korelačný koeficient nie je vhodný na použitie ako miera pevnosti spojenia: jeho hodnota má tendenciu k nule.

Podmienky na uplatnenie korelačných koeficientov budú teda nasledovné:

  • premenné merané v kvantitatívnej (hodnotovej, metrickej) škále na tej istej vzorke objektov;
  • vzťah medzi premennými je monotónny.

Hlavná štatistická hypotéza, ktorá je testovaná korelačnou analýzou, je nesmerová a obsahuje tvrdenie, že korelácia sa vo všeobecnej populácii rovná nule. H0: r xy= 0. Ak sa zamietne, prijme sa alternatívna hypotéza H 1: r xy≠ 0 o prítomnosti pozitívnej alebo negatívnej korelácie - v závislosti od znamienka vypočítaného korelačného koeficientu.

Na základe prijatia alebo odmietnutia hypotéz sa vyvodzujú zmysluplné závery. Ak podľa výsledkov štatistického testovania H0: r xy= 0 sa neodchyľuje na úrovni a, potom bude zmysluplný záver nasledovný: vzťah medzi X A Y nenájdené. Ak pri H 0 r xy= 0 sa odchyľuje na úrovni a, čo znamená, že medzi nimi bol nájdený pozitívny (negatívny) vzťah X A Y. K interpretácii odhalených korelácií však treba pristupovať opatrne. Z vedeckého hľadiska jednoduché stanovenie vzťahu medzi dvoma premennými neznamená existenciu kauzálneho vzťahu. Okrem toho prítomnosť korelácie nestanovuje sekvenčný vzťah medzi príčinou a následkom. Jednoducho to naznačuje, že dve premenné spolu súvisia viac, ako by sa dalo očakávať od náhody. Napriek tomu, opatrne, použitie korelačných metód pri štúdiu kauzálnych vzťahov je plne opodstatnené. Treba sa vyhýbať kategorickým frázam ako „premenná X je dôvodom zvýšenia ukazovateľa“. Y". Takéto tvrdenia by mali byť formulované ako predpoklady, ktoré by mali byť prísne teoreticky podložené.

Podrobný popis matematického postupu pre každý korelačný koeficient je uvedený v učebniciach matematickej štatistiky; ; ; Obmedzíme sa na popis možnosti použitia týchto koeficientov v závislosti od typu meracej stupnice.

Korelácia metrických premenných

Na štúdium vzťahu dvoch metrických premenných nameraných na tej istej vzorke používame korelačný koeficient r-Pearson. Samotný koeficient charakterizuje prítomnosť iba lineárneho vzťahu medzi znakmi, zvyčajne označenými symbolmi X A Y. Koeficient lineárnej korelácie je parametrická metóda a jej správna aplikácia je možná len vtedy, ak sú výsledky merania prezentované na stupnici intervalov a samotné rozloženie hodnôt v analyzovaných premenných sa v malej miere líši od normálu. Existuje veľa situácií, v ktorých je jeho použitie vhodné. Napríklad: vytvorenie spojenia medzi intelektom študenta a jeho akademickým výkonom; medzi náladou a úspechom pri vymanení sa z problémovej situácie; medzi úrovňou príjmu a temperamentom atď.

Pearsonov koeficient je široko používaný v psychológii a pedagogike. Napríklad v prácach I. Ya. Kaplunovicha a P. D. Rabinovicha, M. P. Nuzhdina bol na potvrdenie predložených hypotéz použitý výpočet Pearsonovho lineárneho korelačného koeficientu.

Pri „ručnom“ spracovaní údajov je potrebné vypočítať korelačný koeficient a následne určiť p- úroveň významnosti (na zjednodušenie overovania údajov sa používajú tabuľky kritických hodnôt rxy, ktoré sú zostavené pomocou tohto kritéria). Hodnota Pearsonovho lineárneho korelačného koeficientu nemôže prekročiť +1 a byť menšia ako -1. Tieto dve čísla +1 a -1 sú limity pre korelačný koeficient. Keď je výsledkom výpočtu hodnota väčšia ako +1 alebo menšia ako -1, znamená to, že sa vyskytla chyba výpočtu.

Pri výpočte na počítači štatistický program (SPSS, Statistica) doplní vypočítaný korelačný koeficient presnejšou hodnotou p-úroveň.

Pre štatistické rozhodnutie o prijatí alebo odmietnutí H0 zvyčajne nastavený α = 0,05 a pre veľký objem pozorovaní (100 alebo viac) α = 0,01. Ak p < a, H0 sa zamietne a urobí sa zmysluplný záver, že medzi skúmanými premennými bol zistený štatisticky významný (významný) vzťah (pozitívny alebo negatívny, v závislosti od znamienka korelácie). Kedy p > a, H0 sa nezamieta, zmysluplný záver sa obmedzuje na konštatovanie, že vzťah (štatisticky významný) nebol zistený.

Ak sa nenájde žiadne spojenie, ale existuje dôvod domnievať sa, že spojenie skutočne existuje, mali by ste skontrolovať možné dôvody nespoľahlivosti spojenia.

Komunikačná nelinearita– Na tento účel analyzujte dvojrozmerný bodový graf. Ak je vzťah nelineárny, ale monotónny, prejdite na hodnotiace korelácie. Ak vzťah nie je monotónny, potom rozdeľte vzorku na časti, v ktorých je vzťah monotónny, a vypočítajte korelácie samostatne pre každú časť vzorky, alebo rozdeľte vzorku do kontrastných skupín a potom ich porovnajte podľa úrovne vyjadrenia vlastnosť.

Prítomnosť odľahlých hodnôt a výrazná asymetria v rozložení jedného alebo oboch znakov. Aby ste to dosiahli, musíte sa pozrieť na histogramy frekvenčného rozloženia oboch funkcií. Ak existujú odľahlé hodnoty alebo asymetrie, vylúčte odľahlé hodnoty alebo prejdite na korelácie poradia.

Heterogenita vzorky(analyzujte 2D bodový graf). Pokúste sa rozdeliť vzorku na časti, v ktorých môže mať vzťah rôzne smery.

Ak je vzťah štatisticky významný, potom pred zmysluplným záverom je potrebné vylúčiť možnosť falošnej korelácie:

  • spojenie v dôsledku odľahlých hodnôt. Ak existujú odľahlé hodnoty, prejdite na hodnotiace korelácie alebo vylúčte odľahlé hodnoty;
  • vzťah je spôsobený vplyvom tretej premennej. Ak sa vyskytne podobný jav, je potrebné vypočítať koreláciu nielen pre celú vzorku, ale aj pre každú skupinu zvlášť. Ak je „tretia“ premenná metrická, vypočítajte čiastočnú koreláciu.

Parciálny korelačný koeficient rxy-z sa vypočíta, ak je potrebné otestovať predpoklad, že vzťah medzi dvoma premennými X A Y nezávisí od vplyvu tretej premennej Z. Veľmi často dve premenné navzájom korelujú len vďaka tomu, že sa obe menia v zhode pod vplyvom tretej premennej. Inými slovami, v skutočnosti neexistuje žiadna súvislosť medzi zodpovedajúcimi vlastnosťami, ale objavuje sa v štatistickom vzťahu pod vplyvom spoločnej príčiny. Napríklad spoločnou príčinou variability dvoch premenných môže byť vek pri štúdiu vzťahu rôznych psychologických charakteristík v skupine rôzneho veku. Pri interpretácii parciálnej korelácie z hľadiska kauzality treba byť opatrný, pretože ak Z koreluje s X a s Y a čiastočná korelácia rxy-z blízko nule, nemusí to nevyhnutne nasledovať Z je častým dôvodom X A Y.

Korelácia premenných poradia

Ak je korelačný koeficient neprijateľný pre kvantitatívne údaje r-Pearson, potom na testovanie hypotézy o vzťahu dvoch premenných po predbežnom zoradení možno použiť korelácie r- oštepár alebo τ -Kendalla. Napríklad v štúdii o psychofyzických charakteristikách hudobne nadaných adolescentov od I. A. Lavočkina bolo použité Spearmanovo kritérium.

Pre správny výpočet oboch koeficientov (Spearman a Kendall) musia byť výsledky meraní prezentované v stupnici radov alebo intervalov. Medzi týmito kritériami nie sú žiadne zásadné rozdiely, ale všeobecne sa uznáva, že Kendallov koeficient je „zmysluplnejší“, pretože podrobnejšie a podrobnejšie analyzuje vzťahy medzi premennými a triedi všetky možné korešpondencie medzi pármi hodnôt. Spearmanov koeficient presnejšie zohľadňuje kvantitatívnu mieru asociácie medzi premennými.

Spearmanov koeficient poradovej korelácie je neparametrickou obdobou klasického Pearsonovho korelačného koeficientu, pri jeho výpočte sa však zohľadňujú nie distribučné ukazovatele porovnávaných premenných (aritmetický priemer a rozptyl), ale poradia. Napríklad je potrebné určiť vzťah medzi hodnotiacimi hodnoteniami osobnostných čŕt, ktoré sú zahrnuté v predstave človeka o jeho „som skutočný“ a „som ideálny“.

Spearmanov koeficient je široko používaný v psychologickom výskume. Napríklad v práci Yu. V. Bushova a N. N. Nesmelovej: práve on bol použitý na štúdium závislosti presnosti odhadovania a reprodukcie trvania zvukových signálov od individuálnych charakteristík človeka.

Pretože tento koeficient je analogický r-Pearson, jeho použitie na testovanie hypotéz je podobné ako použitie koeficientu r-Pearson. To znamená, že testovaná štatistická hypotéza, postup pri štatistickom rozhodovaní a formulácia zmysluplného záveru sú rovnaké. V počítačových programoch (SPSS, Statistica) hladiny významnosti pre rovnaké koeficienty r-Pearson a r-Spearman sa vždy zhoduje.

Pomerová výhoda r-Spearman verzus pomer r-Pearson - vo väčšej citlivosti na komunikáciu. Používame ho v nasledujúcich prípadoch:

  • prítomnosť významnej odchýlky v rozdelení aspoň jednej premennej od normálnej formy (šikmosť, odľahlé hodnoty);
  • vzhľad krivočiareho (monotónneho) spojenia.

Obmedzenie uplatnenia koeficientu r- Spearmanovi sú:

  • pre každú premennú aspoň 5 pozorovaní;
  • koeficient s veľkým počtom rovnakých poradí v jednej alebo oboch premenných dáva zhrubnutú hodnotu.

Koeficient poradovej korelácie τ -Kendalla je nezávislá originálna metóda založená na výpočte pomeru párov hodnôt dvoch vzoriek, ktoré majú rovnaký alebo rozdielny trend (nárast alebo pokles hodnôt). Tento pomer sa nazýva aj faktor zhody. Hlavnou myšlienkou tejto metódy je teda to, že smer spojenia možno posúdiť porovnaním subjektov v pároch: ak má pár subjektov zmenu v X sa zhoduje v smere so zmenou v Y, to naznačuje pozitívny vzťah, ak nie rovnaký - negatívny vzťah, napríklad pri skúmaní osobných vlastností, ktoré sú rozhodujúce pre blaho rodiny. V tejto metóde je jedna premenná reprezentovaná ako monotónna postupnosť (napríklad údaje manžela) vo vzostupnom poradí; inej premennej (napríklad údaje manželky) sú priradené zodpovedajúce miesta v rebríčku. Počet inverzií (porušenie monotónnosti v porovnaní s prvým riadkom) sa používa vo vzorci pre korelačné koeficienty.

Pri počítaní τ- Údaje Kendall „ručne“ sú najskôr zoradené podľa premennej X. Potom sa pre každý predmet vypočíta, koľkokrát sa umiestnil Y sa ukáže byť nižšia ako hodnosť nižšie uvedených subjektov. Výsledok je zaznamenaný v stĺpci Zápasy. Súčet všetkých hodnôt v stĺpci „Koincidencia“ je P- celkový počet zhôd sa dosadí do vzorca na výpočet Kendallovho koeficientu, ktorý je výpočtovo jednoduchší, ale s nárastom vzorky, na rozdiel od r- Spearman, objem výpočtov sa nezväčšuje proporcionálne, ale exponenciálne. Tak napríklad kedy N= 12 je potrebné zoradiť 66 dvojíc predmetov a kedy N= 489 - už 1128 párov, t.j. počet výpočtov sa zvyšuje viac ako 17-krát. Pri výpočte na počítači v štatistickom programe (SPSS, Statistica) sa Kendallov koeficient počíta podobne ako koeficienty r- Spearman a r-Pearson. Vypočítaný korelačný koeficient τ -Kendall sa vyznačuje presnejšou hodnotou p-úroveň.

Použitie Kendallovho koeficientu sa uprednostňuje, ak pôvodné údaje obsahujú odľahlé hodnoty.

Charakteristickým znakom koeficientov poradovej korelácie je, že maximálne korelácie poradia (+1, –1) nemusia nevyhnutne zodpovedať prísnym priamym alebo nepriamo úmerným vzťahom medzi pôvodnými premennými. X A Y: stačí medzi nimi len monotónne funkčné spojenie. Rankové korelácie dosahujú svoju maximálnu hodnotu modulo, ak väčšia hodnota jednej premennej vždy zodpovedá väčšej hodnote inej premennej (+1), alebo väčšia hodnota jednej premennej vždy zodpovedá menšej hodnote inej premennej a naopak (–1 ).

Štatistická hypotéza, ktorá sa má testovať, postup pri prijímaní štatistického rozhodnutia a formulácia zmysluplného záveru sú rovnaké ako v prípade r-Spearman alebo r-Pearson.

Ak sa nenájde štatisticky významný vzťah, ale existuje dôvod domnievať sa, že vzťah skutočne existuje, mali by ste najprv vychádzať z koeficientu

r-Spearman na pomer τ -Kendall (alebo naopak) a potom skontrolujte možné dôvody nespoľahlivosti spojenia:

  • nelinearita komunikácie: Ak to chcete urobiť, pozrite sa na 2D bodový graf. Ak vzťah nie je monotónny, potom rozdeľte vzorku na časti, v ktorých je vzťah monotónny, alebo rozdeľte vzorku do kontrastných skupín a potom ich porovnajte podľa úrovne prejavu symptómov;
  • heterogenita vzorky: pozrite sa na dvojrozmerný bodový graf, skúste rozdeliť vzorku na časti, v ktorých môže mať vzťah rôzne smery.

Ak je súvislosť štatisticky významná, potom pred zmysluplným záverom je potrebné vylúčiť možnosť falošnej korelácie (analogicky s metrickými korelačnými koeficientmi).

Korelácia dichotomických premenných

Pri porovnávaní dvoch premenných nameraných na dichotomickej škále je mierou korelácie takzvaný j-faktor, čo je korelačný koeficient pre dichotomické údaje.

Hodnota koeficient φ leží medzi +1 a -1. Môže byť pozitívny aj negatívny, charakterizujúci smer spojenia medzi dvoma dichotomicky meranými znakmi. Interpretácia φ však môže spôsobiť špecifické problémy. Dichotomické údaje zahrnuté v schéme na výpočet koeficientu φ nevyzerajú ako dvojrozmerný normálny povrch, preto je nesprávne predpokladať, že interpretované hodnoty rxy\u003d 0,60 a φ \u003d 0,60 sú rovnaké. Koeficient φ možno vypočítať kódovacou metódou, ako aj pomocou takzvanej štvorpolovej tabuľky alebo kontingenčnej tabuľky.

Na uplatnenie korelačného koeficientu φ musia byť splnené tieto podmienky:

  • porovnávané vlastnosti by sa mali merať na dichotomickej škále;
  • X A Y by mala byť rovnaká.

Tento typ korelácie je vypočítaný v počítačovom programe SPSS na základe definície mier vzdialenosti a miery podobnosti. Niektoré štatistické postupy, ako je faktorová analýza, zhluková analýza, multivariačné škálovanie, sú postavené na aplikácii týchto mier a niekedy samotné poskytujú ďalšie možnosti na výpočet mier podobnosti.

Keď sa jedna premenná meria na dichotomickej škále (premenná X) a druhý v škále intervalov alebo pomerov (premenné Y), sa používa bisériový korelačný koeficient, napríklad pri testovaní hypotéz o vplyve pohlavia dieťaťa na výšku a váhu. Tento koeficient sa pohybuje v rozmedzí od -1 do +1, ale pre interpretáciu výsledkov nezáleží na jeho znamienku. Pre jeho použitie musia byť splnené nasledujúce podmienky:

  • porovnávané znaky by sa mali merať v rôznych mierkach: jedna X- v dichotomickej mierke; ďalší Y– v škále intervalov alebo pomerov;
  • premenlivý Y má normálny distribučný zákon;
  • počet rôznych znakov v porovnávaných premenných X A Y by mala byť rovnaká.

Ak premenná X merané na dichotomickej škále a premenná Y v rebríčku hodností (premenná Y), môže byť použité poradovo-dvojsériový korelačný koeficient, ktorý úzko súvisí s Kendallovým τ a vo svojej definícii používa pojmy koincidencia a inverzia. Interpretácia výsledkov je rovnaká.

Vykonávanie korelačnej analýzy pomocou počítačových programov SPSS a Statistica je jednoduchá a pohodlná operácia. Ak to chcete urobiť, po vyvolaní dialógového okna Bivariačné korelácie (Analyze> Correlate> Bivariate ...), musíte presunúť skúmané premenné do poľa Variables a vybrať metódu, pomocou ktorej sa bude korelácia medzi premennými zisťovať. Výstupný súbor výsledkov obsahuje štvorcovú tabuľku (Korelácie) pre každé vypočítané kritérium. Každá bunka tabuľky obsahuje: samotnú hodnotu korelačného koeficientu (Correlation Coefficient), štatistickú významnosť vypočítaného koeficientu Sig, počet subjektov.

Nadpis a bočné stĺpce výslednej korelačnej tabuľky obsahujú názvy premenných. Uhlopriečka (ľavý horný - pravý dolný roh) tabuľky pozostáva z jednotiek, pretože korelácia akejkoľvek premennej so sebou je maximálna. Stôl je symetrický okolo tejto uhlopriečky. Ak je v programe zaškrtnuté políčko "Označiť významné korelácie", potom sa vo výslednej korelačnej tabuľke označia štatisticky významné koeficienty: na úrovni 0,05 a menej - jednou hviezdičkou (*) a na úrovni 0,01 - s dve hviezdičky (**).

Aby som to zhrnul: hlavným účelom korelačnej analýzy je identifikovať vzťah medzi premennými. Mierou súvislosti sú korelačné koeficienty, ktorých výber priamo závisí od typu škály, v ktorej sa premenné merajú, od počtu rôznych znakov v porovnávaných premenných a od distribúcie premenných. Prítomnosť korelácie medzi dvoma premennými neznamená, že medzi nimi existuje kauzálny vzťah. Hoci korelácia priamo nenaznačuje kauzalitu, môže byť kľúčom k príčinám. Na jeho základe sa dajú vytvárať hypotézy. V niektorých prípadoch má nedostatok korelácie hlbší vplyv na hypotézu príčinnej súvislosti. Nulová korelácia dvoch premenných môže naznačovať, že neexistuje žiadny vplyv jednej premennej na druhú.

Za zakladateľov teórie korelácie sa považujú anglickí biometrici F. Galton (1822-1911) a K. Pearson (1857-1936). Pojem "korelácia" znamená pomer, korešpondenciu. Myšlienka korelácie ako vzájomnej závislosti náhodných premenných je základom štatistickej teórie korelácie - štúdia závislosti variácie funkcie na podmienkach prostredia. Niektoré znaky pôsobia ako ovplyvňujúce (faktoriálne), iné - ktoré sú ovplyvnené, efektívne. Vzťahy medzi vlastnosťami môžu byť funkčné a korelačné. Funkčné vzťahy sú charakterizované úplnou korešpondenciou medzi zmenou atribútu faktora a zmenou efektívnej hodnoty. Každá hodnota atribútu-faktora zodpovedá určitej hodnote efektívneho atribútu. Neexistuje úplná zhoda v koreláciách medzi zmenou faktora a výsledným znamienkom. V komplexnej interakcii je efektívna vlastnosť samotná. Preto sú výsledky korelačnej analýzy v tomto smere dôležité a interpretácia týchto výsledkov vo všeobecnosti si vyžaduje vytvorenie systému korelácií. Vyznačujú sa množstvom príčin a následkov a pomocou nich sa vytvára tendencia k zmene výsledného atribútu pri zmene hodnoty faktora. Napríklad produktivitu práce ovplyvňujú faktory stupňa zdokonalenia techniky a technológie, úroveň mechanizácie a automatizácie práce, špecializácia výroby, fluktuácia zamestnancov atď.

V prírode a spoločnosti prebiehajú javy a udalosti podľa charakteru korelácie, kedy so zmenou hodnoty jedného atribútu existuje tendencia meniť atribút druhý. Korelácia je špeciálny prípad štatistického vzťahu. Korelačná analýza sa používa na stanovenie tesnosti vzťahu medzi javmi, procesmi, objektmi.

Účelom štúdie je často zistiť vzťah (koreláciu) medzi znakmi. Znalosť závislosti umožňuje riešiť kardinálnu úlohu každého výskumu – schopnosť predvídať a predvídať vývoj situácie pri zmene ovplyvňujúceho faktora. Korelácia môže poskytnúť iba formálne hodnotenie vzťahu. Preto predtým, ako sa pristúpi k výpočtu korelačných koeficientov medzi akýmikoľvek znakmi, malo by sa teoreticky zistiť, či medzi týmito znakmi existuje vzťah. Formálne môžu štatistiky skutočne dokázať neexistujúce vzťahy, napríklad medzi výškou budovy v meste a výnosom pšenice na farmách.

Vzťah medzi javmi (korelácia) sa zisťuje nastavením experimentov, štatistickou analýzou. Korelácia by sa nemala stotožňovať s kauzalitou. Treba si však uvedomiť, že dôkaz matematického spojenia musí byť založený na skutočnom vzťahu medzi javmi. Napríklad mineralizácia vody zo severu na juh Bieloruska klesá a rovnakým smerom klesá aj obsah živín v pôde. Medzi uvažovanými ukazovateľmi možno získať pozitívny významný vzťah. Stupeň mineralizácie vody však neurčuje optimálny obsah živín v pôde. V opačnom prípade by v púštnych krajinách bola úrodnosť maximálna, pretože tu je maximálna mineralizácia vody (pôda a podzemná voda je brakická), čo je v rozpore s pravdou. Preto je takéto spojenie v púštnych krajinách nezmyselné. Najlepší denný prenájom bytov rôznych úrovní komfortu od vlastníkov bez provízie nájdete na webovej stránke piter.stay24.ru. Pohodlné vyhľadávanie vám umožní jednoducho rýchlo nájsť ten správny byt podľa vašich požiadaviek, pričom strávite minimum času.

Akýkoľvek indikátor súvislosti slúži ako približný odhad uvažovanej závislosti a nie je zárukou existencie rigidnej (funkčnej) podriadenosti. Absencia rigidnej závislosti v prírode a spoločnosti prispieva k samoregulácii procesov, javov, systémov

Smer komunikácie môže byť priamy a reverzný; podľa povahy - funkčné alebo štatistické (korelácia); vo veľkosti - slabé, stredné alebo silné; vo forme - lineárne a nelineárne; počtom korelovaných znakov - párových a viacnásobných.

Funkčná závislosť je typická pre geometrické tvary, technické systémy, kedy každá hodnota jedného atribútu zodpovedá presnej hodnote iného. Toto je príklad vzťahu medzi plochou obdĺžnika a dĺžkou jednej z jeho strán. Takáto závislosť je úplná alebo úplná.

Existuje niekoľko typov párovej korelácie:

Paralelno-korelatívne alebo asociatívne, keď sa oba znaky menia v spojení, čiastočne pod vplyvom spoločných príčin a účinkov (obmedzenie vegetácie a pôdy na určité formy krajiny; priemyselný rozvoj a rast populácie na suroviny);

subkauzálny, keď jeden faktor pôsobí ako samostatná príčina pridruženej zmeny znaku (vzťah medzi biomasou a zrážkami; rastom populácie a plodnosťou);

vzájomne anticipatívne, kedy príčina a následok, ktoré sú v stabilnom vzájomnom vzťahu, sa navzájom dôsledne ovplyvňujú (vlhkosť vzduchu a zrážky).

Ak je vlastnosť ovplyvnená viacerými faktormi, je potrebné vyhodnotiť viaceré korelácie. Viacnásobná korelácia slúži ako základ na identifikáciu vzťahov medzi znakmi, ale vyžaduje si prísnu normalitu a priamočiarosť rozdelenia, takže jej použitie môže byť náročné. So zvyšujúcim sa počtom premenných sa množstvo výpočtovej práce zvyšuje úmerne druhej mocnine počtu premenných. V tomto prípade je ťažšie posúdiť významnosť výsledkov, pretože sa zvyšujú chyby v korelačných koeficientoch. V praxi sa v takýchto prípadoch obmedzujú len na štúdium hlavných faktorov. Povaha vplyvu hlavných faktorov na vlastnosť sa však podrobnejšie a presnejšie študuje pomocou faktorovej analýzy.

Pri praktickej práci na stanovení korelácie medzi znakmi a javmi je potrebné dodržiavať nasledujúcu postupnosť:

na základe vykonaných štúdií sa predbežne určí, či medzi posudzovanými znakmi existuje súvislosť;

Ak medzi nimi existuje spojenie, zistite jeho tvar, smer a tesnosť pomocou grafu.

Na začiatku sú zostavené konjugované variačné rady, v ktorých by sa mal určiť argument x a funkcia y:

Pre konjugované možnosti je vytvorený graf, ktorý pomáha určiť typ vzťahu medzi argumentom a funkciou. Ďalšie spracovanie experimentálnych alebo štatistických údajov závisí od formy korelácie. Lineárna závislosť zahŕňa výpočet korelačného koeficientu r a nelineárna závislosť - korelačný pomer η (obr. 5.1). Stupeň frekvenčného rozptylu alebo variant vzhľadom na regresnú priamku na grafe udáva približne tesnosť spojenia: čím menší rozptyl, tým pevnejšie spojenie (obr. 5.2).

Korelačná analýza rieši tieto úlohy:

Stanovenie smeru a formy komunikácie,

posúdenie tesnosti spoja,

posúdenie reprezentatívnosti štatistických odhadov vzťahu,

· určenie veľkosti determinácie (podielu vzájomného vplyvu) korelovaných faktorov.

Ryža. 5.1. Korelačný formulár:

a - priamka; b - spätný lineárny; c - parabalický; g - hyperbolický

Na posúdenie súvislosti sa používajú nasledujúce číselné kritériá (koeficienty) korelácie:

korelačný koeficient (r) s lineárnou závislosťou,

korelačný pomer (η) s nelineárnou závislosťou,

viacnásobné regresné koeficienty,

· poradové koeficienty lineárnej korelácie podľa Pearsona alebo Kendala.

Pojem vzťah je v psychologických výskumoch celkom bežný. Psychológ s ním musí pracovať, keď je potrebné porovnať merania dvoch alebo viacerých ukazovateľov znakov alebo javov, aby mohol vyvodiť závery.

Charakter vzťahu medzi skúmanými javmi môže byť jednoznačný, t.j. ako keď určitá hodnota jedného atribútu zodpovedá jasnej a určitej hodnote iného. Takže napríklad v subteste na hľadanie vzorcov testov mentálnych funkcií sa počet „surových“ bodov určuje podľa vzorca:
Xi \u003d Stz – Soz / Stz + Spz * Sbc,
kde Xi je hodnota variantov, Sтз je počet a priori špecifikovaných vzorov (zhôd) v subteste, Soz je počet chybne označených zhôd s testovanými subjektmi, Soz je počet neindikovaných (chýbajúcich) zhôd s testované subjekty, Sbс je počet všetkých slov zobrazených testovanými subjektmi v teste.

Takýto vzťah sa nazýva funkčný: tu je jeden ukazovateľ funkciou druhého, čo je argument vo vzťahu k prvému.

Nie vždy sa však nájde jednoznačný vzťah. Častejšie sa musíme vysporiadať so situáciou, v ktorej jedna hodnota funkcie môže zodpovedať niekoľkým hodnotám inej. Tieto hodnoty sa líšia vo viac či menej definovaných hraniciach. Tento typ vzťahu sa nazýva korelácia alebo korelácia.

Používa sa niekoľko typov korelačných výrazov. Takže na vyjadrenie vzťahu medzi znakmi, ktoré majú kvantitatívny charakter variácie ich hodnôt, sa používajú miery centrálnej tendencie: tabelácia nasledovaná výpočtom párového korelačného koeficientu, koeficientu viacnásobnej a parciálnej korelácie, koeficientu viacnásobné určenie, korelačný pomer.

Ak je potrebné študovať vzťah medzi znakmi, ktorých variácia má kvalitatívny charakter (výsledky projektívnych metód výskumu osobnosti, štúdie s použitím metódy sémantického diferenciálu, štúdie s použitím otvorených škál a pod.), potom použite kvalitatívne alternatívny korelačný koeficient (tetrachorický indikátor), Pearsonovo kritérium x2, indikátory kontingencie (kontingencie) Pearsona a Chuprova.

Na zistenie kvalitatívno-kvantitatívnej korelácie, t.j. taká korelácia, keď jeden znak má kvalitatívnu variáciu a druhý - kvantitatívnu.Používajú sa špeciálne metódy.

Korelačný koeficient (pojem prvýkrát zaviedol F. Galton v roku 1888) je indikátorom sily vzťahu medzi dvomi porovnávanými možnosťami vzorky (vzoriek). Bez ohľadu na vzorec použitý na výpočet korelačného koeficientu sa jeho hodnota pohybuje od -1 do +1. V prípade úplnej pozitívnej korelácie sa tento koeficient rovná plus 1 a v prípade úplnej negatívnej korelácie je mínus 1. Zvyčajne ide o priamku prechádzajúcu priesečníkmi hodnôt každý pár údajov.

Ak hodnoty variantu nie sú zoradené na priamke, ale tvoria „oblak“, potom absolútna hodnota korelačného koeficientu bude menšia ako jedna a pri zaokrúhľovaní „oblaka“ sa blíži k nule. Ak je korelačný koeficient 0, obe možnosti sú od seba úplne nezávislé.

Akákoľvek vypočítaná (empirická) hodnota korelačného koeficientu sa musí skontrolovať na spoľahlivosť (štatistickú významnosť) podľa príslušných tabuliek kritických hodnôt korelačného koeficientu. Ak je empirická hodnota menšia alebo rovná tabuľkovej hodnote pre 5-percentnú úroveň (P = 0,05), korelácia nie je významná. Ak je vypočítaná hodnota korelačného koeficientu väčšia ako tabuľková hodnota pre P = 0,01, potom je korelácia štatisticky významná (významná).

V prípade, že je hodnota koeficientu medzi 0,05 > P > 0,01, v praxi sa hovorí o významnosti korelácie pre P = 0,05.

Bravais-Pearsonov korelačný koeficient (r) je parametrický ukazovateľ navrhnutý v roku 1896, na výpočet ktorého sa porovnávajú aritmetický priemer a stredné štvorcové hodnoty variantu. Na výpočet tohto koeficientu sa používa nasledujúci vzorec (pre rôznych autorov môže vyzerať inak):
r= (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

kde E Xi Xi1 - súčet súčinov hodnôt párovo porovnateľných možností, n je počet porovnávaných párov, NXap, X1ap - možnosti aritmetického priemeru Xi, Xi; v uvedenom poradí, Qx, Qx, - štandardné odchýlky rozdelenia x a x.

Spearmanov koeficient poradovej korelácie Rs (koeficient poradovej korelácie, Spearmanov koeficient) je najjednoduchšou formou korelačného koeficientu a meria vzťah medzi poradiami (miestami) daného variantu na rôznych základoch, bez zohľadnenia jeho vlastnej hodnoty. Tu je vzťah skôr kvalitatívny ako kvantitatívny.

Tento neparametrický test sa zvyčajne používa v prípadoch, keď je potrebné vyvodiť závery nie tak o intervaloch medzi údajmi, ako o ich poradí, a tiež vtedy, keď sú distribučné krivky extrémne asymetrické a neumožňujú použitie takýchto parametrických testov. ako Bravaisov-Pearsonov korelačný koeficient (v niektorých prípadoch môže byť potrebné previesť kvantitatívne údaje na ordinálne údaje). Ak je koeficient Rs blízky +1, potom to znamená, že dva riadky vzorky zoradené podľa určitých charakteristík sa prakticky zhodujú a ak je tento koeficient blízky -1, môžeme hovoriť o úplnej inverznej závislosti.

Podobne ako výpočet Bravaisovho-Pearsonovho korelačného koeficientu je vhodnejšie prezentovať výpočty Rs koeficientu v tabuľkovej forme.

Regresia zovšeobecňuje koncept funkčného vzťahu na prípad stochastickej (pravdepodobnostnej) povahy vzťahu medzi hodnotami variantu. Účelom riešenia kategórie regresných problémov je odhadnúť hodnotu kontinuálneho výstupného rozptylu z hodnôt vstupných variantov.

MINISTERSTVO ŠKOLSTVA A VEDY

RUSKÁ FEDERÁCIA

Federálna štátna rozpočtová vzdelávacia inštitúcia vyššieho odborného vzdelávania

„MOSKOVSKÁ ŠTÁTNA UNIVERZITA

TECHNOLÓGIE A RIADENIE POMENOVANÉ PO K.G. RAZUMOVSKÝ"

(FGBOU VPO MGUTU pomenovaný po K.G. Razumovskom)

Ústav textilného a ľahkého priemyslu

Katedra technológie kože, kožušín a kožených výrobkov


TEST

v odbore "Metódy a prostriedky výskumu"


Vyplnené študentom

kurz Strazdin S.Yu.


Moskva, 2013

Cvičenie 1.

Korelačná analýza


Korelačná analýza je súbor metód na zisťovanie takzvanej korelačnej závislosti medzi náhodnými premennými.

Úlohy korelačnej analýzy sa redukujú na meranie blízkosti známeho vzťahu medzi rôznymi znakmi, identifikáciu neznámych príčinných vzťahov (ktorých kauzálny charakter treba objasniť pomocou teoretickej analýzy) a hodnotenie faktorov, ktoré majú najväčší vplyv na výsledný znak.

Etapy korelačnej analýzy

Multivariačná korelačná analýza vám umožňuje stanoviť prítomnosť, blízkosť a formu vzťahu medzi faktormi a skúmaným ukazovateľom. Pozostáva z niekoľkých etáp, ktorých rozdelenie je ľubovoľné, keďže jednotlivé etapy spolu úzko súvisia.

V prvej fáze sa stanovia ciele a zámery štúdie a na základe kvalitatívnej analýzy sa vyberú faktory, ktoré pravdepodobne ovplyvňujú skúmaný ukazovateľ.

Pri ich výbere je potrebné vziať do úvahy:

prítomnosť kauzálnych vzťahov medzi ukazovateľmi;

významnosť faktorov, to znamená miera ich vplyvu na ukazovateľ výkonnosti;

možnosť kvantitatívneho merania faktora.

V druhej fáze sa vykonáva zber a primárne spracovanie počiatočných informácií.

Súbor údajov musí byť dostatočne veľký. Informácie musia byť v súlade so zákonom o bežnom rozdelení, podľa ktorého by väčšina pozorovaní pre každý ukazovateľ mala byť zoskupená okolo jeho priemernej hodnoty.

Počiatočné údaje musia byť kvalitatívne a kvantitatívne homogénne. Z kvalitatívnej homogenity vyplývajú približne rovnaké podmienky a špecifiká tvorby faktora a výsledných znakov. Kvantitatívna homogenita spočíva v absencii takých pozorovaní, ktoré sa výrazne (anomálne) líšia od množstva údajov.

Kritériom homogenity informácií je smerodajná odchýlka a variačný koeficient, ktoré sa vypočítavajú pre každý faktor a ukazovateľ výsledku. Smerodajná odchýlka ukazuje absolútnu odchýlku jednotlivých hodnôt od aritmetického priemeru a variačný koeficient charakterizuje relatívnu mieru odchýlky jednotlivých hodnôt od aritmetického priemeru. Navyše, čím väčší je variačný koeficient, tým relatívne väčší je rozptyl údajov v súhrne.

Za variabilitu radu variácií sa považuje:

nevýznamné, ak odchýlka nepresahuje 10 %;

stredná, ak je odchýlka 10-20%;

významné, ak je viac ako 20 %, ale nepresahuje 33 %. Ak je odchýlka väčšia ako 33 %, atypické pozorovania by sa mali zo vzorky vylúčiť.

V tretej etape sa modelujú vzťahy medzi faktormi a výsledným znakom, t.j. rieši sa otázka výberu formy komunikácie.

Na základe ekonomického a logického rozboru povahy a podstaty skúmaného javu sa vyberie taký typ matematickej rovnice, ktorý najlepšie odráža povahu skúmaných závislostí.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov