Výpočet Spearmanovho korelačného koeficientu. Korelačná analýza pomocou Spearmanovej metódy (Spearmanove hodnosti)

Korelácia poradia Spearmana(poradová korelácia). Spearmanova poradová korelácia je najjednoduchší spôsob, ako určiť stupeň vzťahu medzi faktormi. Názov metódy naznačuje, že vzťah sa určuje medzi radmi, to znamená sériami získaných kvantitatívnych hodnôt, zoradených v zostupnom alebo vzostupnom poradí. Treba mať na pamäti, že po prvé, korelácia poradia sa neodporúča, ak je spojenie medzi pármi menej ako štyri a viac ako dvadsať; po druhé, poradová korelácia umožňuje určiť vzťah v inom prípade, ak sú hodnoty semikvantitatívnej povahy, to znamená, že nemajú číselné vyjadrenie a odrážajú jasné poradie výskytu týchto hodnôt; po tretie, je vhodné použiť koreláciu poradia v prípadoch, keď stačí získať približné údaje. Príklad výpočtu koeficientu poradovej korelácie na určenie otázky: dotazník meria X a Y podobné osobné vlastnosti subjektov. Pomocou dvoch dotazníkov (X a Y), ktoré vyžadujú alternatívne odpovede „áno“ alebo „nie“, boli získané primárne výsledky – odpovede 15 subjektov (N = 10). Výsledky boli prezentované ako súčet kladných odpovedí zvlášť pre dotazník X a pre dotazník B. Tieto výsledky sú zhrnuté v tabuľke. 5.19.

Tabuľka 5.19. Tabuľka primárnych výsledkov na výpočet Spearmanovho koeficientu poradovej korelácie (p) *

Analýza súhrnnej korelačnej matice. Metóda korelačných galaxií.

Príklad. V tabuľke Obrázok 6.18 ukazuje interpretácie jedenástich premenných, ktoré sa testujú pomocou Wechslerovej metódy. Údaje boli získané z homogénnej vzorky vo veku 18 až 25 rokov (n = 800).

Pred stratifikáciou je vhodné zoradiť korelačnú maticu. Na tento účel sa v pôvodnej matici vypočítajú priemerné hodnoty korelačných koeficientov každej premennej so všetkými ostatnými.

Potom podľa tabuľky. 5.20 určiť prijateľné úrovne stratifikácie korelačnej matice s danou pravdepodobnosťou spoľahlivosti 0,95 a n - veličinami

Tabuľka 6.20. Vzostupná korelačná matica

Premenné 1 2 3 4 by 0 7 8 0 10 11 M(rij) Poradie
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

Označenia: 1 - všeobecné povedomie; 2 - koncepčnosť; 3 - pozornosť; 4 - vdatnosť K zovšeobecnenia; b - priame zapamätanie (v číslach) 6 - úroveň ovládania materinského jazyka; 7 - rýchlosť osvojenia senzomotoriky (kódovanie symbolov) 8 - pozorovanie; 9 - kombinatorické schopnosti (na analýzu a syntézu) 10 - schopnosť organizovať časti do zmysluplného celku; 11 - schopnosť heuristickej syntézy; M (rij) - priemerná hodnota korelačných koeficientov premennej s ostatnými pozorovanými premennými (v našom prípade n = 800): r (0) - hodnota nulovej "Disecujúcej" roviny - minimálna významná absolútna hodnota premennej. korelačný koeficient (n - 120, r (0) = 0,236; n = 40, r (0) = 0,407) | Δr | - prípustný stupeň stratifikácie (n = 40, | Δr | = 0,558) v - prípustný počet úrovní stratifikácie (n = 40, s = 1; n = 120, s = 2); r (1), r (2), ..., r (9) - absolútna hodnota roviny rezu (n = 40, r (1) = 0,965).

Pre n = 800 nájdeme hodnotu gtypu a hraníc gi, po ktorých stratifikujeme korelačnú maticu, pričom zvýrazníme korelačné galaxie vo vrstvách alebo oddelené časti korelačnej matice, pričom nakreslíme asociácie korelačných galaxií pre nadložné vrstvy (obr. 5.5).

Zmysluplná analýza výsledných galaxií presahuje hranice matematických štatistík. Treba poznamenať, že existujú dva formálne ukazovatele, ktoré pomáhajú pri zmysluplnej interpretácii Plejád. Jedným z dôležitých ukazovateľov je stupeň vrcholu, to znamená počet hrán susediacich s vrcholom. Premenná s najväčším počtom hrán je „jadrom“ galaxie a možno ju považovať za indikátor zostávajúcich premenných tejto galaxie. Ďalším významným ukazovateľom je hustota komunikácie. Premenná môže mať menej spojení v jednej galaxii, ale bližšie, a viac spojení v inej galaxii, ale menej blízko.

Predpovede a odhady. Rovnica y = b1x + b0 sa nazýva všeobecná rovnica priamky. Označuje, že dvojice bodov (x, y), ktoré

Ryža. 5.5. Korelačné galaxie získané vrstvením matrice

ležať na určitej čiare, spojené tak, že pre akúkoľvek hodnotu x možno nájsť s ňou spojenú hodnotu b vynásobením x určitým číslom b1 a pripočítaním čísla b0 k tomuto súčinu.

Regresný koeficient umožňuje určiť mieru zmeny vyšetrovacieho faktora pri zmene kauzálneho faktora o jednu jednotku. Absolútne hodnoty charakterizujú vzťah medzi premennými faktormi ich absolútnymi hodnotami. Regresný koeficient sa vypočíta podľa vzorca:

Návrh a analýza experimentov. Návrh a analýza experimentov je tretím dôležitým odvetvím štatistických metód vyvinutých na hľadanie a testovanie kauzálnych vzťahov medzi premennými.

Na štúdium multifaktoriálnych závislostí sa v poslednom čase čoraz viac využívajú metódy matematického experimentálneho dizajnu.

Schopnosť súčasne meniť všetky faktory vám umožňuje: a) znížiť počet experimentov;

b) znížiť experimentálnu chybu na minimum;

c) zjednodušiť spracovanie prijatých údajov;

d) zabezpečiť jasnosť a jednoduchosť porovnávania výsledkov.

Každý faktor môže nadobudnúť určitý zodpovedajúci počet rôznych hodnôt, ktoré sa nazývajú úrovne a označujú sa -1, 0 a 1. Pevný súbor úrovní faktorov určuje podmienky jedného z možných experimentov.

Súčet všetkých možných kombinácií sa vypočíta podľa vzorca:

Úplný faktoriálny experiment je experiment, v ktorom sú implementované všetky možné kombinácie úrovní faktorov. Úplné faktorové experimenty môžu mať vlastnosť ortogonality. Pri ortogonálnom plánovaní sú faktory v experimente nekorelované, regresné koeficienty, ktoré sú nakoniec vypočítané, sú určené nezávisle od seba.

Dôležitou výhodou metódy matematického plánovania experimentov je jej univerzálnosť a vhodnosť v mnohých oblastiach výskumu.

Uvažujme príklad porovnania vplyvu niektorých faktorov na tvorbu úrovne psychického stresu u ovládačov farebných TV.

Experiment je založený na ortogonálnom návrhu 2 tri (tri faktory sa menia na dvoch úrovniach).

Experiment sa uskutočnil s úplnou časťou 2 + 3 s tromi opakovaniami.

Ortogonálne plánovanie je založené na konštrukcii regresnej rovnice. Pre tri faktory to vyzerá takto:

Spracovanie výsledkov v tomto príklade zahŕňa:

a) zostavenie ortogonálneho plánu 2 +3 tabuľky na výpočet;

b) výpočet regresných koeficientov;

c) kontrola ich významu;

d) interpretácia získaných údajov.

Pre regresné koeficienty uvedenej rovnice bolo potrebné dať N = 2 3 = 8 možností, aby bolo možné posúdiť významnosť koeficientov, kde počet opakovaní K bol 3.

Matica na plánovanie experimentu vyzerala takto:

Stručná teória

Ranková korelácia je metóda korelačnej analýzy, ktorá odráža vzťahy premenných usporiadaných podľa rastúcej hodnoty.

Hodnosti sú poradové čísla súhrnných jednotiek v zoradenej sérii. Ak zoradíme populáciu podľa dvoch charakteristík, medzi ktorými sa skúma vzťah, potom úplná zhoda hodností znamená najužšiu možnú priamu súvislosť a úplný opak hodností najužšiu možnú spätnú väzbu. Je potrebné zoradiť obe charakteristiky v rovnakom poradí: buď od menších hodnôt charakteristiky po väčšie, alebo naopak.

Pre praktické účely je použitie korelácie hodnosti veľmi užitočné. Napríklad, ak je medzi dvoma kvalitatívnymi charakteristikami produktov stanovená vysoká hodnotová korelácia, potom stačí produkty kontrolovať len jednou z charakteristík, čo znižuje náklady a urýchľuje kontrolu.

Koeficient poradovej korelácie, navrhnutý K. Spearmanom, sa týka neparametrickej miery vzťahu medzi premennými meranými na stupnici poradia. Pri výpočte tohto koeficientu nie sú potrebné žiadne predpoklady o charaktere rozdelenia charakteristík v populácii. Tento koeficient určuje mieru tesnej súvislosti medzi ordinálnymi charakteristikami, ktoré v tomto prípade predstavujú rady porovnávaných veličín.

Hodnota Spearmanovho korelačného koeficientu leží v rozmedzí +1 a -1. Môže byť pozitívny alebo negatívny, charakterizujúci smer vzťahu medzi dvoma charakteristikami meranými na hodnotovej stupnici.

Spearmanov koeficient poradovej korelácie sa vypočíta podľa vzorca:

Rozdiel medzi pozíciami na dvoch premenných

počet spárovaných párov

Prvým krokom pri výpočte koeficientu poradovej korelácie je zoradiť rad premenných. Postup hodnotenia začína usporiadaním premenných vo vzostupnom poradí ich hodnôt. Rôzne hodnoty majú priradené hodnosti označené prirodzenými číslami. Ak existuje niekoľko premenných rovnakej hodnoty, priradí sa im priemerné poradie.

Výhodou Spearmanovho koeficientu poradovej korelácie je, že je možné zoradiť podľa charakteristík, ktoré nie je možné vyjadriť číselne: je možné zoradiť kandidátov na určitú pozíciu podľa profesionálnej úrovne, podľa schopnosti viesť tím, podľa osobného šarmu, zoradiť kandidátov na určitú pozíciu podľa profesijnej úrovne. Pri expertných posudkoch je možné hodnotiť hodnotenia rôznych expertov a nájsť ich vzájomné korelácie, aby sa potom z posudzovania vylúčili hodnotenia expertov, ktoré slabo korelujú s hodnoteniami iných expertov. Na posúdenie stability trendu sa používa Spearmanov koeficient poradovej korelácie. Nevýhodou koeficientu hodnostnej korelácie je, že rovnaké rozdiely v poradí môžu zodpovedať úplne odlišným rozdielom v hodnotách charakteristík (v prípade kvantitatívnych charakteristík). Preto by sa korelácia hodností mala považovať za približnú mieru blízkosti spojenia, ktorá je menej informatívna ako korelačný koeficient číselných hodnôt charakteristík.

Príklad riešenia problému

Úloha

Prieskum medzi náhodne vybranými 10 študentmi bývajúcimi na vysokoškolskom internáte odhaľuje vzťah medzi priemerným skóre z predchádzajúcej relácie a počtom hodín týždenne, ktoré študent strávi samostatným štúdiom.

Určte silu vzťahu pomocou Spearmanovho koeficientu poradovej korelácie.

Ak máte problémy s riešením problémov, stránka poskytuje online pomoc študentom v štatistikách s domácimi testami alebo skúškami.

Riešenie problému

Vypočítajme koeficient poradovej korelácie.

Rozsah Porovnanie poradia Rozdiel v poradí 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Sum 60

Spearmanov koeficient poradovej korelácie:

Nahradením číselných hodnôt dostaneme:

Záver k problému

Vzťah medzi GPA z predchádzajúceho zasadnutia a počtom hodín týždenne, ktoré študent strávi samostatným štúdiom, je stredne silný.

Ak sa vám kráti čas na dokončenie testu, na webovej stránke si vždy môžete objednať urgentné riešenie problémov so štatistikou.

Priemerná náklady na vyriešenie testu sú 700 - 1200 rubľov (ale nie menej ako 300 rubľov za celú objednávku). Cenu do značnej miery ovplyvňuje naliehavosť rozhodnutia (od dňa až po niekoľko hodín). Náklady na online pomoc pre skúšku / test sú od 1 000 rubľov. za vyriešenie tiketu.

Všetky otázky o nákladoch môžete položiť priamo v chate, keď ste predtým poslali podmienky úlohy a informovali vás o časovom rámci pre riešenie, ktoré potrebujete. Čas odozvy je niekoľko minút.

Príklady súvisiacich problémov

Fechnerov pomer
Uvádza sa stručná teória a uvažuje sa o príklade riešenia problému výpočtu Fechnerovho znamienkového korelačného koeficientu.

Vzájomné kontingenčné koeficienty Chuprova a Pearsona
Stránka obsahuje informácie o metódach štúdia vzťahov medzi kvalitatívnymi charakteristikami pomocou Chuprovových a Pearsonových koeficientov vzájomnej kontingencie.

37. Spearmanov koeficient poradovej korelácie.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanov koeficient poradovej korelácie sa používa v prípadoch, keď:
- premenné majú hodnotiacej stupnici merania;
- distribúcia údajov je príliš odlišná od normálne alebo vôbec neznáme;
- vzorky majú malý objem (N< 30).

Interpretácia Spearmanovho koeficientu poradovej korelácie sa nelíši od Pearsonovho koeficientu, ale jeho význam je trochu odlišný. Aby sme pochopili rozdiel medzi týmito metódami a logicky zdôvodnili ich oblasti použitia, porovnajme ich vzorce.

Pearsonov korelačný koeficient:

Spearmanov korelačný koeficient:

Ako vidíte, vzorce sa výrazne líšia. Porovnajme vzorce

Pearsonov korelačný vzorec používa aritmetický priemer a štandardnú odchýlku korelovaného radu, ale Spearmanov vzorec nie. Na získanie adekvátneho výsledku pomocou Pearsonovho vzorca je teda potrebné, aby korelovaný rad bol blízko normálnemu rozdeleniu (priemer a štandardná odchýlka sú normálne distribučné parametre). Toto nie je relevantné pre Spearmanov vzorec.

Prvkom Pearsonovho vzorca je štandardizácia každej série v z-škála.

Ako vidíte, vo vzorci pre Pearsonov korelačný koeficient je prítomná konverzia premenných na Z-škálu. V súlade s tým pre Pearsonov koeficient vôbec nezáleží na mierke údajov: môžeme napríklad korelovať dve premenné, z ktorých jedna má min. = 0 a max. = 1 a druhá min. = 100 a max. = 1000. Bez ohľadu na to, aký rozdielny je rozsah hodnôt, všetky sa skonvertujú na štandardné hodnoty z, ktoré sú v mierke rovnaké.

Takáto normalizácia sa preto v Spearmanovom koeficiente nevyskytuje

POVINNOU PODMIENKOU POUŽITIA KOEFICIENTU SPEARMAN JE ROVNOSŤ ROZSAHU DVOCH PREMENNÝCH.

Pred použitím Spearmanovho koeficientu pre dátové série s rôznymi rozsahmi je potrebné hodnosť. Výsledkom hodnotenia je, že hodnoty týchto sérií získajú rovnaké minimum = 1 (minimálne poradie) a maximum rovné počtu hodnôt (maximum, posledné poradie = N, t.j. maximálny počet prípadov vo vzorke) .

V akých prípadoch sa zaobídete bez hodnotenia?

Toto sú prípady, keď sú dáta na začiatku hodnotiacej stupnici. Napríklad Rokeachov test hodnotových orientácií.

Tiež ide o prípady, keď je počet možností hodnôt malý a vzorka obsahuje pevne stanovené minimum a maximum. Napríklad v sémantickom diferenciáli je minimum = 1, maximum = 7.

Príklad výpočtu Spearmanovho koeficientu poradovej korelácie

Rokeachov test hodnotových orientácií sa uskutočnil na dvoch vzorkách X a Y. Cieľ: zistiť, ako blízko sú hierarchie hodnôt týchto vzoriek (doslova, nakoľko sú si podobné).

Výsledná hodnota r=0,747 je kontrolovaná pomocou tabuľka kritických hodnôt. Podľa tabuľky pri N=18 je získaná hodnota významná na úrovni p<=0,005

Spearman a Kendal hodnotia korelačné koeficienty

Pre premenné patriace do ordinálnej stupnice alebo pre premenné, ktoré nepodliehajú normálnemu rozdeleniu, ako aj pre premenné patriace do intervalovej stupnice, sa namiesto Pearsonovho koeficientu počíta Spearmanova poradová korelácia. Na tento účel sú jednotlivým hodnotám premenných priradené poradia, ktoré sa následne spracúvajú pomocou vhodných vzorcov. Ak chcete zistiť koreláciu hodnotenia, zrušte začiarknutie políčka predvolená korelácia Pearson v dialógovom okne Bivariačné korelácie.... Namiesto toho aktivujte výpočet Spearmanovej korelácie. Tento výpočet poskytne nasledujúce výsledky. Koeficienty poradovej korelácie sú veľmi blízke zodpovedajúcim hodnotám Pearsonových koeficientov (pôvodné premenné majú normálne rozdelenie).

titkova-matmetody.pdf str. 45

Spearmanova metóda poradovej korelácie umožňuje určiť tesnosť (pevnosť) a smer

korelácia medzi dve znamenia alebo dva profily (hierarchie) znamenia.

Na výpočet poradovej korelácie je potrebné mať dva riadky hodnôt,

ktoré možno zoradiť. Takéto série hodnôt môžu byť:

1) dve znamenia merané v tom istom skupina predmety;

2) dve individuálne hierarchie charakteristík, identifikované v dvoch predmetoch pomocou toho istého

súbor funkcií;

3) dva skupinové hierarchie charakteristík,

4) individuálne a skupinové hierarchia funkcií.

Po prvé, ukazovatele sú zoradené samostatne pre každú z charakteristík.

Spravidla sa nižšej hodnote atribútu priraďuje nižšia hodnosť.

V prvom prípade (dve charakteristiky) sú jednotlivé hodnoty zoradené podľa prvého

charakteristika získaná rôznymi subjektmi a potom individuálne hodnoty pre druhú

znamenie.

Ak sú dve charakteristiky v pozitívnom vzťahu, ide o subjekty s nízkym hodnotením

jeden z nich bude mať nízke hodnosti v druhom a subjekty, ktoré majú vysoké hodnosti v

jedna z charakteristík bude mať vysoké hodnotenie aj pre druhú charakteristiku. Na výpočet rs

rozdiely je potrebné určiť (d) medzi hodnosťami získanými daným subjektom v oboch

znamenia. Potom sa tieto ukazovatele d určitým spôsobom transformujú a odpočítajú od 1. Než

Čím menší je rozdiel medzi hodnotami, tým väčšie bude rs, tým bližšie bude k +1.

Ak neexistuje žiadna korelácia, všetky poradia budú zmiešané a nebude žiadna

žiadna korešpondencia. Vzorec je navrhnutý tak, že v tomto prípade bude rs blízko 0.

V prípade negatívnej korelácie nízky počet subjektov na jednom základe

vysoké hodnosti na inom základe budú zodpovedať a naopak. Čím väčší je rozpor

medzi radmi subjektov na dvoch premenných, čím bližšie je rs k -1.

V druhom prípade (dva individuálne profily), jednotlivé sú zoradené

hodnoty získané každým z 2 subjektov podľa určitého (to istého pre nich

obaja) súbor funkcií. Prvé hodnotenie bude udelené objektu s najnižšou hodnotou; druhé miesto -

znak s vyššou hodnotou a pod. Je zrejmé, že všetky charakteristiky musia byť zmerané

rovnaké jednotky, inak nie je možné klasifikovať. Napríklad je to nemožné

zoraďte ukazovatele na Cattell Personality Inventory (16PF), ak sú vyjadrené v

„surové“ body, pretože rozsahy hodnôt sa líšia pre rôzne faktory: od 0 do 13, od 0 do

20 a od 0 do 26. Nevieme povedať, ktorý faktor bude na prvom mieste

výraz, kým neprivedieme všetky hodnoty do jednej stupnice (najčastejšie je to nástenná stupnica).

Ak spolu jednotlivé hierarchie dvoch subjektov kladne súvisia, potom znamenia

mať nízke hodnosti v jednom z nich bude mať nízke hodnosti v druhom a naopak.

Napríklad, ak faktor E (dominancia) jedného subjektu má najnižšie hodnotenie, potom

iný testovaný subjekt, mal by mať nízke hodnotenie, ak jeden testovaný subjekt má faktor C

(emocionálna stabilita) má najvyššiu hodnosť, potom ju musí mať aj druhý subjekt

tento faktor má vysoké hodnotenie atď.

V treťom prípade (dva skupinové profily) sú zoradené priemerné hodnoty skupiny,

získané v 2 skupinách predmetov podľa konkrétneho súboru, identické pre obe skupiny

znamenia. V nasledujúcom je spôsob uvažovania rovnaký ako v predchádzajúcich dvoch prípadoch.

V prípade 4 (individuálne a skupinové profily) sú zoradené samostatne

individuálne hodnoty subjektu a priemerné hodnoty skupiny pre rovnaký súbor

znaky, ktoré sa získavajú spravidla vylúčením tohto jednotlivého subjektu – on

nezúčastňuje sa na priemernom skupinovom profile, s ktorým sa bude porovnávať jeho individuálny profil

profilu. Ranková korelácia vám umožní skontrolovať, ako konzistentný jednotlivec a

skupinové profily.

Vo všetkých štyroch prípadoch sa zisťuje významnosť výsledného korelačného koeficientu

podľa počtu hodnotených hodnôt N. V prvom prípade sa toto množstvo zhoduje s

veľkosť vzorky n. V druhom prípade bude počet pozorovaní počtom funkcií,

tvoriaci hierarchiu. V treťom a štvrtom prípade je N tiež porovnávaným číslom

charakteristiky, a nie počet predmetov v skupinách. Podrobné vysvetlenia sú uvedené v príkladoch. Ak

absolútna hodnota rs dosahuje alebo prekračuje kritickú hodnotu, koreláciu

spoľahlivý.

Hypotézy.

Existujú dve možné hypotézy. Prvý platí pre prípad 1, druhý pre ďalšie tri

Prvá verzia hypotéz

H0: Korelácia medzi premennými A a B sa nelíši od nuly.

H2: Korelácia medzi premennými A a B je výrazne odlišná od nuly.

Druhá verzia hypotéz

H0: Korelácia medzi hierarchiami A a B sa nelíši od nuly.

H2: Korelácia medzi hierarchiami A a B je výrazne odlišná od nuly.

Obmedzenia koeficientu poradovej korelácie

1. Pre každú premennú sa musí predložiť aspoň 5 pozorovaní. Horná

hranica odberu vzoriek je určená dostupnými tabuľkami kritických hodnôt .

2. Spearmanov koeficient poradovej korelácie rs pre veľký počet identických

poradie pre jednu alebo obe porovnávané premenné dáva hrubé hodnoty. V ideálnom prípade

obe korelované série musia predstavovať dve odlišné sekvencie

hodnoty. Ak táto podmienka nie je splnená, je potrebné vykonať zmenu

rovnaké hodnosti.

Spearmanov koeficient poradovej korelácie sa vypočíta podľa vzorca:

Ak oba porovnávané radové rady obsahujú skupiny rovnakých radov,

pred výpočtom koeficientu poradovej korelácie je potrebné vykonať korekcie

Hodnotenie Ta a TV:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Kde A - objem každej skupiny identických hodností v radovej rade A, v objem každého

skupiny identických hodností v radovej sérii B.

Na výpočet empirickej hodnoty rs použite vzorec:

38. Bodovo-dvojsériový korelačný koeficient.

O korelácii vo všeobecnosti pozri otázku č.36 s. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Nech sa premenná X meria na silnej škále a premenná Y na dichotomickej škále. Bodový biseriálny korelačný koeficient rpb sa vypočíta podľa vzorca:

Tu x 1 je priemerná hodnota za X objektov s hodnotou „jedna“ za Y;

x 0 – priemerná hodnota za X objektov s hodnotou „nula“ za Y;

s x – štandardná odchýlka všetkých hodnôt pozdĺž X;

n 1 – počet objektov „jedna“ v Y, n 0 – počet objektov „nula“ v Y;

n = n 1 + n 0 – veľkosť vzorky.

Bodový biseriálny korelačný koeficient možno vypočítať aj pomocou iných ekvivalentných výrazov:

Tu x– celková priemerná hodnota premennej X.

Bodový biseriálny korelačný koeficient rpb sa pohybuje od –1 do +1. Jeho hodnota je nula, ak sú premenné s jednotkou Y mať priemer Y rovná priemeru premenných s nulou nad Y.

Vyšetrenie hypotézy významnosti bodový biseriálny korelačný koeficient je potrebné skontrolovať nulová hypotézah 0 o rovnosti všeobecného korelačného koeficientu k nule: ρ = 0, ktorý sa vykonáva pomocou Studentovho t-testu. Empirický význam

v porovnaní s kritickými hodnotami t a (df) pre počet stupňov voľnosti df = n– 2

Ak je podmienka | t| ≤ ta(df), nulová hypotéza ρ = 0 nie je zamietnutá. Bodový biseriálny korelačný koeficient sa výrazne líši od nuly, ak je empirická hodnota | t| spadá do kritickej oblasti, to znamená, ak je podmienka | t| > ta(n– 2). Spoľahlivosť vzťahu vypočítaná pomocou bodového biseriálneho korelačného koeficientu rpb, možno určiť aj pomocou kritéria χ 2 pre počet stupňov voľnosti df= 2.

Bodová biseriálna korelácia

Následná úprava korelačného koeficientu súčinu momentov sa premietla do bodového biseriálu r. Táto štatistika. ukazuje vzťah medzi dvoma premennými, z ktorých jedna je údajne spojitá a normálne rozdelená a druhá je diskrétna v užšom zmysle slova. Bodový biseriálny korelačný koeficient označujeme r pbis Keďže v r r pbis dichotómia odráža skutočnú povahu diskrétnej premennej a nie je umelá, ako v tomto prípade r bis, jeho znamienko je určené ľubovoľne. Preto na všetky praktické účely. Ciele r pbis uvažované v rozsahu od 0,00 do +1,00.

Existuje aj prípad, keď sa predpokladá, že dve premenné sú spojité a normálne rozdelené, ale obe sú umelo dichotomizované, ako v prípade biserálnej korelácie. Na posúdenie vzťahu medzi takýmito premennými sa používa tetrachorický korelačný koeficient r tet, ktorú vyšľachtil aj Pearson. Základné (presné) vzorce a postupy výpočtu r tet dosť zložité. Preto s praktickým Táto metóda používa aproximácie r tet,získané na základe skrátených postupov a tabuliek.

/on-line/dictionary/dictionary.php?term=511

BODOVÝ BISERIÁLNY KOEFICIENT je korelačný koeficient medzi dvoma premennými, pričom jedna sa meria na dichotomickej škále a druhá na intervalovej stupnici. Používa sa v klasickom i modernom testovaní ako indikátor kvality testovacej úlohy – spoľahlivosť a súlad s celkovým skóre testu.

Na koreláciu premenných meraných v dichotomická a intervalová stupnica použitie bodovo-dvojsériový korelačný koeficient.
Bod-biseriálny korelačný koeficient je metóda korelačnej analýzy vzťahu premenných, z ktorých jedna sa meria na stupnici mien a má iba 2 hodnoty (napríklad muži/ženy, správna odpoveď/nesprávna odpoveď, vlastnosť prítomný/neprítomný) a druhý na mierkových pomeroch alebo intervalovej stupnici. Vzorec na výpočet bodovo-biserického korelačného koeficientu:

Kde:
m1 a m0 sú priemerné hodnoty X s hodnotou 1 alebo 0 v Y.
σx – štandardná odchýlka všetkých hodnôt o X
n1,n0 – počet hodnôt X od 1 alebo 0 do Y.
n – celkový počet párov hodnôt

Najčastejšie sa tento typ korelačného koeficientu používa na výpočet vzťahu medzi testovanými položkami a celkovou škálou. Toto je jeden typ kontroly platnosti.

39. Hodnotovo-dvojsériový korelačný koeficient.

O korelácii vo všeobecnosti pozri otázku č.36 s. 56 (64) 063.JPG

harchenko-korranaliz.pdf str. 28

Hodnotový biseriálny korelačný koeficient, ktorý sa používa v prípadoch, keď jedna z premenných ( X) sa uvádza v poradovej mierke a druhý ( Y) – dichotomický, vypočítaný podľa vzorca

.

Tu je priemerný počet objektov s jedným in Y; – priemerné poradie objektov od nuly do Y, n- veľkosť vzorky.

Vyšetrenie hypotézy významnosti Koeficient poradovo-dvojsériovej korelácie sa vykonáva podobne ako bodový dvojsériový korelačný koeficient pomocou Studentovho testu s náhradou vo vzorcoch rpb na rrb.

V prípadoch, keď sa jedna premenná meria na dichotomickej škále (premenná X), a druhý na stupnici poradia (premenná Y), použije sa dvojsériový korelačný koeficient poradia. Pamätáme si, že premenná X, meraný na dichotomickej škále, nadobúda iba dve hodnoty (kódy) 0 a 1. Zvlášť zdôrazňujeme: napriek tomu, že tento koeficient sa pohybuje v rozmedzí od –1 do +1, jeho znamienko nezáleží na interpretácii výsledky. Toto je ďalšia výnimka zo všeobecného pravidla.

Tento koeficient sa vypočíta podľa vzorca:

kde ' X 1 priemerné poradie pre tieto prvky premennej Y, čo zodpovedá kódu (znaku) 1 v premennej X;

„X 0 – priemerné poradie pre tie prvky premennej Y,čo zodpovedá kódu (znaku) 0 v premennej X\

N – celkový počet prvkov v premennej X.

Na uplatnenie koeficientu hodnostnej dvojsériovej korelácie musia byť splnené tieto podmienky:

1. Porovnávané premenné sa musia merať na rôznych mierkach: jedna X - v dichotomickom meradle; iné Y– na rebríčku.

2. Počet rôznych charakteristík v porovnávaných premenných X A Y by mala byť rovnaká.

3. Na posúdenie úrovne spoľahlivosti koeficientu hodnostnej dvojsériovej korelácie by ste mali použiť vzorec (11.9) a tabuľku kritických hodnôt pre študentský test k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Prípady, keď je jedna z premenných zastúpená v dichotomická stupnica, a druhý v hodnosť (ordinálna), vyžadujú aplikáciu poradovo-dvojsériový korelačný koeficient:

rpb=2 / n * (m1 - m0)

Kde:
n – počet meraných objektov
m1 a m0 - priemerné poradie objektov s 1 alebo 0 na druhej premennej.
Tento koeficient sa používa aj pri kontrole platnosti testov.

40. Lineárny korelačný koeficient.

Koreláciu vo všeobecnosti (a lineárnu koreláciu zvlášť) pozri v otázke č.36 s. 56 (64) 063.JPG

KOEFICIENT pána PEARSONA

r-Pearson (Pearson r) sa používa na štúdium vzťahu medzi dvoma metrikamirôznych premenných meraných na tej istej vzorke. Existuje veľa situácií, v ktorých je jeho použitie vhodné. Ovplyvňuje inteligencia akademický výkon vo vyšších ročníkoch univerzity? Súvisí výška platu zamestnanca s jeho ústretovosťou voči kolegom? Ovplyvňuje nálada študenta úspešnosť riešenia zložitého aritmetického problému? Na zodpovedanie takýchto otázok musí výskumník zmerať dva ukazovatele záujmu pre každého člena vzorky. Údaje na štúdium vzťahu sú potom tabuľkové, ako v príklade nižšie.

PRÍKLAD 6.1

V tabuľke je uvedený príklad počiatočných údajov na meranie dvoch ukazovateľov inteligencie (verbálnej a neverbálnej) pre 20 žiakov 8. ročníka.

Vzťah medzi týmito premennými je možné znázorniť pomocou bodového grafu (pozri obrázok 6.3). Diagram ukazuje, že medzi meranými ukazovateľmi existuje určitý vzťah: čím väčšia je hodnota verbálnej inteligencie, tým (väčšinou) je väčšia hodnota neverbálnej inteligencie.

Pred uvedením vzorca pre korelačný koeficient sa pokúsme vysledovať logiku jeho výskytu pomocou údajov z príkladu 6.1. Pozíciu každého /-bodu (predmet s číslom /) na rozptylovom diagrame vzhľadom na ostatné body (obr. 6.3) je možné špecifikovať hodnotami a znakmi odchýlok zodpovedajúcich hodnôt premenných od ich priemerných hodnôt. : (xj - MJ A (myseľ pri ). Ak sa znaky týchto odchýlok zhodujú, znamená to pozitívny vzťah (väčšie hodnoty pre X zodpovedajú veľké hodnoty pri alebo nižšie hodnoty X zodpovedajú menšie hodnoty y).

U predmetu č.1 odchýlka od priemeru X a podľa pri pozitívne a pre subjekt č. 3 sú obe odchýlky negatívne. V dôsledku toho údaje z oboch naznačujú pozitívny vzťah medzi študovanými znakmi. Naopak, ak známky odchýlok od priemeru X a podľa pri sa líšia, bude to indikovať negatívny vzťah medzi charakteristikami. Teda u predmetu č.4 odchýlka od priemeru X je negatívny, tým y - pozitívne a pre predmet č. 9 - naopak.

Ak teda súčin odchýlok (x,- M X ) X (myseľ pri ) pozitívny, potom údaje /-subjektu naznačujú priamy (pozitívny) vzťah a ak negatívny, potom reverzný (negatívny) vzťah. V súlade s tým, ak Xwy y sú vo všeobecnosti spojené priamo úmerne, potom väčšina súčinov odchýlok bude kladná, a ak súvisia inverzným vzťahom, potom väčšina súčinov bude negatívna. Preto všeobecným ukazovateľom sily a smeru vzťahu môže byť súčet všetkých produktov odchýlok pre danú vzorku:

Pri priamo úmernom vzťahu medzi premennými je táto hodnota veľká a pozitívna - pre väčšinu subjektov sa odchýlky zhodujú v znamienkach (veľké hodnoty jednej premennej zodpovedajú veľkým hodnotám inej premennej a naopak). Ak X A pri mať spätnú väzbu, potom pre väčšinu subjektov budú väčšie hodnoty jednej premennej zodpovedať menším hodnotám inej premennej, t.j. znamienka produktov budú záporné a súčet produktov ako celku bude tiež veľký v absolútnej hodnote, ale v zápornom znamienku. Ak medzi premennými neexistuje systematická súvislosť, kladné členy (produkty odchýlok) budú vyvážené zápornými členmi a súčet všetkých produktov odchýlok bude blízky nule.

Aby sa zabezpečilo, že súčet produktov nezávisí od veľkosti vzorky, stačí ju spriemerovať. Nás však nezaujíma miera prepojenia ako všeobecný parameter, ale ako jeho vypočítaný odhad – štatistika. Preto, pokiaľ ide o vzorec rozptylu, v tomto prípade urobíme to isté, vydelíme súčet súčinov odchýlok nie N, a v TV - 1. Výsledkom je miera spojenia, široko používaná vo fyzike a technických vedách, ktorá sa nazýva kovariancia (Covahance):


IN V psychológii, na rozdiel od fyziky, sa väčšina premenných meria na ľubovoľných mierkach, pretože psychológov nezaujíma absolútna hodnota znaku, ale relatívne postavenie subjektov v skupine. Okrem toho je kovariancia veľmi citlivá na škálu škály (variancie), na ktorej sa vlastnosti merajú. Aby bola miera spojenia nezávislá od jednotiek merania oboch charakteristík, stačí rozdeliť kovarianciu na zodpovedajúce štandardné odchýlky. Tak sa to získalo pre-Mule korelačného koeficientu K. Pearsona:

alebo po nahradení výrazov za o x a


Ak boli hodnoty oboch premenných prevedené na r-hodnoty pomocou vzorca


potom vzorec pre r-Pearsonov korelačný koeficient vyzerá jednoduchšie (071.JPG):

/dikt/sociológia/článok/soc/soc-0525.htm

KORELAČNÁ LINEÁRNA- štatistický lineárny vzťah nekauzálnej povahy medzi dvoma kvantitatívnymi premennými X A pri. Merané pomocou "koeficientu K.L." Pearson, ktorý je výsledkom delenia kovariancie štandardnými odchýlkami oboch premenných:

,

Kde s xy- kovariancia medzi premennými X A pri;

s X , s r- štandardné odchýlky pre premenné X A pri;

X i , r i- premenlivé hodnoty X A pri pre objekt s číslom i;

X, r- aritmetické priemery premenných X A pri.

Pearsonov koeficient r môže nadobúdať hodnoty z intervalu [-1; +1]. Význam r = 0 znamená, že medzi premennými neexistuje lineárny vzťah X A pri(ale nevylučuje nelineárny štatistický vzťah). Kladné hodnoty koeficientu ( r> 0) označujú priame lineárne spojenie; čím je jeho hodnota bližšie k +1, tým silnejší je vzťah štatistickej čiary. Záporné hodnoty koeficientu ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 znamená prítomnosť úplného lineárneho spojenia, priameho alebo reverzného. V prípade úplného spojenia, všetky body so súradnicami ( X i , r i) ležať na priamke r = a + bx.

"Koeficient K.L." Pearson sa tiež používa na meranie sily spojenia v lineárnom párovom regresnom modeli.

41. Korelačná matica a korelačný graf.

O korelácii vo všeobecnosti pozri otázku č.36 s. 56 (64) 063.JPG

Korelačná matica. Korelačná analýza často zahŕňa štúdium vzťahov medzi nie dvoma, ale mnohými premennými meranými na kvantitatívnom meradle v jednej vzorke. V tomto prípade sú korelácie vypočítané pre každý pár tohto súboru premenných. Výpočty sa zvyčajne vykonávajú na počítači a výsledkom je korelačná matica.

Korelačná matica(Korelácia Matrix) je výsledkom výpočtu korelácií jedného typu pre každý pár z množiny R premenné merané na kvantitatívnom meradle v jednej vzorke.

PRÍKLAD

Predpokladajme, že študujeme vzťahy medzi 5 premennými (vl, v2,..., v5; P= 5), merané na vzorke N=30Ľudské. Nižšie je uvedená tabuľka zdrojových údajov a korelačná matica.

A
podobné údaje:

Korelačná matica:

Je ľahké si všimnúť, že korelačná matica je štvorcová, symetrická vzhľadom na hlavnú uhlopriečku (takkak,y = /) y), s jednotkami na hlavnej uhlopriečke (od r. G A = Gu = 1).

Korelačná matica je námestie: počet riadkov a stĺpcov sa rovná počtu premenných. Ona symetrické vzhľadom na hlavnú uhlopriečku, keďže korelácia X s pri rovná korelácii pri s X. Jednotky sú umiestnené na jeho hlavnej uhlopriečke, pretože korelácia prvku so sebou samým je rovná jednej. V dôsledku toho nie sú predmetom analýzy všetky prvky korelačnej matice, ale tie, ktoré sa nachádzajú nad alebo pod hlavnou diagonálou.

počet korelačných koeficientov, Vlastnosti, ktoré sa majú analyzovať pri štúdiu vzťahov, sú určené vzorcom: P(P- 1)/2. Vo vyššie uvedenom príklade je počet takýchto korelačných koeficientov 5(5 - 1)/2 = 10.

Hlavnou úlohou analýzy korelačnej matice je identifikácia štruktúry vzťahov medzi mnohými znakmi. V tomto prípade je možná vizuálna analýza korelačné galaxie- grafický obrázok štruktúry štatistickyzmysluplné spojenia, ak takýchto spojení nie je veľmi veľa (do 10-15). Ďalším spôsobom je použitie viacrozmerných metód: viacnásobná regresia, faktorová alebo zhluková analýza (pozri časť „Multivariačné metódy...“). Pomocou faktorovej alebo zhlukovej analýzy je možné identifikovať zoskupenia premenných, ktoré sú navzájom prepojené viac ako s inými premennými. Veľmi účinná je aj kombinácia týchto metód, napríklad ak je znakov veľa a nie sú homogénne.

Porovnanie korelácií - dodatočná úloha analýzy korelačnej matice, ktorá má dve možnosti. Ak je potrebné porovnať korelácie v jednom z riadkov korelačnej matice (pre jednu z premenných), použije sa porovnávacia metóda pre závislé vzorky (s. 148-149). Pri porovnávaní rovnomenných korelácií vypočítaných pre rôzne vzorky sa používa porovnávacia metóda pre nezávislé vzorky (s. 147-148).

Porovnávacie metódy korelácie v uhlopriečkach korelačná matica (na posúdenie stacionárnosti náhodného procesu) a porovnanie niekoľko korelačné matice získané pre rôzne vzorky (pre ich homogenitu) sú náročné na prácu a presahujú rámec tejto knihy. S týmito metódami sa môžete zoznámiť z knihy G.V. Suchodolského 1.

Problém štatistickej významnosti korelácií. Problém je, že postup pri testovaní štatistických hypotéz predpokladá jeden-viacnásobné test vykonaný na jednej vzorke. Ak sa použije rovnaká metóda opakovane, aj keď vo vzťahu k rôznym premenným sa zvyšuje pravdepodobnosť získania výsledku čisto náhodou. Vo všeobecnosti, ak zopakujeme rovnakú metódu testovania hypotéz raz vo vzťahu k rôznym premenným alebo vzorkám, potom so stanovenou hodnotou a zaručene dostaneme potvrdenie hypotézy v ahk počet prípadov.

Predpokladajme, že korelačná matica sa analyzuje pre 15 premenných, to znamená, že sa vypočíta 15(15-1)/2 = 105 korelačných koeficientov. Na testovanie hypotéz je nastavená úroveň a = 0,05 105-krát zaškrtnutím hypotézy dostaneme jej potvrdenie päťkrát (!) bez ohľadu na to, či spojenie skutočne existuje. Keď to vieme a máme povedzme 15 „štatisticky významných“ korelačných koeficientov, vieme povedať, ktoré z nich boli získané náhodou a ktoré odrážajú skutočný vzťah?

Presne povedané, na prijatie štatistického rozhodnutia je potrebné znížiť úroveň a toľkokrát, ako je počet testovaných hypotéz. To sa však sotva odporúča, pretože pravdepodobnosť ignorovania skutočne existujúceho spojenia (vykonanie chyby typu II) sa zvyšuje nepredvídateľným spôsobom.

Samotná korelačná matica nie je dostatočným základompre štatistické závery týkajúce sa jednotlivých koeficientov v ňom zahrnutýchkorelácie!

Existuje len jeden skutočne presvedčivý spôsob, ako vyriešiť tento problém: rozdeliť vzorku náhodne na dve časti a vziať do úvahy len tie korelácie, ktoré sú štatisticky významné v oboch častiach vzorky. Alternatívou môže byť použitie viacrozmerných metód (faktorová, zhluková alebo viacnásobná regresná analýza) na identifikáciu a následnú interpretáciu skupín štatisticky významne súvisiacich premenných.

Problém s chýbajúcimi hodnotami. Ak v údajoch chýbajú hodnoty, potom sú možné dve možnosti na výpočet korelačnej matice: a) odstránenie hodnôt riadok po riadku (Vylúčiťprípadyzoznamovo); b) párové vymazanie hodnôt (Vylúčiťprípadypárovo). O vymazanie riadok po riadku pozorovania s chýbajúcimi hodnotami sa vymaže celý riadok pre objekt (predmet), ktorý má aspoň jednu chýbajúcu hodnotu pre jednu z premenných. Táto metóda vedie k „správnej“ korelačnej matici v tom zmysle, že všetky koeficienty sú vypočítané z rovnakej množiny objektov. Ak sú však chýbajúce hodnoty v premenných distribuované náhodne, potom táto metóda môže viesť k tomu, že v uvažovanom súbore údajov nezostane jediný objekt (v každom riadku bude chýbať aspoň jedna hodnota) . Aby ste sa vyhli tejto situácii, použite inú metódu tzv párové odstránenie. Táto metóda zohľadňuje iba medzery v každom vybranom páre stĺpec-premenná a ignoruje medzery v iných premenných. Korelácia pre pár premenných sa vypočíta pre tie objekty, kde nie sú žiadne medzery. V mnohých situáciách, najmä keď je počet medzier relatívne malý, povedzme 10 %, a medzery sú rozdelené celkom náhodne, táto metóda nevedie k závažným chybám. Niekedy to však tak nie je. Napríklad systematická odchýlka (posun) v hodnotení môže „skryť“ systematické usporiadanie vynechaní, čo je dôvodom rozdielu v korelačných koeficientoch vytvorených pre rôzne podmnožiny (napríklad pre rôzne podskupiny objektov). Ďalší problém spojený s vypočítanou korelačnou maticou párovo k odstráneniu medzier dochádza pri použití tejto matice v iných typoch analýzy (napríklad pri viacnásobnej regresii alebo faktorovej analýze). Predpokladajú, že „správna“ korelačná matica sa používa s určitou úrovňou konzistencie a „súladu“ rôznych koeficientov. Použitie matice so „zlými“ (zaujatými) odhadmi vedie k tomu, že program buď nedokáže takúto maticu analyzovať, alebo budú výsledky chybné. Preto, ak sa použije párová metóda vylúčenia chýbajúcich údajov, je potrebné skontrolovať, či v distribúcii chýbajúcich údajov existujú systematické vzorce.

Ak párové vymazanie chýbajúcich údajov nevedie k žiadnemu systematickému posunu v priemeroch a rozptyloch (štandardné odchýlky), potom budú tieto štatistiky podobné tým, ktoré sa vypočítali pomocou metódy vymazania chýbajúcich údajov riadok po riadku. Ak je pozorovaný významný rozdiel, potom existuje dôvod predpokladať, že došlo k posunu v odhadoch. Napríklad, ak je priemer (alebo štandardná odchýlka) hodnôt premennej A, ktorý sa použil pri výpočte jeho korelácie s premennou IN, oveľa menej ako priemer (alebo štandardná odchýlka) rovnakých hodnôt premennej A, ktoré boli použité pri výpočte jej korelácie s premennou C, potom je dôvod očakávať, že tieto dve korelácie (A-Bnás) na základe rôznych podmnožín údajov. Bude existovať skreslenie v koreláciách spôsobené nenáhodným umiestnením medzier v hodnotách premenných.

Analýza korelačných galaxií. Po vyriešení problému štatistickej významnosti prvkov korelačnej matice možno štatisticky významné korelácie znázorniť graficky vo forme korelačnej galaxie alebo galaxie. Korelačná galaxia - Toto je obrazec pozostávajúci z vrcholov a čiar, ktoré ich spájajú. Vrcholy zodpovedajú charakteristikám a sú zvyčajne označené číslami - premennými číslami. Čiary zodpovedajú štatisticky významným spojeniam a graficky vyjadrujú znamienko a niekedy aj j-úroveň významnosti spojenia.

Korelačná galaxia môže odrážať Všetkyštatisticky významné súvislosti korelačnej matice (niekedy tzv korelačný graf ) alebo len ich zmysluplne vybranú časť (napr. zodpovedajúcu jednému faktoru podľa výsledkov faktorovej analýzy).

PRÍKLAD KONŠTRUKCIE KORELAČNEJ PLEJÁDY


Príprava na štátnu (záverečnú) certifikáciu absolventov: vytvorenie databázy jednotných štátnych skúšok (všeobecný zoznam účastníkov jednotných štátnych skúšok všetkých kategórií s uvedením predmetov) - zohľadnenie rezervných dní v prípade rovnakých predmetov;

  • Pracovný plán (27)

    Riešenie

    2. Činnosť vzdelávacej inštitúcie na zlepšenie obsahu a hodnotenie kvality v predmetoch prírodovedné a matematické vzdelávanie Mestská vzdelávacia inštitúcia stredná škola č. 4, Litvinovská, Čapajevskaja,

  • Táto kalkulačka nižšie počíta Spearmanov koeficient poradovej korelácie medzi dvoma náhodnými premennými.Teoretická časť je tradične pod kalkulačkou.

    pridať import_export mode_edit vymazať

    Zmeny náhodných premenných

    šípka_nahoršípka_nadol šípka_nahoršípka_nadol
    Položiek na stranu: 5 10 20 50 100 chevron_left chevron_right

    Zmeny náhodných premenných

    Import údajov Chyba importu

    "Na oddelenie dátových polí sa používa jeden z nasledujúcich znakov: tabulátor, bodkočiarka (;) alebo čiarka(,)" Vzor: -50,5;-50,5

    Import Späť Zrušiť

    Číslice za desatinnou čiarkou: 4

    Vypočítajte

    Spearmanov korelačný koeficient

    Uložiť zdieľam rozšírenie

    Metóda výpočtu Spearmanovho koeficientu hodnostnej korelácie je v skutočnosti pomerne jednoduchá. Je to ako navrhnutý Pearsonov korelačný koeficient , ale nie len na merania náhodných premenných, ale na ne hodnotiace rebríčky.

    Musíme len pochopiť, čo je hodnota hodnosti a prečo je to všetko potrebné.

    Ak sú prvky variačného radu usporiadané vo vzostupnom alebo zostupnom poradí, to hodnosť prvku bude jeho číslo v usporiadanej sérii.

    Napríklad máme rôzne série (17,26,5,14,21). Zoraďme jej prvky v zostupnom poradí (26,21,17,14,5). 26 má poradie 1, 21 - poradie 2 atď., Variačné série hodnotiacich poradie budú vyzerať takto (3,1,5,4,2).

    T.j. pri výpočte Spearmanovho koeficientu sa počiatočné série variácií prevedú na variačné série hodnotiacich hodnôt a potom sa na ne použije Pearsonov vzorec.
    .
    Existuje jedna jemnosť - poradie opakujúcich sa hodnôt sa berie ako priemer poradí. To znamená, že pre sériu (17, 15, 14, 15) bude poradová séria vyzerať ako (1, 2,5, 4, 2,5), keďže prvý prvok je 15 má poradie 2 a druhý - poradie 3, a.

    Ak nemáte opakujúce sa hodnoty, teda všetky hodnoty hodnotiacich sérií – čísla medzi 1 a n, Pearsonov vzorec možno zjednodušiť na

    Mimochodom, tento vzorec sa často uvádza ako vzorec na výpočet Spearmanovho koeficientu.

    Aká je podstata prechodu od samotných hodnôt k ich hodnotovej hodnote?
    Pri skúmaní korelácie hodnotiacich hodnôt môžete zistiť, ako dobre je závislosť dvoch premenných opísaná monotónnou funkciou.

    Znamienko koeficientu udáva smer vzťahu medzi premennými. Ak je znamienko kladné, hodnoty Y majú tendenciu rásť so zvyšovaním X. Ak je znamienko záporné, hodnoty Y majú tendenciu klesať so zvyšovaním X. Ak je koeficient 0 potom nie je tendencia. Ak sa koeficient rovná 1 alebo -1, vzťah medzi X a Y má vzhľad monotónnej funkcie, t.j. s nárastom X sa zvyšuje aj Y a naopak.

    To znamená, že na rozdiel od Pearsonovho korelačného koeficientu, ktorý dokáže detekovať iba lineárny vzťah jednej premennej od druhej, Spearmanov korelačný koeficient dokáže odhaliť monotónnu závislosť, kde priamy lineárny vzťah nemožno odhaliť.

    Tu je príklad.
    Vysvetlím to na príklade. Predpokladajme, že skúmame funkciu y=10/x.
    Máme nasledujúce merania X a Y
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Pre tieto údaje je Pearsonov korelačný koeficient rovný -0,4686, t.j. vzťah je slabý alebo chýba. A Spearmanov korelačný koeficient je striktne rovný -1, ako keby to výskumníkovi naznačovalo, že Y má silne negatívnu monotónnu závislosť od X.

    Študenta psychológie (sociológ, manažér, manažér atď.) často zaujíma, ako spolu súvisia dve alebo viaceré premenné v jednej alebo viacerých skúmaných skupinách.

    V matematike sa na popis vzťahov medzi premennými veličinami používa pojem funkcie F, ktorá spája každú konkrétnu hodnotu nezávisle premennej X s konkrétnou hodnotou závisle premennej Y. Výsledná závislosť sa označí ako Y=F( X).

    Zároveň môžu byť typy korelácií medzi meranými charakteristikami rôzne: napríklad korelácia môže byť lineárna a nelineárna, pozitívna a negatívna. Je lineárna - ak s nárastom alebo poklesom jednej premennej X, druhá premenná Y v priemere buď tiež rastie, alebo klesá. Je nelineárny, ak pri náraste jednej veličiny povaha zmeny druhej nie je lineárna, ale je opísaná inými zákonmi.

    Korelácia bude pozitívna, ak s nárastom premennej X v priemere rastie aj premenná Y a ak s nárastom X má premenná Y tendenciu v priemere klesať, potom hovoríme o prítomnosti záporu. korelácia. Je možné, že medzi premennými nie je možné stanoviť žiadny vzťah. V tomto prípade hovoria, že neexistuje žiadna súvislosť.

    Úloha korelačnej analýzy spočíva v stanovení smeru (pozitívneho alebo negatívneho) a tvaru (lineárneho, nelineárneho) vzťahu medzi premenlivými charakteristikami, zmeraní jeho blízkosti a nakoniec v kontrole úrovne významnosti získaných korelačných koeficientov.

    Koeficient poradovej korelácie, navrhnutý K. Spearmanom, sa týka neparametrickej miery vzťahu medzi premennými meranými na stupnici poradia. Pri výpočte tohto koeficientu nie sú potrebné žiadne predpoklady o charaktere rozdelenia charakteristík v populácii. Tento koeficient určuje mieru tesnej súvislosti medzi ordinálnymi charakteristikami, ktoré v tomto prípade predstavujú rady porovnávaných veličín.

    Spearmanov koeficient lineárnej korelácie poradia sa vypočíta pomocou vzorca:

    kde n je počet hodnotených prvkov (ukazovateľov, predmetov);
    D je rozdiel medzi hodnoteniami dvoch premenných pre každý subjekt;
    D2 je súčet druhých mocnín rozdielov v poradí.

    Kritické hodnoty Spearmanovho koeficientu poradovej korelácie sú uvedené nižšie:

    Hodnota Spearmanovho koeficientu lineárnej korelácie leží v rozmedzí +1 a -1. Spearmanov koeficient lineárnej korelácie môže byť pozitívny alebo negatívny, charakterizujúci smer vzťahu medzi dvoma vlastnosťami meranými na stupňovej škále.

    Ak je korelačný koeficient v absolútnej hodnote blízky 1, potom to zodpovedá vysokej úrovni prepojenia medzi premennými. Takže najmä, keď premenná koreluje sama so sebou, hodnota korelačného koeficientu sa bude rovnať +1. Takýto vzťah charakterizuje priamoúmernú závislosť. Ak sú hodnoty premennej X usporiadané vo vzostupnom poradí a rovnaké hodnoty (teraz označené ako premenná Y) sú usporiadané v zostupnom poradí, potom v tomto prípade bude korelácia medzi premennými X a Y presne -1. Táto hodnota korelačného koeficientu charakterizuje nepriamo úmerný vzťah.

    Pre interpretáciu výsledného vzťahu je veľmi dôležité znamienko korelačného koeficientu. Ak je znamienko lineárneho korelačného koeficientu plus, potom vzťah medzi korelačnými znakmi je taký, že väčšia hodnota jedného znaku (premennej) zodpovedá väčšej hodnote iného znaku (inej premennej). Inými slovami, ak sa jeden ukazovateľ (premenná) zvýši, potom sa zodpovedajúcim spôsobom zvýši aj druhý ukazovateľ (premenná). Táto závislosť sa nazýva priamoúmerná závislosť.

    Ak je prijaté znamienko mínus, potom väčšia hodnota jednej charakteristiky zodpovedá menšej hodnote inej. Inými slovami, ak existuje znamienko mínus, zvýšenie jednej premennej (znamienko, hodnota) zodpovedá zníženiu inej premennej. Táto závislosť sa nazýva nepriamo úmerná závislosť. V tomto prípade je výber premennej, ktorej je priradený charakter (tendencia) nárastu, ľubovoľný. Môže to byť premenná X alebo premenná Y. Ak sa však predpokladá, že premenná X rastie, potom sa premenná Y zodpovedajúcim spôsobom zníži a naopak.

    Pozrime sa na príklad Spearmanovej korelácie.

    Psychológ zisťuje, ako súvisia jednotlivé ukazovatele školskej pripravenosti, získané pred nástupom do školy u 11 prvákov, medzi sebou a ich priemerným prospechom na konci školského roka.

    Aby sme tento problém vyriešili, zoradili sme v prvom rade hodnoty ukazovateľov školskej pripravenosti získané pri prijatí do školy a v druhom rade konečné ukazovatele študijného výkonu na konci roka u tých istých študentov v priemere. Výsledky uvádzame v tabuľke:

    Získané údaje dosadíme do vyššie uvedeného vzorca a vykonáme výpočet. Dostaneme:

    Aby sme našli úroveň významnosti, odkazujeme na tabuľku „Kritické hodnoty Spearmanovho koeficientu poradovej korelácie“, ktorá ukazuje kritické hodnoty pre koeficienty poradovej korelácie.

    Zostrojíme zodpovedajúcu „os významnosti“:

    Výsledný korelačný koeficient sa zhodoval s kritickou hodnotou pre hladinu významnosti 1 %. Následne možno tvrdiť, že ukazovatele školskej zrelosti a konečných známok prvákov spája pozitívna korelácia – inými slovami, čím vyšší je ukazovateľ školskej pripravenosti, tým lepšie sa prvák študuje. Z hľadiska štatistických hypotéz musí psychológ zamietnuť nulovú (H0) hypotézu podobnosti a akceptovať alternatívu (H1) rozdielov, čo naznačuje, že vzťah medzi ukazovateľmi školskej pripravenosti a priemerným študijným výkonom je odlišný od nuly.

    Spearmanova korelácia. Korelačná analýza pomocou Spearmanovej metódy. Rad Spearman. Spearmanov korelačný koeficient. Korelácia poradia Spearmana

    KATEGÓRIE

    POPULÁRNE ČLÁNKY

    2024 „kingad.ru“ - ultrazvukové vyšetrenie ľudských orgánov