Raport z analizy korelacji. Korelacje w tezach z psychologii

Podstawowe pojęcia analizy korelacji

Istnieje kilka typów powiązania między zmiennymi:

Zależność korelacyjna zakłada wzajemną zgodność zmian wielkości zmiennych oraz fakt, że zmiany te można mierzyć jednorazowo lub wielokrotnie (w tym przypadku mówimy o gęstości powiązań między zmiennymi, a nie o związkach przyczynowo-skutkowych); na przykład we współczesnym społeczeństwie rosyjskim im wyższy wiek, tym niższy status społeczny osoby; indywidualne przejawy gerontokracji nie naruszają tego schematu.

Wpływ funkcjonalny zakłada, że ​​zmianom zmiennej niezależnej towarzyszą coraz szybsze zmiany zmiennej zależnej (związki przyczynowe rejestrują wpływ zmiennej niezależnej na zależną); na przykład im bardziej radykalne poglądy polityczne ma dana osoba, tym bardziej nie akceptuje istniejącego reżimu politycznego; jednocześnie nie można argumentować, że im bardziej ktoś negatywnie ocenia władzę, tym bardziej radykalne ma poglądy.

Zależność funkcjonalna - powiązanie zmiennych, co oznacza, że ​​zmiana jednej zmiennej wpływa na zmianę drugiej, co z kolei wpływa na pierwszą zmienną, tj. są to połączenia interakcji; na przykład świadomość danej osoby w zakresie polityki jest bezpośrednio powiązana z zainteresowaniem nią; Im bardziej ktoś interesuje się polityką, tym lepiej ją rozumie.

Zależność może być nieliniowa i niemonotoniczna.

Niezależnie od tego, jaki ostatecznie okaże się rodzaj powiązania między zmiennymi, należy upewnić się, że w zasadzie istnieje. Analiza korelacji służy do wyjaśnienia interakcji i trendów w charakterystyce badanego zjawiska.

Za początkowy etap jego rozwoju uważa się lata 1870-1880, a autorem koncepcji „współczynnika korelacji” jest Francis Galton. Najpoważniejsze osiągnięcia w dziedzinie analizy korelacyjnej na przełomie XIX i XX wieku. w wykonaniu Karla Pearsona. Tradycyjnie analizę korelacji stosuje się do testowania hipotezy dotyczącej statystycznej zależności dwóch lub więcej zmiennych. Jako pomoc można zastosować analizę korelacji do sprawdzenia przydatności hipotez eksperymentalnych oraz do uwzględnienia zmiennych w analizach czynnikowych i regresyjnych. Analizę korelacji przeprowadza się poprzez porównanie i zestawienie szeregów rozkładów skonstruowanych na podstawie grupowań opartych na różnych cechach.

Korelacja - obecność związku statystycznego między cechami, gdy każda konkretna wartość jednej cechy X odpowiada określonej wartości U (lub kompleks wartości rozkładu serii K). Analiza korelacji wyjaśnia zależność funkcjonalną pomiędzy wielkościami zmiennymi, która charakteryzuje się tym, że każdej wartości jednej z nich odpowiada bardzo konkretna wartość drugiej. Analiza korelacji nie oznacza jednak identyfikacji związków przyczynowo-skutkowych, dlatego przy interpretacji wyników należy posługiwać się sformułowaniami typu „zmienna X wpływa na zmienną y” lub „zmienna X zależy od zmiennej y” gorszący.

Wyróżnić łaźnia parowa I liczne korelacje. Korelacja sparowana charakteryzuje rodzaj, formę i gęstość powiązań między dwiema cechami, wielokrotność - między kilkoma.

Zależność korelacyjna występuje najczęściej tam, gdzie na jedno zjawisko oddziałuje duża liczba czynników działających z różną siłą, dlatego stosuje się specjalne miary korelacji, tzw. współczynniki korelacji. Współczynniki (w statystyce jest ich łącznie kilkadziesiąt) pokazują stopień powiązania pomiędzy zjawiskami ( gęstość korelacji, o których czasami mówią badacze intensywność połączenia) i charakter tego połączenia ( centrum ). Komunikacja może być bezpośrednia i odwrotna. Przykładowo, im starszy wyborca, tym aktywniej uczestniczy w wyborach. Im wyższy poziom dochodów ludzi, tym mniejsze prawdopodobieństwo, że wezmą udział w wyborach jako wyborcy (sprzężenie zwrotne). Im wyższy współczynnik korelacji między dwiema zmiennymi, tym dokładniej można przewidzieć wartości jednej z wartości drugiej. Charakter połączenia określa się także w kategoriach „ monotonny „(kierunek zmiany jednej zmiennej nie zmienia się, gdy zmienia się druga zmienna) i „ niemonotoniczny " połączenie. Oprócz oceny gęstości i kierunku komunikacji należy wziąć pod uwagę niezawodność (niezawodność ) połączenia.

Analiza korelacji konsekwentnie rozwiązuje trzy praktyczne problemy:

    wyznaczenie pola korelacji i sporządzenie tabeli korelacji (w tym przypadku zespolonej);

    obliczanie przykładowych zależności korelacyjnych lub współczynników korelacji;

    testowanie hipotezy statystycznej o istotności związku.

Współczynnik korelacji nie zawiera informacji o tym, czy związek między nimi ma charakter przyczynowo-skutkowy, czy też współistniejący (wygenerowany przez wspólną przyczynę). Badacz musi rozwiązać to pytanie samodzielnie, opierając się na sensownych wyobrażeniach na temat struktury, dynamiki badanych obiektów społecznych, korelacji pomiędzy badanymi cechami, a także zastosować inne metody analizy statystycznej (regresja, czynnik, dyskryminator, ścieżka itp.). ). Ale wartość współczynnika pozwala ocenić gęstość połączeń jako mniejszą (nieistotną) lub większą. Po znaku współczynnika korelacji dla szeregów porządkowych można stwierdzić, czy zależność ta jest bezpośrednia, czy odwrotna (w przypadku szeregów nominalnych znak współczynnika nie ma żadnego znaczenia).

Aby ustalić korelację pomiędzy dwiema cechami, należy wykazać, że wszystkie pozostałe zmienne nie wpływają na związek pomiędzy dwiema zmiennymi będącymi przedmiotem badań. W przeciwnym razie wystąpi taka sytuacja fałszywa korelacja. Sekret fałszywej korelacji polega na tym, że dwa zjawiska, których związek formalnie potwierdza obecność powiązania statystycznego, mają wspólną przyczynę, która w równym stopniu wpływa na każde z nich.

Analizę korelacji poprzedza etap obliczeń Statystyka X 2 - Ale na podstawie uzyskanej wartości statystycznej X 2 nie możemy nic powiedzieć o gęstości połączeń analizowanych zmiennych. Aby rozwiązać ten problem, należy zwrócić się do współczynników korelacji.

Tradycyjnym sposobem przeprowadzania analizy korelacji jest odniesienie się do współczynnika korelacji Pearsona (Pearson) R (w literaturze oznacza się je także przez r).

Jeżeli przy opisie obiektu politycznego stwierdza się jedynie obecność lub brak cechy lub bada się związek między alternatywnymi cechami, wówczas tablice korelacji (tablice cech sprzężonych) są 4-komórkowe. W tym wypadku zastosuj współczynnik Yula(O) I czynnik przygodny (F). Opierają się na zasadzie współwystępowania zdarzeń (wartości cech obiektu badań) i nadają się do analizy dowolnych cech (metrycznych, porządkowych, a nawet nominalnych).

Jeżeli skale nominalne mają więcej wartości niż dwie, wówczas w celu określenia związku między cechami stosuje się współczynniki kontyngencji Pearsona ( R ), Czuprow (7) i Kramer (DO). W tym przypadku wymiar stołu ma określone znaczenie Z NA Do, który wyświetla wartości dwóch cech. Współczynniki Chuprov I Kramera są uważane za bardziej „rygorystyczne” niż Współczynnik kontyngencji Pearsona. Ponieważ jednak obliczenia w nich opierają się na statystyce x2, wówczas wszystkie ograniczenia z nią związane dotyczą tych współczynników.

Wielokrotny współczynnik korelacji (IV), co jest czasami nazywane współczynnikiem zgodność, służy do oceny spójności dwóch lub więcej serii wartości zmiennych rankingowych.

Istnieją dwie możliwości obliczania współczynników korelacji pomiędzy cechami w pakiecie statystycznym SPSS.

Analiza korelacji

Korelacja- związek statystyczny pomiędzy dwiema lub większą liczbą zmiennych losowych (lub zmiennych, które można uznać za takie z pewnym akceptowalnym stopniem dokładności). Co więcej, zmiany jednej lub więcej z tych wielkości prowadzą do systematycznej zmiany innej lub innych wielkości. Matematyczną miarą korelacji między dwiema zmiennymi losowymi jest współczynnik korelacji.

Korelacja może być dodatnia i ujemna (możliwy jest także brak zależności statystycznej – np. dla niezależnych zmiennych losowych). Ujemna korelacja - korelacja, w której wzrost jednej zmiennej wiąże się ze spadkiem innej zmiennej, a współczynnik korelacji jest ujemny. Pozytywna korelacja - korelacja, w której wzrost jednej zmiennej wiąże się ze wzrostem innej zmiennej, a współczynnik korelacji jest dodatni.

Autokorelacja - zależność statystyczna pomiędzy zmiennymi losowymi z tego samego szeregu, ale wzięta z przesunięciem, np. dla procesu losowego - z przesunięciem czasowym.

Pozwalać X,Y- dwie zmienne losowe zdefiniowane w jednej przestrzeni prawdopodobieństwa. Następnie ich współczynnik korelacji wyraża się wzorem:

,

gdzie cov oznacza kowariancję, a D jest wariancją lub równoważnie,

,

gdzie symbol oznacza oczekiwanie matematyczne.

Aby graficznie przedstawić taką zależność, można użyć prostokątnego układu współrzędnych z osiami odpowiadającymi obu zmiennym. Każda para wartości oznaczona jest konkretnym symbolem. Wykres ten nazywany jest „wykresem rozrzutu”.

Sposób obliczania współczynnika korelacji zależy od rodzaju skali, do której należą zmienne. Zatem do pomiaru zmiennych skalami interwałowymi i ilościowymi konieczne jest wykorzystanie współczynnika korelacji Pearsona (korelacja momentu iloczynu). Jeżeli co najmniej jedna z dwóch zmiennych należy do skali porządkowej lub nie ma rozkładu normalnego, należy zastosować korelację rang Spearmana lub τ (tau) Kendala. W przypadku, gdy jedna z dwóch zmiennych jest dychotomiczna, stosuje się korelację punktowo-biseryjną, a jeśli obie zmienne są dychotomiczne – korelację czteropolową. Obliczanie współczynnika korelacji pomiędzy dwiema zmiennymi niedychotomicznymi ma sens tylko wtedy, gdy zależność między nimi jest liniowa (jednokierunkowa).

Współczynnik korelacji Kendella

Używany do pomiaru wzajemnych nieporządków.

Współczynnik korelacji Spearmana

Własności współczynnika korelacji

jeśli przyjmiemy kowariancję jako iloczyn skalarny dwóch zmiennych losowych, wówczas norma zmiennej losowej będzie równa , a konsekwencją nierówności Cauchy'ego-Bunyakovsky'ego będzie: . , Gdzie . Co więcej, w tym przypadku znaki i k dopasować: .

Analiza korelacji

Analiza korelacji- metoda przetwarzania danych statystycznych polegająca na badaniu współczynników ( korelacje) pomiędzy zmiennymi. W tym przypadku porównuje się współczynniki korelacji pomiędzy jedną parą lub wieloma parami cech w celu ustalenia statystycznych zależności między nimi.

Cel analiza korelacji- podać informacje o jednej zmiennej, używając innej zmiennej. W przypadkach, w których osiągnięcie celu jest możliwe, mówi się, że zmienne są korelat. W najbardziej ogólnej formie przyjęcie hipotezy korelacji oznacza, że ​​zmiana wartości zmiennej A nastąpi jednocześnie z proporcjonalną zmianą wartości B: jeżeli obie zmienne wzrosną, to korelacja jest dodatnia, jeśli jedna zmienna rośnie, a druga maleje, korelacja jest ujemna.

Korelacja odzwierciedla jedynie liniową zależność wartości, ale nie odzwierciedla ich funkcjonalnej łączności. Na przykład, jeśli obliczysz współczynnik korelacji między wielkościami A = SIN(X) I B = CoS(X) , to będzie bliskie zeru, czyli nie ma zależności pomiędzy wielkościami. Tymczasem wielkości A i B są oczywiście powiązane funkcjonalnie zgodnie z prawem SIN 2 (X) + CoS 2 (X) = 1 .

Ograniczenia analizy korelacji

Wykresy rozkładów par (x,y) z odpowiadającymi im współczynnikami korelacji x i y dla każdej z nich. Należy zauważyć, że współczynnik korelacji odzwierciedla zależność liniową (górna linia), ale nie opisuje krzywej zależności (linia środkowa) i w ogóle nie nadaje się do opisu złożonych, nieliniowych zależności (dolna linia).

  1. Zastosowanie jest możliwe w przypadku wystarczającej liczby przypadków do badania: dla danego typu współczynnik korelacji waha się od 25 do 100 par obserwacji.
  2. Drugie ograniczenie wynika z hipotezy analizy korelacji, która obejmuje liniowa zależność zmiennych. W wielu przypadkach, gdy wiadomo, że istnieje związek, analiza korelacji może nie dać wyników po prostu dlatego, że związek jest nieliniowy (wyrażony na przykład jako parabola).
  3. Sam fakt korelacji nie daje podstaw do stwierdzenia, która ze zmiennych poprzedza lub powoduje zmiany, albo że zmienne są ze sobą w ogólności powiązane przyczynowo, na przykład na skutek działania trzeciego czynnika.

Obszar zastosowań

Ta metoda przetwarzania danych statystycznych jest bardzo popularna w ekonomii i naukach społecznych (w szczególności w psychologii i socjologii), chociaż zakres zastosowań współczynników korelacji jest szeroki: kontrola jakości wyrobów przemysłowych, metalurgia, agrochemia, hydrobiologia, biometria i inne.

Popularność metody wynika z dwóch czynników: współczynniki korelacji są stosunkowo łatwe do obliczenia, a ich stosowanie nie wymaga specjalnego przeszkolenia matematycznego. W połączeniu z łatwością interpretacji, łatwość stosowania współczynnika doprowadziła do jego szerokiego zastosowania w dziedzinie analizy danych statystycznych.

Fałszywa korelacja

Często kusząca prostota badań korelacji skłania badacza do wyciągania fałszywych, intuicyjnych wniosków na temat występowania związku przyczynowo-skutkowego pomiędzy parami cech, podczas gdy współczynniki korelacji ustalają jedynie zależności statystyczne.

We współczesnej ilościowej metodologii nauk społecznych faktycznie odrzucono próby ustalania związków przyczynowo-skutkowych pomiędzy obserwowanymi zmiennymi za pomocą metod empirycznych. Dlatego też, gdy badacze nauk społecznych mówią o ustaleniu zależności między badanymi zmiennymi, zakłada się albo ogólne założenie teoretyczne, albo zależność statystyczną.

Zobacz też

Fundacja Wikimedia. 2010.

Zobacz, co oznacza „Analiza korelacji” w innych słownikach:

    Zobacz ANALIZA KORELACJI. Antynaziści. Encyklopedia Socjologii, 2009... Encyklopedia socjologii

    Dział statystyki matematycznej łączący praktyczne metody badania korelacji między dwiema (lub większą liczbą) losowych cech lub czynników. Zobacz Korelacja (w statystyce matematycznej)... Wielki słownik encyklopedyczny

    ANALIZA KORELACJI, sekcja statystyki matematycznej, która łączy praktyczne metody badania korelacji między dwiema (lub większą liczbą) losowych cech lub czynników. Zobacz Korelację (patrz KORELACJA (wzajemna relacja ... słownik encyklopedyczny

    Analiza korelacji- (w ekonomii) dział statystyki matematycznej badający zależności pomiędzy zmieniającymi się wielkościami (korelacja to stosunek, od łacińskiego słowa correlatio). Relacja może być pełna (tj. funkcjonalna) i niekompletna,... ... Słownik ekonomiczny i matematyczny

    analiza korelacji- (w psychologii) (od łacińskiego współczynnika korelacji) statystyczna metoda oceny formy, znaku i bliskości związku między badanymi cechami lub czynnikami. Przy określaniu formy połączenia uwzględnia się jego liniowość lub nieliniowość (tj. jak średnio... ... Świetna encyklopedia psychologiczna

    analiza korelacji- - [L.G. Sumenko. Słownik angielsko-rosyjski dotyczący technologii informatycznych. M.: Przedsiębiorstwo Państwowe TsNIIS, 2003.] Tematyka informatyka w ogólności EN analiza korelacji... Przewodnik tłumacza technicznego

    analiza korelacji- koreliacinė analizė statusas T sritis Kūno kultūra ir sportas apibrėžtis Statistikos metodas, kuriuo įvertinami tiriamųjų asmenų, reiškinių požymiai arba veiksnių santykiai. atitikmenys: pol. badania korelacyjne vok. Analyze der Correlation, f;… … Sporto terminų žodynas

    Zestaw metod opartych na matematycznej teorii korelacji (patrz Korelacja) służących do wykrywania korelacji między dwiema losowymi cechami lub czynnikami. K.a. dane eksperymentalne obejmują następujące... ... Wielka encyklopedia radziecka

    Sekcja matematyczna statystyki, łączące praktykę Korelacyjne metody badawcze. zależności pomiędzy dwiema (lub większą liczbą) losowych cech lub czynników. Zobacz korelację... Wielki encyklopedyczny słownik politechniczny

W badaniach naukowych często istnieje potrzeba znalezienia powiązania między zmiennymi wynikowymi a zmiennymi czynnikowymi (plonami upraw i ilością opadów, wzrostem i wagą osoby w jednorodnych grupach według płci i wieku, tętnem i temperaturą ciała). itp.).

Drugie to znaki, które przyczyniają się do zmian w tych z nimi związanych (pierwszy).

Pojęcie analizy korelacji

Jest ich wiele. Na podstawie powyższego można powiedzieć, że analiza korelacji to metoda służąca do sprawdzenia hipotezy o istotności statystycznej dwóch lub więcej zmiennych, jeśli badacz może je zmierzyć, ale nie może ich zmienić.

Istnieją inne definicje omawianego pojęcia. Analiza korelacji to metoda przetwarzania polegająca na badaniu współczynników korelacji między zmiennymi. W tym przypadku porównuje się współczynniki korelacji pomiędzy jedną parą lub wieloma parami cech w celu ustalenia statystycznych zależności pomiędzy nimi. Analiza korelacji to metoda badania zależności statystycznej między zmiennymi losowymi z opcjonalnym występowaniem ścisłego charakteru funkcjonalnego, w której dynamika jednej zmiennej losowej prowadzi do dynamiki matematycznych oczekiwań drugiej.

Pojęcie fałszywej korelacji

Prowadząc analizę korelacji należy wziąć pod uwagę, że można ją przeprowadzić w odniesieniu do dowolnego zbioru cech, często absurdalnych względem siebie. Czasami nie mają ze sobą żadnego związku przyczynowego.

W tym przypadku mówią o fałszywej korelacji.

Problemy analizy korelacji

W oparciu o powyższe definicje można sformułować następujące zadania opisywanej metody: uzyskanie informacji o jednej z poszukiwanych zmiennych za pomocą innej; określić bliskość związku pomiędzy badanymi zmiennymi.

Analiza korelacji polega na określeniu zależności pomiędzy badanymi cechami, dlatego też zadania analizy korelacji można uzupełnić o:

  • identyfikacja czynników mających największy wpływ na uzyskaną charakterystykę;
  • identyfikacja niezbadanych wcześniej przyczyn powiązań;
  • budowa modelu korelacji wraz z jego analizą parametryczną;
  • badanie znaczenia parametrów komunikacyjnych i ocena ich interwałów.

Związek analizy korelacji z regresją

Metoda analizy korelacji często nie ogranicza się do znalezienia bliskości zależności między badanymi wielkościami. Czasami uzupełnia się go zestawieniem równań regresji, które uzyskuje się za pomocą analizy o tej samej nazwie i które stanowią opis zależności korelacyjnej między wynikiem a cechą (cechami) czynnika (czynnika). Metoda ta wraz z analizowaną analizą stanowi metodę

Warunki stosowania metody

Czynniki skuteczne zależą od jednego do kilku czynników. Metodę analizy korelacji można zastosować w przypadku dużej liczby obserwacji dotyczących wartości wskaźników efektywnych i czynnikowych (czynników), przy czym badane czynniki muszą mieć charakter ilościowy i mieć odzwierciedlenie w konkretnych źródłach. Pierwszą z nich można wyznaczyć na podstawie prawa normalnego – w tym przypadku wynikiem analizy korelacji są współczynniki korelacji Pearsona lub, jeżeli cechy nie spełniają tego prawa, stosuje się współczynnik korelacji rang Spearmana.

Zasady doboru czynników analizy korelacji

Stosując tę ​​metodę, konieczne jest określenie czynników wpływających na wskaźniki wydajności. Dobiera się je z uwzględnieniem faktu, że pomiędzy wskaźnikami muszą istnieć związki przyczynowo-skutkowe. W przypadku tworzenia wieloczynnikowego modelu korelacji wybiera się te, które mają istotny wpływ na wynikowy wskaźnik, przy czym lepiej nie uwzględniać w modelu korelacji czynników współzależnych, których współczynnik korelacji par jest większy niż 0,85, a także tych, które dla których związek z parametrem wynikowym nie ma charakteru liniowego ani funkcjonalnego.

Wyświetlanie wyników

Wyniki analizy korelacji można przedstawić w formie tekstowej i graficznej. W pierwszym przypadku są one prezentowane jako współczynnik korelacji, w drugim – w formie diagramu punktowego.

W przypadku braku korelacji pomiędzy parametrami punkty na diagramie są rozmieszczone chaotycznie, średni stopień powiązania charakteryzuje się większym stopniem uporządkowania i charakteryzuje się mniej więcej równomierną odległością zaznaczonych znaków od mediany. Silne połączenie jest zwykle proste, a przy r=1 wykres punktowy jest linią płaską. Odwrotna korelacja różni się kierunkiem wykresu od lewego górnego do prawego dolnego rogu, korelacja bezpośrednia - od lewego dolnego rogu do prawego górnego rogu.

Reprezentacja 3D wykresu punktowego

Oprócz tradycyjnego wyświetlania wykresu punktowego 2D, obecnie używana jest graficzna reprezentacja analizy korelacji 3D.

Wykorzystywana jest również macierz wykresów rozrzutu, która wyświetla wszystkie sparowane wykresy na jednym rysunku w formacie macierzowym. Dla n zmiennych macierz zawiera n wierszy i n kolumn. Wykres znajdujący się na przecięciu i-tego wiersza i j-tej kolumny jest wykresem zmiennych Xi względem Xj. Zatem każdy wiersz i kolumna ma jeden wymiar, a pojedyncza komórka wyświetla wykres rozrzutu dwóch wymiarów.

Ocena szczelności połączenia

O bliskości powiązania korelacji decyduje współczynnik korelacji (r): silna – r = ±0,7 do ±1, średnia – r = ±0,3 do ±0,699, słaba – r = 0 do ±0,299. Klasyfikacja ta nie jest ścisła. Na rysunku przedstawiono nieco inny schemat.

Przykład zastosowania metody analizy korelacji

Ciekawe badanie przeprowadzono w Wielkiej Brytanii. Poświęcono je powiązaniu między paleniem tytoniu a rakiem płuc i przeprowadzono je na podstawie analizy korelacji. Obserwację tę przedstawiono poniżej.

Wstępne dane do analizy korelacji

Grupa profesjonalna

śmiertelność

Rolnicy, leśnicy i rybacy

Górnicy i pracownicy kamieniołomów

Producenci gazu, koksu i chemikaliów

Producenci szkła i ceramiki

Pracownicy pieców, kuźni, odlewni i walcowni

Pracownicy elektrycy i elektronicy

Zawody inżynierskie i pokrewne

Przemysł drzewny

Kaletnicy

Pracownicy tekstylni

Producenci odzieży roboczej

Pracownicy branży spożywczej, napojów i tytoniowej

Producenci papieru i druku

Producenci innych produktów

Budowniczowie

Malarze i dekoratorzy

Kierowcy silników stacjonarnych, dźwigów itp.

Pracownicy nieuwzględnieni gdzie indziej

Pracownicy transportu i komunikacji

Pracownicy magazynów, magazynierzy, pakowacze i pracownicy maszyn rozlewniczych

Pracownicy biurowi

Sprzedawców

Pracownicy sportu i rekreacji

Administratorzy i menedżerowie

Profesjonaliści, technicy i artyści

Rozpoczynamy analizę korelacji. Dla przejrzystości lepiej zacząć rozwiązanie od metody graficznej, dla której skonstruujemy diagram punktowy.

Pokazuje bezpośrednie połączenie. Trudno jednak wyciągnąć jednoznaczny wniosek na podstawie samej metody graficznej. Dlatego będziemy kontynuować analizę korelacji. Poniżej przedstawiono przykład obliczenia współczynnika korelacji.

Korzystając z oprogramowania (na przykładzie MS Excel zostanie opisany poniżej) wyznaczamy współczynnik korelacji, który wynosi 0,716, co oznacza silny związek pomiędzy badanymi parametrami. Określmy rzetelność statystyczną otrzymanej wartości korzystając z odpowiedniej tabeli, dla której od 25 par wartości należy odjąć 2, w rezultacie otrzymamy 23 i korzystając z tej linii w tabeli znajdujemy r krytyczne dla p = 0,01 (ponieważ są to dane medyczne, zależność bardziej rygorystyczna, w pozostałych przypadkach wystarczy p=0,05), co dla tej analizy korelacji wynosi 0,51. Na przykładzie pokazano, że obliczone r jest większe od r krytycznego, a wartość współczynnika korelacji uważa się za statystycznie wiarygodną.

Korzystanie z oprogramowania przy przeprowadzaniu analizy korelacji

Opisany rodzaj przetwarzania danych statystycznych może być realizowany przy wykorzystaniu oprogramowania, w szczególności MS Excel. Korelacja polega na obliczeniu następujących parametrów za pomocą funkcji:

1. Współczynnik korelacji wyznacza się za pomocą funkcji CORREL (tablica1; tablica2). Tablica1,2 - komórka przedziału wartości zmiennych wynikowych i czynnikowych.

Współczynnik korelacji liniowej nazywany jest także współczynnikiem korelacji Pearsona, dlatego począwszy od Excela 2007 można używać tej funkcji z tymi samymi tablicami.

Graficzne przedstawienie analizy korelacji w programie Excel odbywa się za pomocą panelu „Wykresy” z opcją „Wykres punktowy”.

Po podaniu danych początkowych otrzymujemy wykres.

2. Ocena istotności współczynnika korelacji parami za pomocą testu t-Studenta. Obliczoną wartość kryterium t porównuje się z tabelaryczną (krytyczną) wartością tego wskaźnika z odpowiedniej tabeli wartości rozpatrywanego parametru, biorąc pod uwagę określony poziom istotności i liczbę stopni swobody. Oszacowanie to przeprowadza się za pomocą funkcji STUDISCOVER(prawdopodobieństwo; stopnie_wolności).

3. Macierz współczynników korelacji par. Analizę przeprowadza się za pomocą narzędzia Analiza danych, w którym wybrana jest opcja Korelacja. Statystyczną ocenę współczynników korelacji par przeprowadza się poprzez porównanie jej wartości bezwzględnej z wartością tabelaryczną (krytyczną). Jeżeli obliczony współczynnik korelacji parami przekracza wartość krytyczną, to przy danym stopniu prawdopodobieństwa można powiedzieć, że hipoteza zerowa o istotności zależności liniowej nie zostaje odrzucona.

Wreszcie

Zastosowanie metody analizy korelacji w badaniach naukowych pozwala określić związek pomiędzy różnymi czynnikami a wskaźnikami efektywności. Należy wziąć pod uwagę, że z absurdalnej pary lub zbioru danych można uzyskać wysoki współczynnik korelacji, dlatego tego typu analizę należy przeprowadzić na odpowiednio dużym zbiorze danych.

Po uzyskaniu obliczonej wartości r wskazane jest porównanie jej z r krytycznym w celu potwierdzenia wiarygodności statystycznej określonej wartości. Analizę korelacji można przeprowadzić ręcznie za pomocą wzorów lub przy użyciu oprogramowania, w szczególności MS Excel. W tym miejscu można również skonstruować diagram punktowy w celu wizualnego przedstawienia związku pomiędzy badanymi czynnikami analizy korelacji a uzyskaną charakterystyką.

Za twórców teorii korelacji uważa się angielskich biometryków F. Galtona (1822-1911) i K. Pearsona (1857-1936). Termin „korelacja” oznacza korelację, zgodność. Idea korelacji jako współzależności zmiennych losowych leży u podstaw statystycznej teorii korelacji - badania zależności zmienności cechy od warunków środowiskowych. Niektóre znaki działają jako wpływające (czynnikowe), inne zaś jako wpływowe i skuteczne. Zależności pomiędzy cechami mogą mieć charakter funkcjonalny i korelacyjny. Połączenia funkcjonalne charakteryzują się całkowitą zgodnością między zmianą charakterystyki czynnika a zmianą wartości wypadkowej. Każdej wartości cechy czynnikowej odpowiada pewna wartość cechy wynikowej. Nie ma pełnej zgodności w korelacjach między zmianami czynnika a wynikającymi z niego cechami. Sam skuteczny znak znajduje się w złożonej interakcji. Dlatego też wyniki analizy korelacji są w tym względzie istotne, a interpretacja tych wyników w formie ogólnej wymaga zbudowania systemu korelacji. Charakteryzują się one różnorodnością przyczyn i skutków, a za ich pomocą tendencją do zmiany charakterystyki efektywnej w przypadku ustalenia wartości cechy charakterystycznej czynnika. Na przykład na wydajność pracy wpływają czynniki takie jak stopień ulepszenia sprzętu i technologii, poziom mechanizacji i automatyzacji pracy, specjalizacja produkcji, rotacja personelu itp.

W przyrodzie i społeczeństwie zjawiska i zdarzenia zachodzą zgodnie z naturą zależności korelacyjnej, gdy gdy zmienia się wartość jednej cechy, istnieje tendencja do zmiany drugiej cechy. Zależność korelacyjna jest szczególnym przypadkiem zależności statystycznej. Analiza korelacji służy do ustalenia bliskości związku między zjawiskami, procesami i obiektami.

Celem badania jest często ustalenie związku (korelacji) pomiędzy cechami. Znajomość zależności umożliwia rozwiązanie kardynalnego problemu wszelkich badań - umiejętności przewidywania i przewidywania rozwoju sytuacji, gdy zmienia się czynnik wpływający. Stosując korelację można jedynie dokonać formalnej oceny zależności. Dlatego przed przystąpieniem do obliczania współczynników korelacji pomiędzy dowolnymi cechami należy teoretycznie ustalić, czy istnieje związek między tymi cechami. Przecież formalnie statystyka może wykazać, że nie ma powiązań np. pomiędzy wysokością budynku w mieście a plonami pszenicy w gospodarstwach.

Związek między zjawiskami (korelację) ustala się poprzez prowadzenie eksperymentów i analizę statystyczną. Korelacji nie należy utożsamiać z przyczynowością. Należy jednak pamiętać, że dowód związku matematycznego musi opierać się na realnym związku między zjawiskami. Na przykład mineralizacja wody zmniejsza się z północy na południe Białorusi i w tym samym kierunku zmniejsza się zawartość składników odżywczych w glebie. Można uzyskać pozytywną, wiarygodną zależność pomiędzy rozpatrywanymi wskaźnikami. Stopień mineralizacji wody nie determinuje jednak optymalnej zawartości składników pokarmowych w glebie. W przeciwnym razie w krajobrazach pustynnych żyzność byłaby maksymalna, ponieważ tutaj występuje maksymalna mineralizacja wody (gleba i wody gruntowe są słonawe), co jest sprzeczne z prawdą. Dlatego tworzenie takiego połączenia w pustynnych krajobrazach nie ma sensu. Najlepszy codzienny wynajem apartamentów o różnym poziomie komfortu od właścicieli bez prowizji możesz znaleźć na stronie piter.stay24.ru. Wygodna wyszukiwarka pozwoli Ci łatwo i szybko znaleźć odpowiednie mieszkanie odpowiadające Twoim wymaganiom, poświęcając minimum czasu.

Każdy wskaźnik połączenia służy jako przybliżona ocena rozważanej zależności i nie gwarantuje istnienia ścisłego (funkcjonalnego) podporządkowania. Brak ścisłej zależności w przyrodzie i społeczeństwie sprzyja samoregulacji procesów, zjawisk, systemów

W kierunku połączenie może być bezpośrednie lub odwrotne; z natury - funkcjonalne lub statystyczne (korelacja); pod względem wielkości - słaby, średni lub mocny; w formie - liniowy i nieliniowy; według liczby skorelowanych cech - parowanych i wielokrotnych.

Zależność funkcjonalna jest charakterystyczna dla form geometrycznych i systemów technicznych, gdy każda wartość jednej cechy odpowiada dokładnej wartości drugiej. To jest przykład zależności pomiędzy polem prostokąta a długością jednego z jego boków. Taka zależność jest całkowita lub wyczerpująca.

Istnieje kilka typów korelacji parami:

·równolegle-korelacyjny lub asocjacyjny, gdy obie cechy zmieniają się koniugująco, częściowo pod wpływem wspólnych przyczyn i konsekwencji (ograniczenie roślinności i gleb do określonych form rzeźby; rozwój przemysłu i wzrost liczby ludności w kierunku surowców);

· subprzyczynowy, gdy jeden czynnik działa jako osobna przyczyna sprzężonej zmiany cechy (zależność biomasy od opadów; wzrost liczby ludności i urodzeń);

· wzajemnie proaktywne, gdy przyczyna i skutek, pozostając w stabilnym wzajemnym powiązaniu, konsekwentnie na siebie wpływają (wilgotność powietrza i opady).

Jeśli na cechę wpływa kilka czynników, należy ocenić wielokrotną korelację. Korelacja wielokrotna służy jako podstawa do identyfikacji zależności między cechami, ale wymaga ścisłej normalności i prostości rozkładu, więc jej użycie może być trudne. Wraz ze wzrostem liczby zmiennych objętość pracy obliczeniowej wzrasta proporcjonalnie do kwadratu liczby zmiennych. W tym przypadku trudniej jest ocenić istotność wyników, gdyż zwiększają się błędy współczynników korelacji. W praktyce w takich przypadkach ogranicza się do badania tylko głównych czynników. Jednak charakter wpływu głównych czynników na cechę bada się bardziej szczegółowo i dokładnie za pomocą analizy czynnikowej.

W praktyce w celu ustalenia korelacji między znakami i zjawiskami należy przestrzegać następującej kolejności:

· na podstawie przeprowadzonych badań wstępnie ustala się, czy pomiędzy rozpatrywanymi cechami istnieje związek;

· jeżeli istnieje pomiędzy nimi połączenie, ustalić za pomocą wykresu jego kształt, kierunek i szczelność.

Najpierw zestawiane są sprzężone szeregi wariacyjne, w których należy określić argument x i funkcję y:

Dla opcji koniugatu tworzony jest wykres, który pomaga ustalić rodzaj związku pomiędzy argumentem a funkcją. Dalsze przetwarzanie danych eksperymentalnych lub statystycznych zależy od postaci zależności korelacyjnej. Zależność liniowa polega na obliczeniu współczynnika korelacji r, a nieliniowa polega na obliczeniu współczynnika korelacji η (rys. 5.1). Stopień rozproszenia lub zmienności częstotliwości względem linii regresji na wykresie wskazuje w przybliżeniu na bliskość połączenia: im mniejsze rozproszenie, tym silniejsze połączenie (ryc. 5.2).

Analiza korelacji rozwiązuje następujące problemy:

·ustalanie kierunku i formy komunikacji,

· ocena bliskości komunikacji,

·ocena reprezentatywności szacunków statystycznych zależności,

· określenie wielkości determinacji (udziału wzajemnego oddziaływania) czynników skorelowanych.

Ryż. 5.1. Forma korelacji:

a - prosty liniowy; b - odwrotność liniowa; c - parabaliczny; g - hiperboliczny

Do oceny powiązania stosuje się następujące kryteria liczbowe (współczynniki) powiązania korelacyjnego:

współczynnik korelacji (r) dla zależności liniowej,

·współczynnik korelacji (η) dla zależności nieliniowej,

współczynniki regresji wielokrotnej,

· Współczynniki korelacji liniowej rang Pearsona lub Kendala.

Każde prawo natury lub rozwoju społecznego można przedstawić poprzez opis zestawu relacji. Jeżeli zależności te mają charakter stochastyczny, a analizę przeprowadza się na próbie z populacji ogólnej, wówczas ten obszar badań dotyczy zadań statystycznego badania zależności, do których zalicza się analizę korelacji, regresji, wariancji, kowariancji oraz analizę tabele awaryjne.

    Czy istnieje związek pomiędzy badanymi zmiennymi?

    Jak mierzyć bliskość połączeń?

Ogólny schemat zależności między parametrami w badaniu statystycznym pokazano na ryc. 1.

Na rysunku S przedstawiono model badanego obiektu rzeczywistego.Zmienne objaśniające (niezależne, czynnikowe) opisują warunki pracy obiektu. Czynniki losowe to czynniki, których wpływ jest trudny do uwzględnienia lub których wpływ jest obecnie zaniedbywany. Powstałe (zależne, wyjaśnione) zmienne charakteryzują wynik funkcjonowania obiektu.

Wybór metody analizy zależności dokonywany jest z uwzględnieniem charakteru analizowanych zmiennych.

Analiza korelacji to metoda przetwarzania danych statystycznych polegająca na badaniu zależności między zmiennymi.

Celem analizy korelacji jest dostarczenie informacji o jednej zmiennej za pomocą innej zmiennej. W przypadkach, gdy osiągnięcie celu jest możliwe, zmienne nazywa się skorelowanymi. Korelacja odzwierciedla jedynie liniową zależność wartości, ale nie odzwierciedla ich funkcjonalnej łączności. Przykładowo, jeśli obliczymy współczynnik korelacji pomiędzy wielkościami A = sin(x) i B = cos(x), to będzie on bliski zeru, tj. nie ma związku pomiędzy ilościami.

Do badania korelacji stosuje się podejście graficzne i analityczne.

Analiza graficzna rozpoczyna się od skonstruowania pola korelacji. Pole korelacji (lub wykres rozrzutu) to graficzna zależność pomiędzy wynikami pomiarów dwóch cech. Aby go skonstruować, początkowe dane są nanoszone na wykres, wyświetlając każdą parę wartości (xi, yi) jako punkt o współrzędnych xi i yi w prostokątnym układzie współrzędnych.

Wizualna analiza pola korelacji pozwala na przyjęcie założeń co do formy i kierunku zależności pomiędzy obydwoma badanymi wskaźnikami. Ze względu na postać zależności zależności korelacyjne dzieli się zwykle na liniowe (patrz rys. 1) i nieliniowe (patrz rys. 2). Przy zależności liniowej obwiednia pola korelacji jest zbliżona do elipsy. Liniowa zależność dwóch zmiennych losowych polega na tym, że w miarę wzrostu jednej zmiennej losowej druga zmienna losowa ma tendencję do zwiększania się (lub zmniejszania) zgodnie z prawem liniowym.

Kierunek zależności jest dodatni, jeśli wzrost wartości jednego atrybutu prowadzi do wzrostu wartości drugiego (patrz rys. 3) i ujemny, jeśli wzrost wartości jednego atrybutu prowadzi do zmniejszenia wartości drugiego (patrz ryc. 4).

Zależności, które mają tylko dodatnie lub tylko ujemne kierunki, nazywane są monotonicznymi.

KATEGORIE

POPULARNE ARTYKUŁY

2023 „kingad.ru” - badanie ultrasonograficzne narządów ludzkich