즐겨 찾기에 추가

V. 변이 계열, 평균값, 특성 변동성

변형 시리즈특성의 일련의 수치 값입니다.

변형 시리즈의 주요 특징: v – 변형, p – 발생 빈도.

변형 시리즈 유형:

옵션 발생 빈도에 따라: 단순 - 옵션이 한 번 발생하고, 가중치가 적용됨 - 옵션이 두 번 이상 발생합니다.

옵션 위치별: 순위 - 옵션이 내림차순 및 오름차순으로 정렬됩니다. 순위 없음 - 옵션이 특별한 순서 없이 기록됩니다.

옵션을 그룹으로 결합하여: 그룹화됨 - 옵션이 그룹으로 결합되고, 그룹 해제됨 - 옵션이 그룹으로 결합되지 않습니다.

크기별 옵션: 연속형 - 옵션은 정수 및 분수로 표시되고, 이산형 - 옵션은 정수로 표시되고, 복합형 - 옵션은 상대값 또는 평균값으로 표시됩니다.

평균값을 계산하기 위해 변형 시리즈가 편집되고 공식화됩니다.

변주 시리즈 녹음 형식:

8. 평균값, 유형, 계산 방법, 의료 분야에서의 적용

평균값– 정량적 특성의 누적 일반화 특성. 평균의 적용:

1. 의료 기관의 업무 조직을 특성화하고 활동을 평가합니다.

a) 진료소 내: 의사의 업무량, 평균 방문 횟수, 해당 지역의 평균 거주자 수에 대한 지표

b) 병원: 연간 병상이 열려 있는 평균 일수 평균 입원 기간;

c) 위생, 전염병학 및 공중 보건 중심: 1인당 평균 면적(또는 입방 용량), 평균 영양 기준(단백질, 지방, 탄수화물, 비타민, 무기염, 칼로리), 위생 기준 및 기준 등

2. 신체 발달(주요 인체 측정 특성, 형태학적 및 기능적)을 특성화합니다.

3. 임상 및 실험 연구에서 정상 및 병리학적 조건에서 신체의 의학적 및 생리학적 매개변수를 결정합니다.

4. 특별한 과학 연구에서.

평균값과 지표의 차이:

1. 계수는 통계적 모집단의 특정 부분에서만 발생하는 대체 특성을 나타내며 발생하거나 발생하지 않을 수 있습니다.

평균값은 팀의 모든 구성원에게 공통되지만 정도는 다양합니다(체중, 키, 병원 치료 일수).

2. 계수는 질적 특성을 측정하는 데 사용됩니다. 평균값 – 다양한 정량적 특성에 대한 것입니다.

평균 유형:

산술평균의 특징은 표준편차와 평균오차입니다.

모드와 중앙값. 패션(모)- 주어진 모집단에서 다른 것보다 더 자주 발생하는 특성의 값에 해당합니다. 중앙값(나)– 주어진 모집단에서 중앙값을 차지하는 특성의 값. 관측치 수에 따라 계열을 2개의 동일한 부분으로 나눕니다. 산술평균(M)– 모드 및 중앙값과 달리 모든 관측치를 기반으로 하므로 전체 분포에 중요한 특성입니다.

특수 연구에 사용되는 다른 유형의 평균: 제곱 평균 제곱근, 3차, 고조파, 기하, 누진.

산술 평균통계 인구의 평균 수준을 나타냅니다.

간단한 계열의 경우

∑v – 금액 옵션,

n – 관측치 수.

가중 계열의 경우

∑vр – 각 옵션의 곱과 발생 빈도의 합

n – 관측치 수.

표준 편차산술 평균 또는 시그마(σ)는 특성의 다양성을 나타냅니다.

- 간단한 시리즈의 경우

Σd 2 – 산술 평균과 각 옵션 간의 차이의 제곱의 합(d = │M-V│)

n – 관측치 수

- 가중치 시리즈의 경우

∑d 2 p – 산술 평균과 각 옵션 간의 차이의 제곱과 해당 옵션의 발생 빈도의 곱의 합,

n – 관측치 수.

다양성의 정도는 변동계수의 크기로 판단할 수 있다.
. 20% 이상이면 강한 다양성, 10~20%는 중간 다양성, 10% 미만은 약한 다양성입니다.

산술 평균 값에 하나의 시그마(M ± 1σ)를 더하고 빼면 정규 분포를 사용하면 모든 변형(관찰)의 최소 68.3%가 이러한 한계 내에 속하게 되며 이는 연구 중인 현상의 표준으로 간주됩니다. . k 2 ± 2σ이면 모든 관측치의 95.5%가 이 한계 내에 속하게 되고, kM ± 3σ이면 모든 관측치의 99.7%가 이 한계 내에 속하게 됩니다. 따라서 표준 편차는 지정된 경계 내에 연구 중인 특성 값이 발생할 확률을 예측할 수 있는 표준 편차입니다.

산술평균의 평균오차또는 대표성 편향. 단순하고 가중치가 부여된 계열 및 순간의 규칙의 경우:

평균값을 계산하려면 재료의 균질성, 충분한 수의 관찰이 필요합니다. 관측치 수가 30개 미만인 경우 σ 및 m을 계산하는 공식에 n-1이 사용됩니다.

평균 오차의 크기로 얻은 결과를 평가할 때 정답 확률을 결정할 수 있는 신뢰 계수가 사용됩니다. 즉, 샘플링 오차의 결과 값이 다음보다 크지 않음을 나타냅니다. 지속적인 관찰의 결과로 발생한 실제 오류. 결과적으로, 신뢰확률이 증가함에 따라 신뢰구간의 폭이 증가하고, 이는 결과적으로 판단의 신뢰도와 획득된 결과의 지지가능성도 증가한다.

변주 계열 - 비교되는 계열(증가 또는 감소 정도에 따라) 옵션그리고 그에 상응하는 주파수

옵션은 특성을 개별적으로 정량적으로 표현한 것입니다. 라틴 문자로 표시됨 V . "변형"이라는 용어에 대한 고전적인 이해에서는 반복 횟수를 고려하지 않고 특성의 각 고유 값을 변형이라고 가정합니다.

예를 들어, 10명의 환자를 대상으로 측정한 수축기 혈압 지표의 변형 시리즈에서는 다음과 같습니다.

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

사용 가능한 값은 6개뿐입니다.

110, 120, 130, 140, 160, 170.

빈도(Frequency)는 옵션이 몇 번 반복되는지 나타내는 숫자입니다. 라틴 문자로 표시됨 피 . 모든 빈도의 합(물론 연구된 모든 빈도의 수와 동일)은 다음과 같이 표시됩니다. N.

옵션 110의 경우 빈도 P = 1(값 110은 한 명의 환자에게 발생함),
옵션 120의 경우 빈도 P = 2(두 명의 환자에게 값 120 발생),
옵션 130의 경우 빈도 P = 3(값 130은 세 명의 환자에게 발생함),
옵션 140의 경우 빈도 P = 2(값 140은 두 명의 환자에게 발생함),
옵션 160의 경우 빈도 P = 1(값 160은 한 명의 환자에게 발생함),
옵션 170의 경우 빈도 P = 1(값 170은 한 명의 환자에게 발생함),

변형 시리즈 유형:

단순한- 이것은 각 옵션이 한 번만 발생하는 계열입니다(모든 빈도는 1과 같습니다).
정지된- 하나 이상의 옵션이 두 번 이상 나타나는 시리즈입니다.

변형 시리즈는 숫자의 큰 배열을 설명하는 데 사용됩니다. 대부분의 의학 연구에서 수집된 데이터가 처음에 이 형식으로 표시됩니다. 변형 시리즈를 특성화하기 위해 평균값, 변동성 지표(소위 분산) 및 샘플 데이터의 대표성 지표를 포함한 특수 지표가 계산됩니다.

변형 시리즈 표시기

1) 산술 평균은 연구되는 특성의 크기를 나타내는 일반적인 지표입니다. 산술 평균은 다음과 같이 표시됩니다. 중 는 가장 일반적인 유형의 평균입니다. 산술 평균은 모든 관찰 단위의 지표 값의 합과 연구된 모든 과목의 수의 비율로 계산됩니다. 단순변동계열과 가중변동계열의 경우 산술평균을 계산하는 방법이 다릅니다.

계산 공식 단순 산술 평균:

계산 공식 가중 산술 평균:

M = Σ(V * P)/n

2) 모드는 가장 자주 반복되는 옵션에 해당하는 변형 계열의 또 다른 평균값입니다. 혹은 다르게 말하면 가장 높은 빈도에 해당하는 옵션이다. 다음과 같이 표시됨 모 . 모드는 가중치 계열에 대해서만 계산됩니다. 단순 계열에서는 옵션이 반복되지 않고 모든 주파수가 1과 동일하기 때문입니다.

예를 들어 심박수 값의 변형 시리즈에서는 다음과 같습니다.

80, 84, 84, 86, 86, 86, 90, 94;

모드 값은 86입니다. 이 옵션이 3번 발생하므로 빈도가 가장 높습니다.

3) 중앙값 - 변형 시리즈를 절반으로 나누는 옵션 값: 양쪽에 동일한 수의 옵션이 있습니다. 중앙값은 산술 평균 및 최빈값과 마찬가지로 평균값을 나타냅니다. 다음과 같이 표시됨 나

4) 표준편차 (동의어: 표준편차, 시그마편차, 시그마) - 변이 계열의 변동성을 측정합니다. 평균에서 벗어난 모든 경우를 통합하는 통합 지표입니다. 실제로, 이는 산술 평균에서 변형이 얼마나 멀리, 얼마나 자주 확산되는지에 대한 질문에 답합니다. 그리스 문자로 표시 σ ("시그마").

모집단 규모가 30단위를 초과하는 경우 표준 편차는 다음 공식을 사용하여 계산됩니다.

소규모 모집단(관측 단위 30개 이하)의 경우 표준 편차는 다른 공식을 사용하여 계산됩니다.

그룹화 방법을 사용하면 다음을 측정할 수도 있습니다. 변화(변동성, 변동) 기호. 모집단의 단위 수가 상대적으로 적은 경우 모집단을 구성하는 단위의 순위 수를 기준으로 변동이 측정됩니다. 시리즈라고 합니다 순위,단위가 특성의 오름차순(내림차순)으로 배열되어 있는 경우.

그러나 순위가 매겨진 계열은 변동의 비교 특성이 필요할 때 매우 유용합니다. 또한 다수의 단위로 구성된 통계적 모집단을 다루어야 하는 경우가 많아 특정 계열의 형태로 표현하기가 현실적으로 어렵습니다. 이와 관련하여, 통계 데이터에 대한 초기 일반 지식, 특히 특성 변화 연구를 용이하게 하기 위해 연구 중인 현상과 프로세스를 일반적으로 그룹으로 결합하고 그룹화 결과를 그룹 테이블 형식으로 표시합니다.

그룹 테이블에 선택한 특성(옵션)에 따른 그룹과 그룹 수(빈도 또는 빈도)라는 두 개의 열만 있는 경우 이를 호출합니다. 유통에 가깝습니다.

분포 범위 -하나의 특성을 기반으로 하는 가장 간단한 유형의 구조적 그룹화로, 특성의 변형과 빈도를 포함하는 두 개의 열이 있는 그룹 테이블에 표시됩니다. 많은 경우에 이러한 구조적 그룹화는 다음과 같습니다. 분포계열의 편찬과 함께 초기 통계자료에 대한 연구가 시작된다.

분포 계열 형태의 구조적 그룹화는 선택한 그룹이 빈도뿐만 아니라 다른 통계 지표에 의해 특성화되는 경우 진정한 구조적 그룹화로 전환될 수 있습니다. 분포 계열의 주요 목적은 특성의 변화를 연구하는 것입니다. 분포 계열 이론은 수학적 통계를 통해 자세히 전개됩니다.

배포 시리즈는 다음과 같이 나뉩니다. 명사 수식어(속성적 특성에 따라 그룹화, 예를 들어 인구를 성별, 국적, 결혼 상태 등으로 나누기) 및 변형(정량적 특성별로 그룹화).

변형 시리즈하나의 정량적 특성에 따른 단위 그룹화와 각 그룹의 단위 수라는 두 개의 열을 포함하는 그룹 테이블입니다. 변이 계열의 간격은 일반적으로 동일하고 닫혀 있습니다. 변형 계열은 러시아 인구를 1인당 평균 화폐 소득별로 다음과 같이 그룹화한 것입니다(표 3.10).

표 3.10

2004-2009년 1인당 평균 소득에 따른 러시아 인구 분포.

1인당 평균 현금 소득별 인구 그룹(문지름/월)	그룹 내 인구, 전체 대비 %
1인당 평균 현금 소득별 인구 그룹(문지름/월)




8 000,1-10 000,0
10 000,1-15 000,0
15 000,1-25 000,0
25,000.0 이상
전체 인구

변형 계열은 차례로 이산 계열과 간격 계열로 구분됩니다. 이산형변형 시리즈는 좁은 범위 내에서 변화하는 개별 특성의 변형을 결합합니다. 이산형 변형 시리즈의 예는 자녀 수에 따른 러시아 가족의 분포입니다.

간격변형 시리즈는 넓은 범위에 걸쳐 변화하는 연속 특성 또는 이산 특성의 변형을 결합합니다. 간격은 1인당 평균 화폐 소득에 따른 러시아 인구 분포의 변동 계열입니다.

이산변이 계열은 실제로는 자주 사용되지 않습니다. 한편, 그룹의 구성은 연구된 그룹화 특성이 실제로 갖는 특정 변형에 의해 결정되므로 이를 컴파일하는 것은 어렵지 않습니다.

간격 변화 계열이 더 널리 퍼져 있습니다. 이를 컴파일할 때 그룹 수와 설정해야 하는 간격의 크기에 대한 어려운 질문이 발생합니다.

이 문제를 해결하기 위한 원칙은 통계적 그룹화 방법론에 관한 장에 설명되어 있습니다(3.3항 참조).

변이 계열은 다양한 정보를 압축하여 압축하는 수단으로, 이로부터 변이의 성격을 상당히 명확하게 판단할 수 있으며, 연구 대상 집합에 포함된 현상의 특성 차이를 연구할 수 있습니다. 그러나 변이 계열의 가장 중요한 의미는 이를 토대로 변이의 특별한 일반화 특성이 계산된다는 것입니다(7장 참조).

변형정량적으로 구성된 분포 계열이라고 합니다. 인구의 개별 단위의 정량적 특성 값은 일정하지 않으며 서로 다소 다릅니다.

변화- 인구 단위 간 특성 값의 변동, 변경 가능성. 연구 대상 모집단에서 발견된 특성의 개별 수치를 호출합니다. 옵션가치. 모집단을 완전히 특성화하기에는 평균값이 부족하기 때문에 연구 중인 특성의 가변성(변동)을 측정하여 이러한 평균의 대표성을 평가할 수 있는 지표로 평균값을 보완해야 합니다.

변이의 존재는 특성 수준의 형성에 대한 많은 요인의 영향으로 인해 발생합니다. 이러한 요소는 강도가 다르고 방향이 다릅니다. 변이 지수는 특성 변이의 척도를 설명하는 데 사용됩니다.

변동에 대한 통계적 연구의 목적:

1) 인구의 개별 단위의 특성 변화의 성격과 정도에 대한 연구
2) 인구의 특정 특성의 변화에서 개별 요인 또는 해당 그룹의 역할을 결정합니다.

통계에서는 지표 시스템을 사용하여 변동을 연구하는 특별한 방법이 사용됩니다. 와 함께변화를 측정하는 방법입니다.

변이에 대한 연구는 중요하다. 시료 관찰, 상관관계 분석, 분산 분석 등을 수행할 때 편차 측정이 필요합니다. Ermolaev O.Yu. 심리학자를 위한 수학적 통계: 교과서 [텍스트]/ O.Yu. Ermolaev. - M .: 모스크바 심리 사회 연구소 플린트 출판사, 2012. - 335 p.

변동 정도에 따라 모집단의 동질성, 개별 특성 값의 안정성 및 평균의 전형성을 판단할 수 있습니다. 이를 바탕으로 특성 간의 관계가 밀접하다는 지표와 표본 관찰의 정확성을 평가하는 지표가 개발됩니다.

공간의 변화와 시간의 변화는 구별됩니다.

공간의 변화는 개별 영토를 대표하는 인구 단위 간의 속성 값의 변동으로 이해됩니다. 시간 변화는 다양한 기간에 걸쳐 특성 값의 변화를 나타냅니다.

분포 행의 변화를 연구하기 위해 속성 값의 모든 변형이 오름차순 또는 내림차순으로 정렬됩니다. 이 프로세스를 행 순위라고 합니다.

변이의 가장 단순한 징후는 다음과 같습니다. 최소 및 최대- 집합에서 속성의 가장 작은 값과 가장 큰 값입니다. 특징값의 개별 변형이 반복되는 횟수를 반복 빈도(fi)라고 합니다. 주파수를 주파수(wi)로 바꾸는 것이 편리합니다. 빈도는 빈도의 상대적 지표로, 단위의 분수 또는 백분율로 표시할 수 있으며 다양한 관찰 횟수를 사용하여 변형 계열을 비교할 수 있습니다. 다음 공식으로 표현됩니다.

여기서 Xmax, Xmin은 집계된 특성의 최대값과 최소값입니다. n - 그룹 수.

특성의 변화를 측정하기 위해 다양한 절대 및 상대 지표가 사용됩니다. 절대 변동 지표에는 변동 범위, 평균 선형 편차, 분산 및 표준 편차가 포함됩니다. 진동의 상대적 지표에는 진동 계수, 상대 선형 편차 및 변동 계수가 포함됩니다.

변형 시리즈를 찾는 예

운동.이 샘플의 경우:

a) 변형 시리즈를 찾습니다.
b) 분포 함수를 구성합니다.

번호=42. 샘플 요소:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

해결책.

a) 순위가 매겨진 변형 시리즈의 구성:
- 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
b) 이산형 변형 계열의 구성.

Sturgess 공식을 사용하여 변형 계열의 그룹 수를 계산해 보겠습니다.

그룹 수를 7로 가정해 보겠습니다.

그룹 수를 알면 간격의 크기를 계산합니다.

테이블 구성의 편의를 위해 그룹 수는 8개이고 간격은 1입니다.

쌀. 1 특정 기간 동안 매장의 상품 판매량

(변이 계열의 정의, 변이 계열의 구성 요소, 세 가지 형태의 변이 계열, 간격 계열 구성의 타당성, 구성된 계열에서 도출할 수 있는 결론)

변형 시리즈는 감소하지 않는 순서로 배열된 모든 샘플 요소의 시퀀스입니다. 동일한 요소가 반복됩니다.

변형 시리즈는 양적 기반으로 구축된 시리즈입니다.

변형 분포 계열은 옵션과 빈도라는 두 가지 요소로 구성됩니다.

변이는 변이 분포 계열의 정량적 특성의 수치 값입니다. 그것들은 긍정적일 수도 있고 부정적일 수도 있고, 절대적일 수도 있고 상대적일 수도 있습니다. 따라서 경제 활동 결과에 따라 기업을 그룹화할 때 긍정적인 선택은 이익이고 음수는 손실입니다.

빈도는 개별 옵션의 수 또는 변형 시리즈의 각 그룹입니다. 이는 배포 시리즈에서 특정 옵션이 얼마나 자주 발생하는지 보여주는 숫자입니다. 모든 빈도의 합을 모집단의 부피라고 하며 전체 모집단의 요소 수에 의해 결정됩니다.

주파수는 상대값(단위의 분수 또는 백분율)으로 표현되는 주파수입니다. 빈도의 합은 1 또는 100%와 같습니다. 빈도를 빈도로 바꾸면 다양한 수의 관측값을 사용하여 변형 계열을 비교할 수 있습니다.

변형 시리즈에는 세 가지 형태가 있습니다.순위 시리즈, 이산 시리즈 및 간격 시리즈.

순위 계열은 연구되는 특성의 오름차순 또는 내림차순으로 인구의 개별 단위를 분포하는 것입니다. Ranking을 사용하면 정량적 데이터를 그룹으로 쉽게 나누고, 특성의 최소값과 최대값을 즉시 감지하고, 가장 자주 반복되는 값을 강조표시할 수 있습니다.

다른 형태의 변형 시리즈는 연구되는 특성 값의 변형 특성에 따라 구성된 그룹 테이블입니다. 변이의 성질에 따라 이산적(불연속적) 특성과 연속적 특성이 구별됩니다.

이산 계열은 불연속적인 변화 특성(이산 특성)을 기반으로 구성되는 변이 계열입니다. 후자에는 관세 범주, 가족의 자녀 수, 기업 직원 수 등이 포함됩니다. 이러한 기능은 한정된 수의 특정 값만 사용할 수 있습니다.

이산형 변형 계열은 두 개의 열로 구성된 테이블을 나타냅니다. 첫 번째 열은 속성의 특정 값을 나타내고 두 번째 열은 특정 속성 값을 가진 모집단의 단위 수를 나타냅니다.

특성에 지속적인 변화(소득 금액, 서비스 기간, 기업의 고정 자산 비용 등 특정 한도 내에서 모든 값을 취할 수 있음)가 있는 경우 이 특성에 대해 다음을 구축해야 합니다. 간격 변형 시리즈.

여기의 그룹 테이블에도 두 개의 열이 있습니다. 첫 번째는 "from - to" 간격(옵션)의 속성 값을 나타내고, 두 번째는 간격(빈도)에 포함된 단위 수를 나타냅니다.

빈도(반복 빈도) - 속성 값의 특정 변형의 반복 횟수는 fi로 표시되고 연구 중인 인구의 양과 동일한 빈도의 합이 표시됩니다.

여기서 k는 속성 값에 대한 옵션 수입니다.

종종 표에는 누적 빈도 S가 계산되는 열이 추가됩니다. 이 열은 모집단에서 이 값보다 크지 않은 특성 값을 갖는 단위의 수를 보여줍니다.

이산변동분포 계열은 이산적으로 변화하는 특성에 따라 그룹이 구성되고 정수 값만 취하는 계열입니다.

구간변동분포 계열은 그룹화의 기초가 되는 그룹화 특성이 특정 구간에서 분수 값을 포함하여 임의의 값을 가질 수 있는 계열입니다.

간격 변동 계열은 각 값의 해당 빈도 또는 발생 빈도에 따라 랜덤 변수의 값을 변화시키는 순서화된 간격 세트입니다.

우선 특성의 연속적인 변화와 이산적인 변화가 넓은 범위에 걸쳐 나타나는 경우 간격 분포 계열을 구성하는 것이 좋습니다. 이산 특성의 변형 수는 상당히 많습니다.

이 시리즈에서 이미 몇 가지 결론을 도출할 수 있습니다. 예를 들어, 변동 계열의 중간 요소(중앙값)는 가장 가능성이 높은 측정 결과의 추정치가 될 수 있습니다. 변형 계열의 첫 번째와 마지막 요소(즉, 표본의 최소 및 최대 요소)는 표본 요소의 확산을 보여줍니다. 때로는 첫 번째 또는 마지막 요소가 나머지 샘플 요소와 크게 다른 경우 이러한 값이 기술과 같은 일종의 심각한 실패의 결과로 얻은 것으로 간주하여 측정 결과에서 제외됩니다.

카테고리