V. Вариационни редове, средни стойности, изменчивост на признака

Вариационни сериие поредица от числени стойности на характеристика.

Основните характеристики на вариационния ред: v – вариант, p – честота на неговото появяване.

Видове вариационни серии:

    според честотата на срещане на опциите: прости - опцията се среща веднъж, претеглени - опцията се среща два или повече пъти;

    по местоположение на опциите: класирани - опциите са подредени в низходящ и възходящ ред, некласирани - опциите са написани без определен ред;

    чрез комбиниране на опция в групи: групирани - опциите се комбинират в групи, негрупирани - опциите не се комбинират в групи;

    по размер опции: непрекъснати - опциите се изразяват като цяло число и дробно число, дискретни - опциите се изразяват като цяло число, комплексни - опциите се представят с относителна или средна стойност.

Вариационната серия се съставя и формализира за целите на изчисляването на средните стойности.

Форма за запис на вариационна серия:

8. Средни стойности, видове, методи за изчисляване, приложение в здравеопазването

Средни стойности– кумулативна обобщаваща характеристика на количествените характеристики. Прилагане на средни стойности:

1. Да се ​​характеризира организацията на работа на лечебните заведения и да се оцени тяхната дейност:

а) в клиниката: показатели за натовареност на лекарите, среден брой посещения, среден брой жители в района;

б) в болница: средният брой дни, през които едно легло е отворено за година; средна продължителност на болничния престой;

в) в центъра по хигиена, епидемиология и обществено здраве: средна площ (или кубичен капацитет) на човек, средни хранителни норми (белтъчини, мазнини, въглехидрати, витамини, минерални соли, калории), санитарни норми и стандарти и др.;

2. Да характеризира физическото развитие (основни антропометрични характеристики, морфологични и функционални);

3. Да се ​​определят медико-физиологичните параметри на организма в нормални и патологични състояния при клинични и експериментални изследвания.

4. В специални научни изследвания.

Разликата между средните стойности и индикаторите:

1. Коефициентите характеризират алтернативна характеристика, която се среща само в определена част от статистическата съвкупност, която може или не може да се появи.

Средните стойности обхващат характеристики, които са общи за всички членове на екипа, но в различна степен (тегло, ръст, дни на лечение в болница).

2. Коефициентите се използват за измерване на качествени характеристики. Средни стойности – за различни количествени характеристики.

Видове средни стойности:

    средно аритметично, неговите характеристики са стандартно отклонение и средна грешка

    режим и медиана. Мода (Mo)– съответства на стойността на характеристиката, която се среща по-често от други в дадена популация. Медиана (аз)– стойността на характеристика, която заема средната стойност в дадена популация. Той разделя серията на 2 равни части според броя на наблюденията. Средно аритметично (M)– за разлика от модата и медианата, тя се основава на всички направени наблюдения, следователно е важна характеристика за цялото разпределение.

    други видове средни стойности, които се използват в специални изследвания: средноквадратична, кубична, хармонична, геометрична, прогресивна.

Средноаритметичнохарактеризира средното ниво на статистическата съвкупност.

За проста серия, където

∑v – опция за сума,

n – брой наблюдения.

за претеглена серия, където

∑vр – сумата от произведенията на всяка опция и честотата на нейното появяване

n – брой наблюдения.

Стандартно отклонениесредно аритметично или сигма (σ) характеризира разнообразието на дадена характеристика

- за проста серия

Σd 2 – сумата от квадратите на разликата между средноаритметичното и всеки вариант (d = │M-V│)

n – брой наблюдения

- за претеглена серия

∑d 2 p – сумата от произведенията на квадратите на разликата между средноаритметичното и всяка опция и честотата на нейното появяване,

n – брой наблюдения.

Степента на разнообразие може да се съди по величината на коефициента на вариация
. Повече от 20% е силно разнообразие, 10-20% е средно разнообразие, по-малко от 10% е слабо разнообразие.

Ако добавим и извадим една сигма (M ± 1σ) към средноаритметичната стойност, тогава при нормално разпределение най-малко 68,3% от всички варианти (наблюдения) ще бъдат в тези граници, което се счита за норма за изследваното явление . Ако k 2 ± 2σ, тогава 95,5% от всички наблюдения ще бъдат в тези граници, а ако k M ± 3σ, тогава 99,7% от всички наблюдения ще бъдат в тези граници. По този начин стандартното отклонение е стандартно отклонение, което ни позволява да предскажем вероятността за възникване на такава стойност на изследваната характеристика, която е в определените граници.

Средна грешка на средноаритметичната стойностили пристрастност към представителността. За проста, претеглена серия и правилото на моментите:

.

За да се изчислят средните стойности, е необходимо: хомогенност на материала, достатъчен брой наблюдения. Ако броят на наблюденията е по-малък от 30, във формулите за изчисляване на σ и m се използва n-1.

При оценката на получения резултат от размера на средната грешка се използва коефициент на доверие, който дава възможност да се определи вероятността за правилен отговор, т.е. показва, че получената стойност на грешката на извадката няма да бъде по-голяма от действителната грешка, допусната в резултат на непрекъснато наблюдение. Следователно, с увеличаване на вероятността за доверие, ширината на интервала на доверие се увеличава, което от своя страна увеличава увереността на преценката и надеждността на получения резултат.

Вариационна серия - серия, в която се сравняват (по степен на увеличение или намаление) настроикии съответстващи честоти

Опциите са индивидуални количествени изрази на характеристика. Обозначава се с латинска буква V . Класическото разбиране на термина "вариант" предполага, че всяка уникална стойност на характеристика се нарича вариант, без да се взема предвид броят на повторенията.

Например, в серията вариации на показателите за систолично кръвно налягане, измерени при десет пациенти:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Има само 6 налични стойности:

110, 120, 130, 140, 160, 170.

​Честотата е число, показващо колко пъти се повтаря дадена опция. Означава се с латинска буква П . Сумата от всички честоти (която, разбира се, е равна на броя на всички изследвани) се означава като н.

    В нашия пример честотите ще приемат следните стойности:
  • за опция 110 честота P = 1 (стойност 110 се среща при един пациент),
  • за опция 120 честота P = 2 (стойност 120 се среща при двама пациенти),
  • за опция 130 честота P = 3 (стойност 130 се среща при трима пациенти),
  • за опция 140 честота P = 2 (стойност 140 се среща при двама пациенти),
  • за опция 160 честота P = 1 (стойност 160 се среща при един пациент),
  • за опция 170 честота P = 1 (стойност 170 се среща при един пациент),

Видове вариационни серии:

  1. просто- това е серия, в която всяка опция се среща само веднъж (всички честоти са равни на 1);
  2. спряно- серия, в която една или повече опции се появяват повече от веднъж.

Вариационните серии се използват за описване на големи масиви от числа; именно в тази форма първоначално се представят събраните данни от повечето медицински изследвания. За да се характеризират вариационните серии, се изчисляват специални показатели, включително средни стойности, показатели за променливост (т.нар. дисперсия) и показатели за представителност на извадковите данни.

Индикатори за вариационни серии

1) Средната аритметична стойност е общ показател, характеризиращ размера на изследваната характеристика. Средната аритметична стойност се означава като М , е най-често срещаният тип средна стойност. Средната аритметична стойност се изчислява като съотношението на сумата от стойностите на индикатора на всички единици за наблюдение към броя на всички изследвани субекти. Методът за изчисляване на средната аритметична стойност се различава за прости и претеглени вариационни серии.

Формула за изчисление проста аритметична средна:

Формула за изчисление средно претеглено аритметично:

M = Σ(V * P)/ n

​ 2) Mode е друга средна стойност на вариационната серия, съответстваща на най-често повтарящата се опция. Или, казано по друг начин, това е опцията, която отговаря на най-високата честота. Означава се като мо . Режимът се изчислява само за претеглени серии, тъй като при прости серии нито една от опциите не се повтаря и всички честоти са равни на единица.

Например в серията вариации на стойностите на сърдечната честота:

80, 84, 84, 86, 86, 86, 90, 94;

стойността на режима е 86, тъй като тази опция се среща 3 пъти, следователно нейната честота е най-висока.

3) Медиана - стойността на опцията, разделяща вариационната серия наполовина: от двете й страни има равен брой опции. Медианата, както средната аритметична стойност и модата, се отнасят за средни стойности. Означава се като аз

4) Стандартно отклонение (синоними: стандартно отклонение, сигма отклонение, сигма) - мярка за променливостта на вариационната серия. Това е интегрален показател, който обединява всички случаи на отклонение от средната стойност. Всъщност той отговаря на въпроса колко далеч и колко често се разпространяват вариантите от средноаритметичното. Означава се с гръцка буква σ ("сигма").

Ако размерът на популацията е повече от 30 единици, стандартното отклонение се изчислява по следната формула:

За малки популации - 30 единици за наблюдение или по-малко - стандартното отклонение се изчислява по различна формула:

Методът на групиране също ви позволява да измервате вариация(променливост, колебание) на знаците. Когато броят на единиците в популацията е относително малък, вариацията се измерва въз основа на класирания брой единици, които съставляват популацията. Сериалът се нарича класиран,ако единиците са подредени във възходящ (низходящ) ред на характеристиката.

Класираните серии обаче са доста показателни, когато е необходима сравнителна характеристика на вариацията. Освен това в много случаи трябва да имаме работа със статистически съвкупности, състоящи се от голям брой единици, които на практика е трудно да се представят под формата на определена серия. В тази връзка, за първоначално общо запознаване със статистически данни и особено за улесняване на изучаването на вариациите в характеристиките, изследваните явления и процеси обикновено се обединяват в групи, а резултатите от групирането се представят под формата на групови таблици.

Ако една групова таблица има само две колони - групи по избран признак (опции) и брой групи (честота или честота), тя се нарича близко разпространение.

Диапазон на разпространение -най-простият тип структурно групиране въз основа на една характеристика, показана в групова таблица с две колони, съдържащи варианти и честоти на характеристиката. В много случаи при такова структурно групиране, т.е. Със съставянето на редове за разпределение започва изучаването на изходния статистически материал.

Структурно групиране под формата на серия на разпределение може да се превърне в истинско структурно групиране, ако избраните групи се характеризират не само с честоти, но и с други статистически показатели. Основната цел на сериите за разпределение е да изследват вариациите на характеристиките. Теорията на редовете на разпределение е разработена подробно от математическата статистика.

Разпределителните серии са разделени на атрибутивни(групиране според атрибутивни характеристики, например разделяне на населението по пол, националност, семейно положение и т.н.) и вариационен(групиране по количествени признаци).

Вариационни сериие групова таблица, която съдържа две колони: групиране на единици по един количествен признак и брой единици във всяка група. Интервалите във вариационните серии обикновено се образуват равни и затворени. Вариационната серия е следното групиране на руското население по среден паричен доход на глава от населението (Таблица 3.10).

Таблица 3.10

Разпределение на населението на Русия по среден доход на глава от населението през 2004-2009 г.

Групи от населението по среден паричен доход на глава от населението, рубли / месец

Население в групата, % от общото

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Над 25 000,0

Цялото население

Вариационните серии от своя страна се делят на дискретни и интервални. Отделенвариационните серии комбинират варианти на дискретни характеристики, които варират в тесни граници. Пример за дискретна вариационна серия е разпределението на руските семейства по броя на децата, които имат.

Интервалвариационните серии комбинират варианти на непрекъснати характеристики или дискретни характеристики, вариращи в широк диапазон. Интервалът е вариационната серия на разпределението на руското население по среден паричен доход на глава от населението.

Дискретните вариационни серии не се използват много често на практика. Междувременно съставянето им не е трудно, тъй като съставът на групите се определя от специфичните варианти, които действително притежават изследваните групови характеристики.

Интервалните вариационни серии са по-разпространени. При съставянето им възниква труден въпрос за броя на групите, както и за размера на интервалите, които трябва да се установят.

Принципите за решаване на този проблем са изложени в главата относно методологията за конструиране на статистически групи (вижте параграф 3.3).

Вариационните серии са средство за свиване или компресиране на разнообразна информация в компактна форма; от тях може да се направи доста ясна преценка за естеството на вариацията и да се изучат разликите в характеристиките на явленията, включени в изследваната група. Но най-важното значение на вариационните редове е, че на тяхна основа се изчисляват специалните обобщаващи характеристики на вариацията (виж Глава 7).

Вариационенсе наричат ​​серии на разпределение, построени на количествена основа. Стойностите на количествените характеристики в отделните единици на съвкупността не са постоянни и се различават повече или по-малко една от друга.

Вариация- колебание, променливост на стойността на дадена характеристика сред единиците от съвкупността. Наричат ​​се индивидуални числени стойности на характеристика, открита в изследваната популация настроикистойности. Недостатъчността на средната стойност за пълно характеризиране на популацията ни принуждава да допълним средните стойности с показатели, които ни позволяват да оценим типичността на тези средни стойности чрез измерване на променливостта (вариацията) на изследваната характеристика.

Наличието на вариация се дължи на влиянието на голям брой фактори върху формирането на нивото на признака. Тези фактори действат с различна сила и в различни посоки. Индексите на вариация се използват за описание на мярката за вариабилност на признака.

Цели на статистическото изследване на вариацията:

  • 1) изследване на естеството и степента на вариация на характеристиките в отделни единици от съвкупността;
  • 2) определяне на ролята на отделни фактори или техните групи в изменението на определени характеристики на населението.

В статистиката се използват специални методи за изследване на вариациите, базирани на използването на система от показатели, спо който се измерва вариацията.

Изследването на вариациите е важно. Измерването на вариациите е необходимо при провеждане на наблюдение на извадки, корелационен и дисперсионен анализ и др. Ермолаев О.Ю. Математическа статистика за психолози: Учебник [Текст]/ О.Ю. Ермолаев. - М .: Издателство "Флинт" на Московския психологически и социален институт, 2012. - 335 с.

По степента на вариация може да се прецени хомогенността на популацията, стабилността на индивидуалните стойности на характеристиките и типичността на средната стойност. На тяхна основа са разработени показатели за близостта на връзката между характеристиките и показатели за оценка на точността на извадковото наблюдение.

Прави се разлика между изменение в пространството и изменение във времето.

Променливостта в пространството се разбира като колебание на стойностите на атрибутите сред популационните единици, представляващи отделни територии. Времевата вариация се отнася до промени в стойностите на дадена характеристика през различни периоди от време.

За да се проучат вариациите в редовете за разпределение, всички варианти на стойностите на атрибутите се подреждат във възходящ или низходящ ред. Този процес се нарича класиране на серията.

Най-простите признаци на вариация са минимум и максимум- най-малката и най-голямата стойност на атрибута в съвкупността. Броят на повторенията на отделните варианти на стойностите на характеристиките се нарича честота на повторение (fi). Удобно е да замените честотите с честоти - wi. Честотата е относителен показател за честота, който може да бъде изразен в части от единица или като процент и ви позволява да сравнявате вариационни серии с различен брой наблюдения. Изразява се с формулата:

където Xmax, Xmin са максималните и минималните стойности на характеристиката в съвкупността; n - брой групи.

За измерване на вариацията на дадена характеристика се използват различни абсолютни и относителни показатели. Абсолютните показатели за вариация включват диапазона на вариация, средно линейно отклонение, дисперсия и стандартно отклонение. Относителните показатели за трептене включват коефициент на трептене, относително линейно отклонение и коефициент на вариация.

Пример за намиране на вариационна серия

Упражнение.За тази проба:

  • а) Намерете вариационната серия;
  • б) Конструирайте функцията на разпределение;

№=42. Примерни елементи:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Решение.

  • а) изграждане на класирана вариационна серия:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • б) изграждане на дискретна вариационна серия.

Нека изчислим броя на групите във вариационната серия, използвайки формулата на Стърджис:

Нека вземем броя на групите равен на 7.

Знаейки броя на групите, изчисляваме размера на интервала:

За удобство при конструирането на таблицата ще вземем броя на групите, равен на 8, интервалът ще бъде 1.

Ориз. 1 Обемът на продажбите на стоки от магазин за определен период от време

(дефиниция на вариационна серия; компоненти на вариационна серия; три форми на вариационна серия; осъществимост на конструирането на интервална серия; заключения, които могат да бъдат направени от конструираната серия)

Вариационна серия е последователността от всички елементи на извадката, подредени в ненамаляващ ред. Еднаквите елементи се повтарят

Вариационните редове са редове, изградени на количествена основа.

Вариационните серии на разпределение се състоят от два елемента: опции и честоти:

Вариантите са числени стойности на количествена характеристика в серия с вариационно разпределение. Те могат да бъдат положителни и отрицателни, абсолютни и относителни. Така че, когато групирате предприятията според резултатите от икономическата дейност, положителните варианти са печалба, а отрицателните числа са загуба.

Честотите са числата на отделните варианти или всяка група от вариационна серия, т.е. Това са числа, показващи колко често се появяват определени опции в серия за разпространение. Сумата от всички честоти се нарича обем на популацията и се определя от броя на елементите на цялата популация.

Честотите са честоти, изразени като относителни стойности (части от единици или проценти). Сумата от честотите е равна на единица или 100%. Замяната на честотите с честоти позволява да се сравняват вариационни серии с различен брой наблюдения.

Има три форми на вариационни серии:класирани серии, дискретни серии и интервални серии.

Класирана серия е разпределението на отделни единици от популация във възходящ или низходящ ред на характеристиката, която се изследва. Класирането ви позволява лесно да разделяте количествените данни на групи, незабавно да откривате най-малките и най-големите стойности на дадена характеристика и да подчертавате стойностите, които най-често се повтарят.

Други форми на вариационни серии са групови таблици, съставени според естеството на вариацията в стойностите на изследваната характеристика. Според характера на изменението се разграничават дискретни (прекъснати) и непрекъснати характеристики.

Дискретна серия е вариационна серия, чието конструиране се основава на характеристики с прекъснато изменение (дискретни характеристики). Последните включват тарифната категория, броя на децата в семейството, броя на служителите в предприятието и др. Тези функции могат да приемат само краен брой специфични стойности.

Серия от дискретни вариации представлява таблица, която се състои от две колони. Първата колона показва конкретната стойност на атрибута, а втората колона показва броя на единиците в популацията с конкретна стойност на атрибута.

Ако една характеристика има непрекъсната промяна (размер на дохода, трудов стаж, цена на дълготрайните активи на предприятието и т.н., които могат да приемат всякакви стойности в определени граници), тогава за тази характеристика е необходимо да се изгради интервални вариационни серии.



Груповата таблица тук също има две колони. Първият показва стойността на атрибута в интервала „от - до“ (опции), вторият показва броя на единиците, включени в интервала (честота).

Честота (честота на повторение) - броят на повторенията на определен вариант на стойностите на атрибута се обозначава с fi, а сумата от честотите, равна на обема на изследваната популация, се обозначава

Където k е броят на опциите за стойностите на атрибута

Много често таблицата се допълва с колона, в която се изчисляват натрупаните честоти S, които показват колко единици в популацията имат характерна стойност не по-голяма от тази стойност.

Серия с дискретно вариационно разпределение е серия, в която групите са съставени според характеристика, която се променя дискретно и приема само цели числа.

Интервална вариационна серия на разпределение е серия, в която груповата характеристика, която формира основата на групирането, може да приема всякакви стойности, включително дробни, в определен интервал.

Серия от интервални вариации е подреден набор от интервали на вариране на стойностите на случайна променлива със съответните честоти или честоти на появяване на стойността във всяка от тях.

Препоръчително е да се изгради интервална серия на разпределение, на първо място, с непрекъснато изменение на характеристика, а също и ако дискретно изменение се проявява в широк диапазон, т.е. броят на вариантите на една дискретна характеристика е доста голям.

От тази поредица вече могат да се направят няколко извода. Например, средният елемент на серия от вариации (медиана) може да бъде оценка на най-вероятния резултат от измерването. Първият и последният елемент от серията вариации (т.е. минималният и максималния елемент на извадката) показват разпространението на елементите на извадката. Понякога, ако първият или последният елемент е много различен от останалата част от пробата, те се изключват от резултатите от измерването, като се има предвид, че тези стойности са получени в резултат на някакъв вид груба повреда, например технология.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи