Постройте интервална серия на разпределение. Конструиране на интервални вариационни серии за непрекъснати количествени данни

Групиране- това е разделяне на съвкупност на групи, които са хомогенни по някакъв признак.

Цел на услугата. С помощта на онлайн калкулатора можете:

  • изградете вариационна серия, изграждане на хистограма и полигон;
  • намиране на показатели за вариация (средно, режим (включително графично), медиана, диапазон на вариация, квартили, децили, коефициент на квартилна диференциация, коефициент на вариация и други показатели);

Инструкции. За да групирате серия, трябва да изберете вида на получената вариационна серия (дискретна или интервална) и да посочите количеството данни (брой редове). Полученото решение се записва във файл на Word (вижте пример за групиране на статистически данни).

Брой входни данни
",0);">

Ако групирането вече е извършено и дискретни вариационни серииили интервални серии, тогава трябва да използвате онлайн калкулатора Variation Indices. Проверка на хипотезата за вида на разпределениетосе извършва чрез услугата Изучаване на формуляра за разпределение.

Видове статистически групировки

Вариационни серии. В случай на наблюдения на дискретна случайна променлива, една и съща стойност може да се срещне няколко пъти. Такива стойности x i на случайна променлива се записват, като посочват n i броя пъти, в които се появяват в n наблюдения, това е честотата на тази стойност.
В случай на непрекъсната случайна променлива на практика се използва групиране.
  1. Типологично групиране- това е разделянето на качествено разнородната изследвана популация на класове, социално-икономически типове, хомогенни групи единици. За да изградите това групиране, използвайте параметъра Дискретни вариационни серии.
  2. Групирането се нарича структурно, при което една хомогенна популация е разделена на групи, които характеризират нейната структура според някаква различна характеристика. За да създадете това групиране, използвайте параметъра Interval series.
  3. Нарича се групиране, което разкрива връзките между изучаваните явления и техните характеристики аналитична група(виж аналитично групиране на сериите).

Принципи за изграждане на статистически групировки

Серия от наблюдения, подредени във възходящ ред, се нарича вариационна серия. Функция за групиранее характеристика, по която една популация се разделя на отделни групи. Нарича се основа на групата. Групирането може да се основава както на количествени, така и на качествени характеристики.
След определяне на основата на групирането трябва да се реши въпросът за броя на групите, на които трябва да се раздели изследваната популация.

Когато се използват персонални компютри за обработка на статистически данни, групирането на обектни единици се извършва по стандартни процедури.
Една такава процедура се основава на използването на формулата на Стърджис за определяне на оптималния брой групи:

k = 1+3,322*log(N)

Където k е броят на групите, N е броят на единиците от съвкупността.

Дължината на частичните интервали се изчислява като h=(x max -x min)/k

След това се отчита броят на наблюденията, които попадат в тези интервали, които се приемат като честоти n i . Няколко честоти, чиито стойности са по-малки от 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Средните стойности на интервалите x i =(c i-1 +c i)/2 се приемат като нови стойности.

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

публикувано на http://www.allbest.ru/

ЗАДАЧА1

За заплатите на служителите в предприятието има следните данни:

Таблица 1.1

Размерът на заплатите в конвенционални условия. бърлога единици

Изисква се да се изгради интервална серия на разпределение, чрез която да се намери;

1) средна заплата;

2) средно линейно отклонение;

4) стандартно отклонение;

5) диапазон на вариация;

6) коефициент на трептене;

7) линеен коефициент на вариация;

8) прост коефициент на вариация;

10) медиана;

11) коефициент на асиметрия;

12) Индекс на асиметрия на Pearson;

13) коефициент на ексцес.

Решение

Както знаете, опциите (разпознатите стойности) са подредени във възходящ ред, за да се образуват дискретни вариационни серии. С голям брой опция (повече от 10), дори и при дискретна вариация се изграждат интервални серии.

Ако серия от интервали е съставена с четни интервали, тогава обхватът на вариация се разделя на определения брой интервали. Освен това, ако получената стойност е цяло число и недвусмислена (което е рядко), тогава се приема, че дължината на интервала е равна на това число. В други случаи произведени закръгляване Задължително V страна нараства, Така да се последната останала цифра беше четна. Очевидно с увеличаване на дължината на интервала, диапазон на вариация със стойност, равна на произведението на броя на интервалите: с разликата между изчислената и първоначалната дължина на интервала

а) Ако големината на разширяването на диапазона на вариация е незначителна, тогава тя или се добавя към най-голямата, или се изважда от най-малката стойност на характеристиката;

б) Ако големината на разширяването на диапазона на вариация е забележима, тогава, за да се избегне объркване на центъра на диапазона, той грубо се разделя наполовина чрез едновременно добавяне към най-големите и изваждане от най-малките стойности на характеристиката.

Ако се компилира интервална серия с неравни интервали, тогава процесът се опростява, но въпреки това дължината на интервалите трябва да бъде изразена като число с последната четна цифра, което значително опростява последващите изчисления на числените характеристики.

30 е размерът на извадката.

Нека създадем серия с интервално разпределение, като използваме формулата на Sturges:

K = 1 + 3,32*log n,

К - брой групи;

K = 1 + 3,32*lg 30 = 5,91=6

Намираме обхвата на атрибута - заплати на работниците в предприятието - (x), използвайки формулата

R= xmax - xmin и разделяне на 6; R= 195-112=83

Тогава дължината на интервала ще бъде ллента=83:6=13.83

Началото на първия интервал ще бъде 112. Добавяне към 112 л ras = 13.83, получаваме крайната му стойност 125.83, което е и началото на втория интервал и т.н. край на петия интервал - 195.

Когато намирате честоти, трябва да се ръководите от правилото: „ако стойността на характеристика съвпада с границата на вътрешния интервал, тогава тя трябва да се припише на предишния интервал“.

Получаваме интервална серия от честоти и кумулативни честоти.

Таблица 1.2

Следователно 3 служители имат заплата. такса от 112 до 125,83 конвенционални парични единици. Най-висока заплата такса от 181,15 до 195 конвенционални парични единици. само 6 служители.

За да изчислим числените характеристики, трансформираме интервалната серия в дискретна серия, като вземем средата на интервалите като опция:

Таблица 1.3

14131,83

Използване на формулата за средноаритметично претеглено

конвенционални парични единици

Средно линейно отклонение:

където xi е стойността на изследваната характеристика за i-та единица от съвкупността,

Средна стойност на изследвания признак.

публикувано на http://www.allbest.ru/

LПубликувано на http://www.allbest.ru/

Конвенционални парични единици

Стандартно отклонение:

дисперсия:

Относителен диапазон на вариация (коефициент на трептене): c= R:,

Относително линейно отклонение: q = L:

Коефициентът на вариация: V = y:

Коефициентът на колебание показва относителното колебание на екстремните стойности на дадена характеристика около средноаритметичната стойност, а коефициентът на вариация характеризира степента и хомогенността на популацията.

c= R: = 83 / 159,485*100% = 52,043%

Така разликата между екстремните стойности е с 5,16% (=94,84%-100%) по-малко от средната работна заплата на служителите в предприятието.

q = L: = 17,765/ 159,485*100% = 11,139%

V = y: = 21,704/ 159,485*100% = 13,609%

Коефициентът на вариация е по-малък от 33%, което показва слаба вариация в заплатите на работниците в предприятието, т.е. че средната стойност е типична характеристика на заплатите на работниците (съвкупността е хомогенна).

В серии с интервално разпределение модаопределя се по формулата -

Честота на модалния интервал, т.е. интервалът, съдържащ най-голям брой опции;

Честота на интервала, предхождащ модала;

Честота на интервала след модала;

Дължина на модалния интервал;

Долната граница на модалния интервал.

За определяне медианив интервалната серия използваме формулата

където е кумулативната (натрупана) честота на интервала, предхождащ медианата;

Долна граница на медианния интервал;

Средна интервална честота;

Дължина на средния интервал.

Среден интервал- интервал, чиято натрупана честота (=3+3+5+7) надвишава половината от сбора на честотите - (153.49; 167.32).

Нека изчислим асиметрията и ексцеса, за които ще създадем нов работен лист:

Таблица 1.4

Фактически данни

Данни за изчисление

Нека изчислим момента от трети ред

Следователно асиметрията е равна на

Тъй като 0,3553 0,25, асиметрията се счита за значителна.

Нека изчислим момента от четвърти ред

Следователно ексцесът е равен на

защото< 0, то эксцесс является плосковершинным.

Степента на асиметрия може да се определи, като се използва коефициентът на асиметрия на Пиърсън (As): осцилация проба стойност оборот

където е средноаритметичната стойност на серията на разпределение; -- мода; -- стандартно отклонение.

Следователно при симетрично (нормално) разпределение = Mo коефициентът на асиметрия е нула. Ако As > 0, тогава има повече режим, следователно има дясна асиметрия.

Ако As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Разпределението не е симетрично, но има лявостранна асиметрия.

ЗАДАЧА 2

Какъв трябва да бъде размерът на извадката, така че с вероятност 0,954 грешката на извадката да не надвишава 0,04, ако въз основа на предишни проучвания е известно, че дисперсията е 0,24?

Решение

Размерът на извадката за еднократно вземане на проби се изчислява по формулата:

t - коефициент на доверие (с вероятност 0,954 е равен на 2,0; определен от таблици на вероятностни интеграли),

y2=0,24 - стандартно отклонение;

10 000 души - размер на извадката;

Dx =0.04 - максимална грешка на извадковата средна стойност.

С вероятност от 95,4% може да се твърди, че размерът на извадката, осигуряващ относителна грешка не повече от 0,04, трябва да бъде най-малко 566 семейства.

ЗАДАЧА3

Налични са следните данни за приходите от основната дейност на предприятието, милиони рубли.

За да анализирате поредица от динамика, определете следните показатели:

1) верига и основни:

Абсолютни увеличения;

темпове на растеж;

Скорост на растеж;

2) средно

Dynamics ниво на ред;

Абсолютно увеличение;

Скорост на растеж;

Скорост на нарастване;

3) абсолютна стойност от 1% увеличение.

Решение

1. Абсолютно увеличение (дy)- това е разликата между следващото ниво на серията и предишното (или основно):

верига: DN = yi - yi-1,

основен: DN = yi - y0,

уi - ниво на ред,

i - номер на ниво ред,

y0 - ниво на базова година.

2. Темп на растеж (Tu)е съотношението на следващото ниво на серията и предходното (или базова година 2001):

верига: Tu = ;

основно: Tu =

3. Темп на растеж (Tд) е съотношението на абсолютния растеж към предишното ниво, изразено в %.

верига: Tu = ;

основно: Tu =

4. Абсолютна стойност от 1% увеличение (A)- това е отношението на верижния абсолютен прираст към темпа на прираст, изразен в %.

А =

Средно ниво на редаизчислено по формулата за средно аритметично.

Средно ниво на доходи от основна дейност за 4 години:

Средно абсолютно увеличениеизчислено по формулата:

където n е броят нива на серията.

Средно за годината приходите от основни дейности са се увеличили с 3,333 милиона рубли.

Средногодишен темп на растежизчислено по формулата за средногеометрична:

уn е крайното ниво на реда,

y0 е началното ниво на серията.

Tu = 100% = 102,174%

Средногодишен темп на растежизчислено по формулата:

T? = Tu - 100% = 102,74% - 100% = 2,74%.

Така средно за година приходите от основната дейност на предприятието нарастват с 2,74%.

ЗАДАЧИА4

Изчисли:

1. Индивидуални ценови индекси;

2. Общ индекс на търговския оборот;

3. Агрегиран индекс на цените;

4. Агрегиран индекс на физическия обем на продажбите на стоки;

5. Разпределете абсолютното увеличение на стойността на търговския оборот по фактори (поради промени в цените и броя на продадените стоки);

6. Направете кратки изводи по всички получени показатели.

Решение

1. Съгласно условието индивидуалните ценови индекси за продукти A, B, C възлизат на -

ipA=1,20; iрБ=1,15; iрВ=1,00.

2. Ще изчислим общия индекс на търговския оборот по формулата:

I w = = 1470/1045*100% = 140,67%

Търговският оборот нараства с 40,67% (140,67%-100%).

Средно цените на стоките се повишават с 10,24%.

Размерът на допълнителните разходи на купувачите от увеличенията на цените:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 милиона рубли.

В резултат на нарастващите цени купувачите трябваше да похарчат допълнително 136,522 милиона рубли.

4. Общ индекс на физическия обем на търговския оборот:

Физическият обем на търговския оборот нараства с 27.61%.

5. Да определим общата промяна в търговския оборот през втория период спрямо първия период:

w = 1470-1045 = 425 милиона рубли.

поради промени в цените:

W(p) = 1470 - 1333,478 = 136,522 милиона рубли.

поради промени във физическия обем:

w(q) = 1333,478 - 1045 = 288,478 милиона рубли.

Стокооборотът се увеличава с 40,67%. С 10,24% са поскъпнали средно 3 стоки. Физическият обем на търговския оборот нараства с 27.61%.

Като цяло обемът на продажбите се е увеличил с 425 милиона рубли, включително поради нарастващите цени се е увеличил със 136,522 милиона рубли, а поради увеличаване на обема на продажбите - с 288,478 милиона рубли.

ЗАДАЧА5

Следните данни са налични за 10 фабрики в една индустрия.

Номер на завода

Продукция, хиляди бр. (Х)

Въз основа на предоставените данни:

I) за потвърждаване на разпоредбите на логическия анализ за наличието на линейна корелация между факторната характеристика (обем на продукта) и резултантната характеристика (консумация на електроенергия), начертайте първоначалните данни върху графиката на корелационното поле и направете изводи за формата на връзката, посочете нейната формула;

2) определете параметрите на уравнението на връзката и начертайте получената теоретична линия върху графиката на корелационното поле;

3) изчисляване на линейния коефициент на корелация,

4) обяснява значението на показателите, получени в параграфи 2) и 3);

5) използвайки получения модел, направете прогноза за възможното потребление на енергия в завод с производствен обем от 4,5 хиляди единици.

Решение

Данните на признака - обемът на производството (фактор), ще означим с xi; знак - консумация на електроенергия (резултат) чрез yi; точки с координати (x, y) се нанасят върху корелационното поле OXY.

Точките на корелационното поле са разположени по определена права линия. Следователно връзката е линейна, ще търсим регресионно уравнение под формата на права Уx=ax+b. За да го намерим, използваме системата от нормални уравнения:

Нека създадем таблица за изчисление.

Използвайки намерените средни стойности, съставяме система и я решаваме по отношение на параметрите a и b:

И така, получаваме регресионното уравнение за y върху x: = 3,57692 x + 3,19231

Изграждаме регресионна линия върху корелационното поле.

Замествайки стойностите x от колона 2 в уравнението на регресията, получаваме изчислените (колона 7) и ги сравняваме с данните за y, които са отразени в колона 8. Между другото, правилността на изчисленията се потвърждава от съвпадението на средните стойности на y и.

Коефициентлинейна корелацияоценява близостта на връзката между характеристиките x и y и се изчислява с помощта на формулата

Ъгловият коефициент на директна регресия a (при x) характеризира посоката на идентифициранотозависимостипризнаци: за a>0 те са еднакви, за a<0- противоположны. Неговата абсолютна стойност - мярка за промяна в резултантната характеристика, когато факторната характеристика се промени с единица измерване.

Свободният член на директната регресия разкрива посоката, а абсолютната му стойност е количествена мярка за влиянието на всички останали фактори върху резултантната характеристика.

Ако< 0, тогава ресурсът на факторната характеристика на отделен обект се използва с по-малко и когато>0 спо-голяма ефективност от средната за целия набор от обекти.

Нека проведем пост-регресионен анализ.

Коефициентът при x на директната регресия е равен на 3,57692 >0, следователно с увеличаване (намаляване) на производствената продукция потреблението на електроенергия се увеличава (намалява). Увеличение на производството с 1 хил. бр. дава средно увеличение на потреблението на електроенергия с 3,57692 хил. kWh.

2. Свободният член на пряката регресия е равен на 3,19231, следователно влиянието на други фактори увеличава влиянието на продукцията на продукта върху потреблението на електроенергия в абсолютно изражение с 3,19231 хиляди kWh.

3. Корелационният коефициент от 0,8235 разкрива много тясна зависимост на потреблението на електроенергия от продукцията на продукта.

Лесно е да се правят прогнози с помощта на уравнението на регресионния модел. За да направите това, стойностите на x - обемът на производството - се заместват в регресионното уравнение и се прогнозира консумацията на електроенергия. В този случай стойностите на x могат да бъдат взети не само в даден диапазон, но и извън него.

Нека направим прогноза за възможното потребление на енергия в завод с производствен обем от 4,5 хиляди единици.

3.57692*4.5 + 3.19231= 19.288 45 хиляди kWh.

СПИСЪК НА ИЗПОЛЗВАНИТЕ ИЗТОЧНИЦИ

1. Захаренков С.Н. Социално-икономическа статистика: Учебник и практическо ръководство. -Мн.: BSEU, 2002.

2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Обща теория на статистиката. - М.: ИНФРА - М., 2000.

3. Елисеева I.I. Статистика. - М.: Проспект, 2002.

4. Обща теория на статистиката / Под общ. изд. О.Е. Башина, А.А. Спирина. - М.: Финанси и статистика, 2000.

5. Социално-икономическа статистика: Учебно-практически. помощ / Захаренков С.Н. и др. - Мн.: Еревански държавен университет, 2004 г.

6. Социално-икономическа статистика: Учебник. надбавка. / Ед. Нестерович С.Р. - Мн.: BSEU, 2003.

7. Теслюк И. Е., Тарловская В. А., Терлиженко Н. Статистика - Минск, 2000 г.

8. Харченко Л.П. Статистика. - М.: ИНФРА - М, 2002.

9. Харченко Л.П., Долженкова В.Г., Йонин В.Г. Статистика. - М.: ИНФРА - М, 1999.

10. Икономическа статистика / Изд. Ю.Н. Иванова - М., 2000г.

Публикувано на Allbest.ru

...

Подобни документи

    Изчисляване на средната аритметична стойност за интервално разпределение. Определяне на общия индекс на физическия обем на търговския оборот. Анализ на абсолютното изменение на общата себестойност на продукцията поради промени във физическия обем. Изчисляване на коефициента на вариация.

    тест, добавен на 19.07.2010 г

    Същността на търговията на едро, дребно и обществената търговия. Формули за изчисляване на индивидуални и сборни индекси на оборота. Изчисляване на характеристиките на интервален ред на разпределение - средно аритметично, мода и медиана, коефициент на вариация.

    курсова работа, добавена на 05/10/2013

    Изчисляване на планиран и реален обем продажби, процент на изпълнение на плана, абсолютно изменение на оборота. Определяне на абсолютен прираст, средни темпове на прираст и увеличение на паричните доходи. Изчисляване на структурни средни: моди, медиани, квартили.

    тест, добавен на 24.02.2012 г

    Интервални редове на разпределение на банките по обем на печалбата. Намиране на модата и медианата на резултантната серия на интервално разпределение с помощта на графичен метод и чрез изчисления. Изчисляване на характеристиките на интервални разпределителни серии. Изчисляване на средно аритметично.

    тест, добавен на 15.12.2010 г

    Формули за определяне на средните стойности на интервална серия - моди, медиани, дисперсия. Изчисляване на аналитични показатели на динамични серии с помощта на верижни и основни схеми, темпове на растеж и прирасти. Концепцията за консолидиран индекс на разходите, цените, разходите и оборота.

    курсова работа, добавена на 27.02.2011 г

    Понятие и цел, ред и правила за построяване на вариационна серия. Анализ на хомогенността на данните в групи. Индикатори за вариация (флуктуация) на признак. Определяне на средно линейно и квадратично отклонение, коефициент на трептене и вариация.

    тест, добавен на 26.04.2010 г

    Понятието мода и медиана като типични характеристики, редът и критериите за тяхното определяне. Намиране на модата и медианата в дискретни и интервални вариационни серии. Квартили и децили като допълнителни характеристики на вариационен статистически ред.

    тест, добавен на 09/11/2010

    Изграждане на интервална разпределителна серия на базата на групови характеристики. Характеристики на отклонението на честотното разпределение от симетрична форма, изчисляване на показателите за ексцес и асиметрия. Анализ на показателите в баланса или отчета за доходите.

    тест, добавен на 19.10.2014 г

    Преобразуване на емпирични редове в дискретни и интервални. Определяне на средната стойност за дискретна серия чрез нейните свойства. Изчисляване с използване на дискретна серия от индикатори за режим, медиана, вариация (дисперсия, отклонение, коефициент на трептене).

    тест, добавен на 17.04.2011 г

    Изграждане на статистическа серия от разпределение на организациите. Графично определяне на режима и медианните стойности. Близостта на корелацията с помощта на коефициента на детерминация. Определяне на извадковата грешка на средния брой служители.

Ако изследваната случайна променлива е непрекъсната, тогава класирането и групирането на наблюдаваните стойности често не позволява идентифициране на характерните черти на вариацията в нейните стойности. Това се обяснява с факта, че отделните стойности на случайна променлива могат да се различават една от друга толкова малко, колкото желаете, и следователно в съвкупността от наблюдавани данни рядко могат да се появят идентични стойности на дадено количество и честотите на вариантите се различават малко един от друг.

Също така е непрактично да се конструира дискретна серия за дискретна случайна променлива, чийто брой възможни стойности е голям. В такива случаи трябва да строите интервални вариационни серии разпределения.

За да се конструира такава серия, целият интервал на вариация на наблюдаваните стойности на случайна променлива се разделя на серия частични интервали и отчитане на честотата на възникване на стойностите на стойността във всеки частичен интервал.

Интервални вариационни сериинаричаме подреден набор от интервали с различни стойности на случайна променлива със съответните честоти или относителни честоти на стойностите на променливата, попадащи във всяка от тях.

За да изградите интервална серия, трябва:

  1. дефинирам размер частични интервали;
  2. дефинирам ширина интервали;
  3. задайте го за всеки интервал Горна част И долна граница ;
  4. групирайте резултатите от наблюдението.

1 . Въпросът за избора на броя и ширината на груповите интервали трябва да се решава във всеки конкретен случай въз основа на цели изследване, сила на звука проби и степен на вариация характеристика в пробата.

Приблизителен брой интервали к може да се оцени само въз основа на размера на извадката н по един от следните начини:

  • според формулата Стърджъс : k = 1 + 3,32 log n ;
  • използвайки таблица 1.

маса 1

2 . Обикновено се предпочитат пространства с еднаква ширина. За определяне на ширината на интервалите ч изчисли:

  • диапазон на вариация R - примерни стойности: R = x max - x min ,

Където xмакс И xmin - максимални и минимални опции за вземане на проби;

  • ширина на всеки интервал ч определя се по следната формула: h = R/k .

3 . Долен ред първи интервал x h1 е избран така, че опцията за минимална проба xmin падна приблизително в средата на този интервал: x h1 = x min - 0,5 часа .

Междинни интервалиполучен чрез добавяне на дължината на частичния интервал към края на предишния интервал ч :

x hi = x hi-1 +h.

Изграждането на интервална скала въз основа на изчисляването на границите на интервала продължава до стойността x здравей удовлетворява отношението:

x здравей< x max + 0,5·h .

4 . В съответствие с интервалната скала, характерните стойности се групират - за всеки частичен интервал се изчислява сумата от честотите n i опция включена в аз ти интервал. В този случай интервалът включва стойности на случайната променлива, които са по-големи или равни на долната граница и по-малки от горната граница на интервала.

Многоъгълник и хистограма

За по-голяма яснота са изградени различни графики на статистическо разпределение.

Въз основа на данните от дискретна вариационна серия те конструират многоъгълник честоти или относителни честоти.

Честотен полигон х 1 ; n 1 ), (х 2 ; n 2 ), ..., (x k ; n k ). За да се изгради честотен полигон, опциите се нанасят върху абсцисната ос. x i , а по ординатата - съответните честоти n i . Точки ( x i ; n i ) се свързват с прави отсечки и се получава честотен полигон (фиг. 1).

Многоъгълник на относителните честотинаречена начупена линия, чиито сегменти свързват точки ( х 1 ; W 1 ), (х 2 ; W 2 ), ..., (x k ; седмица ). За да се изгради полигон от относителни честоти, опциите се нанасят върху абсцисната ос x i , а по ординатата - съответните относителни честоти W i . Точки ( x i ; W i ) се свързват с прави отсечки и се получава многоъгълник от относителни честоти.

Кога непрекъснат знак препоръчително е да се изгради хистограма .

Честотна хистограманаречена стъпаловидна фигура, състояща се от правоъгълници, чиито основи са частични интервали на дължина ч , а височините са равни на отношението NIH (честотна плътност).

За да се изгради честотна хистограма, върху абсцисната ос се поставят частични интервали, а над тях на разстояние се чертаят сегменти, успоредни на абсцисната ос. NIH .

При конструирането на серия от интервално разпределение се решават три въпроса:

  • 1. Колко интервала трябва да взема?
  • 2. Каква е дължината на интервалите?
  • 3. Каква е процедурата за включване на съвкупност от единици в границите на интервалите?
  • 1. Брой интервалиможе да се определи от Формула на Стърджис:

2. Дължина на интервала или интервална стъпка, обикновено се определя по формулата

Където Р-диапазон на вариация.

3. Редът на включване на единиците на съвкупността в границите на интервала

може да бъде различно, но при изграждането на интервален ред разпределението трябва да бъде строго определено.

Например това: [), в което единиците на съвкупността са включени в долните граници, но не са включени в горните граници, а се прехвърлят към следващия интервал. Изключение от това правило е последният интервал, чиято горна граница включва последното число от класираната серия.

Границите на интервала са:

  • затворен - с две екстремни стойности на атрибута;
  • open - с една крайна стойност на атрибута (предитакъв и такъв номер или надтакъв и такъв номер).

За да усвоим теоретичния материал, въвеждаме обща информацияза решения задача от край до край.

Има условни данни за средния брой мениджъри по продажбите, количеството продадени от тях подобни стоки, индивидуалната пазарна цена за този продукт, както и обема на продажбите на 30 компании в един от регионите на Руската федерация през първото тримесечие на отчетната година (Таблица 2.1).

Таблица 2.1

Първоначална информация за междусекторна задача

Номер

мениджъри,

Цена, хиляди рубли

Обем на продажбите, милиони рубли.

Номер

мениджъри,

Количество продадени стоки, бр.

Цена, хиляди рубли

Обем на продажбите, милиони рубли.

Въз основа на първоначалната информация, както и на допълнителната информация, ще съставим индивидуални задачи. След това ще представим методиката за решаването им и самите решения.

Междусекторна задача. Задача 2.1

Използвайки изходните данни от табл. Изисква се 2.1изградете дискретна серия от разпределение на фирмите по количество продадени стоки (Таблица 2.2).

Решение:

Таблица 2.2

Дискретни серии от разпределение на фирмите по количество продадени стоки в един от регионите на Руската федерация през първото тримесечие на отчетната година

Междусекторна задача. Задача 2.2

изисква сеизградете класирана серия от 30 фирми според средния брой мениджъри.

Решение:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Междусекторна задача. Задача 2.3

Използвайки изходните данни от табл. 2.1, задължително:

  • 1. Конструирайте интервална серия от разпределение на фирмите по брой мениджъри.
  • 2. Изчислете честотите на сериите на разпределение на фирмите.
  • 3. Направете изводи.

Решение:

Нека изчислим по формулата на Стърджис (2.5) брой интервали:

Така вземаме 6 интервала (групи).

Дължина на интервала, или интервална стъпка, изчислете по формулата

Забележка.Редът за включване на единиците на съвкупността в границите на интервала е следният: I), при който единиците на популацията се включват в долните граници, но не се включват в горните граници, а се прехвърлят в следващия интервал. Изключение от това правило е последният интервал I ], чиято горна граница включва последния номер на класираната серия.

Изграждаме интервална серия (Таблица 2.3).

Интервални серии от разпределение на фирмите и средния брой мениджъри в един от регионите на Руската федерация през първото тримесечие на отчетната година

Заключение.Най-голямата група фирми е групата със среден брой мениджъри 25-30 души, която включва 8 фирми (27%); Най-малката група със среден брой мениджъри 40-45 души включва само една компания (3%).

Използвайки изходните данни от табл. 2.1, както и интервална серия от разпределение на фирмите по брой мениджъри (Таблица 2.3), изисква сеизградете аналитично групиране на връзката между броя на мениджърите и обема на продажбите на фирмите и въз основа на това направете заключение за наличието (или липсата) на връзка между тези характеристики.

Решение:

Аналитичното групиране се основава на факторни характеристики. В нашата задача факторната характеристика (x) е броят на мениджърите, а резултантната характеристика (y) е обемът на продажбите (Таблица 2.4).

Да строим сега аналитично групиране(Таблица 2.5).

Заключение.Въз основа на данните от изграденото аналитично групиране можем да кажем, че с увеличаване на броя на мениджърите по продажби се увеличава и средният обем на продажбите на компанията в групата, което показва наличието на пряка връзка между тези характеристики.

Таблица 2.4

Помощна таблица за построяване на аналитична групировка

Брой мениджъри, хора,

Фирмен номер

Обем на продажбите, милиони рубли, г

" = 59 f = 9,97

I-™ 4 -Ю.22

74 '25 1PY1

U4 = 7 = 10,61

при = ’ =10,31 30

Таблица 2.5

Зависимостта на обема на продажбите от броя на мениджърите на компанията в един от регионите на Руската федерация през първото тримесечие на отчетната година

КОНТРОЛНИ ВЪПРОСИ
  • 1. Каква е същността на статистическото наблюдение?
  • 2. Назовете етапите на статистическото наблюдение.
  • 3. Какви са организационните форми на статистическото наблюдение?
  • 4. Назовете видовете статистическо наблюдение.
  • 5. Какво е статистическо резюме?
  • 6. Назовете видовете статистически отчети.
  • 7. Какво е статистическо групиране?
  • 8. Назовете видовете статистически групировки.
  • 9. Какво е серия за разпространение?
  • 10. Наименувайте структурните елементи на разпределителния ред.
  • 11. Каква е процедурата за изграждане на серия за разпределение?

Те са представени под формата на разпределителни серии и са представени във формата.

Разпределителната серия е един от видовете групировки.

Диапазон на разпространение— представлява подредено разпределение на единиците от изследваната популация в групи според определена различна характеристика.

В зависимост от характеристиката, залегнала в основата на формирането на сериите на разпространение, те се разграничават атрибутивни и вариационниразпределителни редове:

  • Атрибутивен- се наричат ​​серии на разпределение, изградени по качествени характеристики.
  • Сериите на разпределение, изградени във възходящ или низходящ ред на стойностите на количествена характеристика, се наричат вариационен.
Вариационната серия на разпределението се състои от две колони:

Първата колона предоставя количествени стойности на вариращата характеристика, които се наричат настроикии са обозначени. Дискретна опция - изразява се като цяло число. Опцията за интервал варира от и до. В зависимост от вида на опциите можете да конструирате дискретна или интервална вариационна серия.
Втората колона съдържа номер на конкретна опция, изразено чрез честоти или честоти:

Честоти- това са абсолютни числа, които показват колко пъти общо се среща дадена стойност на признак, които означават . Сумата от всички честоти трябва да бъде равна на броя на единиците в цялата популация.

Честоти() са честоти, изразени като процент от общата сума. Сумата от всички честоти, изразени като проценти, трябва да бъде равна на 100% в части от единица.

Графично представяне на сериите на разпределение

Сериите за разпространение са визуално представени с помощта на графични изображения.

Разпределителните серии са изобразени като:
  • Многоъгълник
  • Хистограми
  • Кумулира
  • Ogives

Многоъгълник

При конструирането на многоъгълник стойностите на вариращата характеристика се нанасят върху хоризонталната ос (ос x), а честотите или честотите се нанасят върху вертикалната ос (ос y).

Многоъгълникът на фиг. 6.1 се основава на данни от микропреброяването на населението на Русия през 1994 г.

6.1. Разпределение на размера на домакинството

Състояние: Представени са данни за разпределението на 25 служители на едно от предприятията по тарифни категории:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача: Конструирайте серия от дискретни вариации и я изобразете графично като полигон на разпределение.
Решение:
В този пример опциите са степента на заплащане на служителя. За определяне на честотите е необходимо да се изчисли броят на служителите със съответната тарифна категория.

Полигонът се използва за дискретни вариационни серии.

За да конструираме полигон на разпределение (Фигура 1), ние начертаваме количествените стойности на вариращата характеристика - варианти - по абсцисната (X) ос и честотите или честотите по ординатната ос.

Ако стойностите на дадена характеристика са изразени под формата на интервали, тогава такава серия се нарича интервал.
Интервални серииразпределенията се изобразяват графично под формата на хистограма, кумулат или огива.

Статистическа таблица

Състояние: Предоставени са данни за размера на депозитите на 20 лица в една банка (хиляди рубли) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача: Конструирайте интервална вариационна серия с равни интервали.
Решение:

  1. Първоначалната популация се състои от 20 единици (N = 20).
  2. С помощта на формулата на Sturgess определяме необходимия брой използвани групи: n=1+3,322*lg20=5
  3. Нека изчислим стойността на равния интервал: i=(152 - 2) /5 = 30 хиляди рубли
  4. Нека разделим първоначалната популация на 5 групи с интервал от 30 хиляди рубли.
  5. Представяме резултатите от групирането в таблицата:

При такъв запис на непрекъсната характеристика, когато една и съща стойност се среща два пъти (като горна граница на един интервал и долна граница на друг интервал), тогава тази стойност принадлежи към групата, където тази стойност действа като горна граница.

стълбовидна диаграма

За да се изгради хистограма, стойностите на границите на интервалите са посочени по абсцисната ос и въз основа на тях са изградени правоъгълници, чиято височина е пропорционална на честотите (или честотите).

На фиг. 6.2. показва хистограма на разпределението на руското население през 1997 г. по възрастови групи.

Ориз. 6.2. Разпределение на руското население по възрастови групи

Състояние: Дадено е разпределението на 30 служители на фирмата по месечна заплата

Задача: Покажете серията от интервални вариации графично под формата на хистограма и кумулирайте.
Решение:

  1. Неизвестната граница на отворения (първи) интервал се определя от стойността на втория интервал: 7000 - 5000 = 2000 рубли. Със същата стойност намираме долната граница на първия интервал: 5000 - 2000 = 3000 рубли.
  2. За да изградим хистограма в правоъгълна координатна система, начертаваме по оста на абсцисата сегментите, чиито стойности съответстват на интервалите от варикозната серия.
    Тези сегменти служат за долна основа, а съответната честота (честота) служи за височина на образуваните правоъгълници.
  3. Нека изградим хистограма:

За да се конструират кумулати, е необходимо да се изчислят натрупаните честоти (честоти). Те се определят чрез последователно сумиране на честотите (честотите) на предишни интервали и се обозначават с S. Натрупаните честоти показват колко единици от съвкупността имат характерна стойност не по-голяма от разглежданата.

Кумулира

Разпределението на характеристика в вариационна серия върху натрупаните честоти (честоти) се изобразява с помощта на кумулация.

Кумулираили кумулативната крива, за разлика от полигона, се изгражда от натрупани честоти или честоти. В този случай стойностите на характеристиката се поставят на абсцисната ос, а натрупаните честоти или честоти се поставят на ординатната ос (фиг. 6.3).

Ориз. 6.3. Кумулира разпределението на размера на домакинството

4. Нека изчислим натрупаните честоти:
Кумулативната честота на първия интервал се изчислява, както следва: 0 + 4 = 4, за втория: 4 + 12 = 16; за третата: 4 + 12 + 8 = 24 и т.н.

При конструиране на кумулация натрупаната честота (честота) на съответния интервал се присвоява на горната му граница:

Огива

Огивасе конструира подобно на кумулата с единствената разлика, че натрупаните честоти са поставени на абсцисната ос, а характерните стойности са поставени на ординатната ос.

Тип кумулат е крива на концентрация или графика на Лоренц. За да се изгради крива на концентрация, върху двете оси на правоъгълната координатна система се нанася скална скала в проценти от 0 до 100. В същото време на абсцисната ос се посочват натрупаните честоти, а натрупаните стойности на дяла (в проценти) по обем на характеристиката са посочени на ординатната ос.

Равномерното разпределение на характеристиката съответства на диагонала на квадрата върху графиката (фиг. 6.4). При неравномерно разпределение графиката представлява вдлъбната крива в зависимост от нивото на концентрация на признака.

6.4. Концентрационна крива
КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи