Построение ранжированных рядов и графиков. Анализ связи ранжированных рядов

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации

Понятие сводки, группировки, классификации

Сводка – систематизация и подведение итогов: метеосводка, сводка с полей. Сводка не позволяет детально проанализировать информацию. Любая сводка должна опираться на группировку данных, т.е. сначала группировка, а потом сводка данных.

Группировка – разделение совокупностей на ряд групп по наиболее существенным признакам.

Различают качественную и количественную группировку. Качественная – атрибутивная, количественная – вариационная. В свою очередь вариационная делится на структурную и аналитическую. Структурная группировка предполагает расчет удельного веса каждой группы. Пример: на предприятии 80% - рабочие, 20% - служащие, из них 5% - руководители, 3% - служащие,12% - специалисты. Цель аналитической группировки – выявить взаимосвязь между признаками: стажем работы и средним заработком, стажем и выработкой и другими.

При проведении группировки необходимо:

Проведение всестороннего анализа природы изучаемого явления;

Выявление группировочного признака (одного или нескольких);

Установить границы групп таким образом, чтобы группы существенно отличались друг от друга, и в каждой группе объединялись однородные элементы.

По степени сложности группировки могут быть простые и комбинационные (по признакам).

По исходной информации различают первичную и вторичную группировки, первичная осуществляется на основе исходных данных наблюдения, вторичная использует данные первичной группировки.

Количество групп определяется по формуле Стерджесса:

где n - количество групп, N – генеральная совокупность.

Если используются равные интервалы, то величина интервала равна .

Интервалы могут быть равные и неравные. Последние, в свою очередь, делятся на изменяющиеся по закону арифметической или геометрической прогрессии. Первый и последний интервалы могут быть открытые или закрытые. Закрытые интервалы включают или не включают границы интервала.

Если интервалы закрытые, и ничего не сказано о включении верхних границ, то считаем, что верхние границы включены.

Если интервалы открытые, то ориентируемся по последнему интервалу.

Признак в этих интервалах может измеряться дискретно и непрерывно (т.е. дробиться). При непрерывном признаке границы смыкаются 1- 10, 10 - 20, 20 – 30; если признак изменяется дискретно, то можно использовать следующую запись: 1 – 10, 11 – 20, 21 – 30.

Если интервалы открытые, то величина последнего интервала приравнивается к предыдущему, а первого - ко второму.

Классификация – группировка по качественному признаку. Она относительно устойчива, стандартизирована и утверждается органами государственной статистики.


3.2. Ряды распределения: виды и основные характеристики

Под рядом распределения понимается ряд данных, характеризующих какое-либо социально-экономическое явление по одному признаку. Это простейший вид группировки по двум признакам.

Ряды распределения делятся на качественные и количественные, на ранжированные и не ранжированные, на сгруппированные и не сгруппированные, с дискретным и непрерывным распределением признака.

Примером не сгруппированного, не ранжированного ряда по заработной плате является ведомость заработной платы. В то же время, список работников может быть ранжированный по алфавиту или по табельным номерам. Примером ранжированного ряда является список команд, рейтинг теннисистов.

Ранжированный ряд распределения - ряд данных, расположенных в порядке убывания или возрастания признака.

Для сгруппированных ранжированных рядов выделяют следующие характеристики: варианту, частоту или частость, кумуляту и плотность распределения.

Варианта () – среднее интервальное значение признака. Т.к. при создании группировки должен выполняться принцип равномерного распределения признака в каждом интервале, то варианту можно рассчитывать как полусумму границ интервалов.

Частота () показывает сколько раз встречается данное значение признака. Относительное выражение частоты представляет собой частость (.) , т.е. долю, удельный вес от суммы частот.

Кумулята () – накопленная частота или частость, расчет нарастающим итогом. Кумулятивно подсчитываются объем, затраты, доходы, т.е. результаты деятельности.

Таблица 1

Группировка действующих кредитных организаций
по величине зарегистрированного уставного капитала

в 2008 году в РФ

Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным . Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.

Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд .

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).

Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается

где k - число вариантов значений признака

Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.

Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:

При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:

где R = xmax - xmin ; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.

Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда.

Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.

Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин.

То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле

где n - число единиц в совокупности.

Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений.

Численное значение медианы

где xМе - нижняя граница медианного интервала; i - величина интервала; S-1 - накопленная частота интервала, которая предшествует медианному; f - частота медианного интервала.

Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Чтобы найти конкретное значение моды, необходимо использовать формулу

где xМо - нижняя граница модального интервала; iМо - величина модального интервала; fМо - частота модального интервала; fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным.

Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.

Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда. При попытке изображения этих данных графически мы получим некоторую плавную кривую линию, которая для полигона частот будет являться некоторым пределом. Эту линию называют кривой распределения.

Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, которое функционально связано с изменением вариант. Кривая распределения отражает закономерность изменения частот при отсутствии случайных факторов. Графическое изображение облегчает анализ рядов распределения.

Известно достаточно много форм кривых распределения, по которым может выравниваться вариационный ряд, но в практике статистических исследований наиболее часто используются такие формы, как нормальное распределение и распределение Пуассона.

Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения . Его кривая выражается уравнением

где у - ордината кривой нормального распределения; - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение.

Если нужно получить теоретические частоты f" при выравнивании вариационного ряда по кривой нормального распределения, то можно воспользоваться формулой

где - сумма всех эмпирических частот вариационного ряда; h - величина интервала в группах; - cреднее квадратическое отклонение; - нормированное отклонение вариантов от средней арифметической; все остальные величины легко вычисляются по специальным таблицам.

При помощи этой формулы мы получаем теоретическое (вероятностное) распределение , заменяя им эмпирическое (фактическое) распределение , по характеру они не должны отличаться друг от друга.

Тем не менее в ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона.

Кривую Пуассона можно выразить отношением

где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда.

При выравнивании эмпирических данных теоретические частоты можно определить по формуле

где f" - теоретические частоты; N - общее число единиц ряда.

Сравнивая полученные величины теоретических частот f" c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.

Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.

Наиболее распространенным является критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между f" и f к теоретическим частотам:

Вычисленное значение критерия необходимо сравнить с табличным (критическим) значением . Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты < 5, то интервалы объединяют для условия > 5.

Если , то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.

В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом, который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения

где m - число групп; k = (m - 3) - число степеней свободы при исчислении частот нормального распределения.

Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.

Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле

где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; - сумма эмпирических частот.

По таблицам значений вероятностей -критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.

Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).

Под группировкой в статистике понимают расчленение статистической совокупности на группы, однородные в каком-либо существенном отношении, характеристику выделенных групп системы показателей в целях выделения типов явлений, изучение их структуры и взаимосвязи. В процессе сводки первичного материала явления разделяются на группы по различным варьирующим признакам.

Варьирующий признак - это признак, принимающий различные значения у отдельных единиц совокупности.

Задачи, стоящие перед группировкой:

1. Выделение в составе массового явления тех его частей, которые однородны по качеству и условиям развития, и в которых действуют одни и те же закономерные влияния факторов;

2. Изучение и характеристика структуры и структурных сдвигов в исследуемых совокупностях;

3. Влияние взаимосвязи между отдельными признаками изучаемого явления.

Главным вопросом метода группировок является выбор группировочного признака, от правильного выбора которого зависят результаты группировки и всей работы в целом.

После отбора группировочного признака важно разделить единицы совокупности на группы.

Выделенные группы должны быть качественно однородными, а также иметь достаточно большую численность единиц, что позволит проявить типичные черты, свойственные массовым явлениям. Поэтому большое внимание уделяется определения числа групп и их границ. При решения этого вопроса учитывают вид группировки, характер группипровочного признака и задачи исследования.

Сгруппируем хозяйства. За группировочный признак возьмем удой от одной коровы, в кг. По уровню молочной продуктивности наблюдается большое различие в хозяйствах данной зоны. Этот признак колеблется в

С помощью метода статистической группировки различным различия между хозяйствами по уровню молочной продуктивности коров.

Первым этапом работы является построение ранжированного ряда. В ранжированном ряду все величины расположены по нарастанию или убыванию группировочного признака.

Ранжированный ряд показывает интенсивность изменения величины пределах от 1364 до 6270 кг. группировочного признака, по нему можно установить резкие переходы и выделить очень сильно отличающиеся по величине признака единиц.

Для составления ранжированного ряда используем данные молочной продуктивности коров в хозяйствах Ачинской зоны за 2003 г.

Результаты оформим в таблице 2.1.

Таблица 2.1.

Название хозяйства

Удой от 1 коровы в год, кг

ЗАО«Белоозерское»

ЗАО « Шарыповское»

САО «Ивановское»

ЗАО «Оракское»

АО «Сахаптинское»

СЗАО «Анашенское»

ЗАО «Энергетик»

СЗАОТ «Бараитское»

СЗАОТ «Игрышенское»

СХПК «Белоярский»

АОЗТ «Павловское»

АОЗТ «Ададымское»

АО «Краснополянское»

АОЗТ «Дороховское»

АО «Гляденское»

СХАОЗТ «Легостаевское»

ЗАО «Алтайское»

ЗАО «Светлолобовское»

АОЗТ «Подсосенское»

АОЗТ «Крутоярское»

ТОО п/з « Ачинский»

ЗАО «Авангард»

ОАО «Малиновский»

САОЗТ «Навоселовское»

АОЗТ «Назаровское»

Для большей наглядности изобразим ранжированный ряд графически, для чего построим огниву Галь тона.

Для этого на оси абсцисс расположим в порядке возрастания группировочного признака, а по оси - величину молочной продуктивности коров, соответствующий хозяйству, рис.2.1.

Ранжированный ряд хозяйств по уровню молочной продуктивности коров.

Проанализируем данные ранжированного ряда и его графика - оценим характер и интенсивность различий между хозяйствами и попытаемся выделить существенно отличные группы хозяйств. Между хозяйствами имеются существенные различия в уровне молочной продуктивности коров: размах колебаний составляет 6270 - 1364 = 4906 кг от 1 коровы, а уровень производства молока в хозяйстве №25 выше, чем в №1 в 4,6 раза (6720/1364).

Возрастания продуктивности молока от хозяйства к хозяйству происходит в основном постепенно, плавно, без больших скачков, но у последнего хозяйства удой от 1 коровы существенно отличается от остальной массы хозяйств. Но это хозяйство нельзя выделить в отдельную группу, а так же поскольку между остальными хозяйствами различия небольшие, без скачков и нет других данных, указывающих границы перехода от 1 группы к другой, то выделить типичные группы на снование анализа ранжированного ряда в данном случае нельзя. Поэтому далее необходимо построить интервальный ряд распределения хозяйств.

Интервальный вариационный ряд дает возможность получить представление о количестве и характере групп. В начале решим вопрос о числе групп, на которые следует распределить совокупность хозяйств. Приближенное число n можно определить по формуле (2.1):

n = 1+3.322LgN, (2.1)

где n - число групп, N - совокупность единиц.

Эта зависимость может служить ориентированной при определении числа групп в этом случае, если распределение единиц совокупности по данному признаку приближаются к нормальному и применяются равные интервалы в группах.

n = 1+3.322Lg25 = 1+3.322*1.5 ~ 6 групп.

i = (X max - X min) / n , где (2.2)

X max - максимальное значение признака в изучаемом ранжированном ряду,

X min - минимальное значение признака в изучаемом ранжированном ряду,

n - число групп.

I = (6270 - 1364)/6 = 818

Теперь построим ряд распределения хозяйств при этой величине интервала, значение X min = 818 кг, тогда верхняя граница первой группы составит: Xmin+i = 2182 кг. Эта граница одновременно является границей второй группы. Границы остальных групп определяются аналогично. Полученные данные Представлены в таблице 2.2.

Таблица 2.2

Интервальный ряд распределения совхозов (таблица 2.2.) показывает, что в совокупности преобладают хозяйства с удоем от одной коровы (11 хозяйств) от 1364 до 2182 кг. Группы хозяйств с высокой продуктивностью малочисленны, поэтому следует их объединить, то есть провести вторичную группировку, так как в четвертой группе нет ни одного хозяйства, а в пятой одно, но в каждой группе должно быть не менее трех хозяйств.


Интервальный ряд распределения хозяйств по уровню молочной продуктивности коров.

Таблица 2.3

Вторичная группировка хозяйств по уровню молочной продуктивности коров.

Сравнение в пределах каждой группы числа хозяйств можно сказать, что число хозяйств с низким уровнем продуктивности больше, чем с высоким в значительной мере.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http :// www . allbest . ru /

Задание №1

На основании данных статистического наблюдения, приведенных в таблице построить ранжированный, интервальный и кумулятивный ряды распределения сельскохозяйственных предприятий по факторному признаку, изобразить их графически.

Провести сводку данных. Посредством метода группировок определите зависимость результативного признака в сельскохозяйственных предприятиях от факторного. Построить таблицы и графики зависимости. Вывод.

группировка ряд распределение факторный

Качество почвы,баллы (х)

(у)

Решение:

Построение ранжированного ряда распределения предполагает расположение всех вариантов ряда в порядке возрастания изучаемого признака (качества почвы). Проведение сортировки производилось в программе ТП Excel с использованием функции "Сортировка".

Качество почвы

Урожайность овощей открытого грунта

Графическое изображение ранжированного ряда распределения

Линия на рис.1 носит название огива Гальтона. Данная огива имеет тенденцию плавного роста с небольшими скачками в некоторых точках. Для преобразования ранжированного ряда в интервальный лучше выполнить разбивку на группы вручную.

Построение интервального ряда распределения предприятий по изучаемому признаку предполагает определение числа групп (интервалов).

Для расчета числа групп воспользуемся формулой:

n=2 , где N-общее число единиц изучаемой совокупности.

n=2 Ig30 = 2,95424251?3.

Величина равного интервала вычисляется по формуле:

i = = = 16,33333

Кумулятивный ряд - это ряд в котором подсчитываются накопленные частоты. Он показывает, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и вычисляется путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

Интервальный и кумулятивный ряды

частота - число предприятий в группе;

Удельный вес предприятий в группе - находится по формуле:

(число предприятий в группе*100%)/ m , где m-число экспериментальных данных;

Накопленная частота - находится по формуле: число предприятий в предедущей группе +частота данной группы.

Гистограмма частот

Кумулята распределения качества почвы

Сводные показатели

№ группы

Число предприятий в группе

Урожайность овощей открытого грунта (всего по группам)

Качество почвы (всего по группам)

II 61,33333-77,33333

III 77,33333-94,1

Средние характеристики групп

№ Группы

Урожайность овощей открытого грунта

Качество почвы

II 61,33333-77,33333

III 77,33333-94,1

В среднем по совокупности

где, столбец "урожайность овощей" находится по формуле: У У i группе ) / число предприятий в группе ;

столбец "Качество почвы" находится по формуле: У Х i группе)/число предприятий в группе.

Зависимость урожайности овощей открытого грунта от качества почвы.

В рассматриваемом примере можно сделать вывод: с ростом качества почвы увеличивается урожайность овощей открытого грунта, следовательно можно предположить наличие прямой связи между рассматриваемыми параметрами.

Размещено на Allbest.ru

Подобные документы

    Аналитическая группировка по факторному признаку. Построение вариационного частотного и кумулятивного рядов распределения на основе равно интервальной структурной группировки результативного признака – дивидендов, начисленных по результатам деятельности.

    контрольная работа , добавлен 07.05.2009

    Основные показатели численности населения и его размещения по Калужской области. Построение ранжированного и интервального рядов распределения по одному группировочному факторному признаку. Анализ типических групп по показателям в среднем по совокупности.

    курсовая работа , добавлен 11.10.2010

    Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.

    курсовая работа , добавлен 22.11.2013

    Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.

    курсовая работа , добавлен 24.09.2014

    Оценка совокупности на предмет её однородности. Построение ранжированного и интервального рядов распределения. Анализ рядов динамики методами укрупнения интервалов и скользящей средней, аналитическое выравнивание по уравнению прямой и параболы.

    курсовая работа , добавлен 10.09.2014

    Расчет среднего балла успеваемости по данным результатов сессии, определение показателя вариаций уровня знаний и структуры численности студентов по успеваемости. Построение интервального ряда распределения предприятий. Оценка коэффициентов корреляции.

    контрольная работа , добавлен 21.08.2009

    Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".

    дипломная работа , добавлен 14.02.2016

    Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.

    контрольная работа , добавлен 17.03.2015

    Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.

    курсовая работа , добавлен 20.05.2010

    Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.

КАТЕГОРИИ

ПОПУЛЯРНЫЕ СТАТЬИ

© 2024 «kingad.ru» — УЗИ исследование органов человека