Какво е регресионна функция. Регресионният анализ е статистически метод за изследване на зависимостта на случайна променлива от променливи

Регресионният анализ е метод за установяване на аналитичен израз за стохастичната зависимост между изследваните характеристики. Регресионното уравнение показва как се променя средната стойност припри промяна на някоя от х аз , и има формата:

Където y -зависима променлива (винаги е една и съща);

х аз - независими променливи (фактори) (може да има няколко от тях).

Ако има само една независима променлива, това е прост регресионен анализ. Ако има няколко от тях ( П 2), тогава такъв анализ се нарича многофакторен.

Регресионният анализ решава два основни проблема:

    конструиране на регресионно уравнение, т.е. намиране на вида на връзката между резултатния показател и независимите фактори х 1 , х 2 , …, х н .

    оценка на значимостта на полученото уравнение, т.е. определяне доколко избраните факторни характеристики обясняват вариацията на черта u.

Регресионният анализ се използва главно за планиране, както и за разработване на нормативна база.

За разлика от корелационния анализ, който отговаря само на въпроса дали има връзка между анализираните характеристики, регресионният анализ дава и своя формализиран израз. Освен това, ако корелационният анализ изучава някаква връзка между факторите, тогава регресионният анализ изучава едностранната зависимост, т.е. връзка, показваща как промяната във факторните характеристики засяга ефективната характеристика.

Регресионният анализ е един от най-развитите методи на математическата статистика. Строго погледнато, за прилагане на регресионен анализ е необходимо да се изпълнят редица специални изисквания (по-специално, хл 2 ,...,х н ;гтрябва да бъдат независими, нормално разпределени случайни променливи с постоянни дисперсии). В реалния живот стриктното спазване на изискванията за регресионен и корелационен анализ е много рядко, но и двата метода са много разпространени в икономическите изследвания. Зависимостите в икономиката могат да бъдат не само преки, но и обратни и нелинейни. Регресионен модел може да бъде изграден при наличието на някаква зависимост, но при многовариантния анализ се използват само линейни модели на формата:

Регресионното уравнение се конструира, като правило, с помощта на метода на най-малките квадрати, чиято същност е да се минимизира сумата от квадратните отклонения на действителните стойности на получената характеристика от нейните изчислени стойности, т.е.:

Където T -брой наблюдения;

й =a+b 1 х 1 й + б 2 х 2 й + ... + b н х н й - изчислена стойност на фактора резултат.

Препоръчва се коефициентите на регресия да се определят с помощта на аналитични пакети за персонален компютър или специален финансов калкулатор. В най-простия случай коефициентите на регресия на еднофакторно уравнение на линейна регресия от формата y = a + bxможе да се намери с помощта на формулите:

Клъстерен анализ

Клъстерният анализ е един от методите на многомерния анализ, предназначен за групиране (групиране) на популация, чиито елементи се характеризират с много характеристики. Стойностите на всяка характеристика служат като координати на всяка единица от изследваната популация в многомерното пространство на характеристиките. Всяко наблюдение, характеризиращо се със стойностите на няколко индикатора, може да бъде представено като точка в пространството на тези индикатори, чиито стойности се считат за координати в многомерно пространство. Разстояние между точките РИ рс ккоординатите се определят като:

Основният критерий за клъстериране е, че разликите между клъстерите трябва да са по-значими, отколкото между наблюденията, приписани на един и същ клъстер, т.е. в многомерно пространство трябва да се спазва следното неравенство:

Където r 1, 2 - разстояние между клъстери 1 и 2.

Подобно на процедурите за регресионен анализ, процедурата за клъстериране е доста трудоемка, препоръчително е да се извърши на компютър.

В творбите си от 1908г. Той го описа на примера на работата на агент, продаващ недвижими имоти. В своите записи специалистът по продажбите на къщи следи широк набор от входни данни за всяка конкретна сграда. Въз основа на резултатите от търга беше определено кой фактор е оказал най-голямо влияние върху цената на сделката.

Анализът на голям брой транзакции даде интересни резултати. Крайната цена беше повлияна от много фактори, понякога водещи до парадоксални заключения и дори до очевидни „отклонения“, когато къща с висок първоначален потенциал беше продадена на намалена цена.

Вторият пример за прилагане на такъв анализ е работата, на която е възложено определянето на възнагражденията на служителите. Сложността на задачата се състоеше във факта, че изискваше не разпределяне на фиксирана сума на всички, а стриктното й съответствие с конкретната извършена работа. Появата на много задачи с практически сходни решения изискваше по-детайлното им изследване на математическо ниво.

Значително място беше отделено на раздела „регресионен анализ“, който комбинира практически методи, използвани за изследване на зависимости, попадащи в понятието регресия. Тези връзки се наблюдават между данните, получени от статистически изследвания.

Сред множеството задачи за решаване, основните цели са три: определяне на общо регресионно уравнение; конструиране на оценки на параметри, които са неизвестни, които са част от регресионното уравнение; тестване на хипотези за статистическа регресия. В хода на изучаване на връзката, която възниква между двойка величини, получени в резултат на експериментални наблюдения и съставляващи серия (набор) от типа (x1, y1), ..., (xn, yn), те разчитат на разпоредбите на теорията на регресията и приемаме, че за една величина Y има определено разпределение на вероятностите, докато другата X остава фиксирана.

Резултатът Y зависи от стойността на променливата X; тази зависимост може да се определи от различни модели, докато точността на получените резултати се влияе от естеството на наблюденията и целта на анализа. Експерименталният модел се основава на определени предположения, които са опростени, но правдоподобни. Основното условие е параметърът X да е контролирана величина. Стойностите му се задават преди началото на експеримента.

Ако по време на експеримент се използва двойка неконтролирани променливи XY, тогава регресионният анализ се извършва по същия начин, но се използват методи за интерпретация на резултатите, по време на които се изследва връзката на изследваните случайни променливи. не са абстрактна тема. Те намират приложение в живота в различни сфери на човешката дейност.

В научната литература терминът линеен регресионен анализ се използва широко за дефиниране на горния метод. За променлива X се използва терминът регресор или предиктор, а зависимите Y променливи се наричат ​​още критериални променливи. Тази терминология отразява само математическата зависимост на променливите, но не и причинно-следствената връзка.

Регресионният анализ е най-разпространеният метод, използван за обработка на резултатите от голямо разнообразие от наблюдения. Чрез този метод се изучават физически и биологични зависимости, той се прилага както в икономиката, така и в технологиите. Много други области използват модели за регресионен анализ. Анализът на дисперсията и многовариантният статистически анализ работят в тясно сътрудничество с този метод на изследване.

Регресионният и корелационният анализ са статистически методи за изследване. Това са най-често срещаните начини за показване на зависимостта на параметър от една или повече независими променливи.

По-долу, използвайки конкретни практически примери, ще разгледаме тези два много популярни сред икономистите анализа. Ще дадем и пример за получаване на резултати при комбинирането им.

Регресионен анализ в Excel

Показва влиянието на някои стойности (независими, независими) върху зависимата променлива. Например, как броят на икономически активното население зависи от броя на предприятията, заплатите и други параметри. Или: как влияят на нивото на БВП чуждите инвестиции, цените на енергията и т.н.

Резултатът от анализа ви позволява да подчертаете приоритетите. И въз основа на основните фактори прогнозирайте, планирайте развитието на приоритетните области и вземете управленски решения.

Регресията се случва:

  • линеен (y = a + bx);
  • параболичен (y = a + bx + cx 2);
  • експоненциален (y = a * exp(bx));
  • мощност (y = a*x^b);
  • хиперболичен (y = b/x + a);
  • логаритмичен (y = b * 1n(x) + a);
  • експоненциален (y = a * b^x).

Нека да разгледаме пример за изграждане на регресионен модел в Excel и интерпретиране на резултатите. Да вземем линейния тип регресия.

Задача. В 6 предприятия са анализирани средната месечна заплата и броят на напусналите служители. Необходимо е да се определи зависимостта на броя на напусналите служители от средната работна заплата.

Моделът на линейната регресия изглежда така:

Y = a 0 + a 1 x 1 +…+a k x k.

Където a са регресионни коефициенти, x са влияещи променливи, k е броят на факторите.

В нашия пример Y е индикаторът за напускане на служители. Влияещият фактор е работната заплата (x).

Excel има вградени функции, които могат да ви помогнат да изчислите параметрите на линеен регресионен модел. Но добавката „Пакет за анализ“ ще направи това по-бързо.

Активираме мощен аналитичен инструмент:

След като бъде активирана, добавката ще бъде налична в раздела Данни.

Сега нека направим самия регресионен анализ.



На първо място, обръщаме внимание на R-квадрат и коефициентите.

R-квадрат е коефициентът на детерминация. В нашия пример – 0,755, или 75,5%. Това означава, че изчислените параметри на модела обясняват 75,5% от връзката между изследваните параметри. Колкото по-висок е коефициентът на детерминация, толкова по-добър е моделът. Добър - над 0,8. Лошо – по-малко от 0,5 (такъв анализ едва ли може да се счита за разумен). В нашия пример – „не е зле“.

Коефициентът 64.1428 показва какво ще бъде Y, ако всички променливи в разглеждания модел са равни на 0. Тоест стойността на анализирания параметър се влияе и от други фактори, които не са описани в модела.

Коефициентът -0.16285 показва тежестта на променливата X върху Y. Тоест средната месечна заплата в рамките на този модел влияе върху броя на напусналите с тежест -0.16285 (това е малка степен на влияние). Знакът „-“ показва отрицателно въздействие: колкото по-висока е заплатата, толкова по-малко хора напускат. Което е справедливо.



Корелационен анализ в Excel

Корелационният анализ помага да се определи дали има връзка между показателите в една или две проби. Например между времето за работа на една машина и цената на ремонта, цената на оборудването и продължителността на работа, височината и теглото на децата и т.н.

Ако има връзка, тогава увеличението на един параметър води ли до увеличение (положителна корелация) или намаление (отрицателна) на другия. Корелационният анализ помага на анализатора да определи дали стойността на един индикатор може да се използва за прогнозиране на възможната стойност на друг.

Коефициентът на корелация се означава с r. Варира от +1 до -1. Класификацията на корелациите за различните области ще бъде различна. Когато коефициентът е 0, няма линейна връзка между извадките.

Нека да разгледаме как да намерим коефициента на корелация с помощта на Excel.

За намиране на сдвоени коефициенти се използва функцията CORREL.

Цел: Определете дали има връзка между времето за работа на струг и разходите за неговата поддръжка.

Поставете курсора в произволна клетка и натиснете бутона fx.

  1. В категорията „Статистически“ изберете функцията CORREL.
  2. Аргумент "Масив 1" - първият диапазон от стойности - време на работа на машината: A2:A14.
  3. Аргумент “Масив 2” - втори диапазон от стойности – цена на ремонта: B2:B14. Натиснете OK.

За да определите вида на връзката, трябва да погледнете абсолютното число на коефициента (всяка сфера на дейност има своя собствена скала).

За корелационен анализ на няколко параметъра (повече от 2) е по-удобно да използвате „Анализ на данни“ (добавката „Пакет за анализ“). Трябва да изберете корелация от списъка и да посочите масива. Всичко.

Получените коефициенти ще бъдат показани в корелационната матрица. Като този:

Корелационен и регресионен анализ

На практика тези две техники често се използват заедно.

Пример:


Сега данните от регресионния анализ станаха видими.

Целта на регресионния анализ е да се измери връзката между зависима променлива и една (регресионен анализ по двойки) или повече (множество) независими променливи. Независимите променливи се наричат ​​още факторни, обяснителни, детерминантни, регресорни и предикторни променливи.

Зависимата променлива понякога се нарича определена, обяснена или променлива „отговор“. Изключително широкото използване на регресионния анализ в емпиричните изследвания се дължи не само на факта, че той е удобен инструмент за проверка на хипотези. Регресията, особено множествената регресия, е ефективен метод за моделиране и прогнозиране.

Нека започнем да обясняваме принципите на работа с регресионния анализ с по-прост - метода на двойките.

Сдвоен регресионен анализ

Първите стъпки при използване на регресионен анализ ще бъдат почти идентични с тези, които направихме при изчисляването на коефициента на корелация. Трите основни условия за ефективността на корелационния анализ с помощта на метода на Pearson - нормално разпределение на променливите, интервално измерване на променливите, линейна връзка между променливите - също са от значение за множествената регресия. Съответно на първия етап се изграждат диаграми на разсейване, извършва се статистически и описателен анализ на променливите и се изчислява регресионна линия. Както в рамките на корелационния анализ, регресионните линии се конструират с помощта на метода на най-малките квадрати.

За да илюстрираме по-ясно разликите между двата метода за анализ на данни, нека се обърнем към вече обсъдения пример с променливите „SPS подкрепа“ и „дял на селското население“. Изходните данни са идентични. Разликата в диаграмите на разсейване ще бъде, че при регресионния анализ е правилно да се начертае зависимата променлива - в нашия случай „SPS подкрепа“ върху оста Y, докато при корелационния анализ това няма значение. След почистване на отклоненията диаграмата на разсейване изглежда така:

Основната идея на регресионния анализ е, че имайки обща тенденция за променливите - под формата на регресионна линия - е възможно да се предвиди стойността на зависимата променлива, като се имат предвид стойностите на независимата.

Нека си представим обикновена математическа линейна функция. Всяка права линия в евклидовото пространство може да се опише с формулата:

където a е константа, която определя преместването по ординатната ос; b е коефициент, който определя ъгъла на наклона на линията.

Като знаете наклона и константата, можете да изчислите (предскажете) стойността на y за всяко x.

Тази най-проста функция формира основата на модела за регресионен анализ с уговорката, че няма да прогнозираме точно стойността на y, но в рамките на определен доверителен интервал, т.е. приблизително.

Константата е точката на пресичане на регресионната линия и у-оста (F-пресечна точка, обикновено означавана като „прихващач“ в статистическите пакети). В нашия пример с гласуването за Съюза на десните сили закръглената му стойност ще бъде 10,55. Ъгловият коефициент b ще бъде приблизително -0,1 (както при корелационния анализ знакът показва вида на връзката - директна или обратна). Така полученият модел ще има формата SP C = -0.1 x Sel. нас. + 10.55.

ATP = -0,10 х 47 + 10,55 = 5,63.

Разликата между първоначалните и прогнозираните стойности се нарича остатък (вече сме срещали този термин, който е основен за статистиката, когато анализираме таблици за непредвидени обстоятелства). Така че за случая на „Република Адигея“ остатъкът ще бъде равен на 3,92 - 5,63 = -1,71. Колкото по-голяма е модулната стойност на остатъка, толкова по-малко успешна е прогнозираната стойност.

Ние изчисляваме прогнозираните стойности и остатъците за всички случаи:
Случва се Седна. нас. Мерси

(оригинал)

Мерси

(предвиден)

Остатъци
Република Адигея 47 3,92 5,63 -1,71 -
Република Алтай 76 5,4 2,59 2,81
Република Башкортостан 36 6,04 6,78 -0,74
Република Бурятия 41 8,36 6,25 2,11
Република Дагестан 59 1,22 4,37 -3,15
Република Ингушетия 59 0,38 4,37 3,99
и т.н.

Анализът на съотношението на първоначалните и прогнозираните стойности служи за оценка на качеството на получения модел и неговата прогностична способност. Един от основните показатели на регресионната статистика е коефициентът на множествена корелация R - коефициентът на корелация между първоначалните и прогнозираните стойности на зависимата променлива. При сдвоен регресионен анализ той е равен на обичайния коефициент на корелация на Pearson между зависимите и независимите променливи, в нашия случай - 0,63. За да се интерпретира смислено множество R, то трябва да се преобразува в коефициент на определяне. Това става по същия начин, както при корелационния анализ – чрез повдигане на квадрат. Коефициентът на детерминация R-квадрат (R 2) показва съотношението на вариация в зависимата променлива, която се обяснява от независимата променлива(и).

В нашия случай R 2 = 0,39 (0,63 2); това означава, че променливата „дял на селското население“ обяснява приблизително 40% от вариацията в променливата „подпомагане на СЕП“. Колкото по-голям е коефициентът на детерминация, толкова по-високо е качеството на модела.

Друг показател за качеството на модела е стандартната грешка на оценката. Това е мярка за това колко широко точките са „разпръснати“ около регресионната линия. Мярката за спред за интервални променливи е стандартното отклонение. Съответно, стандартната грешка на оценката е стандартното отклонение на разпределението на остатъците. Колкото по-висока е стойността му, толкова по-голямо е разсейването и толкова по-лош е моделът. В нашия случай стандартната грешка е 2,18. Именно с тази сума нашият модел ще „греши средно“, когато прогнозира стойността на променливата „SPS support“.

Регресионната статистика включва и анализ на дисперсията. С негова помощ откриваме: 1) каква част от вариацията (дисперсията) на зависимата променлива се обяснява с независимата променлива; 2) каква част от дисперсията на зависимата променлива се отчита от остатъците (необяснена част); 3) какво е съотношението на тези две величини (/"-отношение). Статистиката на дисперсията е особено важна за извадкови изследвания - тя показва колко вероятно е да има връзка между независимите и зависимите променливи в съвкупността. Въпреки това, за непрекъснати проучвания (както в нашия пример) резултатите от изследването на дисперсионния анализ не са полезни. В този случай те проверяват дали идентифицираният статистически модел е причинен от комбинация от случайни обстоятелства, колко е характерен за комплекса от условия, при които се установява, че полученият резултат не е верен за някаква по-широка обща съвкупност, а степента на нейната закономерност, свобода от случайни влияния.

В нашия случай статистиката ANOVA е както следва:

СС df Г-ЦА Е значение
Регрес. 258,77 1,00 258,77 54,29 0.000000001
остатък 395,59 83,00 L,11
Обща сума 654,36

F-съотношението от 54,29 е значително на ниво 0,0000000001. Съответно, можем уверено да отхвърлим нулевата хипотеза (че връзката, която открихме, се дължи на случайност).

Критерият t изпълнява подобна функция, но по отношение на коефициентите на регресия (ъглово и F-пресичане). Използвайки критерия /, проверяваме хипотезата, че в генералната съвкупност коефициентите на регресия са равни на нула. В нашия случай отново можем уверено да отхвърлим нулевата хипотеза.

Множествен регресионен анализ

Моделът на множествена регресия е почти идентичен с модела на сдвоена регресия; единствената разлика е, че няколко независими променливи са последователно включени в линейната функция:

Y = b1X1 + b2X2 + …+ bpXp + a.

Ако има повече от две независими променливи, ние не можем да получим визуална представа за тяхната връзка; в това отношение множествената регресия е по-малко „визуална“ от регресията по двойки. Когато имате две независими променливи, може да е полезно да покажете данните в 3D точкова диаграма. В професионалните статистически софтуерни пакети (например Statistica) има опция за завъртане на триизмерна диаграма, което ви позволява визуално да представите добре структурата на данните.

При работа с множествена регресия, за разлика от регресия по двойки, е необходимо да се определи алгоритъмът за анализ. Стандартният алгоритъм включва всички налични предиктори в крайния регресионен модел. Алгоритъмът стъпка по стъпка включва последователно включване (изключване) на независими променливи въз основа на тяхното обяснително „тегло“. Поетапният метод е добър, когато има много независими променливи; той „изчиства“ модела от откровено слаби предиктори, правейки го по-компактен и стегнат.

Допълнително условие за коректността на множествената регресия (наред с интервала, нормалността и линейността) е липсата на мултиколинеарност - наличието на силни корелации между независими променливи.

Интерпретацията на статистическите данни за множествена регресия включва всички елементи, които разгледахме за случая на регресия по двойки. Освен това има други важни компоненти на статистиката на множествения регресионен анализ.

Ще илюстрираме работата с множествена регресия, като използваме примера за тестване на хипотези, които обясняват разликите в нивото на избирателна активност в руските региони. Специфични емпирични проучвания показват, че нивата на избирателна активност се влияят от:

Национален фактор (променлива „Руско население“; операционализирана като дял от руското население в съставните образувания на Руската федерация). Предполага се, че увеличаването на дела на руското население води до намаляване на избирателната активност;

Коефициент на урбанизация (променливата „градско население“; операционализирана като дял от градското население в съставните единици на Руската федерация; вече сме работили с този фактор като част от корелационния анализ). Предполага се, че увеличаването на дела на градското население води и до намаляване на избирателната активност.

Зависимата променлива - „интензивност на избирателната активност“ („активна“) се операционализира чрез данни за средната избирателна активност по региони на федерални избори от 1995 г. до 2003 г. Първоначалната таблица с данни за две независими и една зависима променлива ще бъде както следва:

Случва се Променливи
Активи. Гор. нас. рус. нас.
Република Адигея 64,92 53 68
Република Алтай 68,60 24 60
Република Бурятия 60,75 59 70
Република Дагестан 79,92 41 9
Република Ингушетия 75,05 41 23
Република Калмикия 68,52 39 37
Карачаево-Черкеска република 66,68 44 42
Република Карелия 61,70 73 73
Република Коми 59,60 74 57
Република Марий Ел 65,19 62 47

и т.н. (след почистване на емисиите остават 83 от 88 случая)

Статистика, описваща качеството на модела:

1. Множество R = 0,62; L-квадрат = 0,38. Следователно националният фактор и факторът урбанизация заедно обясняват около 38% от вариацията на променливата „избирателна активност“.

2. Средната грешка е 3,38. Точно толкова „средно грешен” е изграденият модел при прогнозиране на нивото на избирателна активност.

3. /l-съотношението на обяснена и необяснена вариация е 25,2 на ниво 0,000000003. Нулевата хипотеза за случайността на идентифицираните връзки се отхвърля.

4. Критерият / за константните и регресионните коефициенти на променливите „градско население” и „руско население” е значим на ниво 0,0000001; 0,00005 и 0,007 съответно. Нулевата хипотеза, че коефициентите са случайни, се отхвърля.

Допълнителни полезни статистически данни при анализиране на връзката между първоначалните и прогнозираните стойности на зависимата променлива са разстоянието Махаланобис и разстоянието на Кук. Първият е мярка за уникалността на случая (показва доколко комбинацията от стойности на всички независими променливи за даден случай се отклонява от средната стойност за всички независими променливи едновременно). Второто е мярка за влиянието на случая. Различните наблюдения имат различен ефект върху наклона на регресионната линия и разстоянието на Кук може да се използва за сравняването им по този показател. Това може да бъде полезно при почистване на извънредни стойности (външната стойност може да се разглежда като твърде влиятелен случай).

В нашия пример уникалните и влиятелни случаи включват Дагестан.

Случва се Оригинален

стойности

Предска

стойности

Остатъци Разстояние

Махаланобис

Разстояние
Адигея 64,92 66,33 -1,40 0,69 0,00
Република Алтай 68,60 69.91 -1,31 6,80 0,01
Република Бурятия 60,75 65,56 -4,81 0,23 0,01
Република Дагестан 79,92 71,01 8,91 10,57 0,44
Република Ингушетия 75,05 70,21 4,84 6,73 0,08
Република Калмикия 68,52 69,59 -1,07 4,20 0,00

Самият регресионен модел има следните параметри: Y-пресечна (константа) = 75.99; b (хоризонтално) = -0,1; Комерсант (руски нас.) = -0,06. Крайна формула.

Регресионният анализ е един от най-популярните методи за статистическо изследване. Може да се използва за установяване на степента на влияние на независимите променливи върху зависимата променлива. Microsoft Excel има инструменти, предназначени за извършване на този тип анализ. Нека да разгледаме какво представляват те и как да ги използваме.

Но за да използвате функцията, която ви позволява да извършвате регресионен анализ, първо трябва да активирате пакета за анализ. Само тогава инструментите, необходими за тази процедура, ще се появят на лентата на Excel.


Сега, когато отидем на раздела "Данни", на лентата в кутията с инструменти "Анализ"ще видим нов бутон - "Анализ на данни".

Видове регресионен анализ

Има няколко вида регресии:

  • параболичен;
  • улегнал;
  • логаритмичен;
  • експоненциален;
  • демонстративен;
  • хиперболичен;
  • линейна регресия.

По-късно ще говорим по-подробно за извършването на последния тип регресионен анализ в Excel.

Линейна регресия в Excel

По-долу, като пример, е дадена таблица, показваща средната дневна външна температура и броя на клиентите на магазина за съответния работен ден. Нека да разберем с помощта на регресионен анализ как точно метеорологичните условия под формата на температура на въздуха могат да повлияят на посещаемостта на търговски обект.

Общото уравнение на линейната регресия е както следва: Y = a0 + a1x1 +…+ akhk. В тази формула Yозначава променлива, влиянието на факторите, върху които се опитваме да изследваме. В нашия случай това е броят на купувачите. Значение хса различните фактори, които влияят върху дадена променлива. Настроики аса регресионни коефициенти. Тоест те са тези, които определят значимостта на даден фактор. Индекс кобозначава общия брой на същите тези фактори.


Анализ на резултатите от анализа

Резултатите от регресионния анализ се показват под формата на таблица на мястото, посочено в настройките.

Един от основните показатели е R-квадрат. Това показва качеството на модела. В нашия случай този коефициент е 0,705 или около 70,5%. Това е приемливо ниво на качество. Зависимост по-малка от 0,5 е лоша.

Друг важен индикатор се намира в клетката в пресечната точка на линията "Y-пресечка"и колона "коефициенти". Това показва каква стойност ще има Y, а в нашия случай това е броят на купувачите, като всички други фактори са равни на нула. В тази таблица тази стойност е 58,04.

Стойност в пресечната точка на графиката "Променлива X1"И "коефициенти"показва нивото на зависимост на Y от X. В нашия случай това е нивото на зависимост на броя клиенти на магазина от температурата. Коефициент от 1,31 се счита за показател с доста високо влияние.

Както можете да видите, с помощта на Microsoft Excel е доста лесно да създадете таблица за регресионен анализ. Но само обучен човек може да работи с изходните данни и да разбере същността им.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи