Какво е регресионна функция. Регресионен анализ - статистически метод за изследване на зависимостта на случайна величина от променливи

Регресионният анализ е метод за установяване на аналитичен израз на стохастична връзка между изследваните характеристики. Регресионното уравнение показва как се променя средно припри промяна на някоя от х аз , и изглежда така:

Където y -зависима променлива (тя винаги е една);

х аз - независими променливи (фактори) (може да има няколко от тях).

Ако има само една независима променлива, това е прост регресионен анализ. Ако са няколко П 2), тогава такъв анализ се нарича многовариантен.

В хода на регресионния анализ се решават две основни задачи:

    изграждане на регресионното уравнение, т.е. намиране на вида на връзката между резултатния показател и независимите фактори х 1 , х 2 , …, х н .

    оценка на значимостта на полученото уравнение, т.е. определяне на това доколко избраните факторни характеристики обясняват вариацията на характеристиката г.

Регресионният анализ се използва главно за планиране, както и за разработване на нормативна база.

За разлика от корелационния анализ, който отговаря само на въпроса дали има връзка между анализираните признаци, регресионният анализ дава и своя формализиран израз. Освен това, ако корелационният анализ изучава някаква връзка на факторите, тогава регресионният анализ изучава едностранна зависимост, т.е. връзка, показваща как промяната в знаците на фактора влияе върху резултатния знак.

Регресионният анализ е един от най-развитите методи на математическата статистика. Строго погледнато, прилагането на регресионен анализ изисква изпълнението на редица специални изисквания (по-специално, хл 2 ,...,х н ;гтрябва да бъдат независими, нормално разпределени случайни променливи с постоянни дисперсии). В реалния живот стриктното спазване на изискванията за регресионен и корелационен анализ е много рядко, но и двата метода са много разпространени в икономическите изследвания. Зависимостите в икономиката могат да бъдат не само преки, но и обратни и нелинейни. Регресионен модел може да бъде изграден при наличие на каквато и да е зависимост, но при многовариантния анализ се използват само линейни модели на формата:

Изграждането на регресионното уравнение се извършва, като правило, по метода на най-малките квадрати, чиято същност е да се минимизира сумата от квадратните отклонения на действителните стойности на получения атрибут от неговите изчислени стойности, т.е.:

Където T -брой наблюдения;

й =a+b 1 х 1 й 2 х 2 й + ... + b н х н й - изчислена стойност на фактора резултат.

Коефициентите на регресия се препоръчват да се определят с помощта на аналитични пакети за персонален компютър или специален финансов калкулатор. В най-простия случай коефициентите на регресия на еднофакторно уравнение на линейна регресия от формата y = a + bxможе да се намери с помощта на формулите:

клъстерен анализ

Клъстерният анализ е един от методите на многовариантния анализ, предназначен за групиране (клъстериране) на популация, чиито елементи се характеризират с много характеристики. Стойностите на всеки от признаците служат като координати на всяка единица от изследваната популация в многомерното пространство на признаците. Всяко наблюдение, характеризиращо се със стойностите на няколко индикатора, може да бъде представено като точка в пространството на тези индикатори, чиито стойности се считат за координати в многомерно пространство. Разстояние между точките РИ рс ккоординатите се определят като:

Основният критерий за клъстериране е, че разликите между клъстерите трябва да са по-значими, отколкото между наблюденията, приписани на един и същ клъстер, т.е. в многомерно пространство трябва да се спазва неравенството:

Където r 1, 2 - разстояние между клъстери 1 и 2.

Както и процедурите за регресионен анализ, процедурата за клъстеризиране е доста трудоемка, препоръчително е да се извърши на компютър.

В творбите си от 1908г. Той го описа на примера на работата на агент, продаващ недвижими имоти. В своите бележки специалистът по продажби на жилища записва широк набор от входни данни за всяка конкретна сграда. Въз основа на резултатите от търга беше определено кой фактор е оказал най-голямо влияние върху цената на сделката.

Анализът на голям брой сделки даде интересни резултати. Много фактори повлияха на крайната цена, понякога водейки до парадоксални заключения и дори до директни „отклонения“, когато къща с висок първоначален потенциал беше продадена на по-нисък ценови показател.

Вторият пример за прилагане на такъв анализ е работата, на която е възложено определянето на възнагражденията на служителите. Сложността на задачата беше, че не се изискваше да се разпредели фиксирана сума на всички, а стриктно да се съобрази стойността й с конкретната извършена работа. Появата на много задачи с практически сходни решения изискваше по-детайлното им изследване на математическо ниво.

Значително място беше отделено на раздела "регресионен анализ", който комбинира практическите методи, използвани за изследване на зависимостите, които попадат в понятието регресия. Тези зависимости се наблюдават между данните, получени в хода на статистическите изследвания.

Сред множеството задачи за решаване той си поставя три основни цели: дефинирането на регресионно уравнение от общ вид; изграждане на оценки на параметри, които са неизвестни, които са част от регресионното уравнение; тестване на хипотези за статистическа регресия. В хода на изучаване на връзката, която възниква между двойка величини, получени в резултат на експериментални наблюдения и съставляващи серия (набор) от типа (x1, y1), ..., (xn, yn), те разчитат на разпоредбите на регресионната теория и приемаме, че за една величина Y се наблюдава определено вероятностно разпределение, докато другата X остава фиксирана.

Резултатът Y зависи от стойността на променливата X, тази зависимост може да се определи от различни модели, докато точността на получените резултати се влияе от естеството на наблюденията и целта на анализа. Експерименталният модел се основава на определени предположения, които са опростени, но правдоподобни. Основното условие е параметърът X да е контролирана стойност. Стойностите му се задават преди началото на експеримента.

Ако по време на експеримента се използва двойка неконтролирани XY стойности, тогава регресионният анализ се извършва по същия начин, но за тълкуването на резултатите, по време на които се изследва връзката на изследваните случайни променливи, се използват методи Методите на математическата статистика не са абстрактна тема. Те намират своето приложение в живота в различни области на човешката дейност.

В научната литература терминът линеен регресионен анализ намери широка употреба за дефиниране на горния метод. За променливата X се използва терминът регресор или предиктор, а зависимите Y-променливи се наричат ​​още критериални променливи. Тази терминология отразява само математическата зависимост на променливите, но не и причинно-следствените връзки.

Регресионният анализ е най-разпространеният метод, използван за обработка на резултатите от голямо разнообразие от наблюдения. С помощта на този метод се изучават физически и биологични зависимости, той се прилага както в икономиката, така и в технологиите. Множество други области използват модели за регресионен анализ. Анализът на дисперсията, многовариантният статистически анализ работят в тясно сътрудничество с този метод на изследване.

Регресионен и корелационен анализ - статистически методи за изследване. Това са най-често срещаните начини за показване на зависимостта на параметър от една или повече независими променливи.

По-долу, използвайки конкретни практически примери, ще разгледаме тези два много популярни анализа сред икономистите. Ще дадем и пример за получаване на резултати, когато се комбинират.

Регресионен анализ в Excel

Показва влиянието на някои стойности (независими, независими) върху зависимата променлива. Например как броят на икономически активното население зависи от броя на предприятията, заплатите и други параметри. Или: как влияят на нивото на БВП чуждите инвестиции, цените на енергията и т.н.

Резултатът от анализа ви позволява да дадете приоритет. И въз основа на основните фактори, да се прогнозира, планира развитието на приоритетните области, да се вземат управленски решения.

Регресията се случва:

  • линеен (y = a + bx);
  • параболичен (y = a + bx + cx 2);
  • експоненциален (y = a * exp(bx));
  • мощност (y = a*x^b);
  • хиперболичен (y = b/x + a);
  • логаритмичен (y = b * 1n(x) + a);
  • експоненциален (y = a * b^x).

Разгледайте примера за изграждане на регресионен модел в Excel и интерпретиране на резултатите. Нека вземем линеен тип регресия.

Задача. В 6 предприятия са анализирани средната месечна работна заплата и напусналите служители. Необходимо е да се установи зависимостта на броя на пенсионираните служители от средната работна заплата.

Линейният регресионен модел има следния вид:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Където a са регресионните коефициенти, x са влияещите променливи и k е броят на факторите.

В нашия пример Y е индикаторът за напуснали работници. Влияещият фактор е работната заплата (x).

Excel има вградени функции, които могат да се използват за изчисляване на параметрите на линеен регресионен модел. Но добавката Analysis ToolPak ще го направи по-бързо.

Активирайте мощен аналитичен инструмент:

След като бъде активирана, добавката ще бъде достъпна в раздела Данни.

Сега ще се занимаваме директно с регресионния анализ.



На първо място, обръщаме внимание на R-квадрата и коефициентите.

R-квадрат е коефициентът на детерминация. В нашия пример това е 0,755, или 75,5%. Това означава, че изчислените параметри на модела обясняват връзката между изследваните параметри с 75,5%. Колкото по-висок е коефициентът на детерминация, толкова по-добър е моделът. Добър - над 0,8. Слабо - под 0,5 (такъв анализ едва ли може да се счита за разумен). В нашия пример - "не е лошо".

Коефициентът 64.1428 показва какво ще бъде Y, ако всички променливи в разглеждания модел са равни на 0. Тоест други фактори, които не са описани в модела, също влияят върху стойността на анализирания параметър.

Коефициентът -0.16285 показва тежестта на променливата X върху Y. Тоест средната месечна заплата в този модел влияе върху броя на напусналите с тежест -0.16285 (това е малка степен на влияние). Знакът „-“ показва отрицателно въздействие: колкото по-висока е заплатата, толкова по-малко напускат. Което е справедливо.



Корелационен анализ в Excel

Корелационният анализ помага да се установи дали има връзка между показателите в една или две проби. Например между времето за работа на машината и разходите за ремонт, цената на оборудването и продължителността на работа, височината и теглото на децата и т.н.

Ако има връзка, тогава дали увеличението на един параметър води до увеличение (положителна корелация) или намаление (отрицателна) на другия. Корелационният анализ помага на анализатора да определи дали стойността на един индикатор може да предвиди възможната стойност на друг.

Коефициентът на корелация се обозначава с r. Варира от +1 до -1. Класификацията на корелациите за различните области ще бъде различна. Когато стойността на коефициента е 0, няма линейна връзка между извадките.

Помислете как да използвате Excel, за да намерите коефициента на корелация.

Функцията CORREL се използва за намиране на сдвоените коефициенти.

Задача: Установете дали има връзка между времето на работа на струг и разходите за неговата поддръжка.

Поставете курсора в произволна клетка и натиснете бутона fx.

  1. В категорията "Статистически" изберете функцията CORREL.
  2. Аргумент "Масив 1" - първият диапазон от стойности - времето на машината: A2: A14.
  3. Аргумент "Масив 2" - вторият диапазон от стойности - цената на ремонта: B2:B14. Натиснете OK.

За да определите вида на връзката, трябва да погледнете абсолютното число на коефициента (всяка сфера на дейност има своя собствена скала).

За корелационен анализ на няколко параметъра (повече от 2) е по-удобно да използвате "Анализ на данни" (добавка "Пакет за анализ"). В списъка трябва да изберете корелация и да посочите масив. Всичко.

Получените коефициенти ще бъдат показани в корелационната матрица. Като този:

Корелационно-регресионен анализ

На практика тези две техники често се използват заедно.

Пример:


Сега данните от регресионния анализ са видими.

Целта на регресионния анализ е да се измери връзката между зависима променлива и една (регресионен анализ по двойки) или повече (множество) независими променливи. Независимите променливи се наричат ​​още факторни, обяснителни, детерминантни, регресори и предиктори.

Зависимата променлива понякога се нарича дефинирана, обяснена или променлива "отговор". Изключително широкото използване на регресионния анализ в емпиричните изследвания се дължи не само на факта, че той е удобен инструмент за проверка на хипотези. Регресията, особено множествената регресия, е ефективна техника за моделиране и прогнозиране.

Нека започнем да обясняваме принципите на работа с регресионния анализ с по-прост - метода на двойките.

Регресионен анализ по двойки

Първите стъпки при използване на регресионен анализ ще бъдат почти идентични с тези, предприети от нас в рамките на изчисляването на коефициента на корелация. Трите основни условия за ефективността на корелационния анализ с помощта на метода на Pearson - нормалното разпределение на променливите, интервалното измерване на променливите, линейната връзка между променливите - също са от значение за множествената регресия. Съответно на първия етап се изграждат диаграми на разсейване, извършва се статистически и описателен анализ на променливите и се изчислява регресионна линия. Както в рамките на корелационния анализ, регресионните линии се изграждат с помощта на метода на най-малките квадрати.

За да илюстрираме по-ясно разликите между двата метода за анализ на данни, нека се обърнем към вече разгледания пример с променливите „SPS подкрепа“ и „дял на селското население“. Оригиналните данни са идентични. Разликата в диаграмите на разсейване ще бъде, че при регресионния анализ е правилно да се изобрази зависимата променлива - в нашия случай "SPS support" по оста Y, докато при корелационния анализ това няма значение. След почистване на отклоненията диаграмата на разсейване изглежда така:

Основната идея на регресионния анализ е, че като имате обща тенденция за променливите - под формата на регресионна линия - можете да предвидите стойността на зависимата променлива, имайки стойностите на независимата.

Нека си представим обикновена математическа линейна функция. Всяка права в евклидовото пространство може да бъде описана с формулата:

където a е константа, която определя отместването по оста y; b - коефициент, който определя ъгъла на линията.

Като знаете наклона и константата, можете да изчислите (предвидите) стойността на y за всяко x.

Тази най-проста функция формира основата на модела за регресионен анализ с уговорката, че ще прогнозираме стойността на y не точно, но в рамките на определен доверителен интервал, т.е. приблизително.

Константата е точката на пресичане на регресионната линия и у-оста (F-отсечката, обикновено наричана "отсечка" в статистическите пакети). В нашия пример за гласуване за SPS, закръглената му стойност ще бъде 10,55. Коефициентът на наклон b ще бъде равен приблизително на -0,1 (като при корелационния анализ знакът показва вида на връзката - пряка или обратна). Така полученият модел ще изглежда като SP C = -0.1 x Sel. нас. + 10.55.

ATP \u003d -0,10 x 47 + 10,55 \u003d 5,63.

Разликата между първоначалните и прогнозираните стойности се нарича остатък (вече сме срещали този термин - основен за статистиката - при анализиране на таблици за непредвидени обстоятелства). Така че, за случая на Република Адигея, остатъкът ще бъде 3,92 - 5,63 = -1,71. Колкото по-голяма е модулната стойност на остатъка, толкова по-лошо е предвидената стойност.

Ние изчисляваме прогнозираните стойности и остатъците за всички случаи:
Случва се сб. нас. Мерси

(оригинал)

Мерси

(предвиден)

останки
Република Адигея 47 3,92 5,63 -1,71 -
Република Алтай 76 5,4 2,59 2,81
Република Башкортостан 36 6,04 6,78 -0,74
Република Бурятия 41 8,36 6,25 2,11
Република Дагестан 59 1,22 4,37 -3,15
Република Ингушетия 59 0,38 4,37 3,99
и т.н.

Анализът на съотношението на първоначалните и прогнозираните стойности служи за оценка на качеството на получения модел, неговата прогностична способност. Един от основните показатели на регресионната статистика е коефициентът на множествена корелация R - коефициентът на корелация между първоначалните и прогнозираните стойности на зависимата променлива. При сдвоен регресионен анализ той е равен на обичайния коефициент на корелация на Pearson между зависимата и независимата променлива, в нашия случай - 0,63. За смислено тълкуване на множественото R, то трябва да се преобразува в коефициент на определяне. Това става по същия начин, както при корелационния анализ – повдигане на квадрат. Коефициентът на детерминация R-квадрат (R 2) показва съотношението на вариацията в зависимата променлива, обяснена от независимите (независимите) променливи.

В нашия случай R 2 = 0,39 (0,63 2); това означава, че променливата „пропорция на селското население“ обяснява около 40% от вариацията в променливата „подкрепа за CPS“. Колкото по-голяма е стойността на коефициента на детерминация, толкова по-високо е качеството на модела.

Друга мярка за качеството на модела е стандартната грешка на оценката. Това е мярка за това колко точките са "разпръснати" около регресионната линия. Мярката за дисперсия за интервални променливи е стандартното отклонение. Съответно, стандартната грешка на оценката е стандартното отклонение на разпределението на остатъците. Колкото по-висока е стойността му, толкова по-голям е спредът и толкова по-лош е моделът. В нашия случай стандартната грешка е 2,18. Именно с тази сума нашият модел ще „греши средно“, когато прогнозира стойността на променливата „SPS support“.

Регресионната статистика включва и анализ на дисперсията. С негова помощ откриваме: 1) каква част от вариацията (дисперсията) на зависимата променлива се обяснява с независимата променлива; 2) каква част от дисперсията на зависимата променлива се отчита от остатъците (необяснена част); 3) какво е съотношението на тези две стойности (/ "-съотношение). Статистиката на дисперсията е особено важна за извадкови проучвания - тя показва колко вероятно е да има връзка между независимите и зависимите променливи в общата съвкупност. Въпреки това , за непрекъснати проучвания (както в нашия пример), проучването В този случай се проверява дали разкритият статистически модел е причинен от съвпадение на случайни обстоятелства, доколко е характерен за комплекса от условия, в които се намира изследваната популация , т.е. се установява, че полученият резултат не е верен за някаква по-обширна обща съвкупност, а степента на нейната закономерност, свобода от случайни влияния.

В нашия случай анализът на статистиката на дисперсията е както следва:

СС df Г-ЦА Е значение
Регрес. 258,77 1,00 258,77 54,29 0.000000001
оставащи 395,59 83,00 L,11
Обща сума 654,36

F-съотношението от 54,29 е значително на ниво 0,0000000001. Съответно, можем спокойно да отхвърлим нулевата хипотеза (че връзката, която открихме, е случайна).

Подобна функция изпълнява t критерият, но по отношение на коефициентите на регресия (ъглови и F-пресичания). Използвайки критерия /, проверяваме хипотезата, че коефициентите на регресия в генералната съвкупност са равни на нула. В нашия случай отново можем уверено да отхвърлим нулевата хипотеза.

Множествен регресионен анализ

Моделът на множествена регресия е почти идентичен с модела на двойна регресия; единствената разлика е, че няколко независими променливи са последователно включени в линейната функция:

Y = b1X1 + b2X2 + …+ bpXp + a.

Ако има повече от две независими променливи, не можем да получим визуално представяне на тяхната връзка; в това отношение множествената регресия е по-малко „видима“ от регресията по двойки. Когато има две независими променливи, може да е полезно данните да се покажат в 3D точкова диаграма. В професионалните статистически софтуерни пакети (например Statistica) има възможност за завъртане на триизмерна диаграма, което позволява добро визуално представяне на структурата на данните.

При работа с множествена регресия, за разлика от двойната регресия, е необходимо да се определи алгоритъмът за анализ. Стандартният алгоритъм включва всички налични предиктори в крайния регресионен модел. Алгоритъмът стъпка по стъпка предполага последователно включване (изключване) на независими променливи въз основа на тяхната обяснителна "теглост". Поетапният метод е добър, когато има много независими променливи; той "изчиства" модела от откровено слаби предиктори, като го прави по-компактен и стегнат.

Допълнително условие за коректността на множествената регресия (наред с интервала, нормалността и линейността) е липсата на мултиколинеарност - наличието на силни корелации между независими променливи.

Интерпретацията на статистическите данни за множествена регресия включва всички елементи, които разгледахме за случая на регресия по двойки. Освен това има други важни компоненти в статистиката на множествения регресионен анализ.

Ще илюстрираме работата с множествена регресия на примера за тестване на хипотези, които обясняват разликите в нивото на избирателна активност в регионите на Русия. Специфични емпирични проучвания предполагат, че избирателната активност се влияе от:

Национален фактор (променлива „Руско население“; операционализирана като дял на руското население в съставните образувания на Руската федерация). Предполага се, че увеличаването на дела на руското население води до намаляване на избирателната активност;

Коефициент на урбанизация (променлива „градско население“; операционализиран като дял от градското население в съставните единици на Руската федерация, ние вече работихме с този фактор като част от корелационния анализ). Предполага се, че увеличаването на дела на градското население води и до намаляване на избирателната активност.

Зависимата променлива - "интензивност на избирателната активност" ("активна") се операционализира чрез данните за средната избирателна активност за регионите на федералните избори от 1995 до 2003 г. Таблицата с първоначалните данни за две независими и една зависима променлива ще има следния вид :

Случва се Променливи
Активи. Гор. нас. рус. нас.
Република Адигея 64,92 53 68
Република Алтай 68,60 24 60
Република Бурятия 60,75 59 70
Република Дагестан 79,92 41 9
Република Ингушетия 75,05 41 23
Република Калмикия 68,52 39 37
Карачаево-Черкеска република 66,68 44 42
Република Карелия 61,70 73 73
Република Коми 59,60 74 57
Република Марий Ел 65,19 62 47

и т.н. (след почистване на емисиите остават 83 случая от 88)

Статистика, описваща качеството на модела:

1. Множество R = 0,62; L-квадрат = 0,38. Следователно националният фактор и факторът урбанизация заедно обясняват около 38% от вариацията на променливата "избирателна активност".

2. Средната грешка е 3,38. Ето как „средно” конструираният модел греши при прогнозиране на нивото на избирателна активност.

3. /l-съотношението на обяснена и необяснена вариация е 25,2 на ниво 0,000000003. Нулевата хипотеза за случайността на разкритите връзки се отхвърля.

4. Критерият / за константните и регресионните коефициенти на променливите „градско население” и „руско население” е значим на ниво 0,0000001; 0,00005 и 0,007 съответно. Нулевата хипотеза за случайността на коефициентите се отхвърля.

Допълнителни полезни статистически данни при анализа на съотношението на първоначалните и прогнозираните стойности на зависимата променлива са разстоянието Махаланобис и разстоянието на Кук. Първата е мярка за уникалността на случая (показва доколко комбинацията от стойности на всички независими променливи за даден случай се отклонява от средната стойност за всички независими променливи едновременно). Второто е мярка за влиянието на случая. Различните наблюдения влияят на наклона на регресионната линия по различни начини и с помощта на разстоянието на Кук можете да ги сравните според този показател. Това е полезно при изчистване на извънредни стойности (външната стойност може да се разглежда като твърде влиятелен случай).

В нашия пример Дагестан е един от уникалните и влиятелни случаи.

Случва се Първоначално

стойности

Предска

стойности

останки Разстояние

Махаланобис

Разстояние
Адигея 64,92 66,33 -1,40 0,69 0,00
Република Алтай 68,60 69.91 -1,31 6,80 0,01
Република Бурятия 60,75 65,56 -4,81 0,23 0,01
Република Дагестан 79,92 71,01 8,91 10,57 0,44
Република Ингушетия 75,05 70,21 4,84 6,73 0,08
Република Калмикия 68,52 69,59 -1,07 4,20 0,00

Действителният регресионен модел има следните параметри: Y-отсечка (константа) = 75.99; b (Hor. sat.) \u003d -0,1; b (рус. нас.) = -0,06. Крайна формула.

Регресионният анализ е един от най-популярните методи за статистическо изследване. Може да се използва за определяне на степента на влияние на независимите променливи върху зависимата променлива. Функционалността на Microsoft Excel разполага с инструменти, предназначени за извършване на този тип анализ. Нека да разгледаме какво представляват те и как да ги използваме.

Но за да използвате функцията, която ви позволява да извършвате регресионен анализ, първо трябва да активирате пакета за анализ. Само тогава инструментите, необходими за тази процедура, ще се появят на лентата на Excel.


Сега, когато отидем на раздела "Данни", на лентата в кутията с инструменти "Анализ"ще видим нов бутон - "Анализ на данни".

Видове регресионен анализ

Има няколко вида регресии:

  • параболичен;
  • мощност;
  • логаритмичен;
  • експоненциален;
  • демонстрация;
  • хиперболичен;
  • линейна регресия.

Ще говорим по-подробно за изпълнението на последния тип регресионен анализ в Excel по-късно.

Линейна регресия в Excel

По-долу, като пример, е дадена таблица, която показва средната дневна температура на въздуха на улицата и броя на клиентите на магазина за съответния работен ден. Нека разберем с помощта на регресионен анализ как точно метеорологичните условия под формата на температура на въздуха могат да повлияят на посещаемостта на търговски обект.

Общото уравнение на линейната регресия изглежда така: Y = a0 + a1x1 + ... + axk. В тази формула Yозначава променливата, чието влияние се опитваме да изследваме. В нашия случай това е броят на купувачите. Значение хса различните фактори, които влияят на променливата. Настроики аса регресионните коефициенти. Тоест те определят значимостта на даден фактор. Индекс кобозначава общия брой на същите тези фактори.


Анализ на резултатите от анализа

Резултатите от регресионния анализ се показват под формата на таблица на мястото, посочено в настройките.

Един от основните показатели е R-квадрат. Това показва качеството на модела. В нашия случай този коефициент е 0,705 или около 70,5%. Това е приемливо ниво на качество. Връзка по-малка от 0,5 е лоша.

Друг важен индикатор се намира в клетката в пресечната точка на линията "Y-пресечка"и колона "Коефициенти". Тук се посочва каква стойност ще има Y, а в нашия случай това е броят на купувачите, като всички останали фактори са равни на нула. В тази таблица тази стойност е 58,04.

Стойност в пресечната точка на графиката "Променлива X1"И "Коефициенти"показва нивото на зависимост на Y от X. В нашия случай това е нивото на зависимост на броя клиенти на магазина от температурата. Коефициент от 1,31 се счита за доста висок показател за влияние.

Както можете да видите, е доста лесно да създадете таблица за регресионен анализ с помощта на Microsoft Excel. Но само обучен човек може да работи с данните, получени на изхода, и да разбере тяхната същност.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 "kingad.ru" - ултразвуково изследване на човешки органи