توزیع پیرسون با k برابر با 19. آزمون خوب بودن برازش پیرسون

وظیفه 1.

با استفاده از آزمون پیرسون، در سطح معناداری آ= 0.05 بررسی کنید که آیا فرضیه در مورد توزیع نرمال جمعیت سازگار است یا خیر ایکسبا توزیع حجم نمونه تجربی n = 200.

راه حل.

1. بیایید محاسبه کنیم و انحراف استاندارد نمونه .
2. فرکانس های نظری را با در نظر گرفتن آن محاسبه کنیم n = 200, ساعت= 2، = 4.695، طبق فرمول
.

بیایید یک جدول محاسبه (مقادیر تابع j(ایکس) در پیوست 1 آورده شده است.


من

3. بیایید بسامدهای تجربی و نظری را با هم مقایسه کنیم. بیایید یک جدول محاسباتی تهیه کنیم که از آن مقدار مشاهده شده معیار را پیدا کنیم :


من
مجموع

با توجه به جدول نقاط توزیع بحرانی (پیوست 6)، بر اساس سطح معنی داری آ= 0.05 و تعداد درجات آزادی ک = س– 3 = 9 – 3 = 6 نقطه بحرانی ناحیه بحرانی سمت راست (0.05؛ 6) = 12.6 را پیدا می کنیم.
از آنجایی که = 22.2 > = 12.6، فرضیه توزیع نرمال جمعیت را رد می کنیم. به عبارت دیگر، فرکانس های تجربی و نظری به طور قابل توجهی با هم تفاوت دارند.

مشکل 2

داده های آماری ارائه شده است.

نتایج اندازه گیری قطر n= 200 رول پس از آسیاب در جدول خلاصه شده است. (میلی متر):
جدولسری تغییرات فرکانس قطر رول

من

xi، میلی متر

xi، میلی متر

ضروری:

1) یک سری تغییرات گسسته را جمع آوری کنید، در صورت لزوم آن را سفارش دهید.

2) مشخصه های عددی اصلی سری را تعیین کنید.

3) یک نمایش گرافیکی از سری در قالب یک چند ضلعی توزیع (هیستوگرام) ارائه دهید.

4) یک منحنی توزیع نرمال نظری بسازید و مطابقت توزیع های تجربی و نظری را با استفاده از معیار پیرسون بررسی کنید. هنگام آزمون فرضیه آماری در مورد نوع توزیع، سطح معناداری a = 0.05 را بپذیرید.

راه حل: ما مشخصات عددی اصلی یک سری تغییرات معین را با تعریف پیدا خواهیم کرد. قطر متوسط ​​رول ها (mm) است:
ایکسمیانگین = = 6.753;
پراکندگی اصلاح شده (mm2):
D = = 0,0009166;
انحراف میانگین مربع (استاندارد) اصلاح شده (mm):
س = = 0,03028.


برنج.توزیع فرکانس قطر رول

توزیع فرکانس اصلی ("خام") سری تغییرات، به عنوان مثال. مکاتبات ni(xi، با گسترش نسبتاً زیادی از ارزش ها متمایز می شود niنسبت به برخی منحنی فرضی "میانگین" (شکل). در این مورد، ساخت و تجزیه و تحلیل یک سری تغییرات بازه ای، ترکیب فرکانس ها برای قطرهایی که در فواصل مربوطه قرار می گیرند، ترجیح داده می شود.
تعداد گروه های فاصله ای کبیایید با استفاده از فرمول Sturges آن را تعریف کنیم:
ک= 1 + log2 n= 1 + 3.322 لیتر n,
جایی که n= 200 - حجم نمونه. در مورد ما
ک= 1 + 3.322×lg200 = 1 + 3.322×2.301 = 8.644 » 8.
عرض فاصله (6.83 - 6.68)/8 = 0.01875 » 0.02 میلی متر است.
سری تغییرات بازه ای در جدول ارائه شده است.

جدول فاصله فرکانس سری تغییرات قطر رول.

ک

xk، میلی متر

یک سری بازه ای را می توان به صورت بصری در قالب هیستوگرام توزیع فرکانس ارائه کرد.


برنج. توزیع فرکانس قطر رول. خط جامد یک منحنی نرمال صاف کننده است.

ظاهر هیستوگرام به ما این امکان را می دهد که این فرض را بسازیم که توزیع قطرهای رول از قانون عادی پیروی می کند، که طبق آن فرکانس های نظری را می توان به صورت
nk، نظریه = n× ن(آ; s; xk)×D xk,
که به نوبه خود، منحنی گاوسی هموارکننده توزیع نرمال با عبارت زیر تعیین می شود:
ن(آ; s; xk) = .
در این عبارات xk– مراکز فواصل در سری تغییرات بازه فرکانس.

مثلا، ایکس 1 = (6.68 + 6.70)/2 = 6.69. به عنوان ارزیابی های مرکز آو پارامتر s منحنی گاوس را می توان گرفت:
آ = ایکسچهارشنبه
از شکل می توان مشاهده کرد که منحنی توزیع نرمال گاوسی به طور کلی با توزیع فاصله تجربی مطابقت دارد. با این حال، باید اهمیت آماری این مکاتبات را تأیید کرد. برای بررسی انطباق توزیع تجربی با توزیع تجربی، از معیار خوب بودن تناسب پیرسون c2 استفاده می کنیم. برای انجام این کار، مقدار تجربی معیار را به عنوان مجموع محاسبه کنید
= ,
جایی که nkو nk,نظریه – به ترتیب فرکانس های تجربی و نظری (نرمال). ارائه نتایج محاسباتی به صورت جدولی راحت است:
جدولمحاسبات تست پیرسون


[xk, xk+ 1) میلی متر

xk، میلی متر

nk، نظریه

ما مقدار بحرانی معیار را با استفاده از جدول پیرسون برای سطح معناداری 0.05 = a و تعداد درجات آزادی خواهیم یافت. د.f. = ک – 1 – r، جایی که ک= 8 - تعداد فواصل سری تغییرات بازه. r= 2 - تعداد پارامترهای توزیع نظری برآورد شده بر اساس داده های نمونه (در این مورد، پارامترها آو s). بدین ترتیب، د.f. = 5. مقدار بحرانی معیار پیرسون crit(a; د.f.) = 11.1. از آنجایی که c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

مشکل 3

جعبه های شکلات به صورت خودکار بسته بندی می شوند. بر اساس طرح نمونه گیری تصادفی غیر تکراری، 130 بسته از 2000 بسته موجود در دسته جمع آوری و داده های زیر در مورد وزن آنها به دست آمد:

برای آزمون این فرضیه که متغیر تصادفی X - وزن بسته ها - طبق قانون نرمال توزیع شده است، باید از معیار پیرسون در سطح معناداری 05/0 a= استفاده شود. یک هیستوگرام از توزیع تجربی و منحنی نرمال مربوطه را روی یک نمودار بسازید.

راه حل

1012,5
= 615,3846

توجه داشته باشید:

در اصل، واریانس نمونه اصلاح شده باید به عنوان واریانس قانون توزیع نرمال در نظر گرفته شود. اما چون تعداد مشاهدات - 130 به اندازه کافی بزرگ است، سپس "معمولی" انجام خواهد شد.
بنابراین، توزیع نرمال نظری به صورت زیر است:

فاصله

[xi ; xi+1]

فرکانس های تجربی

ni

احتمالات
پی

فرکانس های نظری
npi

(ni-npi)2

آزمون آماری

قاعده ای که به موجب آن فرضیه I 0 رد یا پذیرفته می شود نامیده می شود معیار آمارینام معیار، به عنوان یک قاعده، حاوی حرفی است که نشان دهنده یک مشخصه جمع آوری شده خاص از بند 2 الگوریتم آزمایش فرضیه آماری است (به بند 4.1 مراجعه کنید)، محاسبه شده در معیار. تحت شرایط این الگوریتم، معیار نامیده می شود "V-معیار".

هنگام آزمون فرضیه های آماری، دو نوع خطا ممکن است:

  • - خطای نوع I(شما می توانید فرضیه I 0 را زمانی که واقعاً درست باشد رد کنید).
  • - خطای نوع دوم(شما می توانید فرضیه I 0 را بپذیرید در حالی که واقعاً درست نیست).

احتمال آایجاد خطای نوع اول نامیده می شود سطح اهمیت معیار

اگر برای آراحتمال خطای نوع دوم را نشان دهید، سپس (l - R) -احتمال خطا نکردن از نوع دوم که نامیده می شود قدرت معیار

تست خوب بودن تناسب پیرسون x 2

چند نوع فرضیه آماری وجود دارد:

  • - در مورد قانون توزیع؛
  • - همگنی نمونه ها؛
  • - مقادیر عددی پارامترهای توزیع و غیره

فرضیه قانون توزیع را با استفاده از مثال تست نیکویی برازش پیرسون x 2 در نظر خواهیم گرفت.

معیار توافقیک معیار آماری برای آزمایش فرضیه صفر در مورد قانون فرضی یک توزیع مجهول نامیده می شود.

آزمون نیکویی برازت پیرسون مبتنی بر مقایسه فراوانی‌های تجربی (مشاهده‌شده) و نظری مشاهدات محاسبه‌شده با فرض یک قانون توزیع معین است. فرضیه شماره 0 در اینجا به صورت زیر فرموله می شود: با توجه به ویژگی مورد مطالعه، جمعیت به طور نرمال توزیع می شود.

الگوریتم آزمون فرضیه های آماری شماره 0 برای معیار x 1پیرسون:

  • 1) ما فرضیه I 0 را مطرح می کنیم - با توجه به ویژگی مورد مطالعه، جمعیت عمومی به طور معمول توزیع می شود.
  • 2) میانگین نمونه و انحراف معیار نمونه را محاسبه کنید O V;

3) با توجه به حجم نمونه موجود پما یک مشخصه خاص را محاسبه می کنیم،

جایی که: i، فرکانس های تجربی هستند، - فرکانس های نظری،

پ -اندازهی نمونه،

ساعت- اندازه فاصله (تفاوت بین دو گزینه مجاور)،

مقادیر نرمال شده مشخصه مشاهده شده،

- عملکرد جدول همچنین فرکانس های نظری

را می توان با استفاده از تابع استاندارد MS Excel NORMIDIST با استفاده از فرمول محاسبه کرد.

4) با استفاده از توزیع نمونه، مقدار بحرانی یک مشخصه کامپایل شده ویژه را تعیین می کنیم xl P

5) زمانی که فرضیه شماره 0 رد می شود، زمانی که فرضیه شماره 0 پذیرفته می شود.

مثال.بیایید علامت را در نظر بگیریم ایکس- ارزش شاخص های آزمایش برای محکومان در یکی از مستعمرات اصلاح و تربیت برای برخی از ویژگی های روانی، ارائه شده در قالب یک سری تغییرات:

در سطح معناداری 05/0 فرضیه توزیع نرمال جمعیت را مورد آزمون قرار دهید.

1. بر اساس توزیع تجربی، می توان یک فرضیه را مطرح کرد H 0: با توجه به معیار مورد مطالعه «مقدار شاخص آزمون برای یک ویژگی روانشناختی معین»، جمعیت عمومی

انتظار می رود به طور معمول توزیع شود. فرضیه جایگزین 1: با توجه به معیار مورد مطالعه "مقدار شاخص آزمون برای یک ویژگی روانشناختی معین"، جمعیت عمومی محکومان به طور معمول توزیع نشده است.

2. بیایید ویژگی های نمونه عددی را محاسبه کنیم:

فواصل

x g y

ایکس) sch

3. اجازه دهید مشخصه j 2 را محاسبه کنیم. برای انجام این کار، در ستون ماقبل آخر جدول قبلی، فرکانس های نظری را با استفاده از فرمول پیدا می کنیم و در ستون آخر

بیایید ویژگی های % 2 را محاسبه کنیم. ما گرفتیم x 2 = 0,185.

برای وضوح، ما یک چند ضلعی از توزیع تجربی و یک منحنی نرمال بر اساس فرکانس های نظری می سازیم (شکل 6).

برنج. 6.

4. تعداد درجات آزادی را تعیین کنید س: k = 5، t = 2، s = 5-2-1 = 2.

طبق جدول یا با استفاده از تابع استاندارد MS Excel "HI20BR" برای تعداد درجه آزادی 5 = 2 و سطح معنی داری a = 0.05 مقدار بحرانی معیار را خواهیم یافت xl P.=5,99. برای سطح اهمیت آ= 0.01 مقدار معیار بحرانی ایکس٪. = 9,2.

5. ارزش معیار مشاهده شده ایکس 0.185 = کمتر از همه مقادیر یافت شده Hk R.->بنابراین، فرضیه I 0 در هر دو سطح معناداری پذیرفته می شود. اختلاف بین فرکانس های تجربی و نظری ناچیز است. بنابراین، داده‌های مشاهده‌ای با فرضیه توزیع عادی جمعیت مطابقت دارد. بنابراین، با توجه به معیار مورد مطالعه "مقدار شاخص آزمون برای یک ویژگی روانی معین"، جمعیت عمومی محکومان به طور عادی توزیع می شود.

  • 1. Koryachko A.V., Kulichenko A.G. ریاضیات عالی و روش های ریاضی در روانشناسی: راهنمای کلاس های عملی برای دانشجویان دانشکده روانشناسی. ریازان، 1994.
  • 2. Nasledov A.D. روشهای ریاضی تحقیق روانشناختی. تجزیه و تحلیل و تفسیر داده ها: کتاب درسی، راهنما. سن پترزبورگ، 2008.
  • 3. Sidorenko E.V. روشهای پردازش ریاضی در روانشناسی سن پترزبورگ، 2010.
  • 4. سوشنیکوا L.A. تجزیه و تحلیل آماری چند متغیره در اقتصاد: کتاب درسی، راهنما برای دانشگاه ها. م.، 1999.
  • 5. Sukhodolsky E.V. روشهای ریاضی در روانشناسی خارکف، 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. کارگاه تئوری آمار: کتاب درسی، راهنما. م.، 2009.
  • Gmurman V.E. نظریه احتمالات و آمار ریاضی. ص 465.
هدف از معیار χ 2 - معیار پیرسون معیار χ 2 برای دو هدف استفاده می شود: 1) برای مقایسه توزیع تجربی یک مشخصه با ویژگی نظری - یکنواخت، نرمال یا موارد دیگر. 2) مقایسه دو، سه یا چند توزیع تجربی از یک مشخصه. توصیف معیار معیار χ2 به این سوال پاسخ می دهد که آیا مقادیر مختلف یک مشخصه با فرکانس مساوی در توزیع های تجربی و نظری یا در دو یا چند توزیع تجربی رخ می دهد. مزیت روش این است که به فرد امکان می دهد توزیع ویژگی های ارائه شده در هر مقیاس را با شروع از مقیاس نام ها مقایسه کند. در ساده ترین حالت توزیع جایگزین "بله - نه"، "عیب مجاز است - نقص اجازه نمی دهد"، "مشکل را حل کرد - مشکلی را حل نکرد" و غیره، می توانیم از قبل معیار χ 2 را اعمال کنیم. هرچه اختلاف بین دو توزیع مقایسه شده بیشتر باشد، مقدار تجربی χ 2 بیشتر است. محاسبه خودکار χ 2 - معیار پیرسون برای انجام محاسبه خودکار χ 2 - معیار پیرسون باید دو مرحله را انجام دهید: مرحله 1. تعداد توزیع های تجربی (از 1 تا 10) را مشخص کنید. گام 2. فرکانس های تجربی را در جدول وارد کنید. مرحله 3. جواب بگیرید.

مزیت معیار پیرسون جهانی بودن آن است: می توان از آن برای آزمایش فرضیه های مربوط به قوانین توزیع مختلف استفاده کرد.

1. آزمون فرضیه توزیع نرمال.

بگذارید یک نمونه به اندازه کافی بزرگ به دست آید پبا بسیاری از گزینه های معانی مختلف. برای راحتی پردازش آن، فاصله را از کوچکترین تا بزرگ ترین مقدار گزینه به سقسمت های مساوی و فرض می کنیم که مقادیر گزینه هایی که در هر بازه قرار می گیرند تقریباً برابر با عددی است که وسط فاصله را مشخص می کند. با شمارش تعداد گزینه هایی که در هر بازه قرار می گیرند، یک نمونه به اصطلاح گروه بندی شده ایجاد می کنیم:

گزینه ها……….. ایکس 1 ایکس 2 … x s

فرکانس ها…………. پ 1 پ 2 … n s ,

جایی که x iمقادیر نقاط میانی فواصل هستند و n من- تعداد گزینه های موجود در من-فاصله (فرکانس های تجربی).



از داده های به دست آمده می توانید میانگین نمونه و انحراف معیار نمونه را محاسبه کنید σ B. بیایید این فرض را بررسی کنیم که جمعیت بر اساس یک قانون عادی با پارامترها توزیع شده است م(ایکس) = , D(ایکس) = . سپس می توانید تعداد اعداد را از حجم نمونه پیدا کنید پ، که باید در هر بازه تحت این فرض ظاهر شود (یعنی فرکانس های نظری). برای انجام این کار، با استفاده از جدول مقادیر تابع لاپلاس، احتمال ورود به آن را پیدا می کنیم منفاصله ام:

,

جایی که و منو b i- مرزها من-مین فاصله با ضرب احتمالات به دست آمده در حجم نمونه n، بسامدهای نظری را پیدا می کنیم: p i =n·p iهدف ما این است که بسامدهای تجربی و نظری را که البته با یکدیگر متفاوت هستند، مقایسه کنیم و دریابیم که آیا این تفاوت ها ناچیز هستند و فرضیه توزیع نرمال متغیر تصادفی مورد مطالعه را رد نمی کنند یا خیر. آنقدر بزرگ که با این فرضیه در تناقض هستند. برای این منظور از معیاری در قالب متغیر تصادفی استفاده می شود

. (20.1)

معنای آن واضح است: قسمت هایی که مجذور انحراف فرکانس های تجربی از فرکانس های نظری تشکیل می دهند از فرکانس های نظری مربوطه خلاصه می شوند. می توان ثابت کرد که بدون توجه به قانون توزیع واقعی جمعیت، قانون توزیع متغیر تصادفی (20.1) با تعداد درجات آزادی به قانون توزیع گرایش دارد (به درس 12 مراجعه کنید). k = s - 1 – r، جایی که r- تعداد پارامترهای توزیع مورد انتظار برآورد شده از داده های نمونه. بنابراین توزیع نرمال با دو پارامتر مشخص می شود k = s - 3. برای معیار انتخاب شده، یک منطقه بحرانی سمت راست ساخته می شود که با شرط تعیین می شود

(20.2)

جایی که α - سطح اهمیت در نتیجه، منطقه بحرانی توسط نابرابری داده می شود و حوزه پذیرش فرضیه است.

بنابراین، برای آزمایش فرضیه صفر ن 0: جامعه به طور معمول توزیع شده است - شما باید مقدار مشاهده شده معیار را از نمونه محاسبه کنید:

, (20.1`)

و با استفاده از جدول نقاط بحرانی توزیع χ2، نقطه بحرانی را با استفاده از مقادیر شناخته شده α و k = s - 3. اگر - فرض صفر پذیرفته شود، در صورتی که رد شود.

2. آزمون فرضیه توزیع یکنواخت.

هنگام استفاده از آزمون پیرسون برای آزمایش این فرضیه که جمعیت به طور یکنواخت با چگالی احتمال تخمین زده شده توزیع شده است.

لازم است با محاسبه مقدار از نمونه موجود، پارامترها برآورد شوند آو بطبق فرمول های:

جایی که آ*و ب*- ارزیابی ها آو ب. در واقع، برای توزیع یکنواخت م(ایکس) = , ، جایی که می توانید یک سیستم برای تعیین دریافت کنید آ*و ب*: که حل آن عبارات (20.3) است.

سپس با این فرض ، می توانید فرکانس های نظری را با استفاده از فرمول ها پیدا کنید

اینجا س- تعداد فواصل زمانی که نمونه به آنها تقسیم می شود.

مقدار مشاهده شده از معیار پیرسون با استفاده از فرمول (20.1`) و مقدار بحرانی با در نظر گرفتن تعداد درجات آزادی با استفاده از جدول محاسبه می شود. k = s - 3. پس از این، مرزهای منطقه بحرانی به همان روشی که برای آزمایش فرضیه توزیع نرمال تعیین می شود.

3. آزمون فرضیه در مورد توزیع نمایی.

در این حالت، پس از تقسیم نمونه موجود به فواصل با طول مساوی، دنباله ای از گزینه ها را با فاصله مساوی از یکدیگر در نظر می گیریم (فرض می کنیم که همه گزینه هایی که در من- امین بازه، یک مقدار منطبق بر وسط آن و فرکانس های مربوط به آنها را بگیرید n من(تعداد گزینه های نمونه موجود در من- فاصله بین). اجازه دهید از این داده ها محاسبه کنیم و به عنوان تخمینی از پارامتر در نظر بگیریم λ اندازه. سپس فرکانس های نظری با استفاده از فرمول محاسبه می شوند

سپس ارزش مشاهده شده و بحرانی معیار پیرسون با در نظر گرفتن این واقعیت که تعداد درجات آزادی مقایسه می شود. k = s - 2.

یک معیار تناسب برای آزمون یک فرضیه در مورد قانون توزیع متغیر تصادفی مورد مطالعه، در بسیاری از مسائل عملی، قانون توزیع دقیق ناشناخته است، بنابراین، فرضیه ای در مورد مطابقت قانون تجربی موجود مطرح می شود. این فرضیه نیاز به آزمون های آماری دارد که نتایج آن یا تایید یا رد می شود.

فرض کنید X متغیر تصادفی مورد مطالعه باشد. لازم است فرضیه H 0 را آزمایش کنیم که این متغیر تصادفی از قانون توزیع F(x) تبعیت می کند. برای این کار باید نمونه ای از n مشاهدات مستقل تهیه کرد و از آن برای ساخت قانون توزیع تجربی F"(x) استفاده کرد.برای مقایسه قوانین تجربی و فرضی از قاعده ای به نام معیار خوب بودن برازش استفاده می شود. یکی از محبوب‌ترین آن‌ها، تست نیکویی تناسب کای اسکوئر K. Pearson است.

آمار خی دو را محاسبه می کند:

,

که در آن N تعداد بازه هایی است که طبق آنها قانون توزیع تجربی ساخته شده است (تعداد ستون های هیستوگرام مربوطه)، i تعداد بازه است، p t i احتمال سقوط مقدار یک متغیر تصادفی در i است. -مین بازه برای قانون توزیع نظری، p e i احتمال سقوط مقدار یک متغیر تصادفی در بازه i برای قانون توزیع تجربی است. باید از توزیع کای دو تبعیت کند.

اگر مقدار محاسبه شده آماره بیش از چندک توزیع کای دو با درجه آزادی k-p-1 برای سطح معنی داری معین باشد، فرضیه H 0 رد می شود، در غیر این صورت، در سطح معناداری داده شده پذیرفته می شود. تعداد مشاهدات، p تعداد پارامترهای تخمینی قانون توزیع است.

پیرسون به شما امکان می دهد توزیع های تجربی و نظری (یا سایر تجربیات) یک مشخصه را بررسی کنید. این معیار عمدتاً در دو مورد اعمال می شود:

برای مقایسه توزیع تجربی یک مشخصه با توزیع نظری (عادی، نمایی، یکنواخت یا قانون دیگری).

برای مقایسه دو توزیع تجربی از یک ویژگی.

ایده روش تعیین درجه اختلاف بین فرکانس های مربوطه n i و ; هر چه اختلاف بیشتر باشد، ارزش آن بیشتر است

اندازه نمونه باید حداقل 50 باشد و مجموع فرکانس ها باید برابر باشد

فرضیه صفر H 0 = (دو توزیع عملاً با یکدیگر تفاوت ندارند). فرضیه جایگزین - H 1 = (اختلاف بین توزیع ها معنی دار است).

در اینجا نموداری برای اعمال معیار برای مقایسه دو توزیع تجربی آورده شده است:

معیار - یک معیار آماری برای آزمایش این فرضیه که متغیر تصادفی مشاهده شده از قانون توزیع نظری تبعیت می کند.


بسته به ارزش معیار، فرضیه را می توان پذیرفت یا رد کرد:

§ ، فرضیه محقق می شود.

§ (به سمت چپ "دم" توزیع می افتد). بنابراین، ارزش های نظری و عملی بسیار نزدیک هستند. به عنوان مثال، اگر یک مولد اعداد تصادفی در حال آزمایش باشد که n عدد از یک قطعه تولید کرده باشد و فرضیه این باشد: نمونه به طور یکنواخت در توزیع شده است، آنگاه نمی توان مولد را تصادفی نامید (فرضیه تصادفی برآورده نمی شود)، زیرا نمونه بیش از حد یکنواخت توزیع شده است، اما این فرضیه درست است.

§ (به سمت راست "دم" توزیع می افتد) فرضیه رد می شود.

تعریف: اجازه دهید یک متغیر تصادفی X داده شود.

فرضیه: با. V. X از قانون توزیع تبعیت می کند.

برای آزمون فرضیه، نمونه ای متشکل از n مشاهدات مستقل r.v را در نظر بگیرید. ایکس: . بر اساس نمونه، توزیع تجربی r.v. را در X خواهیم ساخت. مقایسه توزیع تجربی و نظری (مورد فرض در فرضیه) با استفاده از یک تابع انتخاب شده ویژه - معیار خوب بودن برازش - انجام می‌شود. معیار مناسب بودن پیرسون (معیار) را در نظر بگیرید:

فرضیه: X n توسط تابع تولید می شود.

به k فواصل ناهمگون تقسیم کنید ;

تعداد مشاهدات در بازه j را در نظر بگیرید: ;

احتمال قرار گرفتن یک مشاهده در بازه j ام زمانی که فرضیه محقق می شود.

- تعداد مورد انتظار بازدید در بازه j-ام.

آمار: - توزیع Chi-square با k-1 درجه آزادی.

این معیار در نمونه هایی با رویدادهای کم بسامد (نادر) خطا ایجاد می کند.این مشکل را می توان با کنار گذاشتن رویدادهای فرکانس پایین یا ترکیب آنها با رویدادهای دیگر حل کرد.به این روش تصحیح یتس می گویند.

آزمون نیکویی تناسب پیرسون (χ2) برای آزمایش این فرضیه استفاده می‌شود که توزیع تجربی با توزیع نظری مورد انتظار F(x) با حجم نمونه بزرگ (n≥ 100) مطابقت دارد. این معیار برای هر نوع تابع F(x) قابل اجرا است، حتی با مقادیر ناشناخته پارامترهای آنها، که معمولاً هنگام تجزیه و تحلیل نتایج آزمایش های مکانیکی رخ می دهد. این همه کاره بودن آن است.

استفاده از معیار χ2 شامل تقسیم دامنه تغییرات نمونه به فواصل و تعیین تعداد مشاهدات (فرکانس) n j برای هر یک از هفواصل برای راحتی تخمین پارامترهای توزیع، فواصل با طول یکسان انتخاب می شوند.

تعداد فواصل به حجم نمونه بستگی دارد. معمولاً پذیرفته می شود: در n = 100 ه= 10 ÷ 15، با n = 200 ه= 15 ÷ 20، با n = 400 ه= 25 ÷ 30، با n = 1000 ه= 35 ÷ 40.

فواصل حاوی کمتر از پنج مشاهده با مشاهدات همسایه ترکیب می شوند. با این حال، اگر تعداد این فواصل کمتر از 20٪ از تعداد کل آنها باشد، فواصل با فرکانس n j ≥ 2 مجاز است.

آماره معیار پیرسون مقدار است
, (3.91)
که در آن pj احتمال قرار گرفتن متغیر تصادفی مورد مطالعه در بازه j است که مطابق با قانون توزیع فرضی F(x) محاسبه می شود. هنگام محاسبه احتمال p j، باید در نظر داشته باشید که مرز سمت چپ اولین بازه و مرز سمت راست آخرین بازه باید با مرزهای ناحیه مقادیر ممکن متغیر تصادفی منطبق باشد. برای مثال، با یک متغیر تصادفی توزیع نرمال، اولین بازه به -∞ و آخرین بازه به +∞ گسترش می یابد.

فرضیه صفر در مورد مطابقت توزیع نمونه با قانون نظری F(x) با مقایسه مقدار محاسبه شده با استفاده از فرمول (3.91) با مقدار بحرانی χ 2 α یافت شده از جدول بررسی می شود. برنامه های VI برای سطح اهمیت α و تعداد درجات آزادی k = ه 1 - m - 1. اینجا ه 1 - تعداد فواصل پس از ادغام. m تعداد پارامترهای برآورد شده از نمونه مورد بررسی است. اگر نابرابری برآورده شود
χ 2 ≤ χ 2 α (3.92)
اگر نابرابری مشخص شده برآورده نشود، فرضیه جایگزینی پذیرفته می شود که نمونه متعلق به توزیع ناشناخته است.

عیب آزمون تناسب پیرسون از دست دادن بخشی از اطلاعات اولیه مرتبط با نیاز به گروه بندی نتایج مشاهدات در فواصل زمانی و ترکیب فواصل فردی با تعداد کمی از مشاهدات است که در این راستا توصیه می شود تکمیل شود. بررسی انطباق توزیع ها با استفاده از معیار χ 2 با سایر معیارها.این امر به ویژه در نمونه های حجم نسبتاً کوچک (n≈ 100) ضروری است.

جدول مقادیر بحرانی توزیع کای دو را با تعداد درجات آزادی مشخص نشان می دهد.مقدار مورد نظر در تقاطع ستون با مقدار احتمال مربوطه و ردیف با تعداد درجه آزادی قرار دارد. به عنوان مثال، مقدار بحرانی کای دو توزیع با 4 درجه آزادی برای احتمال 0.25، 5.38527 است. این بدان معناست که مساحت زیر منحنی چگالی مجذور کای با 4 درجه آزادی در سمت راست مقدار 5.38527 برابر با 0.25 است.

ODAمعیار آزمون فرضیه در مورد قانون مفروض توزیع مجهول را معیار خوب بودن برازش می نامند.

چندین تست خوب بودن وجود دارد: $\chi ^2$ (chi-square) توسط K. Pearson، Kolmogorov، Smirnov و غیره.

به طور معمول، فرکانس نظری و تجربی متفاوت است. مورد اختلاف ممکن است تصادفی نباشد، به این معنی که با این واقعیت توضیح داده می شود که فرضیه به درستی انتخاب نشده است. معیار پیرسون به سؤال مطرح شده پاسخ می دهد، اما مانند هر معیاری چیزی را ثابت نمی کند، بلکه تنها موافقت یا عدم موافقت خود را با داده های مشاهده ای در سطح معناداری پذیرفته شده نشان می دهد.

ODAیک احتمال به اندازه کافی کوچک که در آن یک رویداد عملاً غیرممکن تلقی شود، سطح اهمیت نامیده می شود.

در عمل، سطوح معنی‌داری معمولاً بین 0.01 و 0.05 در نظر گرفته می‌شوند، $\alpha =0.05$ سطح معنی‌داری $5 (% ) $ است.

به عنوان معیاری برای آزمایش فرضیه، مقدار \begin(معادله) \label (eq1) \chi ^2=\sum ( \frac (((n_i -n_i"))^2) (n_i") را در نظر می گیریم. \qquad (1) \ پایان (معادله)

در اینجا $n_i -$ فرکانس های تجربی به دست آمده از نمونه، $n_i" -$ فرکانس های نظری به صورت نظری یافت می شوند.

ثابت شده است که برای $n\to \infty $، قانون توزیع متغیر تصادفی (1)، صرف نظر از قانونی که جمعیت توسط آن توزیع می‌شود، به قانون $\chi ^2$ تمایل دارد (chi-square) با درجه آزادی $k$.

ODAتعداد درجات آزادی با برابری $k=S-1-r$ که $S-$ تعداد گروه های بازه ای است، $r-$ تعداد پارامترها است.

1) توزیع یکنواخت: $r=2، k=S-3 $

2) توزیع نرمال: $r=2، k=S-3 $

3) توزیع نمایی: $r=1، k=S-2$.

قانون . آزمون فرضیه با استفاده از آزمون پیرسون.

  1. برای آزمایش فرضیه، فرکانس های نظری را محاسبه کرده و $\chi _ ( obs ) ^2 =\sum ( \frac ( ( ( n_i -n_i " ))^2 ) ( n_i " ) ) $ را پیدا کنید.
  2. استفاده از جدول نقاط بحرانی توزیع $\chi ^2$ برای سطح معنی‌داری معین $\alpha $ و تعداد درجات آزادی $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ پیدا شد.
  3. اگر $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

اظهار نظربرای کنترل محاسبات، از فرمول $\chi ^2$ به شکل $\chi _ (مشاهده شده) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $ استفاده کنید

آزمون فرضیه توزیع یکنواخت

تابع چگالی توزیع یکنواخت کمیت $X$ به شکل $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ (a,b )\right]$ است.

برای آزمایش این فرضیه که یک متغیر تصادفی پیوسته بر اساس یک قانون یکنواخت در سطح معناداری $\alpha $ توزیع شده است، لازم است:

1) میانگین نمونه $\overline ( x_b ) $ و $\sigma _b =\sqrt (D_b) $ را از یک توزیع تجربی مشخص پیدا کنید. مقادیر را به عنوان تخمینی از پارامترهای $a$ و $b$ در نظر بگیرید

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) احتمال سقوط یک متغیر تصادفی $X$ را در بازه های جزئی $(( x_i ,x_ ( i+1 ) ))$ با استفاده از فرمول $ P_i =P(( x_i) پیدا کنید.

3) فرکانس های نظری (همسطح) را با استفاده از فرمول $n_i" =np_i $ پیدا کنید.

4) با گرفتن تعداد درجات آزادی $k=S-3$ و سطح معناداری $\alpha =0.05$ از جداول $\chi ^2$، $\chi _ ( cr ) ^2 $ را برای داده شده پیدا می کنیم. $\alpha $ و $k$، $\chi _ ( kr ) ^2 (( \alpha ,k ))$.

5) با استفاده از فرمول $\chi _ (مشاهده) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) (n_i" ) ) $ که در آن $n_i -$ فرکانس های تجربی هستند، ما مقدار مشاهده شده $\ chi _ ( obs ) ^2 $.

6) اگر $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

بیایید با استفاده از مثال خود فرضیه را آزمایش کنیم.

1) $\overline x _b =13.00\,\,\sigma _b =\sqrt (D_b) = 6.51$

2) $a=13.00-\sqrt 3 \cdot 6.51=13.00-1.732\cdot 6.51=1.72468$

$b=13.00+1.732\cdot 6.51=24.27532$

$b-a=24.27532-1.72468=22.55064$

3) $P_i =P(( x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

در توزیع یکنواخت، اگر طول بازه یکسان باشد، $P_i -$ یکسان است.

4) $n_i" =np_i $ را پیدا کنید.

5) $\sum ( \frac ( ( ( n_i -n_i " ))^2 ) ( n_i" ) ) $ را پیدا کنید و $\chi _ ( obs ) ^2 $ را پیدا کنید.

بیایید تمام مقادیر به دست آمده را در جدول وارد کنیم

\begin(آرایه) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i" ))^2& \frac ( (( n_i -n_i" ))^2) (n_i") و کنترل~ \frac (n_i^2) (n_i") \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.6509898& 11.7950& 2.6509898 6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 2.05744& 0.471463& 0.471463 & 0.471463&4. 8& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 5 & 6 & 4.43438 & 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438 &1.56562&2, 45117& 0.552765& 8.11838 & 8.11838 = 2 & 3 & h. 119& \چی _ ( obs ) ^2 =\sum ( \frac (n_i^2) (n_i") -n) =3.63985 \\ \hline \end(آرایه)

$\chi _ ( cr ) ^2 (( 0.05.3 ))=7.8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

نتیجهدلیلی برای رد این فرضیه وجود ندارد.

دسته بندی ها

مقالات محبوب

2023 "kingad.ru" - بررسی سونوگرافی اندام های انسان