از آنجایی که متغیر جدید به طور معمول توزیع شده است، مرزهای پایین و بالای فاصله اطمینان 95% برای متغیر φ φ-1.96 و φ+1.96 چپ خواهد بود">

به جای 1.96 برای نمونه های کوچک، توصیه می شود مقدار t را جایگزین N - 1 درجه آزادی کنید. این روش مقادیر منفی نمی دهد و به شما امکان می دهد فواصل اطمینان را برای فرکانس ها با دقت بیشتری نسبت به روش Wald تخمین بزنید. علاوه بر این، در بسیاری از کتب مرجع داخلی در مورد آمار پزشکی توضیح داده شده است، که با این حال، منجر به استفاده گسترده از آن در تحقیقات پزشکی نشد. محاسبه فواصل اطمینان با استفاده از تبدیل زاویه برای فرکانس های نزدیک به 0 یا 1 توصیه نمی شود.

اینجاست که معمولاً شرح روش‌های تخمین فواصل اطمینان در اکثر کتاب‌های مبانی آمار برای محققان پزشکی به پایان می‌رسد و این مشکل نه تنها برای ادبیات داخلی، بلکه برای ادبیات خارجی نیز معمول است. هر دو روش بر اساس قضیه حد مرکزی هستند که شامل یک نمونه بزرگ است.

با توجه به کاستی های برآورد فواصل اطمینان با استفاده از روش های فوق، کلپر (کلاپر) و پیرسون (پیرسون) در سال 1934 روشی را برای محاسبه فاصله اطمینان دقیق با در نظر گرفتن توزیع دو جمله ای صفت مورد مطالعه پیشنهاد کردند. این روش در بسیاری از ماشین‌حساب‌های آنلاین موجود است، با این حال، فواصل اطمینان به‌دست‌آمده از این طریق در بیشتر موارد بسیار گسترده است. در عین حال، این روش برای استفاده در مواردی که نیاز به تخمین محافظه کارانه است، توصیه می شود. درجه محافظه کاری روش با کاهش حجم نمونه افزایش می یابد، به ویژه برای N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

به گفته بسیاری از آماردانان، بهینه ترین برآورد فواصل اطمینان برای فرکانس ها با روش ویلسون انجام می شود، که در سال 1927 ارائه شد، اما عملاً در تحقیقات زیست پزشکی داخلی استفاده نمی شود. این روش نه تنها تخمین فواصل اطمینان را برای فرکانس های بسیار کوچک و بسیار بالا ممکن می سازد، بلکه برای تعداد کمی از مشاهدات نیز قابل استفاده است. به طور کلی فاصله اطمینان طبق فرمول ویلسون دارای شکل از است

احتمال فاصله اطمینان چقدر است. فاصله اطمینان

ذهن فقط در دانش نیست، بلکه در توانایی به کارگیری دانش در عمل نیز هست. (ارسطو)

فاصله اطمینان

بررسی کلی

با نمونه برداری از جامعه، تخمین نقطه ای پارامتر مورد علاقه خود را به دست می آوریم و خطای استاندارد را محاسبه می کنیم تا صحت برآورد را نشان دهیم.

با این حال، برای اکثر موارد، خطای استاندارد به عنوان چنین قابل قبول نیست. ترکیب این اندازه گیری دقت با تخمین فاصله ای برای پارامتر جمعیت بسیار مفیدتر است.

این را می توان با استفاده از دانش توزیع احتمال نظری آماره نمونه (پارامتر) به منظور محاسبه فاصله اطمینان (CI - فاصله اطمینان، CI - فاصله اطمینان) برای پارامتر انجام داد.

به طور کلی، فاصله اطمینان تخمین ها را در هر دو جهت با چند برابر خطای استاندارد (یک پارامتر معین) گسترش می دهد. دو مقدار (محدودیت اطمینان) که فاصله را مشخص می کنند معمولاً با کاما از هم جدا می شوند و در پرانتز قرار می گیرند.

فاصله اطمینان برای میانگین

با استفاده از توزیع نرمال

اگر حجم نمونه بزرگ باشد میانگین نمونه دارای توزیع نرمال است، بنابراین دانش توزیع نرمال را می توان هنگام در نظر گرفتن میانگین نمونه به کار برد.

به طور خاص، 95 درصد از توزیع میانگین نمونه در 1.96 انحراف استاندارد (SD) از میانگین جامعه است.

وقتی فقط یک نمونه داریم، آن را خطای استاندارد میانگین (SEM) می نامیم و فاصله اطمینان 95% را برای میانگین به صورت زیر محاسبه می کنیم:

اگر این آزمایش چندین بار تکرار شود، این فاصله شامل جمعیت واقعی 95 درصد مواقع خواهد بود.

این معمولاً یک فاصله اطمینان است، مانند محدوده مقادیری که در آن میانگین جمعیت واقعی (میانگین عمومی) با سطح اطمینان 95٪ قرار دارد.

اگرچه تفسیر فاصله اطمینان به این روش کاملاً سخت نیست (میانگین جمعیت یک مقدار ثابت است و بنابراین نمی تواند احتمال مرتبط با آن را داشته باشد) اما از نظر مفهومی درک آن آسان تر است.

استفاده t-توزیع

اگر مقدار واریانس در جامعه را بدانید می توانید از توزیع نرمال استفاده کنید. همچنین، زمانی که حجم نمونه کوچک است، در صورتی که داده های زیربنایی جامعه به طور نرمال توزیع شوند، میانگین نمونه از توزیع نرمال پیروی می کند.

اگر داده‌های زیربنایی جامعه به طور معمول توزیع نشده باشند و/یا واریانس عمومی (واریانس جمعیت) ناشناخته باشد، میانگین نمونه مطابقت دارد. توزیع تی دانشجویی.

فاصله اطمینان 95% را برای میانگین جمعیت به صورت زیر محاسبه کنید:

کجا - نقطه درصد (درصد) t-توزیع دانش آموز با (n-1) درجه آزادی، که احتمال دو دنباله 0.05 را می دهد.

به طور کلی، فاصله وسیع تری نسبت به زمانی که از توزیع نرمال استفاده می شود، فراهم می کند، زیرا عدم قطعیت اضافی را که با تخمین انحراف استاندارد جامعه و/یا به دلیل حجم نمونه کوچک ایجاد می شود، در نظر می گیرد.

هنگامی که حجم نمونه بزرگ است (از مرتبه 100 یا بیشتر)، تفاوت بین دو توزیع ( t-studentو عادی) ناچیز است. با این حال، همیشه استفاده کنید t-توزیع هنگام محاسبه فواصل اطمینان، حتی اگر حجم نمونه بزرگ باشد.

معمولاً 95٪ CI نشان داده شده است. سایر فواصل اطمینان را می توان محاسبه کرد، مانند 99٪ CI برای میانگین.

به جای حاصل ضرب خطای استاندارد و مقدار جدول t-توزیعی که مربوط به احتمال دو دنباله 0.05 است، آن را ضرب کنید (خطای استاندارد) در مقداری که مربوط به احتمال دو دنباله 0.01 است. این یک فاصله اطمینان گسترده‌تر از مورد 95 درصد است، زیرا نشان‌دهنده افزایش اطمینان است که این فاصله واقعاً میانگین جمعیت را نیز شامل می‌شود.

فاصله اطمینان برای نسبت

توزیع نمونه گیری نسبت ها دارای توزیع دوجمله ای است. با این حال، اگر حجم نمونه nنسبتاً بزرگ است، پس توزیع نسبت نمونه تقریباً نرمال با میانگین است.

برآورد با نسبت نمونه گیری p=r/n(جایی که r- تعداد افراد در نمونه با ویژگی های مورد علاقه ما) و خطای استاندارد تخمین زده می شود:

فاصله اطمینان 95 درصد برای نسبت تخمین زده می شود:

اگر حجم نمونه کوچک باشد (معمولاً زمانی که npیا n (1-p)کمتر 5 ، سپس باید از توزیع دو جمله ای برای محاسبه فواصل اطمینان دقیق استفاده شود.

توجه داشته باشید که اگر پسپس به صورت درصد بیان می شود (1-p)جایگزین توسط (100p).

تفسیر فواصل اطمینان

هنگام تفسیر فاصله اطمینان، ما به سؤالات زیر علاقه مند هستیم:

فاصله اطمینان چقدر است؟

فاصله اطمینان گسترده نشان می دهد که برآورد نادقیق است. باریک نشان دهنده یک تخمین خوب است.

عرض فاصله اطمینان به اندازه خطای استاندارد بستگی دارد که به نوبه خود به حجم نمونه بستگی دارد و هنگام در نظر گرفتن یک متغیر عددی از متغیر بودن داده ها، فواصل اطمینان وسیع تری نسبت به مطالعات یک مجموعه داده بزرگ ارائه می دهد. از چند متغیر

آیا CI ارزش خاصی را شامل می شود؟

می توانید بررسی کنید که آیا مقدار احتمالی پارامتر جمعیت در یک بازه اطمینان قرار می گیرد یا خیر. اگر بله، پس نتایج با این مقدار احتمالی سازگار است. اگر نه، پس بعید است (برای فاصله اطمینان 95٪، شانس تقریباً 5٪ است) که پارامتر این مقدار را داشته باشد.

"Katren-Style" به انتشار چرخه ای از کنستانتین کراوچیک در مورد آمار پزشکی ادامه می دهد. در دو مقاله قبلی، نویسنده به توضیح مفاهیمی مانند و.

کنستانتین کراوچیک

ریاضیدان - تحلیلگر. متخصص در زمینه تحقیقات آماری در پزشکی و علوم انسانی

شهر مسکو

اغلب در مقالات مربوط به آزمایشات بالینی می توانید یک عبارت مرموز را پیدا کنید: "فاصله اطمینان" (95٪ CI یا 95٪ CI - فاصله اطمینان). به عنوان مثال، یک مقاله ممکن است بگوید: "آزمون t-Student برای ارزیابی اهمیت تفاوت ها با فاصله اطمینان 95٪ محاسبه شده استفاده شد."

ارزش «فاصله اطمینان 95 درصد» چیست و چرا محاسبه می شود؟

فاصله اطمینان چیست؟ - این محدوده ای است که مقادیر میانگین واقعی در جمعیت در آن قرار می گیرند. و چه، میانگین های "غیر واقعی" وجود دارد؟ به یک معنا، بله، آنها انجام می دهند. در توضیح دادیم که اندازه‌گیری پارامتر مورد علاقه در کل جمعیت غیرممکن است، بنابراین محققان به نمونه محدودی بسنده می‌کنند. در این نمونه (مثلاً بر اساس وزن بدن) یک مقدار متوسط ​​(وزن معین) وجود دارد که بر اساس آن مقدار میانگین را در کل جمعیت عمومی قضاوت می کنیم. با این حال، بعید است که میانگین وزن در نمونه (به ویژه نمونه کوچک) با میانگین وزن در جمعیت عمومی مطابقت داشته باشد. بنابراین، محاسبه و استفاده از دامنه مقادیر متوسط ​​​​جمعیت عمومی صحیح تر است.

برای مثال، فرض کنید فاصله اطمینان 95% (95% CI) برای هموگلوبین بین 110 تا 122 گرم در لیتر باشد. این بدان معنی است که با احتمال 95٪، مقدار میانگین واقعی هموگلوبین در جمعیت عمومی در محدوده 110 تا 122 گرم در لیتر خواهد بود. به عبارت دیگر، ما میانگین هموگلوبین را در جمعیت عمومی نمی‌دانیم، اما می‌توانیم محدوده مقادیر این ویژگی را با احتمال 95 درصد نشان دهیم.

فواصل اطمینان به ویژه به تفاوت میانگین بین گروه ها یا آنچه اندازه اثر نامیده می شود مربوط می شود.

فرض کنید اثربخشی دو فرآورده آهن را با هم مقایسه کردیم: یکی که مدت زیادی در بازار بوده و دیگری که به تازگی ثبت شده است. پس از طی دوره درمان، غلظت هموگلوبین در گروه های مورد مطالعه از بیماران بررسی شد و برنامه آماری برای ما محاسبه کرد که تفاوت بین مقادیر میانگین دو گروه با احتمال 95 درصد در محدوده 1.72 تا 14.36 گرم در لیتر (جدول 1).

Tab. 1. معیار برای نمونه های مستقل
(گروه ها بر اساس سطح هموگلوبین مقایسه می شوند)

این باید به شرح زیر تفسیر شود: در بخشی از بیماران در جمعیت عمومی که یک داروی جدید مصرف می کنند، هموگلوبین به طور متوسط ​​1.72-14.36 گرم در لیتر نسبت به افرادی که یک داروی شناخته شده مصرف کرده اند بالاتر خواهد بود.

به عبارت دیگر، در جمعیت عمومی، تفاوت میانگین مقادیر هموگلوبین در گروه‌های با احتمال 95 درصد در این حدود است. این بر عهده محقق خواهد بود که قضاوت کند که آیا این مقدار زیاد است یا کم. نکته همه اینها این است که ما با یک مقدار متوسط ​​کار نمی کنیم، بلکه با طیفی از مقادیر کار می کنیم، بنابراین، ما با اطمینان بیشتری تفاوت یک پارامتر را بین گروه ها تخمین می زنیم.

در بسته های آماری به صلاحدید محقق می توان به طور مستقل مرزهای فاصله اطمینان را محدود یا گسترش داد. با کاهش احتمالات فاصله اطمینان، دامنه میانگین ها را محدود می کنیم. برای مثال، در 90% CI، دامنه میانگین ها (یا تفاوت های میانگین) باریک تر از 95% CI خواهد بود.

برعکس، افزایش احتمال به 99٪ دامنه مقادیر را گسترش می دهد. هنگام مقایسه گروه ها، حد پایین CI ممکن است از علامت صفر عبور کند. به عنوان مثال، اگر مرزهای فاصله اطمینان را تا 99 % افزایش دهیم، مرزهای بازه از 1- تا 16 گرم در لیتر متغیر است. به این معنی که در جمعیت عمومی گروه هایی وجود دارد که اختلاف میانگین بین آنها برای صفت مورد مطالعه 0 (M=0) است.

برای آزمون فرضیه های آماری می توان از فواصل اطمینان استفاده کرد. اگر فاصله اطمینان از مقدار صفر عبور کند، فرضیه صفر، که فرض می کند گروه ها در پارامتر مورد مطالعه تفاوتی ندارند، درست است. یک مثال در بالا توضیح داده شده است، زمانی که ما مرزها را تا 99٪ گسترش دادیم. در جایی از جمعیت عمومی، گروه هایی را یافتیم که به هیچ وجه با هم تفاوت نداشتند.

95% فاصله اطمینان اختلاف در هموگلوبین، (g/l)


شکل، فاصله اطمینان 95% اختلاف میانگین هموگلوبین بین دو گروه را به صورت خطی نشان می دهد. خط از علامت صفر عبور می کند، بنابراین بین میانگین ها برابر با صفر تفاوت وجود دارد که فرضیه صفر مبنی بر عدم تفاوت گروه ها را تأیید می کند. تفاوت بین گروه ها بین 2- تا 5 گرم در لیتر است، به این معنی که هموگلوبین می تواند 2 گرم در لیتر کاهش یا 5 گرم در لیتر افزایش یابد.

فاصله اطمینان یک شاخص بسیار مهم است. با تشکر از آن، می توانید ببینید که آیا تفاوت در گروه ها واقعا به دلیل تفاوت در میانگین بوده است یا به دلیل یک نمونه بزرگ، زیرا با یک نمونه بزرگ، شانس پیدا کردن تفاوت بیشتر از نمونه کوچک است.

در عمل، ممکن است به این شکل باشد. ما از 1000 نفر نمونه گرفتیم، سطح هموگلوبین را اندازه گیری کردیم و دریافتیم که فاصله اطمینان برای تفاوت میانگین ها از 1.2 تا 1.5 گرم در لیتر است. سطح معناداری آماری در این مورد ص

می بینیم که غلظت هموگلوبین افزایش یافته است، اما تقریباً به طور نامحسوس، بنابراین، اهمیت آماری دقیقاً به دلیل حجم نمونه ظاهر شد.

فواصل اطمینان را می توان نه تنها برای میانگین ها، بلکه برای نسبت ها (و نسبت های ریسک) نیز محاسبه کرد. به عنوان مثال، ما علاقه مند به فاصله اطمینان نسبت بیمارانی هستیم که در حین مصرف داروی توسعه یافته بهبود یافته اند. فرض کنید که 95% CI برای نسبت‌ها، یعنی نسبت چنین بیمارانی، در محدوده 0.60-0.80 است. بنابراین می توان گفت که داروی ما در 60 تا 80 درصد موارد اثر درمانی دارد.

هر نمونه فقط یک تصور تقریبی از جامعه عمومی به دست می دهد و تمام ویژگی های آماری نمونه (میانگین، حالت، واریانس ...) تقریبی یا می گویند تخمینی از پارامترهای کلی است که در اکثر موارد به دلیل وجود آن قابل محاسبه نیست. عدم دسترسی عموم مردم (شکل 20).

شکل 20. خطای نمونه گیری

اما می توانید بازه ای را مشخص کنید که با درجه ای از احتمال، مقدار واقعی (عمومی) مشخصه آماری در آن قرار دارد. این فاصله نامیده می شود د فاصله اطمینان (CI).

بنابراین میانگین کلی با احتمال 95٪ در داخل قرار دارد

از تا، (20)

جایی که تی - مقدار جدولی معیار دانشجویی برای α =0.05 و f= n-1

را می توان یافت و 99٪ CI، در این مورد تی انتخاب شده برای α =0,01.

اهمیت عملی فاصله اطمینان چیست؟

    فاصله اطمینان گسترده نشان می دهد که میانگین نمونه به طور دقیق میانگین جامعه را منعکس نمی کند. این معمولاً به دلیل حجم نمونه ناکافی یا ناهمگونی آن است. پراکندگی بزرگ هر دو یک خطای بزرگ در میانگین و بر این اساس، یک CI گسترده تر می دهند. و این دلیلی است برای بازگشت به مرحله برنامه ریزی تحقیق.

    حد بالا و پایین CI ارزیابی می کند که آیا نتایج از نظر بالینی قابل توجه هستند یا خیر

اجازه دهید با جزئیات بیشتری در مورد اهمیت آماری و بالینی نتایج مطالعه خواص گروه صحبت کنیم. به یاد بیاورید که وظیفه آمار تشخیص حداقل برخی از تفاوت ها در جمعیت های عمومی بر اساس داده های نمونه است. این وظیفه پزشک است که چنین تفاوت هایی (نه هیچ کدام) را پیدا کند که به تشخیص یا درمان کمک کند. و همیشه نتیجه گیری های آماری مبنای نتایج بالینی نیستند. بنابراین، کاهش معنی دار آماری هموگلوبین به میزان 3 گرم در لیتر، جای نگرانی نیست. و برعکس، اگر مشکلی در بدن انسان دارای ویژگی توده ای در سطح کل جمعیت نباشد، این دلیلی برای عدم پرداختن به این مشکل نیست.

ما این موقعیت را در نظر خواهیم گرفت مثال.

محققان این سوال را مطرح کردند که آیا پسرانی که به نوعی بیماری عفونی مبتلا هستند از نظر رشد از همسالان خود عقب‌تر هستند. برای این منظور یک مطالعه انتخابی انجام شد که در آن 10 پسر مبتلا به این بیماری شرکت کردند. نتایج در جدول 23 ارائه شده است.

جدول 23. نتایج آماری

حد پایین

حد بالا

مشخصات (سانتی متر)

وسط

از این محاسبات چنین استنباط می شود که میانگین قد انتخابی پسران 10 ساله ای که به نوعی بیماری عفونی مبتلا بوده اند نزدیک به نرمال (132.5 سانتی متر) است. با این حال، حد پایین فاصله اطمینان (126.6 سانتی متر) نشان می دهد که احتمال 95٪ وجود دارد که میانگین قد واقعی این کودکان با مفهوم "کوتاه قد" مطابقت دارد. این بچه ها کوتاه قدی هستند

در این مثال، نتایج محاسبات فاصله اطمینان از نظر بالینی قابل توجه است.

فواصل اطمینان برای فرکانس ها و قطعات

© 2008

موسسه ملی بهداشت عمومی، اسلو، نروژ

این مقاله محاسبه فواصل اطمینان برای فرکانس‌ها و نسبت‌ها را با استفاده از روش‌های Wald، Wilson، Klopper-Pearson، با استفاده از تبدیل زاویه‌ای و روش Wald با تصحیح Agresti-Cowll توصیف و بحث می‌کند. مطالب ارائه شده اطلاعات کلی در مورد روش های محاسبه فواصل اطمینان برای فرکانس ها و نسبت ها ارائه می دهد و قصد دارد علاقه خوانندگان مجله را نه تنها در استفاده از فواصل اطمینان هنگام ارائه نتایج تحقیقات خود، بلکه در مطالعه ادبیات تخصصی قبل از شروع مطالعه برانگیزد. روی انتشارات آینده کار کنید

کلید واژه ها: فاصله اطمینان، فرکانس، نسبت

در یکی از نشریات قبلی، شرح داده های کیفی به اختصار ذکر شد و گزارش شد که برآورد فاصله زمانی آنها برای توصیف فراوانی وقوع مشخصه مورد مطالعه در جمعیت عمومی، ارجحیت دارد. در واقع، از آنجایی که مطالعات با استفاده از داده‌های نمونه انجام می‌شوند، پیش‌بینی نتایج بر روی جمعیت عمومی باید دارای عنصری از عدم دقت در برآورد نمونه باشد. فاصله اطمینان اندازه گیری دقت پارامتر برآورد شده است. جالب است که در برخی از کتاب های مبانی آمار برای پزشکان، موضوع فواصل اطمینان برای فرکانس ها کاملا نادیده گرفته شده است. در این مقاله چندین روش برای محاسبه فواصل اطمینان برای فرکانس ها با فرض ویژگی های نمونه مانند عدم تکرار و بازنمایی و همچنین مستقل بودن مشاهدات از یکدیگر در نظر خواهیم گرفت. فراوانی در این مقاله به عنوان یک عدد مطلق که نشان می دهد چند بار این یا آن مقدار در مجموع رخ می دهد درک نمی شود، بلکه یک مقدار نسبی است که نسبت شرکت کنندگان در مطالعه را که دارای ویژگی مورد مطالعه هستند، تعیین می کند.

در تحقیقات زیست پزشکی، از فواصل اطمینان 95 درصد بیشتر استفاده می شود. این فاصله اطمینان منطقه ای است که نسبت واقعی در 95٪ مواقع در آن قرار می گیرد. به عبارت دیگر می توان با اطمینان 95 درصد گفت که مقدار واقعی فراوانی وقوع یک صفت در جمعیت عمومی در فاصله اطمینان 95 درصد خواهد بود.

اکثر کتاب های درسی آماری برای محققان پزشکی گزارش می دهند که خطای فرکانس با استفاده از فرمول محاسبه می شود

که در آن p فراوانی وقوع ویژگی در نمونه است (مقدار از 0 تا 1). در اکثر مقالات علمی داخلی، مقدار فراوانی وقوع یک ویژگی در نمونه (p) و همچنین خطای آن (s) به صورت p ± s نشان داده شده است. با این حال، ارائه یک فاصله اطمینان 95% برای فراوانی وقوع یک صفت در جمعیت عمومی، که شامل مقادیری از

قبل از.

در برخی از کتاب های درسی برای نمونه های کوچک توصیه می شود که مقدار 1.96 را با مقدار t برای N - 1 درجه آزادی جایگزین کنید که N تعداد مشاهدات نمونه است. مقدار t در جداول توزیع t یافت می شود که تقریباً در تمام کتاب های درسی آمار موجود است. استفاده از توزیع t برای روش Wald مزایای قابل مشاهده ای را نسبت به سایر روش های مورد بحث در زیر ارائه نمی دهد و بنابراین مورد استقبال برخی از نویسندگان قرار نمی گیرد.

روش فوق برای محاسبه فواصل اطمینان برای فرکانس ها یا کسری ها به نام آبراهام والد (آبراهام والد، 1902-1950) نامگذاری شده است، زیرا پس از انتشار والد و ولفوویتز در سال 1939 به طور گسترده مورد استفاده قرار گرفت. با این حال، خود این روش توسط پیر سیمون لاپلاس (1749-1827) در اوایل سال 1812 پیشنهاد شد.

روش Wald بسیار محبوب است، اما کاربرد آن با مشکلات قابل توجهی همراه است. این روش برای نمونه های کوچک و همچنین در مواردی که فراوانی وقوع یک ویژگی به 0 یا 1 (0% یا 100%) تمایل دارد و برای فرکانس های 0 و 1 به سادگی امکان پذیر نیست، توصیه نمی شود. تقریب توزیع نرمال، که هنگام محاسبه خطا استفاده می شود، در مواردی که n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



در جایی که هنگام محاسبه فاصله اطمینان 95% مقدار 1.96 را می گیرد، N تعداد مشاهدات و p فراوانی ویژگی در نمونه است. این روش در ماشین حساب های آنلاین موجود است، بنابراین کاربرد آن مشکلی ندارد. و استفاده از این روش را برای n p توصیه نکنید< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

علاوه بر روش ویلسون، روش والد تصحیح شده با Agresti-Caull نیز تخمین بهینه فاصله اطمینان را برای فرکانس ها ارائه می دهد. تصحیح Agresti-Coulle جایگزینی در فرمول Wald برای فراوانی وقوع یک صفت در نمونه (p) توسط p` است، در هنگام محاسبه که 2 به صورت و 4 به مخرج اضافه می شود. ، p` = (X + 2) / (N + 4)، که در آن X تعداد شرکت کنندگان در مطالعه است که دارای ویژگی مورد مطالعه هستند و N حجم نمونه است. این اصلاح نتایج بسیار شبیه به نتایج فرمول ویلسون ایجاد می کند، به جز زمانی که نرخ رویداد به 0٪ یا 100٪ نزدیک می شود و نمونه کوچک است. علاوه بر روش های فوق برای محاسبه فواصل اطمینان برای فرکانس ها، اصلاحات پیوستگی برای هر دو روش والد و روش ویلسون برای نمونه های کوچک پیشنهاد شده است، اما مطالعات نشان داده است که استفاده از آنها نامناسب است.

کاربرد روش های فوق را برای محاسبه فواصل اطمینان با استفاده از دو مثال در نظر بگیرید. در مورد اول، ما یک نمونه بزرگ از 1000 شرکت‌کننده مطالعه به‌طور تصادفی انتخاب شده را مطالعه می‌کنیم که از این تعداد 450 نفر دارای ویژگی مورد مطالعه (خواه یک عامل خطر، یک پیامد یا هر صفت دیگری) هستند که فراوانی 0.45 یا 45 درصد در مورد دوم، مطالعه با استفاده از یک نمونه کوچک، مثلاً فقط 20 نفر انجام می شود و تنها 1 شرکت کننده در مطالعه (5٪) دارای ویژگی مورد مطالعه است. فواصل اطمینان برای روش Wald، برای روش Wald با تصحیح Agresti-Coll، برای روش Wilson با استفاده از یک ماشین حساب آنلاین توسعه یافته توسط جف سائورو (http://www./wald.htm) محاسبه شد. فواصل اطمینان ویلسون تصحیح شده با پیوستگی با استفاده از ماشین حساب ارائه شده توسط Wassar Stats: Website for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html) محاسبه شد. محاسبات با استفاده از تبدیل زاویه ای فیشر به صورت دستی با استفاده از مقدار بحرانی t برای 19 و 999 درجه آزادی انجام شد. نتایج محاسبات در جدول برای هر دو مثال ارائه شده است.

فواصل اطمینان به شش روش مختلف برای دو مثال شرح داده شده در متن محاسبه شده است

روش محاسبه فاصله اطمینان

P=0.0500 یا 5%

95% CI برای X=450، N=1000، P=0.4500، یا 45%

–0,0455–0,2541

والدا با تصحیح Agresti-Coll

<,0001–0,2541

ویلسون با تصحیح تداوم

"روش دقیق" کلوپر-پیرسون

تبدیل زاویه ای

<0,0001–0,1967

همانطور که از جدول مشاهده می شود، برای مثال اول، فاصله اطمینان محاسبه شده با روش Wald "به طور کلی پذیرفته شده" به ناحیه منفی می رود، که نمی تواند برای فرکانس ها صادق باشد. متأسفانه، چنین حوادثی در ادبیات روسی غیر معمول نیست. روش سنتی نمایش داده ها به عنوان یک فرکانس و خطای آن تا حدی این مشکل را پنهان می کند. به عنوان مثال، اگر فراوانی وقوع یک صفت (بر حسب درصد) به صورت 1.4 ± 2.1 ارائه شود، آنگاه به اندازه 2.1٪ "تحریک کننده" نیست (95٪ CI: 0.7-؛ 4.9)، اگرچه و به همین معنی است. روش والد با تصحیح Agresti-Coulle و محاسبه با استفاده از تبدیل زاویه ای کران پایینی را به سمت صفر می دهد. روش ویلسون با تصحیح پیوستگی و "روش دقیق" فواصل اطمینان بیشتری نسبت به روش ویلسون می دهد. برای مثال دوم، همه روش ها تقریباً فواصل اطمینان یکسانی را ارائه می دهند (تفاوت ها فقط در هزارم ظاهر می شوند) که جای تعجب نیست، زیرا فراوانی رویداد در این مثال تفاوت زیادی با 50٪ ندارد و حجم نمونه بسیار بزرگ است. .

برای خوانندگان علاقه مند به این مشکل، می توانیم آثار R. G. Newcombe و Brown، Cai و Dasgupta را توصیه کنیم که به ترتیب مزایا و معایب استفاده از 7 و 10 روش مختلف را برای محاسبه فواصل اطمینان ارائه می دهند. از کتابچه های داخلی، کتاب و توصیه می شود، که در آن، علاوه بر توضیح دقیق تئوری، روش های والد و ویلسون و همچنین روشی برای محاسبه فواصل اطمینان با در نظر گرفتن توزیع فرکانس دو جمله ای ارائه شده است. علاوه بر ماشین حساب های آنلاین رایگان (http://www./wald.htm و http://faculty.vassar.edu/lowry/prop1.html)، فواصل اطمینان برای فرکانس ها (و نه تنها!) را می توان با استفاده از برنامه سیا (تحلیل فواصل اطمینان) که می توانید از http://www دانلود کنید. مدرسه پزشکی سوتون ac uk/cia/.

مقاله بعدی به روش های تک متغیره برای مقایسه داده های کیفی می پردازد.

کتابشناسی - فهرست کتب

بانرجی آ.آمار پزشکی به زبان ساده: یک دوره مقدماتی / A. Banerzhi. - م.: طب عملی، 2007. - 287 ص. آمار پزشکی / . - م. : آژانس اطلاعات پزشکی، 2007. - 475 ص. گلنز اس.آمار پزشکی و بیولوژیکی / S. Glants. - م.: تمرین، 1998. انواع داده ها، تأیید توزیع و آمار توصیفی / // اکولوژی انسانی - 2008. - شماره 1. - ص 52-58. ژیژین ک.اس.. آمار پزشکی: کتاب درسی / . - Rostov n / D: Phoenix, 2007. - 160 p. آمار پزشکی کاربردی / , . - سنت پترزبورگ. : فولیو، 2003. - 428 ص. لاکین جی.اف. بیومتریک / . - م. : دبیرستان، 1990. - 350 ص. پزشک V. A. آمار ریاضی در پزشکی / , . - م.: امور مالی و آمار، 2007. - 798 ص. آمار ریاضی در تحقیقات بالینی / , . - M. : GEOTAR-MED، 2001. - 256 p. یونکروف وی. و. پردازش آماری پزشکی داده های تحقیقات پزشکی /،. - سنت پترزبورگ. : VmedA, 2002. - 266 p. آگرستی ا.تقریبی برای تخمین بازه‌ای نسبت‌های دوجمله‌ای بهتر از دقیق است / A. Agresti, B. Coull // آماردان آمریکایی. - 1998. - N 52. - S. 119-126. آلتمن دی.آمار با اطمینان // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. قهوه ای L.D.تخمین فاصله برای نسبت دو جمله ای / L. D. Brown, T. T. Cai, A. Dasgupta // علم آماری. - 2001. - N 2. - ص 101-133. کلاپر سی.جی.استفاده از محدودیت های اطمینان یا اعتباری نشان داده شده در مورد دو جمله ای / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - ص 404-413. گارسیا پرز ام. ای. در مورد فاصله اطمینان برای پارامتر دو جمله ای / M. A. Garcia-Perez // کیفیت و کمیت. - 2005. - N 39. - ص 467-481. موتولسکی اچ.آمار زیستی شهودی // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. نیوکمب آر.جی.فواصل اطمینان دو طرفه برای نسبت واحد: مقایسه هفت روش / R. G. Newcombe // آمار در پزشکی. - 1998. - N. 17. - P. 857–872. سائورو جی.برآورد نرخ تکمیل از نمونه‌های کوچک با استفاده از فواصل اطمینان دوجمله‌ای: مقایسه‌ها و توصیه‌ها / J. Sauro, J. R. Lewis // مجموعه مقالات انجمن عوامل انسانی و ارگونومی. - اورلاندو، فلوریدا، 2005. والد آ.محدودیت های اطمینان برای توابع توزیع پیوسته // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105–118. ویلسون ای بی. استنتاج احتمالی، قانون جانشینی و استنتاج آماری / E. B. Wilson // مجله انجمن آماری آمریکا. - 1927. - N 22. - ص 209-212.

فواصل اطمینان برای نسبت ها

آ. M. Gribovski

موسسه ملی بهداشت عمومی، اسلو، نروژ

در این مقاله چندین روش برای محاسبه فواصل اطمینان برای نسبت‌های دوجمله‌ای ارائه می‌شود، یعنی روش‌های Wald، Wilson، arcsine، Agresti-Coull و Clopper-Pearson دقیق. این مقاله تنها مقدمه ای کلی برای مسئله تخمین فاصله اطمینان یک نسبت دو جمله ای ارائه می دهد و هدف آن نه تنها تحریک خوانندگان به استفاده از فواصل اطمینان هنگام ارائه نتایج فواصل تحقیقات تجربی خود است، بلکه تشویق آنها به مراجعه به کتاب های آمار قبل از آن است. برای تجزیه و تحلیل داده های خود و تهیه نسخه های خطی.

کلید واژه ها: فاصله اطمینان، نسبت

اطلاعات تماس:

مشاور ارشد موسسه ملی بهداشت عمومی، اسلو، نروژ

در قسمت‌های فرعی قبل، سؤال تخمین پارامتر مجهول را در نظر گرفتیم آیک عدد. چنین ارزیابی "نقطه" نامیده می شود. در تعدادی از کارها، نه تنها برای یافتن پارامتر لازم است آمقدار عددی مناسب، بلکه دقت و قابلیت اطمینان آن را نیز ارزیابی کنید. لازم است بدانیم که تعویض پارامتر می تواند منجر به چه خطاهایی شود آتخمین نقطه ای آن آو با چه درجه ای از اطمینان می توانیم انتظار داشته باشیم که این خطاها از محدوده های شناخته شده فراتر نروند؟

مشکلاتی از این دست به ویژه برای تعداد کمی از مشاهدات، زمانی که تخمین نقطه ای انجام می شود، مرتبط هستند و درتا حد زیادی تصادفی است و جایگزینی تقریبی a با a می تواند منجر به خطاهای جدی شود.

برای ارائه ایده ای از دقت و قابلیت اطمینان تخمین آ,

در آمار ریاضی به اصطلاح از فواصل اطمینان و احتمالات اطمینان استفاده می شود.

اجازه دهید برای پارامتر آبرگرفته از تخمین بی طرفانه تجربه آ.می خواهیم خطای احتمالی را در این مورد تخمین بزنیم. اجازه دهید مقداری از احتمال p به اندازه کافی بزرگ (مثلاً p = 0.9، 0.95 یا 0.99) را به گونه‌ای اختصاص دهیم که یک رویداد با احتمال p را بتوان عملاً قطعی در نظر گرفت و مقدار s را برای آن پیدا کنیم.

سپس محدوده مقادیر عملا ممکن خطا که هنگام جایگزینی رخ می دهد آبر آ، ± s خواهد بود. خطاهای مطلق بزرگ فقط با احتمال کوچک a = 1 - p ظاهر می شوند. بیایید (14.3.1) را به صورت زیر بازنویسی کنیم:

تساوی (14.3.2) به این معنی است که با احتمال p مقدار مجهول پارامتر است آدر فاصله زمانی قرار می گیرد

در این مورد باید به یک مورد توجه کرد. پیش از این، ما به طور مکرر احتمال سقوط یک متغیر تصادفی در یک بازه غیر تصادفی معین را در نظر می گرفتیم. در اینجا وضعیت متفاوت است: آتصادفی نیست، اما فاصله تصادفی / r. به طور تصادفی موقعیت آن بر روی محور x، با مرکز آن تعیین می شود آ; به طور کلی، طول بازه 2s نیز تصادفی است، زیرا مقدار s، به عنوان یک قاعده، از داده های تجربی محاسبه می شود. بنابراین، در این مورد، بهتر است مقدار p را به عنوان احتمال "ضربه" به نقطه تفسیر کنیم. آبه بازه / p، اما به عنوان احتمال اینکه یک بازه تصادفی / p نقطه را پوشش دهد آ(شکل 14.3.1).

برنج. 14.3.1

احتمال p نامیده می شود سطح اطمینان، و فاصله / p - فاصله اطمینان.مرزهای فاصله اگر a x \u003d a-شن a 2 = a +و نامیده می شوند مرزهای اعتماد

بیایید یک تفسیر دیگر برای مفهوم فاصله اطمینان ارائه دهیم: می توان آن را به عنوان فاصله ای از مقادیر پارامتر در نظر گرفت. آ،با داده های تجربی سازگار است و با آنها مغایرت ندارد. در واقع، اگر توافق کنیم که رویدادی با احتمال a = 1-p عملاً غیرممکن در نظر بگیریم، آنگاه مقادیر پارامتر a برای الف - الف> s باید به عنوان متناقض با داده های تجربی شناخته شوند، و آنهایی که برای آنها |a - آ a t na 2 .

اجازه دهید برای پارامتر آیک تخمین بی طرفانه وجود دارد آ.اگر قانون توزیع کمیت را می دانستیم آ، مشکل یافتن فاصله اطمینان بسیار ساده است: برای یافتن مقدار s کافی است که

مشکل در این واقعیت نهفته است که قانون توزیع برآورد آبه قانون توزیع کمیت بستگی دارد ایکسو در نتیجه، روی پارامترهای ناشناخته آن (به ویژه در خود پارامتر آ).

برای دور زدن این مشکل، می‌توان از ترفند تقریبی زیر استفاده کرد: پارامترهای مجهول در عبارت s را با تخمین نقطه‌ای آن‌ها جایگزین کنید. با تعداد نسبتاً زیادی آزمایش پ(حدود 20 ... 30) این تکنیک معمولاً از نظر دقت نتایج رضایت بخشی می دهد.

به عنوان مثال، مسئله فاصله اطمینان برای انتظارات ریاضی را در نظر بگیرید.

اجازه دهید تولید شود پ ایکس،که ویژگی های آن انتظار ریاضی است تیو واریانس D- ناشناخته. برای این پارامترها، برآوردهای زیر به دست آمد:

برای انتظارات ریاضی باید یک فاصله اطمینان / р مطابق با احتمال اطمینان р ایجاد کرد. تیمقادیر ایکس.

در حل این مشکل از این واقعیت استفاده می کنیم که کمیت تیجمع است پمتغیرهای تصادفی مستقل با توزیع یکسان X ساعتو با توجه به قضیه حد مرکزی برای اندازه کافی بزرگ پقانون توزیع آن نزدیک به نرمال است. در عمل، حتی با تعداد نسبتاً کمی از عبارت ها (از مرتبه 10 ... 20)، قانون توزیع مجموع را می توان تقریباً عادی در نظر گرفت. ما این مقدار را فرض خواهیم کرد تیطبق قانون عادی توزیع می شود. ویژگی های این قانون - انتظار ریاضی و واریانس - به ترتیب برابر است تیو

(به فصل 13 زیربخش 13.3 مراجعه کنید). بیایید فرض کنیم که ارزش Dما می دانیم و یک مقدار Ep برای آن پیدا می کنیم

با استفاده از فرمول (6.3.5) از فصل 6، احتمال سمت چپ (14.3.5) را بر حسب تابع توزیع نرمال بیان می کنیم.

انحراف استاندارد برآورد کجاست تی.

از معادله

مقدار S را پیدا کنید:

که در آن arg Ф* (x) تابع معکوس Ф* است (ایکس)،آن ها چنین مقداری از آرگومان که تابع توزیع نرمال برابر است با ایکس.

پراکندگی د،که از طریق آن مقدار بیان می شود آ 1P، ما دقیقا نمی دانیم. به عنوان مقدار تقریبی آن، می توانید از تخمین استفاده کنید D(14.3.4) و تقریباً قرار دهید:

بنابراین، مشکل ایجاد فاصله اطمینان تقریباً حل می شود که برابر است با:

که در آن gp با فرمول (14.3.7) تعریف می شود.

به منظور جلوگیری از درون یابی معکوس در جداول تابع Ф * (l) هنگام محاسبه s p، جمع آوری یک جدول خاص (جدول 14.3.1) راحت است که مقادیر کمیت را فهرست می کند.

بسته به r. مقدار (p برای قانون عادی تعداد انحرافات استاندارد را تعیین می کند که باید در سمت راست و چپ مرکز پراکندگی کنار گذاشته شود تا احتمال سقوط در ناحیه حاصل برابر با p باشد.

از طریق مقدار 7 p، فاصله اطمینان به صورت زیر بیان می شود:

جدول 14.3.1

مثال 1. 20 آزمایش بر روی مقدار انجام شد ایکس؛نتایج در جدول نشان داده شده است. 14.3.2.

جدول 14.3.2

لازم است تخمینی از انتظار ریاضی کمیت پیدا شود ایکسو یک فاصله اطمینان مربوط به سطح اطمینان p = 0.8 ایجاد کنید.

راه حل.ما داریم:

با انتخاب مبدا n: = 10، طبق فرمول سوم (14.2.14) برآورد بی طرفانه را پیدا می کنیم D :

طبق جدول 14.3.1 پیدا می کنیم

محدودیت های اعتماد:

فاصله اطمینان:

مقادیر پارامتر تی،نهفته در این فاصله با داده های تجربی ارائه شده در جدول سازگار است. 14.3.2.

به روشی مشابه، می توان یک فاصله اطمینان برای واریانس ایجاد کرد.

اجازه دهید تولید شود پآزمایشات مستقل روی یک متغیر تصادفی ایکسبا پارامترهای ناشناخته از و A و برای واریانس Dبرآورد بی طرفانه به دست می آید:

لازم است تقریباً یک فاصله اطمینان برای واریانس ایجاد شود.

از فرمول (14.3.11) می توان دریافت که مقدار Dنشان می دهد

میزان پمتغیرهای تصادفی فرم . این مقادیر نیستند

مستقل است، زیرا هر یک از آنها مقدار را شامل می شود تی،وابسته به بقیه با این حال، می توان نشان داد که به عنوان پقانون توزیع مجموع آنها نیز نزدیک به نرمال است. تقریبا در پ= 20...30 در حال حاضر می توان آن را عادی در نظر گرفت.

بیایید فرض کنیم که اینطور است و ویژگی های این قانون را پیدا کنیم: انتظار و واریانس ریاضی. از آنجایی که نمره D- پس بی طرفانه M[D] = D.

محاسبه واریانس DDبا محاسبات نسبتاً پیچیده همراه است، بنابراین ما بیان آن را بدون مشتق ارائه می دهیم:

جایی که c 4 - چهارمین لحظه مرکزی کمیت است ایکس.

برای استفاده از این عبارت، باید مقادیر 4 و را در آن جایگزین کنید. D(حداقل تقریبی). بجای Dمی توانید از ارزیابی استفاده کنید D.در اصل، چهارمین لحظه مرکزی را می توان با تخمین آن، به عنوان مثال، با مقدار شکل جایگزین کرد:

اما چنین جایگزینی دقت بسیار پایینی را به همراه خواهد داشت، زیرا به طور کلی، با تعداد محدودی آزمایش، ممان های مرتبه بالا با خطاهای بزرگ تعیین می شوند. با این حال، در عمل اغلب اتفاق می افتد که شکل قانون توزیع کمیت ایکساز قبل شناخته شده: فقط پارامترهای آن ناشناخته هستند. سپس می توانیم سعی کنیم u4 را بر حسب بیان کنیم D.

اجازه دهید رایج ترین مورد را، زمانی که مقدار، در نظر بگیریم ایکسطبق قانون عادی توزیع می شود. سپس چهارمین لحظه مرکزی آن بر حسب واریانس بیان می شود (به فصل 6 زیربخش 6.2 مراجعه کنید).

و فرمول (14.3.12) می دهد یا

جایگزینی در (14.3.14) مجهول Dارزیابی او D، می گیریم: از کجا

لحظه u 4 را می توان بر حسب بیان کرد Dهمچنین در برخی موارد دیگر، هنگام توزیع مقدار ایکسطبیعی نیست، اما ظاهر آن مشخص است. برای مثال، برای قانون چگالی یکنواخت (به فصل 5 مراجعه کنید) داریم:

که در آن (a, P) فاصله ای است که قانون در آن ارائه می شود.

از این رو،

طبق فرمول (14.3.12) به دست می آید: از جایی که تقریباً پیدا می کنیم

در مواردی که شکل قانون توزیع مقدار 26 ناشناخته است، هنگام تخمین مقدار a /، همچنان توصیه می شود از فرمول (14.3.16) استفاده شود، اگر دلیل خاصی برای این باور وجود نداشته باشد که این امر وجود ندارد. قانون بسیار متفاوت از قانون عادی است (دارای کشش مثبت یا منفی قابل توجهی است).

اگر مقدار تقریبی a /) به روشی به دست آید، می توان یک فاصله اطمینان برای واریانس به همان روشی که آن را برای انتظارات ریاضی ساختیم ایجاد کرد:

جایی که مقدار بسته به احتمال داده شده p در جدول یافت می شود. 14.3.1.

مثال 2. یک فاصله اطمینان تقریباً 80% برای واریانس یک متغیر تصادفی پیدا کنید. ایکستحت شرایط مثال 1، اگر معلوم باشد که مقدار ایکسطبق قانون نزدیک به نرمال توزیع می شود.

راه حل.مقدار مانند جدول باقی می ماند. 14.3.1:

طبق فرمول (14.3.16)

با توجه به فرمول (14.3.18) فاصله اطمینان را پیدا می کنیم:

محدوده مربوط به مقادیر انحراف استاندارد: (0.21؛ 0.29).

14.4. روش های دقیق برای ساخت فواصل اطمینان برای پارامترهای یک متغیر تصادفی توزیع شده بر اساس قانون عادی

در بخش فرعی قبل، روش‌های تقریباً تقریبی را برای ایجاد فاصله اطمینان برای میانگین و واریانس در نظر گرفتیم. در اینجا ما ایده ای از روش های دقیق برای حل همان مشکل ارائه می دهیم. تاکید می کنیم که برای یافتن دقیق فواصل اطمینان، لازم است از قبل شکل قانون توزیع کمیت را بدانیم. ایکس،در حالی که این برای استفاده از روش های تقریبی ضروری نیست.

ایده روش های دقیق برای ساخت فواصل اطمینان به شرح زیر است. هر فاصله اطمینان از شرط بیان کننده احتمال تحقق برخی از نابرابری ها که شامل برآورد علاقه ما می شود به دست می آید. آ.قانون توزیع نمرات آدر حالت کلی به پارامترهای ناشناخته کمیت بستگی دارد ایکس.با این حال، گاهی اوقات می توان نابرابری ها را از یک متغیر تصادفی عبور داد آبه تابع دیگری از مقادیر مشاهده شده X p X 2, ..., X p.قانون توزیع آن به پارامترهای ناشناخته بستگی ندارد، بلکه فقط به تعداد آزمایش ها و شکل قانون توزیع کمیت بستگی دارد. ایکس.متغیرهای تصادفی از این نوع نقش زیادی در آمار ریاضی دارند. آنها با بیشترین جزئیات برای مورد توزیع نرمال کمیت مورد مطالعه قرار گرفته اند ایکس.

به عنوان مثال، ثابت شده است که تحت یک توزیع نرمال کمیت ایکسمقدار تصادفی

موضوع به اصطلاح قانون توزیع دانش آموزانبا پ- 1 درجه آزادی؛ چگالی این قانون شکل دارد

که در آن G(x) تابع گامای شناخته شده است:

همچنین ثابت شده است که متغیر تصادفی

دارای "توزیع % 2" با پ- 1 درجه آزادی (به فصل 7 مراجعه کنید) که چگالی آن با فرمول بیان می شود

بدون پرداختن به مشتقات توزیع ها (14.4.2) و (14.4.4)، نشان خواهیم داد که چگونه می توان آنها را هنگام ساخت فواصل اطمینان برای پارامترها اعمال کرد. تای دی.

اجازه دهید تولید شود پآزمایشات مستقل روی یک متغیر تصادفی ایکس،بر اساس قانون عادی با پارامترهای ناشناخته توزیع شده است TIOبرای این پارامترها، برآورد

لازم است فواصل اطمینان برای هر دو پارامتر مربوط به احتمال اطمینان p ساخته شود.

اجازه دهید ابتدا یک فاصله اطمینان برای انتظارات ریاضی بسازیم. طبیعی است که این بازه را با توجه به متقارن بگیریم تی; با s p نصف طول بازه را نشان دهید. مقدار sp باید طوری انتخاب شود که شرط

بیایید سعی کنیم در سمت چپ برابری (14.4.5) از یک متغیر تصادفی عبور کنیم. تیبه یک متغیر تصادفی تی،طبق قانون دانشجویی توزیع می شود. برای انجام این کار، هر دو قسمت نابرابری |m-w?| را ضرب می کنیم

به ارزش مثبت: یا با استفاده از نماد (14.4.1)،

اجازه دهید یک عدد / p پیدا کنیم به طوری که مقدار / p را بتوان از شرط پیدا کرد

از فرمول (14.4.2) می توان دریافت که (1) یک تابع زوج است، بنابراین (14.4.8) نشان می دهد

برابری (14.4.9) مقدار / p را بسته به p تعیین می کند. اگر جدولی از مقادیر انتگرال در اختیار دارید

سپس مقدار / p را می توان با درون یابی معکوس در جدول پیدا کرد. با این حال ، تهیه جدول مقادیر / p از قبل راحت تر است. چنین جدولی در پیوست (جدول 5) آورده شده است. این جدول مقادیر بسته به احتمال اطمینان p و تعداد درجات آزادی را نشان می دهد پ- 1. با تعیین / p مطابق جدول. 5 و با فرض

نصف عرض فاصله اطمینان / p و خود بازه را پیدا می کنیم

مثال 1. 5 آزمایش مستقل بر روی یک متغیر تصادفی انجام شد ایکس،معمولاً با پارامترهای ناشناخته توزیع می شود تیو در مورد. نتایج آزمایشات در جدول آورده شده است. 14.4.1.

جدول 14.4.1

تخمینی پیدا کنید تیبرای انتظارات ریاضی و ایجاد فاصله اطمینان 90٪ / p برای آن (یعنی فاصله مربوط به احتمال اطمینان p \u003d 0.9).

راه حل.ما داریم:

مطابق جدول 5 درخواست برای پ - 1 = 4 و p = 0.9 پیدا می کنیم جایی که

فاصله اطمینان خواهد بود

مثال 2. برای شرایط مثال 1 از بخش 14.3، با فرض مقدار ایکسبه طور معمول توزیع شده است، فاصله اطمینان دقیق را پیدا کنید.

راه حل.با توجه به جدول 5 برنامه، ما در پ - 1 = 19ir =

0.8 / p = 1.328; از اینجا

در مقایسه با حل مثال 1 از بخش 14.3 (e p = 0.072)، می بینیم که اختلاف بسیار کوچک است. اگر دقت را تا رقم دوم اعشار حفظ کنیم، فواصل اطمینان یافت شده توسط روش های دقیق و تقریبی یکسان است:

بیایید به ساخت یک فاصله اطمینان برای واریانس برویم. برآورد واریانس بی طرفانه را در نظر بگیرید

و متغیر تصادفی را بیان کنید Dاز طریق ارزش V(14.4.3) دارای توزیع x 2 (14.4.4):

دانستن قانون توزیع کمیت می توان بازه / (1) را که در آن قرار می گیرد با یک احتمال معین p پیدا کرد.

قانون توزیع k n _ x (v)مقدار I 7 به شکلی است که در شکل نشان داده شده است. 14.4.1.

برنج. 14.4.1

این سوال مطرح می شود: چگونه فاصله / p را انتخاب کنیم؟ اگر قانون توزیع کمیت Vمتقارن بود (مثل یک قانون نرمال یا توزیع دانش آموز)، طبیعی است که فاصله /p متقارن را با توجه به انتظارات ریاضی در نظر بگیریم. در این مورد، قانون k n _ x (v)نامتقارن اجازه دهید توافق کنیم که بازه /p را انتخاب کنیم تا احتمال خروجی کمیت وجود داشته باشد Vخارج از فاصله سمت راست و چپ (مناطق سایه دار در شکل 14.4.1) یکسان و مساوی بودند.

برای ساختن فاصله / p با این ویژگی، از Table استفاده می کنیم. 4 برنامه: شامل اعداد است y)به طوری که

برای مقدار دارای x 2 - توزیع با r درجه آزادی. در مورد ما r = n- 1. رفع کنید r = n- 1 و در خط مربوطه جدول پیدا کنید. 4 دو مقدار x 2 -یکی مربوط به احتمال دیگری - احتمالات اجازه دهید اینها را تعیین کنیم

ارزش های در 2و xlفاصله دارد y 2 ,با سمت چپش و y~انتهای راست

اکنون فاصله اطمینان مورد نیاز /| را برای واریانس با مرزهای D و و پیدا می کنیم D2،که نقطه را پوشش می دهد Dبا احتمال p:

اجازه دهید چنین بازه ای بسازیم / (، = (?> b A)، که نقطه را پوشش می دهد Dاگر و فقط اگر ارزش Vدر بازه / r قرار می گیرد. اجازه دهید آن فاصله را نشان دهیم

این شرط را برآورده می کند. در واقع، نابرابری ها معادل نابرابری ها هستند

و این نابرابری ها با احتمال p وجود دارد. بنابراین، فاصله اطمینان برای پراکندگی پیدا شده و با فرمول (14.4.13) بیان می شود.

مثال 3. فاصله اطمینان برای واریانس را تحت شرایط مثال 2 از بخش فرعی 14.3 بیابید، اگر معلوم باشد که مقدار ایکسبه صورت عادی توزیع می شود.

راه حل.ما داریم . مطابق جدول 4 برنامه

پیدا می کنیم در r = n - 1 = 19

با توجه به فرمول (14.4.13) فاصله اطمینان برای پراکندگی را پیدا می کنیم

فاصله متناظر برای انحراف معیار: (0.21؛ 0.32). این فاصله فقط اندکی از بازه (0.21؛ 0.29) به دست آمده در مثال 2 از بخش 14.3 با روش تقریبی بیشتر است.

  • شکل 14.3.1 یک فاصله اطمینان را در نظر می گیرد که در حدود a متقارن است. به طور کلی، همانطور که بعدا خواهیم دید، این کار ضروری نیست.
دسته بندی ها

مقالات محبوب

2023 "kingad.ru" - بررسی سونوگرافی اندام های انسان