სტუდენტის t ტესტის ტაბულური მნიშვნელობა. ძირითადი სტატისტიკა და სტუდენტის t-ტესტი

რა შემთხვევაში შეიძლება გამოვიყენოთ Student-ის t-ტესტი?

Student t-ტესტის გამოსაყენებლად აუცილებელია ორიგინალური მონაცემების არსებობა ნორმალური დისტრიბუცია. დამოუკიდებელ ნიმუშებზე ორსაარჩევნო კრიტერიუმის გამოყენების შემთხვევაში ასევე აუცილებელია პირობის დაკმაყოფილება განსხვავებების თანასწორობა (ჰომოსკედასტიურობა)..

თუ ეს პირობები არ არის დაცული, მსგავსი მეთოდები უნდა იქნას გამოყენებული ნიმუშის საშუალებების შედარებისას. არაპარამეტრული სტატისტიკა, რომელთა შორის ყველაზე ცნობილია Mann-Whitney U ტესტი(როგორც დამოუკიდებელი ნიმუშების ორნიმუშიანი ტესტი), და ნიშნის კრიტერიუმიდა ვილკოქსონის ტესტი(გამოიყენება დამოკიდებული ნიმუშების შემთხვევაში).

საშუალო მნიშვნელობების შესადარებლად, სტუდენტის t-ტესტი გამოითვლება შემდეგი ფორმულის გამოყენებით:

სად M 1- პირველი შედარებული პოპულაციის (ჯგუფის) საშუალო არითმეტიკული, M 2- მეორე შედარებული პოპულაციის (ჯგუფის) საშუალო არითმეტიკული, მ 1- პირველი არითმეტიკული საშუალოს საშუალო შეცდომა, მ 2- მეორე არითმეტიკული საშუალოს საშუალო ცდომილება.

როგორ განვსაზღვროთ სტუდენტის t-ტესტის მნიშვნელობა?

მიღებული Student-ის t-ტესტის მნიშვნელობა სწორად უნდა იყოს ინტერპრეტირებული. ამისათვის ჩვენ უნდა ვიცოდეთ საგნების რაოდენობა თითოეულ ჯგუფში (n 1 და n 2). თავისუფლების გრადუსების რაოდენობის პოვნა შემდეგი ფორმულის მიხედვით:

f = (n 1 + n 2) - 2

ამის შემდეგ, ჩვენ განვსაზღვრავთ სტუდენტის t-ტესტის კრიტიკულ მნიშვნელობას მნიშვნელოვნების საჭირო დონისთვის (მაგალითად, p = 0.05) და თავისუფლების ხარისხების მოცემული რაოდენობისთვის. ცხრილის მიხედვით ( იხილეთ ქვემოთ).

ჩვენ ვადარებთ კრიტერიუმის კრიტიკულ და გამოთვლილ მნიშვნელობებს:

· თუ სტუდენტის t-ტესტის გამოთვლილი მნიშვნელობა თანაბარი ან მეტიკრიტიკული, ცხრილიდან ნაპოვნი, ჩვენ დავასკვნით, რომ შედარებულ მნიშვნელობებს შორის განსხვავებები სტატისტიკურად მნიშვნელოვანია.

· თუ გამოთვლილი Student-ის t-ტესტის მნიშვნელობა ნაკლებიცხრილი, რაც ნიშნავს, რომ განსხვავებები შედარებულ მნიშვნელობებს შორის არ არის სტატისტიკურად მნიშვნელოვანი.

სტუდენტის t-ტესტის გამოთვლის მაგალითი

ახალი რკინის პრეპარატის ეფექტურობის შესასწავლად შეირჩა ანემიის მქონე პაციენტების ორი ჯგუფი. პირველ ჯგუფში პაციენტები ორი კვირის განმავლობაში იღებდნენ ახალ პრეპარატს, მეორე ჯგუფში კი პლაცებოს. ამის შემდეგ გაზომეს ჰემოგლობინის დონე პერიფერიულ სისხლში. პირველ ჯგუფში ჰემოგლობინის საშუალო დონე იყო 115,4±1,2 გ/ლ, ხოლო მეორე ჯგუფში - 103,7±2,3 გ/ლ (მონაცემები წარმოდგენილია ფორმატში. მ±მ), შედარებულ პოპულაციებს აქვთ ნორმალური განაწილება. პირველი ჯგუფის რაოდენობა იყო 34, ხოლო მეორე - 40 პაციენტი. საჭიროა დასკვნის გაკეთება მიღებული სხვაობების სტატისტიკური მნიშვნელობისა და ახალი რკინის პრეპარატის ეფექტურობის შესახებ.

გამოსავალი:განსხვავებების მნიშვნელოვნების შესაფასებლად ვიყენებთ Student-ის t-ტესტს, რომელიც გამოითვლება, როგორც განსხვავება საშუალო მნიშვნელობებში, გაყოფილი კვადრატული შეცდომების ჯამზე:

გამოთვლების შესრულების შემდეგ, t-ტესტის მნიშვნელობა აღმოჩნდა 4,51. ჩვენ ვპოულობთ თავისუფლების ხარისხების რაოდენობას, როგორც (34 + 40) - 2 = 72. ჩვენ შევადარებთ მიღებული Student-ის t-ტესტის მნიშვნელობას 4.51 კრიტიკულ მნიშვნელობასთან p = 0.05, რომელიც მითითებულია ცხრილში: 1.993. ვინაიდან კრიტერიუმის გამოთვლილი მნიშვნელობა კრიტიკულ მნიშვნელობაზე მეტია, დავასკვნათ, რომ დაკვირვებული განსხვავებები სტატისტიკურად მნიშვნელოვანია (მნიშვნელოვნების დონე p<0,05).

ფიშერის განაწილება არის შემთხვევითი ცვლადის განაწილება

სად არის შემთხვევითი ცვლადები X 1და X 2დამოუკიდებელნი არიან და აქვთ ჩი-კვადრატული განაწილება თავისუფლების გრადუსების რაოდენობით k 1და k 2შესაბამისად. ამავე დროს, წყვილი (k 1 , k 2)– ფიშერის განაწილების „თავისუფლების ხარისხი“ წყვილი, კერძოდ, k 1არის მრიცხველის თავისუფლების ხარისხითა რიცხვი და k 2– მნიშვნელის თავისუფლების ხარისხების რაოდენობა. შემთხვევითი ცვლადის განაწილება ეწოდა დიდი ინგლისელი სტატისტიკოსის რ.ფიშერის (1890-1962) პატივსაცემად, რომელიც მას აქტიურად იყენებდა თავის ნაშრომებში.

ფიშერის განაწილება გამოიყენება ჰიპოთეზების ტესტირებისას მოდელის ადეკვატურობის შესახებ რეგრესიულ ანალიზში, დისპერსიების თანასწორობასა და გამოყენებითი სტატისტიკის სხვა პრობლემებში.

სტუდენტის კრიტიკული მნიშვნელობების ცხრილი.

ფორმის დასაწყისი

თავისუფლების ხარისხების რაოდენობა, ვ სტუდენტის t-ტესტის მნიშვნელობა p=0.05-ზე
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

Student's t-ტესტი არის ზოგადი სახელი ჰიპოთეზების სტატისტიკური ტესტირების მეთოდების კლასისთვის (სტატისტიკური ტესტები), რომელიც დაფუძნებულია Student განაწილებაზე. t-ტესტის ყველაზე გავრცელებული გამოყენება გულისხმობს საშუალოების ტოლობის ტესტირებას ორ ნიმუშში.

1. t-ტესტის განვითარების ისტორია

ეს კრიტერიუმი შემუშავდა უილიამ გოსეტიგინესის კომპანიაში ლუდის ხარისხის შესაფასებლად. კომპანიის წინაშე მოვალეობების გამო სავაჭრო საიდუმლოების არ გამჟღავნებასთან დაკავშირებით, გოსეტის სტატია გამოქვეყნდა 1908 წელს ჟურნალში Biometrics ფსევდონიმით „სტუდენტი“.

2. რისთვის გამოიყენება Student-ის t-ტესტი?

საშუალოდ განსხვავებათა სტატისტიკური მნიშვნელოვნების დასადგენად გამოიყენება სტუდენტის t ტესტი. შეიძლება გამოყენებულ იქნას როგორც დამოუკიდებელი ნიმუშების შედარების შემთხვევაში ( მაგალითად, დიაბეტიანთა ჯგუფები და ჯანსაღი ჯგუფები) და დაკავშირებული პოპულაციების შედარებისას ( მაგალითად, გულისცემის საშუალო სიხშირე იმავე პაციენტებში ანტიარითმული პრეპარატის მიღებამდე და მის შემდეგ).

3. რა შემთხვევაში შეიძლება გამოვიყენოთ Student-ის t-ტესტი?

Student t-ტესტის გამოსაყენებლად აუცილებელია ორიგინალური მონაცემების არსებობა ნორმალური დისტრიბუცია. დამოუკიდებელ ნიმუშებზე ორსაარჩევნო კრიტერიუმის გამოყენების შემთხვევაში ასევე აუცილებელია პირობის დაკმაყოფილება განსხვავებების თანასწორობა (ჰომოსკედასტიურობა)..

თუ ეს პირობები არ არის დაცული, მსგავსი მეთოდები უნდა იქნას გამოყენებული ნიმუშის საშუალებების შედარებისას. არაპარამეტრული სტატისტიკა, რომელთა შორის ყველაზე ცნობილია Mann-Whitney U ტესტი(როგორც დამოუკიდებელი ნიმუშების ორნიმუშიანი ტესტი), და ნიშნის კრიტერიუმიდა ვილკოქსონის ტესტი(გამოიყენება დამოკიდებული ნიმუშების შემთხვევაში).

4. როგორ გამოვთვალოთ სტუდენტის t-ტესტი?

საშუალო მნიშვნელობების შესადარებლად, სტუდენტის t-ტესტი გამოითვლება შემდეგი ფორმულის გამოყენებით:

სად M 1- პირველი შედარებული პოპულაციის (ჯგუფის) საშუალო არითმეტიკული, M 2- მეორე შედარებული პოპულაციის (ჯგუფის) საშუალო არითმეტიკული, მ 1- პირველი არითმეტიკული საშუალოს საშუალო შეცდომა, მ 2- მეორე არითმეტიკული საშუალოს საშუალო ცდომილება.

5. როგორ განვმარტოთ სტუდენტის t-ტესტის მნიშვნელობა?

მიღებული Student-ის t-ტესტის მნიშვნელობა სწორად უნდა იყოს ინტერპრეტირებული. ამისათვის ჩვენ უნდა ვიცოდეთ საგნების რაოდენობა თითოეულ ჯგუფში (n 1 და n 2). თავისუფლების გრადუსების რაოდენობის პოვნა შემდეგი ფორმულის მიხედვით:

f = (n 1 + n 2) - 2

ამის შემდეგ, ჩვენ განვსაზღვრავთ სტუდენტის t-ტესტის კრიტიკულ მნიშვნელობას მნიშვნელოვნების საჭირო დონისთვის (მაგალითად, p = 0.05) და თავისუფლების ხარისხების მოცემული რაოდენობისთვის. ცხრილის მიხედვით ( იხილეთ ქვემოთ).

ჩვენ ვადარებთ კრიტერიუმის კრიტიკულ და გამოთვლილ მნიშვნელობებს:

  • თუ სტუდენტის t-ტესტის გამოთვლილი მნიშვნელობა თანაბარი ან მეტიკრიტიკული, ცხრილიდან ნაპოვნი, ჩვენ დავასკვნით, რომ შედარებულ მნიშვნელობებს შორის განსხვავებები სტატისტიკურად მნიშვნელოვანია.
  • თუ გამოთვლილი Student-ის t-ტესტის მნიშვნელობა ნაკლებიცხრილი, რაც ნიშნავს, რომ განსხვავებები შედარებულ მნიშვნელობებს შორის არ არის სტატისტიკურად მნიშვნელოვანი.

6. Student's t-ტესტის გამოთვლის მაგალითი

ახალი რკინის პრეპარატის ეფექტურობის შესასწავლად შეირჩა ანემიის მქონე პაციენტების ორი ჯგუფი. პირველ ჯგუფში პაციენტები ორი კვირის განმავლობაში იღებდნენ ახალ პრეპარატს, მეორე ჯგუფში კი პლაცებოს. ამის შემდეგ გაზომეს ჰემოგლობინის დონე პერიფერიულ სისხლში. პირველ ჯგუფში ჰემოგლობინის საშუალო დონე იყო 115,4±1,2 გ/ლ, ხოლო მეორე ჯგუფში - 103,7±2,3 გ/ლ (მონაცემები წარმოდგენილია ფორმატში. მ±მ), შედარებულ პოპულაციებს აქვთ ნორმალური განაწილება. პირველი ჯგუფის რაოდენობა იყო 34, ხოლო მეორე - 40 პაციენტი. საჭიროა დასკვნის გაკეთება მიღებული სხვაობების სტატისტიკური მნიშვნელობისა და ახალი რკინის პრეპარატის ეფექტურობის შესახებ.

გამოსავალი:განსხვავებების მნიშვნელოვნების შესაფასებლად ვიყენებთ Student-ის t-ტესტს, რომელიც გამოითვლება, როგორც განსხვავება საშუალო მნიშვნელობებში, გაყოფილი კვადრატული შეცდომების ჯამზე:

გამოთვლების შესრულების შემდეგ, t-ტესტის მნიშვნელობა აღმოჩნდა 4,51. ჩვენ ვპოულობთ თავისუფლების ხარისხების რაოდენობას, როგორც (34 + 40) - 2 = 72. ჩვენ შევადარებთ მიღებული Student-ის t-ტესტის მნიშვნელობას 4.51 კრიტიკულ მნიშვნელობასთან p = 0.05, რომელიც მითითებულია ცხრილში: 1.993. ვინაიდან კრიტერიუმის გამოთვლილი მნიშვნელობა კრიტიკულ მნიშვნელობაზე მეტია, დავასკვნათ, რომ დაკვირვებული განსხვავებები სტატისტიკურად მნიშვნელოვანია (მნიშვნელოვნების დონე p<0,05).

სტატისტიკური ჰიპოთეზის ტესტირება საშუალებას გვაძლევს გავაკეთოთ ძლიერი დასკვნები პოპულაციის მახასიათებლების შესახებ, ნიმუშის მონაცემების საფუძველზე. არსებობს სხვადასხვა ჰიპოთეზა. ერთ-ერთი მათგანია ჰიპოთეზა საშუალოზე (მათემატიკური მოლოდინი). მისი არსი არის სწორი დასკვნის გაკეთება, მხოლოდ ხელმისაწვდომ ნიმუშზე დაყრდნობით იმის შესახებ, თუ სად შეიძლება იყოს ან არ იყოს ზოგადი საშუალო (ზუსტი სიმართლე ვერასდროს გავიგებთ, მაგრამ შეგვიძლია შევამციროთ ძებნა).

ჰიპოთეზების ტესტირების ზოგადი მიდგომა აღწერილია, ამიტომ მოდით პირდაპირ საქმეზე გადავიდეთ. ჯერ დავუშვათ, რომ ნიმუში შედგენილია შემთხვევითი ცვლადების ნორმალური პოპულაციისგან Xსაერთო საშუალოდ μ და დისპერსიას σ 2(ვიცი, ვიცი, რომ ასე არ ხდება, მაგრამ ხელი არ შემიშალო!). ამ ნიმუშის საშუალო არითმეტიკული აშკარად შემთხვევითი ცვლადია. თუ თქვენ ამოიღებთ ბევრ ასეთ ნიმუშს და გამოთვლით მათ საშუალოებს, მაშინ მათემატიკური მოლოდინიც ექნებათ μ და

შემდეგ შემთხვევითი ცვლადი

ჩნდება კითხვა: იქნება თუ არა საერთო საშუალო 95%-იანი ალბათობით ±1,96 ფარგლებში? s x̅. სხვა სიტყვებით რომ ვთქვათ, არის შემთხვევითი ცვლადების განაწილება

ექვივალენტი.

ეს კითხვა პირველად დაისვა (და გადაჭრა) ქიმიკოსმა, რომელიც მუშაობდა გინესის ლუდის ქარხანაში დუბლინში (ირლანდია). ქიმიკოსს უილიამ სილი გოსეტი ერქვა და ლუდის ნიმუშები აიღო ქიმიური ანალიზისთვის. რაღაც მომენტში, როგორც ჩანს, უილიამმა დაიწყო ტანჯვა გაურკვეველი ეჭვებით საშუალოების განაწილების შესახებ. აღმოჩნდა ცოტა უფრო გაწურული ვიდრე ნორმალური განაწილება უნდა იყოს.

შეაგროვა მათემატიკური საფუძველი და გამოთვალა მის მიერ აღმოჩენილი განაწილების ფუნქციის მნიშვნელობები, დუბლინელმა ქიმიკოსმა უილიამ გოსეტმა დაწერა შენიშვნა, რომელიც გამოქვეყნდა ჟურნალ Biometrics-ის 1908 წლის მარტის ნომერში (მთავარი რედაქტორი - კარლ პირსონი). იმიტომ რომ გინესმა კატეგორიულად აკრძალა ლუდის საიდუმლოების გაცემა გოსეტი ფსევდონიმით სტუდენტი.

მიუხედავად იმისა, რომ კ. პირსონმა უკვე გამოიგონა განაწილება, ნორმალურობის ზოგადი იდეა მაინც დომინირებდა. არავინ აპირებდა იფიქროს, რომ ნიმუშის ქულების განაწილება შეიძლება არ იყოს ნორმალური. ამიტომ, W. Gosset-ის სტატია პრაქტიკულად შეუმჩნეველი და დავიწყებული დარჩა. და მხოლოდ რონალდ ფიშერმა დააფასა გოსეტის აღმოჩენა. ფიშერმა გამოიყენა ახალი დისტრიბუცია თავის ნაშრომში და დაარქვა მას სახელი სტუდენტური t-განაწილება. შესაბამისად, ჰიპოთეზების შემოწმების კრიტერიუმი გახდა სტუდენტის t-ტესტი. ასე მოხდა „რევოლუცია“ სტატისტიკაში, რომელიც გადავიდა ნიმუშის მონაცემების ანალიზის ეპოქაში. ეს იყო მოკლე ექსკურსია ისტორიაში.

ვნახოთ, რას ხედავდა W. Gosset. 6 დაკვირვებიდან გამოვმუშაოთ 20 ათასი ნორმალური ნიმუში საშუალოდ ( ) 50 და სტანდარტული გადახრა ( σ ) 10. შემდეგ ჩვენ ნორმალიზდება ნიმუშის საშუალებების გამოყენებით ზოგადი განსხვავება:

მიღებულ 20 ათას საშუალოს დავაჯგუფებთ 0,1 სიგრძის ინტერვალებად და გამოვთვლით სიხშირეებს. დიაგრამაზე გამოვსახოთ სინჯის საშუალებების სიხშირის რეალური (ნორმა) და თეორიული (ENorm) განაწილება.

წერტილები (დაკვირვებული სიხშირეები) პრაქტიკულად ემთხვევა ხაზს (თეორიული სიხშირეები). ეს გასაგებია, რადგან მონაცემები აღებულია ერთი და იგივე პოპულაციისგან და განსხვავებები მხოლოდ შერჩევის შეცდომებია.

ჩავატაროთ ახალი ექსპერიმენტი. ჩვენ ნორმალიზდება საშუალოდ გამოყენებით ნიმუშის განსხვავება.

მოდით ისევ დავთვალოთ სიხშირეები და დავხატოთ ისინი დიაგრამაზე წერტილების სახით, შედარებისთვის დავტოვოთ ნორმალური განაწილების ხაზი. საშუალოების ემპირიული სიხშირე, ვთქვათ, ასოებით აღვნიშნოთ .

ჩანს, რომ დისტრიბუციები ამჯერად არ ემთხვევა ერთმანეთს. დახურე, დიახ, მაგრამ არა იგივე. კუდები უფრო "მძიმე" გახდა.

Gosset-Student-ს არ ჰქონდა MS Excel-ის უახლესი ვერსია, მაგრამ სწორედ ეს ეფექტი შენიშნა. რატომ ხდება ეს? ახსნა არის ის, რომ შემთხვევითი ცვლადი

დამოკიდებულია არა მხოლოდ შერჩევის შეცდომაზე (მრიცხველი), არამედ საშუალოს სტანდარტულ შეცდომაზე (მნიშვნელი), რომელიც ასევე შემთხვევითი ცვლადია.

მოდით, ცოტა გადავხედოთ რა განაწილებას უნდა ჰქონდეს ასეთი შემთხვევითი ცვლადი. პირველ რიგში, მოგიწევთ დაიმახსოვროთ (ან ისწავლოთ) რაღაც მათემატიკური სტატისტიკიდან. არსებობს ფიშერის თეორემა, რომელიც ამბობს, რომ ნორმალური განაწილების ნიმუშში:

1. საშუალო და ნიმუშის განსხვავება s 2არის დამოუკიდებელი რაოდენობა;

2. შერჩევისა და პოპულაციის დისპერსიის თანაფარდობა, გამრავლებული თავისუფლების ხარისხით, აქვს განაწილება χ 2(ჩი-კვადრატი) იგივე რაოდენობის თავისუფლების ხარისხით, ე.ი.

სად – თავისუფლების გრადუსების რაოდენობა (ინგლისურად თავისუფლების ხარისხი (დ.ფ.))

ამ კანონს ეფუძნება მრავალი სხვა შედეგი ნორმალური მოდელების სტატისტიკაში.

დავუბრუნდეთ საშუალოს განაწილებას. გაყავით გამოხატვის მრიცხველი და მნიშვნელი

on σ X̅. ვიღებთ

მრიცხველი არის სტანდარტული ნორმალური შემთხვევითი ცვლადი (ჩვენ აღვნიშნავთ ξ (xi)). გამოვხატოთ მნიშვნელი ფიშერის თეორემიდან.

შემდეგ ორიგინალური გამოხატულება მიიღებს ფორმას

ეს არის ის, რაც არის ზოგადი ფორმით (სტუდენტური ურთიერთობა). მისი განაწილების ფუნქციის პირდაპირ გამოყვანა შეგიძლიათ, რადგან ცნობილია ორივე შემთხვევითი ცვლადის განაწილება ამ გამოსახულებაში. ეს სიამოვნება მათემატიკოსებს მივატოვოთ.

Student t-distribution ფუნქციას აქვს საკმაოდ რთული გასაგები ფორმულა, ამიტომ მის ანალიზს აზრი არ აქვს. ამას მაინც არავინ იყენებს, რადგან... ალბათობები მოცემულია სტუდენტური განაწილების სპეციალურ ცხრილებში (ზოგჯერ უწოდებენ სტუდენტური კოეფიციენტების ცხრილებს), ან შედის კომპიუტერის ფორმულებში.

ასე რომ, ამ ახალი ცოდნით შეიარაღებული, შეგიძლიათ გაიგოთ სტუდენტური განაწილების ოფიციალური განმარტება.
შემთხვევითი ცვლადი, რომელიც ექვემდებარება სტუდენტურ განაწილებას თავისუფლების ხარისხი არის დამოუკიდებელი შემთხვევითი ცვლადების თანაფარდობა

სად ξ განაწილებული სტანდარტული ნორმალური კანონის მიხედვით და χ 2 კგანაწილებას ემორჩილება χ 2თავისუფლების ხარისხები.

ამრიგად, სტუდენტის t ტესტის ფორმულა არითმეტიკული საშუალოსთვის

სტუდენტური ურთიერთობის განსაკუთრებული შემთხვევაა

ფორმულიდან და განმარტებიდან გამომდინარეობს, რომ სტუდენტის t-ტესტის განაწილება დამოკიდებულია მხოლოდ თავისუფლების ხარისხების რაოდენობაზე.

ზე > 30 t-ტესტი პრაქტიკულად არ განსხვავდება სტანდარტული ნორმალური განაწილებისგან.

ჩი-კვადრატისგან განსხვავებით, t-ტესტი შეიძლება იყოს ერთკუდიანი ან ორკუდიანი. ჩვეულებრივ, ისინი იყენებენ ორმხრივ, იმ ვარაუდით, რომ გადახრა შეიძლება მოხდეს საშუალოდან ორივე მიმართულებით. მაგრამ თუ პრობლემური მდგომარეობა იძლევა გადახრას მხოლოდ ერთი მიმართულებით, მაშინ მიზანშეწონილია გამოიყენოთ ცალმხრივი კრიტერიუმი. ეს ოდნავ ზრდის ძალას, რადგან... ფიქსირებული მნიშვნელობის დონეზე, კრიტიკული მნიშვნელობა ოდნავ უახლოვდება ნულს.

Student's t-ტესტის გამოყენების პირობები

მიუხედავად იმისა, რომ სტუდენტის აღმოჩენამ ერთ დროს რევოლუცია მოახდინა სტატისტიკაში, t-ტესტი ჯერ კიდევ საკმაოდ შეზღუდულია მისი გამოყენების შესაძლებლობებით, რადგან თავად გამომდინარეობს თავდაპირველი მონაცემების ნორმალური განაწილების დაშვებიდან. თუ მონაცემები არ არის ნორმალური (რაც ჩვეულებრივ ხდება), მაშინ t-ტესტს აღარ ექნება Student განაწილება. თუმცა, ცენტრალური ლიმიტის თეორემის მოქმედების გამო, საშუალო, თუნდაც არანორმალური მონაცემებისთვის, სწრაფად იძენს ზარის ფორმის განაწილებას.

განვიხილოთ, მაგალითად, მონაცემები, რომლებიც ძლიერ არის გადახრილი მარჯვნივ, როგორიცაა chi-კვადრატის განაწილება თავისუფლების 5 გრადუსით.

ახლა შევქმნათ 20 ათასი ნიმუში და დავაკვირდეთ როგორ იცვლება საშუალოების განაწილება მათი მოცულობის მიხედვით.

განსხვავება საკმაოდ შესამჩნევია 15-20-მდე დაკვირვების მცირე ნიმუშებში. მაგრამ შემდეგ ის სწრაფად ქრება. ამრიგად, განაწილების არანორმალურობა, რა თქმა უნდა, არ არის კარგი, მაგრამ არა კრიტიკული.

ყველაზე მეტად, t-ტესტი "ეშინია" outliers, ე.ი. არანორმალური გადახრები. ავიღოთ 15 დაკვირვების 20 ათასი ნორმალური ნიმუში და ზოგიერთ მათგანს დავუმატოთ ერთი შემთხვევითი გამონაკლისი.

სურათი ბნელი გამოდის. საშუალოების რეალური სიხშირეები ძალიან განსხვავდება თეორიულიდან. t-დისტრიბუციის გამოყენება ასეთ სიტუაციაში ხდება ძალიან სარისკო წამოწყება.

ასე რომ, არც თუ ისე მცირე ნიმუშებში (15 დაკვირვებიდან), t-ტესტი შედარებით მდგრადია ორიგინალური მონაცემების არანორმალური განაწილების მიმართ. მაგრამ მონაცემების უკიდეგანო ნიშნები მნიშვნელოვნად ამახინჯებს t-ტესტის განაწილებას, რამაც, თავის მხრივ, შეიძლება გამოიწვიოს შეცდომები სტატისტიკურ დასკვნაში, ამიტომ ანომალიური დაკვირვებები უნდა აღმოიფხვრას. ხშირად, ყველა მნიშვნელობა, რომელიც ეცემა საშუალოდან ±2 სტანდარტული გადახრის ფარგლებში, ამოღებულია ნიმუშიდან.

მათემატიკური მოლოდინების შესახებ ჰიპოთეზის ტესტირების მაგალითი სტუდენტის t-ტესტის გამოყენებით MS Excel-ში

Excel-ს აქვს რამდენიმე ფუნქცია, რომელიც დაკავშირებულია t-განაწილებასთან. მოდით შევხედოთ მათ.

STUDENT.DIST – „კლასიკური“ მარცხენამხრივი სტუდენტური t-განაწილება. შეყვანა არის t-კრიტერიუმის მნიშვნელობა, თავისუფლების გრადუსების რაოდენობა და ვარიანტი (0 ან 1), რომელიც განსაზღვრავს რა უნდა გამოითვალოს: სიმკვრივე ან ფუნქციის მნიშვნელობა. გამოსავალზე ვიღებთ, შესაბამისად, სიმკვრივეს ან ალბათობას, რომ შემთხვევითი ცვლადი ნაკლები იქნება არგუმენტში მითითებულ t-კრიტერიუმზე.

STUDENT.DIST.2X – ორმხრივი განაწილება. არგუმენტი არის t-ტესტის აბსოლუტური მნიშვნელობა (მოდული) და თავისუფლების გრადუსების რაოდენობა. შედეგად ვიღებთ ალბათობას, რომ მივიღოთ იგივე ან კიდევ უფრო დიდი t-კრიტერიუმის მნიშვნელობა, ე.ი. ფაქტობრივი მნიშვნელობის დონე (p-დონე).

STUDENT.DIST.PH – მარჯვენა მხარეს t-განაწილება. ასე რომ, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PH(2;5) = 0.05097. თუ t-ტესტი დადებითია, მაშინ მიღებული ალბათობა არის p-დონე.

STUDENT.INR – გამოიყენება t-განაწილების მარცხენა მხარის შებრუნების გამოსათვლელად. არგუმენტი არის თავისუფლების ალბათობა და რაოდენობა. გამოსავალზე ვიღებთ t-კრიტერიუმის მნიშვნელობას, რომელიც შეესაბამება ამ ალბათობას. ალბათობის რაოდენობა არის მარცხნივ. ამიტომ, მარცხენა კუდი მოითხოვს თავად მნიშვნელობის დონეს α და სწორისთვის 1 - α .

STUDENT.OBR.2X – შებრუნებული მნიშვნელობა სტუდენტური ორმხრივი განაწილებისთვის, ე.ი. t-ტესტის მნიშვნელობა (მოდული). მნიშვნელოვნების დონე ასევე მიეწოდება შეყვანას α . მხოლოდ ამჯერად დათვლა ხორციელდება ორივე მხრიდან ერთდროულად, ასე რომ, ალბათობა ნაწილდება ორ კუდში. ასე რომ, STUDENT.ARV(1-0.025;5) = STUDENT.ARV.2X(0.05;5) = 2.57058

STUDENT.TEST არის ფუნქცია მათემატიკური მოლოდინების თანასწორობის შესახებ ჰიპოთეზის შესამოწმებლად ორ ნიმუშში. ცვლის გამოთვლების თაიგულს, რადგან საკმარისია მხოლოდ ორი დიაპაზონის მითითება მონაცემებით და კიდევ რამდენიმე პარამეტრით. გამომავალი არის p-დონე.

CONFIDENCE.STUDENT – საშუალოს ნდობის ინტერვალის გამოთვლა t-განაწილების გათვალისწინებით.

განვიხილოთ ტრენინგის ეს მაგალითი. საწარმოში ცემენტი იფუთება 50 კგ-იან პარკებში. შემთხვევითობის გამო, მოსალოდნელი მასისგან გარკვეული გადახრა დასაშვებია ერთ ტომარაში, მაგრამ საერთო საშუალო უნდა დარჩეს 50 კგ. ხარისხის კონტროლის განყოფილებამ შემთხვევით აწონა 9 ტომარა და მიიღო შემდეგი შედეგები: საშუალო წონა ( ) იყო 50,3 კგ, სტანდარტული გადახრა ( ) – 0,5 კგ.

შეესაბამება თუ არა მიღებული შედეგი ნულოვან ჰიპოთეზას, რომ საერთო საშუალო არის 50 კგ? სხვა სიტყვებით რომ ვთქვათ, შესაძლებელია თუ არა ასეთი შედეგის მიღება სრულიად შემთხვევით, თუ მოწყობილობა მუშაობს გამართულად და აწარმოებს საშუალოდ 50 კგ შევსებას? თუ ჰიპოთეზა არ არის უარყოფილი, მაშინ მიღებული განსხვავება ჯდება შემთხვევითი რყევების დიაპაზონში, მაგრამ თუ ჰიპოთეზა უარყოფილია, მაშინ, სავარაუდოდ, იყო გაუმართაობა აპარატის პარამეტრებში, რომელიც ავსებს ჩანთებს. საჭიროა მისი შემოწმება და კონფიგურაცია.

ზოგადად მიღებული ნოტაციის მოკლე მდგომარეობა ასე გამოიყურება.

H0: μ = 50 კგ

H1: μ ≠ 50 კგ

არსებობს საფუძველი ვივარაუდოთ, რომ ჩანთების შევსების განაწილება მიჰყვება ნორმალურ განაწილებას (ან დიდად არ განსხვავდება მისგან). ეს ნიშნავს, რომ მათემატიკური მოლოდინის შესახებ ჰიპოთეზის შესამოწმებლად, შეგიძლიათ გამოიყენოთ Student t-ტესტი. შემთხვევითი გადახრები შეიძლება მოხდეს ნებისმიერი მიმართულებით, რაც ნიშნავს, რომ საჭიროა ორმხრივი t-ტესტი.

პირველ რიგში, ჩვენ გამოვიყენებთ ანტიდილუვიურ საშუალებებს: ხელით გამოვთვალოთ t-კრიტერიუმი და შევადაროთ ცხრილის კრიტიკულ მნიშვნელობას. სავარაუდო t-ტესტი:

ახლა განვსაზღვროთ, აღემატება თუ არა მიღებული რიცხვი კრიტიკულ დონეს მნიშვნელოვნების დონეზე α = 0.05. გამოვიყენოთ სტუდენტის t-განაწილების ცხრილი (ხელმისაწვდომია სტატისტიკის ნებისმიერ სახელმძღვანელოში).

სვეტები აჩვენებს განაწილების მარჯვენა მხარის ალბათობას, ხოლო რიგები აჩვენებს თავისუფლების ხარისხების რაოდენობას. ჩვენ გვაინტერესებს ორკუდიანი t-ტესტი 0,05 მნიშვნელოვნების დონით, რომელიც ექვივალენტურია t-მნიშვნელობის ნახევარზე მარჯვნივ: 1 - 0,05/2 = 0,975. თავისუფლების გრადუსების რაოდენობა არის ნიმუშის ზომა მინუს 1, ე.ი. 9 - 1 = 8. გადაკვეთაზე ვპოულობთ t-ტესტის ცხრილის მნიშვნელობას - 2.306. თუ გამოვიყენებდით სტანდარტულ ნორმალურ განაწილებას, მაშინ კრიტიკული წერტილი იქნებოდა 1.96, მაგრამ აქ ის უფრო დიდია, რადგან t-განაწილებას მცირე ნიმუშებში აქვს უფრო გაბრტყელებული გარეგნობა.

შევადაროთ ფაქტობრივი (1.8) და ცხრილის მნიშვნელობა (2.306). გამოთვლილი კრიტერიუმი ჩამოთვლილზე ნაკლები აღმოჩნდა. შესაბამისად, არსებული მონაცემები არ ეწინააღმდეგება H 0 ჰიპოთეზას, რომ საერთო საშუალო არის 50 კგ (მაგრამ არც ადასტურებს ამას). ეს არის ყველაფერი, რაც შეგვიძლია ვისწავლოთ ცხრილების გამოყენებით. თქვენ, რა თქმა უნდა, ასევე შეგიძლიათ სცადოთ p- დონის პოვნა, მაგრამ ეს იქნება მიახლოებითი. და, როგორც წესი, ეს არის p- დონე, რომელიც გამოიყენება ჰიპოთეზების შესამოწმებლად. ამიტომ, ჩვენ შემდეგ გადავდივართ Excel-ზე.

არ არსებობს მზა ფუნქცია Excel-ში t-ტესტის გამოსათვლელად. მაგრამ ეს არ არის საშინელი, რადგან Student's t-test ფორმულა საკმაოდ მარტივია და ადვილად აშენდება პირდაპირ Excel უჯრედში.

ჩვენ იგივე 1.8 მივიღეთ. ჯერ ვიპოვოთ კრიტიკული მნიშვნელობა. ვიღებთ ალფა 0.05-ს, კრიტერიუმი ორკუდიანია. ჩვენ გვჭირდება შებრუნებული t-განაწილების ფუნქცია STUDENT.OBR.2X ორმხრივი ჰიპოთეზისთვის.

შედეგად მიღებული მნიშვნელობა წყვეტს კრიტიკულ რეგიონს. დაკვირვებული t-ტესტი მასში არ ჯდება, ამიტომ ჰიპოთეზა არ არის უარყოფილი.

თუმცა, ეს არის ჰიპოთეზის ტესტირების იგივე გზა ცხრილის მნიშვნელობის გამოყენებით. უფრო ინფორმაციული იქნებოდა p- დონის გამოთვლა, ე.ი. საშუალო 50 კგ-დან დაკვირვებული ან კიდევ უფრო დიდი გადახრის მიღების ალბათობა, თუ ეს ჰიპოთეზა სწორია. დაგჭირდებათ Student განაწილების ფუნქცია STUDENT.DIST.2X ორმხრივი ჰიპოთეზისთვის.

P- დონე არის 0,1096, რაც მეტია 0,05 მისაღები მნიშვნელოვნების დონეზე - ჩვენ არ უარვყოფთ ჰიპოთეზას. მაგრამ ახლა ჩვენ შეგვიძლია ვიმსჯელოთ მტკიცებულების ხარისხზე. P- დონე საკმაოდ ახლოს აღმოჩნდა იმ დონესთან, როდესაც ჰიპოთეზა უარყოფილია და ეს იწვევს სხვადასხვა აზრებს. მაგალითად, რომ ნიმუში ძალიან მცირე იყო მნიშვნელოვანი გადახრის აღმოსაჩენად.

გარკვეული პერიოდის შემდეგ, კონტროლის განყოფილებამ კვლავ გადაწყვიტოს შეამოწმოს, თუ როგორ არის დაცული ჩანთების შევსების სტანდარტი. ამჯერად მეტი საიმედოობისთვის შეირჩა არა 9, არამედ 25 ჩანთა. ინტუიციურად ნათელია, რომ საშუალოს გავრცელება შემცირდება და, შესაბამისად, სისტემაში წარუმატებლობის აღმოჩენის შანსი უფრო დიდი ხდება.

ვთქვათ, ნიმუშის საშუალო და სტანდარტული გადახრის იგივე მნიშვნელობები იქნა მიღებული, როგორც პირველად (50.3 და 0.5, შესაბამისად). გამოვთვალოთ t-ტესტი.


კრიტიკული მნიშვნელობა თავისუფლების 24 გრადუსისთვის და α = 0.05 არის 2.064. ქვემოთ მოყვანილი სურათი აჩვენებს, რომ t-ტესტი ვარდება ჰიპოთეზის უარყოფის დიაპაზონში.

შეგვიძლია დავასკვნათ, რომ 95%-ზე მეტი ნდობის ალბათობით საერთო საშუალო 50 კგ-დან განსხვავდება. უფრო დამაჯერებელი რომ ვიყოთ, მოდით გადავხედოთ p- დონეს (ცხრილის ბოლო ხაზი). 50-დან იგივე ან კიდევ უფრო დიდი გადახრით საშუალოს მიღების ალბათობა, თუ ჰიპოთეზა სწორია, არის 0,0062, ანუ 0,62%, რაც პრაქტიკულად შეუძლებელია ერთი გაზომვით. ზოგადად, ჩვენ უარვყოფთ ჰიპოთეზას, როგორც ნაკლებად სავარაუდოა.

ნდობის ინტერვალის გამოთვლა სტუდენტის t-განაწილების გამოყენებით

კიდევ ერთი სტატისტიკური მეთოდი მჭიდრო კავშირშია ჰიპოთეზის ტესტირებასთან - ნდობის ინტერვალების გაანგარიშება. თუ მიღებული ინტერვალი შეიცავს ნულოვანი ჰიპოთეზის შესაბამის მნიშვნელობას, მაშინ ეს უდრის იმ ფაქტს, რომ ნულოვანი ჰიპოთეზა არ არის უარყოფილი. წინააღმდეგ შემთხვევაში, ჰიპოთეზა უარყოფილია შესაბამისი ნდობის დონით. ზოგიერთ შემთხვევაში, ანალიტიკოსები საერთოდ არ ამოწმებენ ჰიპოთეზებს კლასიკური ფორმით, მაგრამ მხოლოდ ითვლის ნდობის ინტერვალებს. ეს მიდგომა საშუალებას გაძლევთ მიიღოთ კიდევ უფრო სასარგებლო ინფორმაცია.

მოდით გამოვთვალოთ ნდობის ინტერვალები საშუალოსთვის 9 და 25 დაკვირვებისთვის. ამისთვის გამოვიყენებთ Excel ფუნქციას CONFIDENT.STUDENT. აქ, უცნაურად საკმარისია, ყველაფერი საკმაოდ მარტივია. თქვენ მხოლოდ უნდა მიუთითოთ მნიშვნელობის დონე ფუნქციის არგუმენტებში α , ნიმუშის სტანდარტული გადახრა და ნიმუშის ზომა. გამოსავალზე ვიღებთ ნდობის ინტერვალის ნახევარ სიგანეს, ანუ მნიშვნელობას, რომელიც უნდა განთავსდეს საშუალოს ორივე მხარეს. გამოთვლების განხორციელების და ვიზუალური დიაგრამის შედგენის შემდეგ ვიღებთ შემდეგს.

როგორც ხედავთ, 9 დაკვირვების ნიმუშის შემთხვევაში, მნიშვნელობა 50 ხვდება ნდობის ინტერვალში (ჰიპოთეზა არ არის უარყოფილი), ხოლო 25 დაკვირვებით ის არ შედის ნდობის ინტერვალში (ჰიპოთეზა უარყოფილია). უფრო მეტიც, 25 ტომარაზე ჩატარებული ექსპერიმენტის დროს შეიძლება ითქვას, რომ 97,5% ალბათობით, საერთო საშუალო აღემატება 50,1 კგ-ს (ნდობის ინტერვალის ქვედა ზღვარი არის 50,094 კგ). და ეს საკმაოდ ღირებული ინფორმაციაა.

ამრიგად, ჩვენ გადავწყვიტეთ იგივე პრობლემა სამი გზით:

1. უძველესი მიდგომის გამოყენებით, t-ტესტის გამოთვლილი და ცხრილოვანი მნიშვნელობების შედარება
2. უფრო თანამედროვე, p- დონის გამოთვლით, ჰიპოთეზის უარყოფისას დამაჯერებლობის ხარისხის დამატება.
3. კიდევ უფრო ინფორმატიული ნდობის ინტერვალის გაანგარიშებით და ზოგადი საშუალო მინიმალური მნიშვნელობის მიღებით.

მნიშვნელოვანია გვახსოვდეს, რომ t-ტესტი ეხება პარამეტრულ მეთოდებს, რადგან ეფუძნება ნორმალურ განაწილებას (მას აქვს ორი პარამეტრი: საშუალო და დისპერსიული). ამიტომ, მისი წარმატებული გამოყენებისთვის მნიშვნელოვანია საწყისი მონაცემების მინიმუმ მიახლოებითი ნორმალურობა და შორეულობის არარსებობა.

და ბოლოს, მე გთავაზობთ უყუროთ ვიდეოს, თუ როგორ უნდა განახორციელოთ გამოთვლები Excel-ში Student t-ტესტთან დაკავშირებით.

მოსწავლეთა განაწილების ცხრილი

ალბათობის ინტეგრალური ცხრილები გამოიყენება უსასრულოდ დიდი პოპულაციის დიდი ნიმუშებისთვის. მაგრამ უკვე (n)< 100 получается Несоответствие между

ცხრილის მონაცემები და ლიმიტის ალბათობა; (n)-ზე< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

საერთო პოპულაციას არ აქვს მნიშვნელობა, რადგან ნიმუშის ინდიკატორის გადახრების განაწილება ზოგადი მახასიათებლიდან დიდი ნიმუშით ყოველთვის ნორმალურია.

ნომ. მცირე ნიმუშებში (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

მოსახლეობა, რომელსაც აქვს ნორმალური განაწილება. მცირე ნიმუშების თეორია შეიმუშავა ინგლისელმა სტატისტიკოსმა W. Gosset-მა (რომელიც წერდა ფსევდონიმით Student) მე-20 საუკუნის დასაწყისში. IN

1908 წელს მან შექმნა სპეციალური განაწილება, რომელიც საშუალებას იძლევა, თუნდაც მცირე ნიმუშებით, მოხდეს (t) და ნდობის ალბათობის F(t) კორელაცია. (n) > 100-ისთვის, სტუდენტური განაწილების ცხრილები იძლევა იგივე შედეგებს, რაც ლაპლასის ალბათობის ინტეგრალური ცხრილები 30-ისთვის< (n ) <

100 განსხვავება უმნიშვნელოა. აქედან გამომდინარე, პრაქტიკულად მცირე ნიმუშები მოიცავს 30 ერთეულზე ნაკლები მოცულობის ნიმუშებს (რა თქმა უნდა, 100 ერთეულზე მეტი მოცულობის ნიმუში ითვლება დიდად).

მცირე ნიმუშების გამოყენება ზოგიერთ შემთხვევაში განპირობებულია გამოკითხული მოსახლეობის ბუნებით. ამრიგად, სანაშენე სამუშაოებში „სუფთა“ გამოცდილების მიღწევა უფრო ადვილია მცირე რაოდენობით

ნაკვეთები. ეკონომიკურ ხარჯებთან დაკავშირებული საწარმოო და ეკონომიკური ექსპერიმენტი ასევე ტარდება მცირე რაოდენობის ცდებზე. როგორც უკვე აღვნიშნეთ, მცირე შერჩევის შემთხვევაში, როგორც ნდობის ალბათობა, ასევე ზოგადი საშუალო ნდობის ლიმიტები შეიძლება გამოითვალოს მხოლოდ ნორმალურად განაწილებული პოპულაციისთვის.

სტუდენტური განაწილების ალბათობის სიმკვრივე აღწერილია ფუნქციით.

1 + t2

f (t ,n) := Bn

n − 1

t - მიმდინარე ცვლადი n - ნიმუშის ზომა;

B არის სიდიდე, რომელიც დამოკიდებულია მხოლოდ (n-ზე).

Student განაწილებას აქვს მხოლოდ ერთი პარამეტრი: (d.f.) - თავისუფლების გრადუსების რაოდენობა (ზოგჯერ აღინიშნება (k)). ეს განაწილება, ისევე როგორც ნორმალური, სიმეტრიულია წერტილის მიმართ (t) = 0, მაგრამ უფრო ბრტყელია. რაც იზრდება ნიმუშის ზომა და, შესაბამისად, თავისუფლების ხარისხების რაოდენობა, სტუდენტური განაწილება სწრაფად უახლოვდება ნორმას. თავისუფლების ხარისხების რაოდენობა უდრის იმ ინდივიდუალური მახასიათებლების მნიშვნელობების რაოდენობას, რომლებიც უნდა განაწილდეს

ვივარაუდოთ სასურველი მახასიათებლის განსაზღვრა. ამრიგად, დისპერსიის გამოსათვლელად, საშუალო მნიშვნელობა უნდა იყოს ცნობილი. ამიტომ, დისპერსიის გამოთვლისას გამოიყენეთ (d.f.) = n - 1.

სტუდენტების განაწილების ცხრილები გამოქვეყნებულია ორი ვერსიით:

1. ალბათობის ინტეგრალური ცხრილების მსგავსად, მნიშვნელობები (უ ) და შესაბამისი

მიმდინარე ალბათობები F(t) თავისუფლების ხარისხის სხვადასხვა რაოდენობაზე;

2. მნიშვნელობები (t) მოცემულია ყველაზე ხშირად გამოყენებული ნდობის ალბათობებისთვის

0,70; 0,75; 0,80; 0,85; 0,90; 0.95 და 0.99 ან 1 - 0.70 = 0.3; 1 - 0.80 = 0.2; …… 1 - 0.99 = 0.01.

3. თავისუფლების სხვადასხვა ხარისხში. ასეთი ცხრილი მოცემულია დანართში

(ცხრილი 1 - 20), ასევე მნიშვნელობა (t) - სტუდენტის ტესტი მნიშვნელოვნების დონეზე 0,7

მთელი მაგალითის განმავლობაში გამოვიყენებთ ფიქტიურ ინფორმაციას, რათა მკითხველმა დამოუკიდებლად განახორციელოს საჭირო გარდაქმნები.

ასე ვთქვათ, კვლევის მსვლელობისას შევისწავლეთ A პრეპარატის მოქმედება B ნივთიერების შემცველობაზე (მმოლ/გ) C ქსოვილში და D ნივთიერების კონცენტრაციაზე სისხლში (მმოლ/ლ) პაციენტებში. ზოგიერთი E კრიტერიუმის მიხედვით იყოფა 3 თანაბარი მოცულობის ჯგუფად (n = 10). ასეთი ფიქტიური კვლევის შედეგები მოცემულია ცხრილში:

B ნივთიერების შემცველობა, მმოლ/გ

ნივთიერება D, მმოლ/ლ

კონცენტრაციის გაზრდა


გვინდა გაგაფრთხილოთ, რომ ჩვენ განვიხილავთ 10 ზომის ნიმუშებს მონაცემთა წარმოდგენისა და გამოთვლების სიმარტივისთვის, ასეთი ნიმუშის ზომა, როგორც წესი, არ არის საკმარისი სტატისტიკური დასკვნის შესაქმნელად.

მაგალითად, განიხილეთ მონაცემები ცხრილის 1 სვეტში.

Აღწერითი სტატისტიკა

ნიმუში ნიშნავს

არითმეტიკული საშუალო, რომელსაც ხშირად უბრალოდ "საშუალოდ" უწოდებენ, მიიღება ყველა მნიშვნელობის დამატებით და ამ ჯამის გაყოფით სიმრავლის მნიშვნელობების რაოდენობაზე. ეს შეიძლება იყოს ნაჩვენები ალგებრული ფორმულის გამოყენებით. x ცვლადის n დაკვირვების სიმრავლე შეიძლება წარმოდგენილი იყოს x 1 , x 2 , x 3 , ..., x n

დაკვირვების საშუალო არითმეტიკული განსაზღვრის ფორმულა (გამოითქმის "X ხაზით"):

= (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

ნიმუშის ვარიაცია

მონაცემთა დისპერსიის გაზომვის ერთ-ერთი გზაა იმის დადგენა, თუ რა ხარისხით არის გადახრილი თითოეული დაკვირვება არითმეტიკული საშუალოდან. ცხადია, რაც მეტია გადახრა, მით მეტია დაკვირვებების ცვალებადობა, ცვალებადობა. თუმცა ამ გადახრების საშუალოს ვერ გამოვიყენებთ როგორც დისპერსიის საზომი, რადგან დადებითი გადახრები ანაზღაურებს უარყოფით გადახრებს (მათი ჯამი არის ნული). ამ ამოცანის გადასაჭრელად ვაკვერცხებთ თითოეულ გადახრას და ვპოულობთ კვადრატულ გადახრების საშუალოს; ამ რაოდენობას ეწოდება ცვალებადობა, ან დისპერსია. ავიღოთ n დაკვირვება x 1, x 2, x 3, ..., x n, საშუალო რომელიც უდრის. დისპერსიის გამოთვლა ეს, როგორც წესი, მოიხსენიება როგორცs2,ეს დაკვირვებები:

ამ ინდიკატორის ნიმუშის ვარიაცია არის s 2 = 3.2.

Სტანდარტული გადახრა

სტანდარტული (საშუალო კვადრატული) გადახრა არის დისპერსიის დადებითი კვადრატული ფესვი. n დაკვირვების მაგალითის გამოყენებით, ასე გამოიყურება:

ჩვენ შეგვიძლია წარმოვიდგინოთ სტანდარტული გადახრა, როგორც დაკვირვების საშუალოდან ერთგვარი საშუალო გადახრა. იგი გამოითვლება იმავე ერთეულებში (განზომილებებით), როგორც ორიგინალური მონაცემები.

s = sqrt (s 2) = sqrt (3,2) = 1.79.

ვარიაციის კოეფიციენტი

თუ სტანდარტულ გადახრას გაყოფთ არითმეტიკულ საშუალოზე და გამოსახავთ შედეგს პროცენტულად, მიიღებთ ვარიაციის კოეფიციენტს.

CV = (1.79 / 13.1) * 100% = 13.7

საშუალო შეცდომის ნიმუში

1.79/sqrt(10) = 0.57;

სტუდენტის t კოეფიციენტი (ერთი ნიმუშის t-ტესტი)

გამოიყენება ჰიპოთეზის შესამოწმებლად საშუალო მნიშვნელობასა და ზოგიერთ ცნობილ მნიშვნელობას შორის სხვაობის შესახებ

თავისუფლების გრადუსების რაოდენობა გამოითვლება როგორც f=n-1.

ამ შემთხვევაში, საშუალო ნდობის ინტერვალი არის 11.87 და 14.39 საზღვრებს შორის.

95% ნდობის დონისთვის m=11.87 ან m=14.39, ეს არის= |13.1-11.82| = |13.1-14.38| = 1.28

შესაბამისად, ამ შემთხვევაში, თავისუფლების გრადუსების რაოდენობისთვის f = 10 - 1 = 9 და 95% ნდობის დონე t = 2.26.

დიალოგის ძირითადი სტატისტიკა და ცხრილები

მოდულში ძირითადი სტატისტიკა და ცხრილებიავირჩიოთ Აღწერითი სტატისტიკა.

გაიხსნება დიალოგური ფანჯარა Აღწერითი სტატისტიკა.

მინდორში ცვლადებიავირჩიოთ ჯგუფი 1.

დაჭერით კარგი, ვიღებთ შედეგების ცხრილებს არჩეული ცვლადების აღწერითი სტატისტიკით.

გაიხსნება დიალოგური ფანჯარა ერთი ნიმუშის t-ტესტი.

დავუშვათ, ვიცით, რომ B ნივთიერების საშუალო შემცველობა C ქსოვილში არის 11.

შედეგების ცხრილი აღწერითი სტატისტიკით და სტუდენტის t-ტესტით ასეთია:

ჩვენ უნდა უარვყოთ ჰიპოთეზა, რომ B ნივთიერების საშუალო შემცველობა C ქსოვილში არის 11.

ვინაიდან კრიტერიუმის გამოთვლილი მნიშვნელობა აღემატება ცხრილის მნიშვნელობას (2.26), ნულოვანი ჰიპოთეზა უარყოფილია შერჩეულ მნიშვნელოვნების დონეზე და განსხვავებები ნიმუშსა და ცნობილ მნიშვნელობას შორის ითვლება სტატისტიკურად მნიშვნელოვანი. ამრიგად, დასკვნა სტუდენტის ტესტის გამოყენებით განსხვავებების არსებობის შესახებ დასტურდება ამ მეთოდის გამოყენებით.

კატეგორიები

პოპულარული სტატიები

2024 "kingad.ru" - ადამიანის ორგანოების ულტრაბგერითი გამოკვლევა