Milline peaks olema usaldusvahemik. Usaldusvahemiku arvutamine Microsoft Excelis. Samuti praktilised sigmaväärtused

Usaldusvahemiku arvutamisel võetakse aluseks vastava parameetri keskmine viga. Usaldusvahemik näitab eeldatava parameetri tegeliku väärtuse piire tõenäosusega (1-a). Siin on a olulisuse tase, (1-a) nimetatakse ka usaldus tõenäosuseks.

Esimeses peatükis näitasime, et näiteks aritmeetilise keskmise korral jääb tegelik keskmine agregaadis umbes 95% juhtudest keskmise keskmise kahe vea piiresse. Seega eraldatakse keskmise 95% usaldusvahemiku piirid valimi keskmisest keskmise kahekordse keskmise veaga, s.o. korrutame keskmise keskmise vea teatud koefitsiendiga, sõltuvalt usaldus tõenäosusest. Keskmise ja keskmiste erinevuse jaoks võetakse õpilase koefitsient (õpilase kriteeriumi kriitiline väärtus), murdosa ja osade erinevuse korral kriteeriumi z kriitiline väärtus. Koefitsiendi korrutist keskmise vea järgi võib nimetada selle parameetri piirveaks, s.t. maksimum, mida me selle hindamisel võime saada.

Usaldusvahemik aritmeetiline keskmine : .

Siin on näidise keskmine;

Aritmeetiline keskmine viga;

s -valimi standardhälve;

n

f \u003d n-1 (õpilase koefitsient).

Usaldusvahemik aritmeetilised keskmised erinevused :

Siin on erinevus valimi keskmistes;

- aritmeetilise keskmise erinevuse keskmine viga;

s 1, s 2 -valimi keskmised ruuthälbed;

n 1, n 2

Õpilase kriteeriumi kriitiline väärtus antud olulisuse taseme a ja vabadusastmete arvu korral f \u003d n 1 + n 2-2 (õpilase koefitsient).

Usaldusvahemik jaga :

.

D on siin proovifraktsioon;

- keskmise aktsia viga;

n - valimi suurus (rühma suurus);

Usaldusvahemik jagada erinevusi :

Siin on erinevus valimi osades;

- aritmeetilise keskmise erinevuse keskmine viga;

n 1, n 2 - valimi suurus (rühmade arv);

Kriteeriumi z kriitiline väärtus antud olulisuse tasemel a (,,).

Näitajate erinevuse usaldusvahemike arvutamisel näeme esiteks vahetult efekti võimalikke väärtusi, mitte ainult selle punkthinnangut. Teiseks võime järeldada, et nullhüpotees on aktsepteeritud või ümber lükatud, ja kolmandaks võime järeldada, et kriteerium on võimas.

Hüpoteeside kontrollimisel usaldusvahemike abil peate järgima järgmist reeglit:

Kui keskmise erinevuse 100 (1-a) protsendiline usaldusvahemik ei sisalda nulli, on erinevused statistiliselt olulised olulisuse tasemel a; Vastupidi, kui see intervall sisaldab nulli, siis pole erinevused statistiliselt olulised.

Tõepoolest, kui see intervall sisaldab nulli, siis võib võrdlusnäitaja osutuda ühes rühmas suuremaks või väiksemaks, võrreldes teisega, s.o. täheldatud erinevused on juhuslikud.

Selle koha järgi, kus null asub usaldusvahemikus, saab hinnata kriteeriumi tugevust. Kui null on vahemiku alumise või ülemise piiri lähedal, siis on see võimalik suurema arvu võrreldavate rühmade korral, kui erinevused saavutaksid statistilise olulisuse. Kui null on vahemiku keskpunkti lähedal, siis tähendab see, et indikaatori suurenemine ja langus katserühmas on võrdselt tõenäoline ning tõenäoliselt erinevusi tõesti pole.

Näited:

Operatiivse suremuse võrdlemiseks kahe erinevat tüüpi anesteesia kasutamisel: esimest tüüpi anesteesia korral opereeriti 61 inimest, 8 inimest suri, teise abil - 67 inimest, 10 suri.

d1 \u003d 8/61 \u003d 0,131; d2 \u003d 10/67 \u003d 0,149; d1-d2 \u003d - 0,018.

Võrreldavate meetodite suremuse erinevus on vahemikus (-0,018 - 0,122; -0,018 + 0,122) või (-0,14; 0,104) tõenäosusega 100 (1-a) \u003d 95%. Intervall sisaldab nulli, s.t. hüpoteesi sama suremuse kohta erinevat tüüpi anesteesias ei saa tagasi lükata.

Seega võib ja väheneb suremus 14% -ni ja suureneb 10,4% -ni tõenäosusega 95%, s.o. null asub umbes intervalli keskel, nii et võib väita, et kõige tõenäolisemalt ei erine need kaks meetodit suremuses tegelikult.

Eelnevalt vaadeldud näites võrreldi koputamistesti ajal surumise keskmist aega neljas õpilaste rühmas, kelle eksamitase oli erinev. Arvutame 2. ja 5. eksami sooritanud õpilaste keskmise pressimise aja usaldusvahemikud ja usaldusvahemiku nende keskmiste erinevuste jaoks.

Õpilaste koefitsiendid leitakse õpilaste jaotustabelitest (vt lisa): esimese rühma jaoks: \u003d t (0,05; 48) \u003d 2,011; teise rühma jaoks: \u003d t (0,05; 61) \u003d 2000. Seega usaldusvahemikud esimese grupi kohta: \u003d (162,19 - 2 011 * 2,18; 162,19 + 2,011 * 2,18) \u003d (157,8; 166,6), teise rühma jaoks (156,55 - 2000 * 1,88; 156,55 + 2000 * 1,88) \u003d (152,8; 160,3). Niisiis, nende jaoks, kes sooritavad eksami 2-ga, jääb keskmine pressimise aeg vahemikku 157,8 ms kuni 166,6 ms tõenäosusega 95%, neile, kes sooritavad eksami viies - vahemikus 152,8 ms kuni 160,3 ms, tõenäosusega 95%.

Nullhüpoteesi saab kontrollida ka keskmiste usaldusvahemikes, mitte ainult keskmiste erinevuste osas. Näiteks nagu meie puhul, kui keskmiste usaldusvahemikud kattuvad, ei saa nullhüpoteesi tagasi lükata. Hüpoteesi tagasilükkamiseks valitud olulisuse tasemel ei tohiks vastavad usaldusvahemikud kattuda.

Eksami sooritanud rühmade keskmise pressimise aja erinevuse usaldusvahemiku leiame 2 ja 5 võrra. Keskmine erinevus: 162,19 - 156,55 \u003d 5,64. Õpilase koefitsient: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Grupi standardhälbed võrduvad :; . Arvutame keskmiste erinevuste keskmise vea:. Usaldusvahemik: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Niisiis on eksami sooritanud rühmade keskmise pressimisaja erinevus vahemikus 2 ja 5 vahemikus -0,044 ms kuni 11,33 ms. See intervall sisaldab nulli, s.t. keskmine eksami sooritanud isikutele klõpsamise aeg võib suureneda ja väheneda võrreldes ebaõnnestunutega, s.o. nullhüpoteesi ei saa tagasi lükata. Kuid null asub alumise piiri lähedal, pressimise aeg väheneb tõenäolisemalt neil, kes on suurepärase läbinud. Seega võime järeldada, et 2 ja 5 möödujate vahel on keskmises pressimisajas erinevused, me lihtsalt ei suutnud neid tuvastada keskmise aja, keskmise aja ja proovide mahu muutuse osas.

Kriteeriumi jõud on vale nullhüpoteesi tagasilükkamise tõenäosus, s.t. leida erinevusi seal, kus nad tegelikult on.

Kriteeriumi võimsus määratakse olulisuse taseme, rühmadevaheliste erinevuste suuruse, väärtuste rühmadesse jaotumise ja proovide mahu põhjal.

Õpilaste kriteeriumide ja dispersioonianalüüside jaoks võib kasutada tundlikkuse diagramme.

Selle kriteeriumi tugevust saab kasutada vajaliku rühmade arvu esialgsel kindlaksmääramisel.

Usaldusvahemik näitab, mil määral hinnangulise parameetri tegelik väärtus antud tõenäosusega asub.

Usaldusvahemikke kasutades saate testida statistilisi hüpoteese ja teha järeldusi kriteeriumide tundlikkuse kohta.

KIRJANDUS.

Glanz S. - peatükk 6.7.

Rebrova O.Yu. - lk 112-114, lk 171-173, lk 234-238.

Sidorenko E. V. - lk 32-33.

Küsimused õpilaste enesekontrolliks.

1. Mis on võimsuse kriteerium?

2. Millistel juhtudel on vaja hinnata kriteeriumide tugevust?

3. Võimsuse arvutamise meetodid.

6. Kuidas testida statistilist hüpoteesi usaldusvahemiku abil?

7. Mida saab öelda kriteeriumi tugevuse kohta usaldusvahemiku arvutamisel?

Ülesanded.

KONFIDENTSIAALSED INTERVJALID SAADUSTE JA AKTSIATE KOHTA

© 2008

Riiklik rahvatervise instituut, Oslo, Norra

Artiklis kirjeldatakse ja käsitletakse sageduste ja murdosade usaldusvahemike arvutamist vastavalt Wald, Wilson, Klopper - Pearson meetoditele, kasutades nurgamuundust ja Wald'i meetodit korrigeerimisega vastavalt Agresti - Cole'ile. Esitatud materjal pakub üldist teavet sageduste ja murdosade usaldusvahemike arvutamise meetodite kohta ning on mõeldud ajakirja lugejate huvi äratamiseks mitte ainult usaldusvahemike kasutamisel oma uurimistöö tulemuste tutvustamisel, vaid ka erialakirjanduse lugemisel enne tulevaste väljaannete kallal töötamist.

Märksõnad: usaldusvahemik, sagedus, osakaal

Ühes varasemates väljaannetes mainiti lühidalt kvalitatiivsete andmete kirjeldust ja teatati, et nende intervalli hindamine on parem kui punkthinnang, et kirjeldada uuritud tunnuse esinemissagedust üldpopulatsioonis. Kuna uuringute läbiviimisel kasutatakse valimi andmeid, peaks tulemuste prognoos populatsiooni kohta sisaldama valimi hinnangu ebatäpsuse elementi. Usaldusvahemik on hinnangulise parameetri täpsuse mõõt. Huvitav on see, et mõnes arstide statistika põhitõdesid käsitlevas raamatus jäetakse sageduste usaldusvahemike teema täielikult tähelepanuta. Selles artiklis käsitleme mitmeid sageduste usaldusvahemike arvutamise meetodeid, mis viitavad valimi sellistele omadustele nagu korratavus ja esindavus, aga ka vaatluste sõltumatus üksteisest. Selles artiklis esitatud sagedus ei ole absoluutarv, mis näitab, mitu korda see või see väärtus leitakse agregaadist, vaid suhteline väärtus, mis määrab uuringus osalejate osakaalu, kellel on uuritav omadus.

Biomeditsiinilistes uuringutes kasutatakse kõige sagedamini 95% usaldusvahemikke. See usaldusvahemik tähistab piirkonda, kuhu murdosa tegelik väärtus langeb 95% juhtudest. Teisisõnu võib 95% usaldusväärsusega öelda, et tunnuse esinemise sageduse tegelik väärtus populatsioonis jääb 95% usaldusvahemikku.

Enamik uuringute juhendeid meditsiiniuurijatele väidavad, et sagedusviga arvutatakse valemi abil

kus p on tunnuse esinemise sagedus proovis (väärtus vahemikus 0 kuni 1). Enamik kodumaiseid teadusartikleid näitavad tunnuse esinemissageduse väärtust proovis (p) ja selle viga (sid) kujul p ± s. Otstarbekam on siiski esitada tunnuse esinemissageduse populatsioonis 95% usaldusvahemik, mis sisaldab väärtusi alates

enne.

Mõnes käsiraamatus on väikeste proovide puhul soovitatav 1,96 väärtus asendada t-väärtusega N - 1 vabadusastme jaoks, kus N on vaatluses esitatud vaatluste arv. T väärtus leitakse t-jaotuse tabelites, mis on saadaval peaaegu kõigis statistikajuhendites. T-jaotuse kasutamine Wald-meetodi jaoks ei anna nähtavaid eeliseid võrreldes teiste allpool käsitletud meetoditega ja seetõttu ei kiida mõned autorid seda heaks.

Ülaltoodud sageduste või murdosade usaldusvahemike arvutamise meetod on nimetatud Wald Abraham Wald (1902-1950) auks, kuna seda hakati laialdaselt kasutama pärast Wald ja Wolfowitzi 1939. aastal avaldamist. Meetodi ise pakkus Pierre Simon Laplace (1749–1827) välja aga juba 1812. aastal.

Waldi meetod on väga populaarne, kuid selle rakendamine on seotud oluliste probleemidega. Meetodit ei soovitata kasutada väikeste valimite korral, samuti juhtudel, kui karakteristiku esinemissagedus kipub olema 0 või 1 (0% või 100%) ja sageduste 0 ja 1 puhul on see lihtsalt võimatu. Lisaks on normaaljaotuse ligikaudne arvutus, mida kasutatakse vea arvutamisel , “Ei tööta” juhtudel, kui n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Kuna uuel muutujal on normaaljaotus, on muutuja φ 95% usaldusvahemiku alumine ja ülemine piir võrdne φ-1,96 ja φ + 1,96vasakas "\u003e

Väikeste proovide 1,96 asemel soovitatakse N - 1 vabadusastmega t väärtus asendada. See meetod ei anna negatiivseid väärtusi ja võimaldab sageduste usaldusvahemikke täpsemini hinnata kui Wald'i meetod. Lisaks kirjeldatakse seda paljudes meditsiinistatistikat käsitlevates kodumaistes teatmikes, mis aga ei viinud selle laialdase kasutamiseni meditsiinilistes uuringutes. Usaldusvahemike arvutamine nurga teisenduse abil ei ole soovitatav sagedustel, mis lähenevad 0 või 1.

See usaldusvahemike hindamise meetodite kirjeldus enamikus raamatutes meditsiiniteadlaste statistika põhialuste kohta lõpeb tavaliselt ja see probleem on omane mitte ainult kodumaisele, vaid ka välismaisele kirjandusele. Mõlemad meetodid põhinevad kesksel piirteoreemil, mis eeldab suure valimi olemasolu.

Arvestades eelnimetatud meetodite abil usaldusvahemike hindamise puudusi, pakkusid Clopper ja Pearson 1934. aastal välja meetodi niinimetatud täpse usaldusvahemiku arvutamiseks, võttes arvesse uuritava tunnuse binomilist jaotust. See meetod on saadaval paljudes veebikalkulaatorites, kuid sel viisil saadud usaldusvahemikud on enamasti liiga laiad. Samal ajal on see meetod soovitatav juhul, kui on vaja konservatiivset hinnangut. Meetodi konservatiivsuse aste suureneb, kui valimi suurus väheneb, eriti N juures< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Paljude statistikute sõnul on sageduste usaldusvahemike optimaalseim hinnang Wilsoni meetodil, mis pakuti välja juba 1927. aastal, kuid mida kodumaises biomeditsiinilises uuringus praktiliselt ei kasutatud. See meetod võimaldab teil mitte ainult usaldusvahemikke hinnata nii väga väikeste kui ka väga suurte sageduste korral, kuid on kasutatav ka väheste vaatluste jaoks. Üldiselt on usaldusvahemik vastavalt Wilsoni valemile järgmine:



kus 95% usaldusvahemiku arvutamisel võetakse väärtus 1,96, on N vaatluste arv ja p on karakteristiku esinemise sagedus proovis. See meetod on saadaval veebikalkulaatorites, seega pole selle kasutamine problemaatiline. ja ei soovita seda meetodit n · p jaoks kasutada< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Arvatakse, et lisaks Wilsoni meetodile annab Waldti meetod korrigeerimisega vastavalt Agresti-Cole'ile ka sageduste usaldusvahemiku optimaalse hinnangu. Parandus vastavalt Agresti-Cole'ile asendab Valdi valemis tähise esinemissageduse proovis (p) p'-ga, arvutades, milline 2 lisatakse lugejale ja 4 lisatakse nimetajale, see tähendab, p '\u003d (X + 2) / (N + 4), kus X on uuringus osalejate arv, kellel on uuritav omadus, ja N on valimi suurus. Selline modifikatsioon viib Wilsoni valemi rakendamise tulemustega väga sarnaste tulemusteni, välja arvatud juhul, kui sündmuste sagedus läheneb 0% või 100% ja valim on väike. Lisaks ülaltoodud meetoditele sageduste usaldusvahemike arvutamiseks pakuti väikeste proovide korral nii Wald-meetodi kui ka Wilsoni meetodi jaoks järjepidevuse korrektsioone, kuid uuringud on näidanud, et nende kasutamine on ebapraktiline.

Kaaluge kahe näite abil ülaltoodud meetodite kasutamist usaldusvahemike arvutamiseks. Esimesel juhul uurime suurt valimit, mis koosneb 1000 juhuslikult valitud uuringus osalejast, kellest 450-l on uuritav tunnus (see võib olla riskifaktor, tulemus või mõni muu omadus), mille sagedus on 0,45 ehk 45%. Teisel juhul viiakse uuring läbi väikese valimi abil, näiteks ainult 20 inimest, ja ainult üks uuringus osaleja (5%) on uuritud tunnust. Usaldusvahemikud Wald-meetodi järgi, Wald-meetodi kohaselt, kasutades parandust Agresti-Cole, Wilsoni meetodi järgi arvutati Jeff Sauro välja töötatud veebikalkulaatori abil (http: // www. / Wald. Htm). Järjepidevuse jaoks kohandatud Wilsoni usaldusvahemikud arvutati Wassar Stats: Statistiliste arvutuste portaali veebisaidi pakutud kalkulaatori abil (http: // teaduskond. Vassar. Edu / lowry / prop1.html). Arvutused nurga Fisheri teisenduse abil viidi läbi käsitsi, kasutades t kriitilist väärtust vastavalt 19 ja 999 vabadusastme jaoks. Mõlema näite tabelis on esitatud arvutustulemused.

Usaldusvahemikud, mis arvutatakse tekstis kirjeldatud kahe näite jaoks kuuel viisil

Usaldusvahemiku arvutamise meetod

P \u003d 0,0500 või 5%

95% CI X \u003d 450 korral, N \u003d 1000, P \u003d 0,4500 või 45%

–0,0455–0,2541

Wald parandusega Agresti - Cole

<,0001–0,2541

Wilsoni järjepidevuse parandus

Clopper-Pearsoni “täpne meetod”

Nurkmuundumine

<0,0001–0,1967

Nagu tabelist näha, läheb esimese näite puhul üldiselt aktsepteeritud Waldi meetodi abil arvutatud usaldusvahemik negatiivsesse piirkonda, mis ei saa olla sageduste jaoks. Kahjuks pole sellised juhtumid vene kirjanduses haruldased. Traditsiooniline andmete esitamise viis sageduse kujul ja selle viga varjavad seda probleemi osaliselt. Näiteks kui märgi esinemissagedus (protsentides) on esitatud kui 2,1 ± 1,4, ei kahjusta see silma isegi 2,1% (95% CI: –0,7; 4,9), isegi ja tähistab sama asja. Waldti meetod korrigeerimisega vastavalt Agresti-Cole'ile ja arvutus nurkmuundumist kasutades annavad alumise piiri nullpunkti. Wilsoni korrigeeritud järjepidevuse meetod ja “täpne meetod” annavad laiemad usaldusintervallid kui Wilsoni meetodil. Teise näite korral annavad kõik meetodid ligikaudu ühesugused usaldusvahemikud (erinevused ilmnevad ainult tuhandetes), mis pole üllatav, kuna antud näites ei erine sündmuse esinemissagedus 50% -st ja valimi suurus on üsna suur.

Sellest probleemist huvitatud lugejatele võime soovitada R. G. Newcombe ning Browni, Cai ja Dasgupta tööd, mis näitavad plusse ja miinuseid vastavalt 7 ja 10 erineva meetodi kasutamisel usaldusvahemike arvutamiseks. Kodumaistest käsiraamatutest soovitatakse raamatut, milles lisaks teooria üksikasjalikule kirjeldusele on esitatud ka Wald ja Wilsoni meetodid, samuti usaldusvahemike arvutamise meetod, võttes arvesse binoomse sageduse jaotust. Lisaks tasuta veebikalkulaatoritele (http: // www. / Wald. Htm ja http: // teaduskond. Vassar. Edu / lowry / prop1.html) saab CIA programmi abil arvutada ka sageduste (ja mitte ainult!) Usaldusvahemikke (ja mitte ainult!). Usaldusvahemike analüüs), mille saab alla laadida saidilt http: // www. keskkool. soton. ac uk / cia /.

Järgmises artiklis käsitletakse ühemõõtmelisi meetodeid kvaliteetsete andmete võrdlemiseks.

Bibliograafia

Meditsiinistatistika lihtsas keeles: sissejuhatav kursus / A. Banerzhi. - M .: Praktiline meditsiin, 2007. - 287 lk. Meditsiinistatistika. - M .: Meditsiiniuudiste agentuur, 2007. - 475 lk. Biomeditsiiniline statistika / S. Glanz. - M .: praktika, 1998. Andmetüübid, leviku kontrollimine ja kirjeldav statistika / // Inimeseökoloogia - 2008. - Nr 1. - Lk 52–58. KUI. Meditsiinistatistika: õppejuhend. - Rostov n / a: Fööniks, 2007. - 160 lk. Rakenduslik meditsiinistatistika. - SPb. : Tome, 2003. - 428 lk. F. Biomeetria. - M .: Keskkool, 1990. - 350 lk. JA. Matemaatiline statistika meditsiinis. - M .: rahandus ja statistika, 2007. - 798 lk. Matemaatiline statistika kliinilistes uuringutes. - M .: GEOTAR-MED, 2001. - 256 lk. Junkerid sisse. JA. Meditsiiniliste ja statistiliste meditsiiniliste uuringute andmete töötlemine. - SPb. : VmedA, 2002. - 266 lk. Agresti A. Ligikaudne väärtus on binoomide proportsioonide intervalli hindamiseks parem kui täpne / A. Agresti, B. Coull // Ameerika statistik. - 1998. - N 52. - S. 119–126. Altman D. Statistika enesekindlalt // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 lk. Brown L. D. Binoomilise osakaalu intervallhinnang / L. D. Brown, T. T. Cai, A. Dasgupta // Statistiline teadus. - 2001. - N 2. - Lk 101–133. Klopp C. J. Usalduse või fiducial piiride kasutamist illustreeritud binomial / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - Lk 404-413. Garcia-Perez M. A. Binoomiparameetri usaldusvahemikus / M. A. Garcia-Perez // Kvaliteet ja kvantiteet. - 2005. - N 39. - Lk 467–481. Motulsky H Intuitiivne biostatistika // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 lk. Newcombe R. G. Kahepoolsed usaldusvahemikud ühe osakaalu kohta: seitsme meetodi võrdlus / R. G. Newcombe // Statistika meditsiinis. - 1998. - N. 17. - Lk 857–872. Sauro J. Väikeste proovide valmidusastme hindamine binomiaalsete usaldusvahemike abil: võrdlused ja soovitused / J. Sauro, J. R. Lewis // Inimfaktorite ja ergonoomikaühiskonna aastakoosoleku toimikud. - Orlando, FL, 2005. Wald A. Pideva jaotuse funktsioonide usalduspiirid // A. Wald, J. Wolfovitz // Matemaatilise statistika ajakirjad. - 1939. - N 10. - Lk 105–118. Wilson E. B. Tõenäoline järeldus, pärimisseadus ja statistilised järeldused / E. B. Wilson // Ameerika statistikaühenduse ajakiri. - 1927. - N 22. - Lk 209–212.

PROPORTSIOONIDE KONFIDENTSUSintervallid

A. M. Grjibovski

Riiklik rahvatervise instituut, Oslo, Norra

Artiklis on esitatud mitu meetodit binoomsete proportsioonide usaldusvahemike arvutamiseks, nimelt Wald, Wilson, arcsine, Agresti-Coull ja täpsed Clopper-Pearsoni meetodid. Artikkel annab binoomse osakaalu usaldusvahemike määramise probleemile ainult üldise sissejuhatuse ja selle eesmärk pole mitte ainult ärgitada lugejaid kasutama oma empiiriliste uuringute tulemuste esitamisel usaldusvahemikke, vaid ka julgustada neid enne statistikaraamatuid tutvuma. oma andmete analüüs ja käsikirjade koostamine.

Võtmesõnad: usaldusvahemik, proportsioon

Kontaktinfo:

riiklik rahvatervise instituudi vanemnõunik, Oslo, Norra

Statistikas on kahte tüüpi hinnanguid: punkt ja intervall. Punktihinnang on eraldi valimisstatistika, mida kasutatakse üldkogumi parameetri hindamiseks. Näiteks valimi keskmine on populatsiooni matemaatilise ootuse ja valimi dispersiooni punkthinnang S 2 - populatsiooni dispersiooni punkthinnang σ 2. näidati, et valimi keskmine on erapooletu hinnang elanikkonna matemaatilistele ootustele. Valimi keskmist nimetatakse erapooletuks, kuna kõigi valimi keskmiste väärtuste keskmine (sama valimi suuruse korral) n) on võrdne elanikkonna matemaatilise ootusega.

Dispersiooni proovide võtmiseks S 2 sai elanikkonna dispersiooni erapooletu hinnangu σ 2, peaks valimi dispersiooni nimetaja olema võrdne n – 1 , kuid mitte n. Teisisõnu on populatsiooni dispersioon igasuguste valimi dispersioonide keskmine.

Üldpopulatsiooni parameetrite hindamisel tuleks meeles pidada, et valimistatistikat, näiteks , sõltuvad konkreetsetest proovidest. Selle fakti arvestamiseks, saamiseks intervalli hindamine elanikkonna matemaatiline ootus analüüsib valimi keskmiste jaotust (vt üksikasju). Konstrueeritud intervalli iseloomustab teatud usaldusnivoo, mis on tõenäosus, et populatsiooni tegelikku parameetrit hinnatakse õigesti. Sarnaseid usaldusvahemikke saab kasutada tunnuse osakaalu hindamiseks. r ja elanikkonna peamine jaotatud mass.

Laadige märkme alla vormingus või näited vormingus

Usaldusvahemiku konstrueerimine teadaoleva standardhälbega populatsiooni matemaatiliste ootuste jaoks

Elanikkonna tunnusjoone usaldusvahemiku loomine

Selles jaotises kehtib usaldusvahemiku mõiste kategooriliste andmete suhtes. See võimaldab teil hinnata tunnuse osa elanikkonnas. r kasutades näidisjaotust r S \u003d X /n. Nagu märgitud, kui kogused nr ja n(1 - p) Kui arv ületab numbri 5, saab binoomjaotuse normi järgi ligikaudseks muuta. Seetõttu hinnata iseloomujoone osakaalu elanikkonnas r saate luua intervalli, mille usaldusnivoo on (1 - α) x100%.


kus lk S - tunnuse valimiosa, mis on võrdne X /n, s.t. edukuse määr jagatud valimi suurusega, r - tunnuse osa elanikkonnast, Z - standardiseeritud normaaljaotuse kriitiline väärtus, n - näidissuurus.

Näide 3 Oletame, et 100-st viimase kuu jooksul täidetud arvest koosnev valim eraldatakse infosüsteemist. Oletame, et neist arvetest 10 koosneb vigadest. Sellel viisil, r \u003d 10/100 \u003d 0,1. Usaldusaste 95% vastab kriitilisele väärtusele Z \u003d 1,96.

Seega on tõenäosus, et 4,12–15,88% arvetest sisaldab vigu, 95%.

Teatud valimi suuruse korral näib atribuudi osa populatsioonis sisaldav usaldusvahemik olevat laiem kui pideva juhusliku muutuja korral. Selle põhjuseks on asjaolu, et pidevad juhuslike muutujate mõõtmised sisaldavad rohkem teavet kui kategoorilised andmete mõõtmised. Teisisõnu, kategoorilised andmed, millel on ainult kaks väärtust, ei sisalda piisavalt teavet nende jaotuse parameetrite hindamiseks.

ATlõplikust populatsioonist tuletatud klasside arvutamine

Matemaatilise ootuse hindamine.Lõpliku populatsiooni parandustegur ( fpc) kasutati standardvea vähendamiseks teguriga. Usalduse intervallide arvutamisel populatsiooni parameetrite hindamiseks kasutatakse parandustegurit olukordades, kus proovid ekstraheeritakse ilma tagasi pöördumata. Seega on usaldusvahemik matemaatilise ootuse korral, kui usaldusnivoo on võrdne (1 - α) x100%arvutatud valemiga:

Näide 4Lõplikule elanikkonnale parandusteguri kohaldamise illustreerimiseks pöördume tagasi näites 3 käsitletud arvete keskmise väärtuse usaldusvahemiku arvutamise probleemi juurde. Oletagem, et kuus kirjutatakse ettevõttes 5000 arvet kuus \u003d 110,27 dollarit., S \u003d 28,95 dollarit N = 5000, n = 100, α \u003d 0,05, t 99 \u003d 1,9842. Valemi (6) abil saame:

Tunnuse osa hindamine.Kui valite ilma usaldusintervalli tagastamata selle tunnuse osaga, mille usaldusnivoo on võrdne (1 - α) x100%arvutatud valemiga:

Usaldusvahemikud ja eetilised probleemid

Elanikkonna valimiuuringus ja statistiliste järelduste sõnastamisel tekivad sageli eetilised probleemid. Peamine on see, kuidas valimi statistika usaldusvahemikud ja punkthinnangud on omavahel kooskõlas. Punktihinnangute avaldamine ilma täpsustamata vastavaid usaldusvahemikke (mille usaldusnivoo on tavaliselt 95%) ja valimi suurust, mille põhjal need saadakse, võib põhjustada arusaamatusi. See võib kasutajale jätta mulje, et punkthinnang on täpselt see, mida ta vajab kogu elanikkonna omaduste ennustamiseks. Seega on vaja mõista, et ühegi uurimistöö puhul ei tohiks intervalli hinnanguid esiplaanile seada. Lisaks tuleks erilist tähelepanu pöörata valimi suuruse õigele valimisele.

Enamasti on statistilise manipuleerimise objektiks elanikkonna sotsioloogiliste uuringute tulemused ühe või teise poliitilise probleemi kohta. Samal ajal pannakse küsitluse tulemused ajalehtede esilehele ning valimi uuringu viga ja statistilise analüüsi metoodika trükitakse kuskile keskele. Saadud punkthinnangute paikapidavuse tõestamiseks on vaja näidata valimi suurus, mille põhjal need saadakse, usaldusvahemiku piirid ja selle olulisuse tase.

Järgmine märkus

Raamatu materjale kasutavad Levin jt., Statistika juhtidele. - M .: Williams, 2004. - lk. 448-462

Keskmise piiri teoreem väidab, et piisavalt suure valimi korral saab keskmiste valimi jaotust ühtlustada normaaljaotusega. See omadus ei sõltu rahvastiku jaotuse tüübist.

Konstantin Kravchik selgitab suukaudselt, milline on usaldusvahemik meditsiinilistes uuringutes ja kuidas seda kasutada

Katren-Style jätkab meditsiinistatistika osas Konstantin Kravchiku tsükli avaldamist. Kahes eelnevas artiklis käsitles autor selliste mõistete selgitamist nagu ja.

Konstantin Kravchik

Matemaatikute analüütik. Meditsiini ja humanitaarteaduste statistiliste uuringute spetsialist

Moskva linn

Kliinilistes uuringutes võib sageli leida salapärase fraasi: usaldusvahemik (95% usaldusvahemik või 95% usaldusvahemik). Näiteks võib artikkel öelda: "Erinevuste olulisuse hindamiseks kasutati 95% usaldusvahemiku arvutamisel Student t-testi."

Milline on usaldusvahemiku 95% väärtus ja miks tuleks seda arvutada?

Mis on usaldusvahemik? - see on vahemik, milles elanikkonna tegelikud keskmised väärtused on. Ja mis on "valed" keskmised väärtused? Teatud mõttes jah. Selgitasime, et huvipakkuvat parameetrit on võimatu mõõta kogu elanikkonna hulgas, seetõttu on teadlased rahul piiratud valikuga. Selles valimis (näiteks vastavalt kehakaalule) on üks keskmine väärtus (teatud kaal), mille järgi saame hinnata kogu populatsiooni keskmist väärtust. Valimi keskmine kaal (eriti väike) ei ole aga vaevalt sama kui elanikkonna keskmine kaal. Seetõttu on korrektsem arvutada ja kasutada elanikkonna keskmiste väärtuste vahemikku.

Kujutage näiteks ette, et hemoglobiini 95% usaldusvahemik (95% CI) on vahemikus 110 kuni 122 g / L. See tähendab, et tõenäosusega 95% on hemoglobiini tegelik keskmine väärtus üldpopulatsioonis vahemikus 110–122 g / l. Teisisõnu, me ei tea elanikkonna keskmist hemoglobiini, kuid võime selle tunnuse väärtuste vahemiku näidata 95% tõenäosusega.

Usaldusvahemik on eriti sobiv rühmade keskmiste väärtuste erinevuse või, nagu nad seda nimetavad, efekti suuruse erinevuseks.

Oletame, et võrdlesime kahe rauapreparaadi tõhusust: sellist, mis on juba pikka aega turul olnud ja lihtsalt registreeritud. Pärast ravikuuri hinnati uuritud patsientide rühmade hemoglobiinisisaldust ja statistiline programm arvutas välja, et 95% tõenäosusega kahe rühma keskmiste väärtuste erinevus on vahemikus 1,72 kuni 14,36 g / l (tabel 1).

Vahekaart. 1. Sõltumatute proovide kriteerium
(rühmi võrreldakse hemoglobiinisisaldusega)

Seda tuleks tõlgendada järgmiselt: mõnedel elanikkonnal, kes kasutavad uut ravimit, on hemoglobiinisisaldus keskmiselt 1,72–14,36 g / l kõrgem kui neil, kes võtsid juba teadaolevat ravimit.

Teisisõnu, üldpopulatsioonis on 95% tõenäosusega rühmade keskmiste hemoglobiini väärtuste erinevus nendes piirides. Uurija saab otsustada, kas seda on palju või vähe. Selle kõige mõte on see, et töötame mitte ühe keskmise väärtuse, vaid väärtuste vahemikuga, seetõttu hindame usaldusväärsemalt parameetri erinevust rühmade vahel.

Statistilistes pakettides saab teadlase äranägemisel usaldusvahemiku piire ise kitsendada või laiendada. Usaldusvahemiku tõenäosuse vähendamise kaudu kitsendame vahendite vahemikku. Näiteks 90% CI juures on keskmiste vahemik (või keskmiste erinevus) kitsam kui 95%.

Ja vastupidi, tõenäosuse suurendamine 99% -ni laiendab väärtuste vahemikku. Rühmade võrdlemisel võib CI alumine piir ületada nullpunkti. Näiteks kui laiendada usaldusvahemiku piire 99% -ni, siis vahemiku piirid jäid vahemikku –1–16 g / l. See tähendab, et üldpopulatsioonis on rühmad, mille keskmiste erinevus uuritud tunnuse järgi on 0 (M \u003d 0).

Usaldusvahemiku abil saab statistilisi hüpoteese testida. Kui usaldusvahemik ületab nullväärtuse, on nullhüpotees tõene, kui eeldada, et rühmad ei erine uuritavas parameetris. Eespool on kirjeldatud näidet, kui laiendasime piire 99% -ni. Kusagil elanikkonnast leidsime rühmad, mis ei erinenud kuidagi.

95% usaldusvahemik hemoglobiini erinevuse osas, (g / l)


Joone kujul olev joonis näitab kahe rühma keskmise hemoglobiini väärtuste erinevuse 95% usaldusvahemikku. Joon läbib nullmärgi, seetõttu on nulliga võrdsete keskmiste väärtuste vahel erinevus, mis kinnitab nullhüpoteesi, et rühmad ei erine. Erinevus rühmade vahel on vahemikus –2 kuni 5 g / l. See tähendab, et hemoglobiin võib väheneda nii 2 g / l kui ka 5 g / l.

Usaldusvahemik on väga oluline näitaja. Tänu temale on näha, kas rühmade erinevused olid tõesti tingitud keskmiste erinevustest või suurest valimist, kuna suure valimi korral on erinevuste leidmise tõenäosus suurem kui väikesega.

Praktikas võib see välja näha selline. Võtsime 1000 inimese proovi, mõõtsime hemoglobiini taset ja leidsime, et keskmiste erinevuste usaldusvahemik on 1,2–1,5 g / l. Statistilise olulisuse tase sel juhul lk

Näeme, et hemoglobiinisisaldus suurenes, kuid peaaegu märkamatult, seetõttu ilmnes statistiline olulisus just valimi suuruse tõttu.

Usaldusvahemikku saab arvutada mitte ainult keskmiste väärtuste, vaid ka proportsioonide (ja riskisuhte) põhjal. Näiteks huvitab meid usaldusvahemik patsientide proportsioonides, kes on saavutanud remissiooni väljatöötatud ravimi võtmise teel. Oletame, et 95% usaldusvahemik proportsioonides, st selliste patsientide osakaal, jääb vahemikku 0,60–0,80. Seega võime öelda, et meie ravimil on ravitoime 60–80% juhtudest.

Valimis elanikkonnast valimi saamiseks saame meid huvitava parameetri punkthinnangu ja arvutame standardvea, et näidata hinnangu täpsust.

Enamikul juhtudel pole standardviga kui selline aktsepteeritav. On palju kasulikum ühendada see täpsusmõõt populatsiooni parameetri intervalli hinnanguga.

Seda saab teha usaldusvahemiku (CI -) arvutamiseks valimisstatistika (parameetri) teoreetilise tõenäosusjaotuse tundmist kasutades Usaldusvahemik, DI - Usaldusvahemik) parameetri jaoks.

Üldiselt usaldusvahemik laiendab hinnanguid mõlemas suunas standardvea (selle parameetri) teatava korrutisega; kaks intervalli määratlevat väärtust (usalduspiirid) eraldatakse tavaliselt komaga ja sulgudes.

Statistika osas a usaldusvahemik (CI) on populatsiooni parameetri teatud intervallide hinnang. See on vaadeldav intervall (st see arvutatakse vaatluste põhjal), mis erineb põhimõtteliselt proovist valimini ja mis sageli hõlmab katse korratava huvipakkuva mitteseotud vaatlusparameetri väärtust. Kui sageli vaadeldav intervall parameetrit sisaldab, määratakse usaldusnivoo või usalduskoefitsient. Täpsemalt öeldes on termini "usaldusnivoo" tähendus see, et kui CI konstrueeritakse paljude korduvate (ja võib-olla ka erinevate) katsete eraldi andmeanalüüsidega, vastab selliste intervallide osakaal, mis sisaldavad parameetri tegelikku väärtust, antud usaldusnivoo. Kui kahepoolsed usalduspiirid moodustavad usaldusvahemiku, siis nende ühepoolseid vastaspindu nimetatakse madalamateks / ülemisteks usalduspiirideks (või piirideks).


Usaldusvahemik näitab, millises vahemikus valimivaatluste (vaatluste) tulemused asuvad. Kui korraldame ühe elanikkonna kohta samades valimites 100 identset uuringut (näiteks 100 miljonit 1000 inimese valimit linnas, kus elab 5 miljonit inimest), siis 95-protsendilise usaldus tõenäosusega jäävad 95 tulemust 100-st usaldusvahemiku piiridesse. (näiteks 28% -lt 32% -ni, tegeliku väärtusega 30%). Näiteks tõeline suitsetajate arv linnas on 30%. Kui valime 100 inimest järjest 1000 inimest ja küsime “Kas te suitsetate?” Nendes proovides on 95-st 100-st proovist 2% usaldusvahemikuga väärtus 28–32%.

Valemid usaldusintervallide konstrueerimiseks koos praktiliste näidetega võib leida näiteks.

Usalduse intervallide tõlgendamine

Usaldusvahemiku tõlgendamisel huvitavad meid järgmised küsimused:

Kui lai on usaldusvahemik?

Lai usaldusvahemik näitab, et hinnang on ebatäpne; kitsas tähistab täpset hinnangut.
Usaldusvahemiku laius sõltub standardvea suurusest, mis omakorda sõltub valimi suurusest ja kui arvumuutujat võetakse arvesse andmete varieeruvuse osas, annavad usaldusvahemikud laiemad kui väheste muutujatega suure andmekogumi uuringud.

Kas ühenduse esindus sisaldab mõnda eriti huvitavat väärtust?

Saate kontrollida, kas populatsiooni parameetri tõenäoline väärtus jääb usaldusvahemikku. Kui jah, siis vastavad tulemused sellele tõenäolisele väärtusele. Kui ei, siis on ebatõenäoline (95% usaldusvahemiku korral on tõenäosus peaaegu 5%), et parameetril oleks see väärtus. ()