Pagbuo ng isang agwat ng kumpiyansa para sa inaasahan sa matematika ng pangkalahatang populasyon. Agwat ng kumpiyansa

Target– turuan ang mga mag-aaral ng mga algorithm para sa pagkalkula ng mga pagitan ng kumpiyansa ng mga istatistikal na parameter.

Kapag nagpoproseso ng data sa istatistika, ang kinakalkulang arithmetic mean, coefficient of variation, correlation coefficient, difference criteria at iba pang point statistics ay dapat makatanggap ng quantitative confidence limits, na nagpapahiwatig ng posibleng pagbabago ng indicator sa mas maliit at malalaking direksyon sa loob ng confidence interval.

Halimbawa 3.1 . Ang pamamahagi ng calcium sa serum ng dugo ng mga unggoy, tulad ng dati nang itinatag, ay nailalarawan sa pamamagitan ng mga sumusunod na sample indicator: = 11.94 mg%; = 0.127 mg%; n= 100. Kinakailangang matukoy ang agwat ng kumpiyansa para sa pangkalahatang average ( ) na may posibilidad ng kumpiyansa P = 0,95.

Ang pangkalahatang average ay matatagpuan na may isang tiyak na posibilidad sa pagitan:

, Saan – sample na arithmetic mean; t- pagsusulit ng mag-aaral; – pagkakamali ng arithmetic mean.

Gamit ang talahanayan na "Mga halaga ng t-test ng mag-aaral" nakita namin ang halaga na may posibilidad na kumpiyansa na 0.95 at ang bilang ng mga antas ng kalayaan k= 100-1 = 99. Ito ay katumbas ng 1.982. Kasama ang mga halaga ng arithmetic mean at statistical error, pinapalitan namin ito sa formula:

o 11.69
12,19

Kaya, na may posibilidad na 95%, masasabi na ang pangkalahatang average ng normal na distribusyon na ito ay nasa pagitan ng 11.69 at 12.19 mg%.

Halimbawa 3.2 . Tukuyin ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba ( ) pamamahagi ng calcium sa dugo ng mga unggoy, kung ito ay kilala na
= 1.60, sa n = 100.

Upang malutas ang problema maaari mong gamitin ang sumusunod na formula:

saan – statistical error ng dispersion.

Nahanap namin ang sampling variance error gamit ang formula:
. Ito ay katumbas ng 0.11. Ibig sabihin t- criterion na may posibilidad na kumpiyansa na 0.95 at ang bilang ng mga antas ng kalayaan k= 100–1 = 99 ay kilala mula sa nakaraang halimbawa.

Gamitin natin ang formula at makuha ang:

o 1.38
1,82

Mas tumpak, ang agwat ng kumpiyansa ng pangkalahatang pagkakaiba ay maaaring gawin gamit ang (chi-square) - Pearson test. Ang mga kritikal na puntos para sa pamantayang ito ay ibinibigay sa isang espesyal na talahanayan. Kapag ginagamit ang pamantayan Upang makabuo ng agwat ng kumpiyansa, ginagamit ang isang dalawang panig na antas ng kahalagahan. Para sa mas mababang limitasyon, ang antas ng kahalagahan ay kinakalkula gamit ang formula
, para sa tuktok -
. Halimbawa, para sa antas ng kumpiyansa = 0,99= 0,010,= 0.990. Alinsunod dito, ayon sa talahanayan ng pamamahagi ng mga kritikal na halaga , na may kalkuladong antas ng kumpiyansa at bilang ng mga antas ng kalayaan k= 100 – 1= 99, hanapin ang mga halaga
At
. Nakukuha namin
katumbas ng 135.80, at
katumbas ng 70.06.

Upang mahanap ang mga limitasyon ng kumpiyansa para sa pangkalahatang pagkakaiba-iba gamit Gamitin natin ang mga formula: para sa mas mababang hangganan
, para sa upper bound
. Palitan natin ang mga nahanap na halaga para sa data ng problema sa mga formula:
= 1,17;
= 2.26. Kaya, na may posibilidad ng kumpiyansa P= 0.99 o 99% pangkalahatang pagkakaiba ay nasa hanay mula 1.17 hanggang 2.26 mg% kasama.

Halimbawa 3.3 . Sa 1000 buto ng trigo mula sa batch na natanggap sa elevator, 120 buto ang natagpuang infected ng ergot. Kinakailangang matukoy ang posibleng mga hangganan ng pangkalahatang proporsyon ng mga nahawaang buto sa isang naibigay na batch ng trigo.

Maipapayo na matukoy ang mga limitasyon ng kumpiyansa para sa pangkalahatang bahagi para sa lahat ng posibleng mga halaga nito gamit ang formula:

,

saan n - bilang ng mga obserbasyon; m– ganap na sukat ng isa sa mga grupo; t- normalized na paglihis.

Ang sample na proporsyon ng mga nahawaang buto ay
o 12%. May posibilidad na may kumpiyansa R= 95% normalized deviation ( t-Pagsusulit ng mag-aaral sa k =
)t = 1,960.

Pinapalitan namin ang magagamit na data sa formula:

Kaya't ang mga hangganan ng agwat ng kumpiyansa ay katumbas ng = 0.122–0.041 = 0.081, o 8.1%; = 0.122 + 0.041 = 0.163, o 16.3%.

Kaya, na may posibilidad na kumpiyansa na 95% masasabi na ang pangkalahatang proporsyon ng mga nahawaang binhi ay nasa pagitan ng 8.1 at 16.3%.

Halimbawa 3.4 . Ang koepisyent ng pagkakaiba-iba na nagpapakilala sa pagkakaiba-iba ng calcium (mg%) sa serum ng dugo ng mga unggoy ay katumbas ng 10.6%. Laki ng sample n= 100. Kinakailangang matukoy ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang parameter Cv.

Mga limitasyon ng agwat ng kumpiyansa para sa pangkalahatang koepisyent ng pagkakaiba-iba Cv ay tinutukoy ng mga sumusunod na formula:

At
, Saan K intermediate value na kinakalkula ng formula
.

Alam iyon nang may kumpiyansa na posibilidad R= 95% normalized deviation (Pagsusuri ng mag-aaral sa k =
)t = 1.960, kalkulahin muna natin ang halaga SA:

.

o 9.3%

o 12.3%

Kaya, ang pangkalahatang koepisyent ng pagkakaiba-iba na may 95% na antas ng kumpiyansa ay nasa hanay mula 9.3 hanggang 12.3%. Sa paulit-ulit na mga sample, ang koepisyent ng variation ay hindi lalampas sa 12.3% at hindi bababa sa 9.3% sa 95 na mga kaso sa 100.

Mga tanong para sa pagpipigil sa sarili:

Mga problema para sa malayang solusyon.

1. Ang average na porsyento ng taba sa gatas sa panahon ng paggagatas ng Kholmogory crossbred cows ay ang mga sumusunod: 3.4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. Magtatag ng mga pagitan ng kumpiyansa para sa pangkalahatang mean sa 95% na antas ng kumpiyansa (20 puntos).

2. Sa 400 hybrid na halaman ng rye, ang mga unang bulaklak ay lumitaw sa average na 70.5 araw pagkatapos ng paghahasik. Ang karaniwang paglihis ay 6.9 araw. Tukuyin ang error ng mean at confidence interval para sa pangkalahatang mean at variance sa antas ng kabuluhan W= 0.05 at W= 0.01 (25 puntos).

3. Kapag pinag-aaralan ang haba ng mga dahon ng 502 specimens ng mga strawberry sa hardin, nakuha ang sumusunod na data: = 7.86 cm; σ = 1.32 cm, =± 0.06 cm Tukuyin ang mga pagitan ng kumpiyansa para sa ibig sabihin ng populasyon ng aritmetika na may mga antas ng kabuluhan na 0.01; 0.02; 0.05. (25 puntos).

4. Sa isang pag-aaral ng 150 adultong lalaki, ang average na taas ay 167 cm, at σ = 6 cm Ano ang mga limitasyon ng pangkalahatang mean at pangkalahatang pagkakaiba na may posibilidad na kumpiyansa na 0.99 at 0.95? (25 puntos).

5. Ang pamamahagi ng calcium sa serum ng dugo ng mga unggoy ay nailalarawan sa pamamagitan ng mga sumusunod na selektibong tagapagpahiwatig: = 11.94 mg%, σ = 1,27, n = 100. Bumuo ng 95% confidence interval para sa pangkalahatang mean ng distribution na ito. Kalkulahin ang koepisyent ng pagkakaiba-iba (25 puntos).

6. Ang kabuuang nilalaman ng nitrogen sa plasma ng dugo ng mga albino rats sa edad na 37 at 180 araw ay pinag-aralan. Ang mga resulta ay ipinahayag sa gramo bawat 100 cm 3 ng plasma. Sa edad na 37 araw, 9 na daga ang may: 0.98; 0.83; 0.99; 0.86; 0.90; 0.81; 0.94; 0.92; 0.87. Sa edad na 180 araw, 8 daga ang may: 1.20; 1.18; 1.33; 1.21; 1.20; 1.07; 1.13; 1.12. Magtakda ng mga pagitan ng kumpiyansa para sa pagkakaiba sa antas ng kumpiyansa na 0.95 (50 puntos).

7. Tukuyin ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba-iba ng pamamahagi ng calcium (mg%) sa serum ng dugo ng mga unggoy, kung para sa pamamahagi na ito ang laki ng sample ay n = 100, statistical error ng sample variance s σ 2 = 1.60 (40 puntos).

8. Tukuyin ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba ng distribusyon ng 40 spikelet ng trigo sa haba (σ 2 = 40.87 mm 2). (25 puntos).

9. Ang paninigarilyo ay itinuturing na pangunahing salik na nagdudulot ng mga nakahahadlang na sakit sa baga. Ang passive smoking ay hindi itinuturing na isang kadahilanan. Nag-alinlangan ang mga siyentipiko sa hindi nakakapinsala ng passive smoking at sinuri ang airway patency ng mga hindi naninigarilyo, passive at aktibong naninigarilyo. Upang makilala ang estado ng respiratory tract, kinuha namin ang isa sa mga tagapagpahiwatig ng panlabas na pag-andar ng paghinga - ang maximum na volumetric na daloy ng rate ng mid-expire. Ang pagbaba sa tagapagpahiwatig na ito ay tanda ng pagbara sa daanan ng hangin. Ang data ng survey ay ipinapakita sa talahanayan.

Bilang ng mga taong sinuri

Maximum na mid-expiratory flow rate, l/s

Standard Deviation

Mga hindi naninigarilyo

magtrabaho sa isang lugar na hindi naninigarilyo

nagtatrabaho sa isang mausok na silid

paninigarilyo

humihithit ng isang maliit na bilang ng mga sigarilyo

average na bilang ng mga naninigarilyo

humihithit ng malaking bilang ng sigarilyo

Gamit ang data ng talahanayan, maghanap ng 95% na agwat ng kumpiyansa para sa pangkalahatang mean at pangkalahatang pagkakaiba para sa bawat pangkat. Ano ang mga pagkakaiba sa pagitan ng mga pangkat? Ipakita ang mga resulta nang grapiko (25 puntos).

10. Tukuyin ang mga hangganan ng 95% at 99% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba sa bilang ng mga biik sa 64 na farrow, kung ang istatistikal na error ng sample na pagkakaiba s σ 2 = 8.25 (30 puntos).

11. Ito ay kilala na ang average na timbang ng mga kuneho ay 2.1 kg. Tukuyin ang mga hangganan ng 95% at 99% na agwat ng kumpiyansa para sa pangkalahatang mean at pagkakaiba sa n= 30, σ = 0.56 kg (25 puntos).

12. Ang nilalaman ng butil ng tainga ay sinukat para sa 100 tainga ( X), haba ng tainga ( Y) at ang masa ng butil sa tainga ( Z). Maghanap ng mga pagitan ng kumpiyansa para sa pangkalahatang mean at pagkakaiba sa P 1 = 0,95, P 2 = 0,99, P 3 = 0.999 kung = 19, = 6.766 cm, = 0.554 g; σ x 2 = 29.153, σ y 2 = 2. 111, σ z 2 = 0. 064. (25 puntos).

13. Sa 100 random na piniling mga tainga ng winter wheat, ang bilang ng mga spikelet ay binilang. Ang sample na populasyon ay nailalarawan sa pamamagitan ng mga sumusunod na tagapagpahiwatig: = 15 spikelet at σ = 2.28 pcs. Tukuyin kung anong katumpakan ang nakuhang average na resulta ( ) at bumuo ng agwat ng kumpiyansa para sa pangkalahatang mean at pagkakaiba sa 95% at 99% na antas ng kabuluhan (30 puntos).

14. Bilang ng mga tadyang sa mga shell ng fossil mollusk Mga Orthambonite calligramma:

Ito ay kilala na n = 19, σ = 4.25. Tukuyin ang mga hangganan ng agwat ng kumpiyansa para sa pangkalahatang mean at pangkalahatang pagkakaiba sa antas ng kahalagahan W = 0.01 (25 puntos).

15. Upang matukoy ang ani ng gatas sa isang komersyal na dairy farm, ang produktibidad ng 15 baka ay tinutukoy araw-araw. Ayon sa datos para sa taon, ang bawat baka ay nagbibigay sa karaniwan ng sumusunod na dami ng gatas bawat araw (l): 22; 19; 25; 20; 27; 17; 30; 21; 18; 24; 26; 23; 25; 20; 24. Bumuo ng mga pagitan ng kumpiyansa para sa pangkalahatang pagkakaiba at ang ibig sabihin ng arithmetic. Maaari ba nating asahan na ang average na taunang ani ng gatas bawat baka ay 10,000 litro? (50 puntos).

16. Upang matukoy ang average na ani ng trigo para sa negosyong pang-agrikultura, ang paggapas ay isinagawa sa mga trial plot na 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 at 2 ektarya. Ang pagiging produktibo (c/ha) mula sa mga plot ay 39.4; 38; 35.8; 40; 35; 42.7; 39.3; 41.6; 33; 42; 29 ayon sa pagkakabanggit. Bumuo ng mga agwat ng kumpiyansa para sa pangkalahatang variance at arithmetic mean. Maaari ba nating asahan na ang average na ani ng agrikultura ay magiging 42 c/ha? (50 puntos).

Agwat ng kumpiyansa

Agwat ng kumpiyansa- isang terminong ginamit sa mga istatistika ng matematika para sa pagitan (kumpara sa punto) na pagtatantya ng mga parameter ng istatistika, na mas mainam kapag maliit ang laki ng sample. Ang agwat ng kumpiyansa ay isa na sumasaklaw sa isang hindi kilalang parameter na may ibinigay na pagiging maaasahan.

Ang paraan ng mga pagitan ng kumpiyansa ay binuo ng Amerikanong istatistika na si Jerzy Neumann, batay sa mga ideya ng Ingles na istatistika na si Ronald Fisher.

Kahulugan

Agwat ng kumpiyansa ng parameter θ random variable distribution X na may antas ng kumpiyansa 100 p%, na nabuo ng sample ( x 1 ,…,x n), ay tinatawag na isang pagitan na may mga hangganan ( x 1 ,…,x n) at ( x 1 ,…,x n), na mga pagsasakatuparan ng mga random na variable L(X 1 ,…,X n) at U(X 1 ,…,X n), ganyan

.

Ang mga boundary point ng confidence interval ay tinatawag mga limitasyon ng kumpiyansa.

Ang interpretasyong batay sa intuwisyon ng agwat ng kumpiyansa ay: kung p ay malaki (sabihin nating 0.95 o 0.99), kung gayon ang pagitan ng kumpiyansa ay halos tiyak na naglalaman ng tunay na halaga θ .

Isa pang interpretasyon ng konsepto ng isang agwat ng kumpiyansa: maaari itong ituring bilang isang pagitan ng mga halaga ng parameter θ tugma sa pang-eksperimentong data at hindi sumasalungat sa mga ito.

Mga halimbawa

  • Agwat ng kumpiyansa para sa mathematical na inaasahan ng isang normal na sample;
  • Agwat ng kumpiyansa para sa normal na pagkakaiba-iba ng sample.

Bayesian confidence interval

Sa mga istatistika ng Bayesian, mayroong isang katulad ngunit naiiba sa ilang mga pangunahing detalye ng kahulugan ng isang agwat ng kumpiyansa. Dito, ang tinantyang parameter mismo ay itinuturing na isang random na variable na may ilang naibigay na naunang pamamahagi (sa pinakasimpleng kaso, uniporme), at ang sample ay naayos (sa mga klasikal na istatistika ang lahat ay eksaktong kabaligtaran). Ang agwat ng kumpiyansa ng Bayesian ay isang agwat na sumasaklaw sa halaga ng isang parameter na may posterior probability:

.

Sa pangkalahatan, magkaiba ang mga agwat ng kumpiyansa ng klasiko at Bayesian. Sa panitikan sa wikang Ingles, ang Bayesian confidence interval ay karaniwang tinatawag na termino mapagkakatiwalaang pagitan, at ang klasiko - agwat ng kumpiyansa.

Mga Tala

Mga pinagmumulan

Wikimedia Foundation.

  • 2010.
  • Mga bata (pelikula)

Kolonista

    Agwat ng kumpiyansa Tingnan kung ano ang "Confidence interval" sa iba pang mga diksyunaryo: - isang agwat na kinakalkula mula sa sample na data, na may ibinigay na posibilidad (kumpiyansa) ay sumasaklaw sa hindi alam na totoong halaga ng tinantyang parameter ng pamamahagi. Pinagmulan: GOST 20522 96: Mga Lupa. Mga pamamaraan para sa pagpoproseso ng istatistika ng mga resulta...

    Dictionary-reference na aklat ng mga tuntunin ng normatibo at teknikal na dokumentasyon agwat ng kumpiyansa - para sa isang scalar parameter ng populasyon, ito ay isang segment na malamang na naglalaman ng parameter na ito. Ang pariralang ito ay walang kabuluhan nang walang karagdagang elaborasyon. Dahil ang mga limitasyon ng agwat ng kumpiyansa ay tinatantya mula sa sample, natural na... ...

    Diksyunaryo ng Sociological Statistics PAGTITIWALA NG PAGTITIWALA - isang paraan ng pagtatantya ng mga parameter na naiiba sa point estimation. Hayaang ang sample x1, . . ., xn mula sa isang distribution na may probability density f(x, α), at a*=a*(x1, . . ., xn) estimate α, g(a*, α) probability density estimate. Kami ay naghahanap ng ... ...

    Diksyunaryo ng Sociological Statistics Geological encyclopedia - (Confidence interval) Isang agwat kung saan ang pagiging maaasahan ng halaga ng parameter para sa populasyon na nakuha batay sa isang sample na survey ay may tiyak na antas ng posibilidad, halimbawa 95%, na dahil sa sample mismo. Lapad……

    Dictionary-reference na aklat ng mga tuntunin ng normatibo at teknikal na dokumentasyon Diksyonaryo ng ekonomiya - – ang pagitan kung saan matatagpuan ang tunay na halaga ng natukoy na halaga na may ibinigay na probabilidad ng kumpiyansa. Pangkalahatang kimika: aklat-aralin / A. V. Zholnin ...

    Mga terminong kemikal Agwat ng kumpiyansa CI - Confidence interval, CI * data interval, CI * confidence interval interval ng characteristic value, na kinakalkula para sa k.l. parameter ng pamamahagi (halimbawa, ang average na halaga ng isang katangian) sa kabuuan ng sample at may tiyak na posibilidad (halimbawa, 95% para sa 95% ...

    Diksyunaryo ng Sociological Statistics- isang konsepto na lumitaw kapag tinatantya ang isang istatistikal na parameter. pamamahagi ayon sa pagitan ng mga halaga. D. at. para sa parameter q, naaayon sa koepisyent na ito. trust P, ay katumbas ng ganoong pagitan (q1, q2) na para sa anumang probabilidad na pamamahagi ng hindi pagkakapantay-pantay... ... Pisikal na encyclopedia

    Dictionary-reference na aklat ng mga tuntunin ng normatibo at teknikal na dokumentasyon- - Mga paksa sa telekomunikasyon, mga pangunahing konsepto EN agwat ng kumpiyansa ... Gabay sa Teknikal na Tagasalin

    Dictionary-reference na aklat ng mga tuntunin ng normatibo at teknikal na dokumentasyon- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: engl. agwat ng kumpiyansa vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasi metrologijos terminų žodynas

    Dictionary-reference na aklat ng mga tuntunin ng normatibo at teknikal na dokumentasyon- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: engl. confidence interval rus. lugar ng pagtitiwala; agwat ng kumpiyansa... Chemijos terminų aiškinamasis žodynas

Mayroong dalawang uri ng mga pagtatantya sa mga istatistika: punto at pagitan. Pagtatantya ng punto ay isang solong sample na istatistika na ginagamit upang tantyahin ang isang parameter ng populasyon. Halimbawa, ang ibig sabihin ng sample ay isang puntong pagtatantya ng mathematical na inaasahan ng populasyon, at ang sample na pagkakaiba S 2- punto ng pagtatantya ng pagkakaiba-iba ng populasyon σ 2. ipinakita na ang sample mean ay isang walang pinapanigan na pagtatantya ng matematikal na inaasahan ng populasyon. Ang isang sample mean ay tinatawag na walang kinikilingan dahil ang average ng lahat ng sample ay nangangahulugan (na may parehong laki ng sample) n) ay katumbas ng mathematical na inaasahan ng pangkalahatang populasyon.

Upang ang sample na pagkakaiba S 2 naging walang pinapanigan na pagtatantya ng pagkakaiba-iba ng populasyon σ 2, ang denominator ng sample na variance ay dapat itakda na katumbas ng n – 1 , hindi n. Sa madaling salita, ang pagkakaiba-iba ng populasyon ay ang average ng lahat ng posibleng pagkakaiba-iba ng sample.

Kapag tinatantya ang mga parameter ng populasyon, dapat tandaan na ang mga sample na istatistika tulad ng , depende sa mga partikular na sample. Upang isaalang-alang ang katotohanang ito, upang makuha pagtatantya ng pagitan pag-asa sa matematika ng pangkalahatang populasyon, pag-aralan ang pamamahagi ng mga sample na paraan (para sa higit pang mga detalye, tingnan). Ang itinayong agwat ay nailalarawan sa pamamagitan ng isang tiyak na antas ng kumpiyansa, na kumakatawan sa posibilidad na ang tunay na parameter ng populasyon ay natantiya nang tama. Maaaring gamitin ang mga katulad na agwat ng kumpiyansa upang tantiyahin ang proporsyon ng isang katangian r at ang pangunahing ibinahagi na masa ng populasyon.

I-download ang tala sa o format, mga halimbawa sa format

Pagbubuo ng agwat ng kumpiyansa para sa mathematical na inaasahan ng populasyon na may kilalang standard deviation

Pagbuo ng agwat ng kumpiyansa para sa bahagi ng isang katangian sa populasyon

Pinapalawak ng seksyong ito ang konsepto ng agwat ng kumpiyansa sa pangkategoryang data. Ito ay nagpapahintulot sa amin na matantya ang bahagi ng katangian sa populasyon r gamit ang sample share rS= X/n. Tulad ng ipinahiwatig, kung ang mga dami nr At n(1 – p) lumampas sa numero 5, ang binomial distribution ay maaaring tantiyahin bilang normal. Samakatuwid, upang tantiyahin ang bahagi ng isang katangian sa populasyon r posible na bumuo ng isang pagitan na ang antas ng kumpiyansa ay katumbas ng (1 – α)x100%.


saan pS- sample na proporsyon ng katangian na katumbas ng X/n, ibig sabihin. bilang ng mga tagumpay na hinati sa laki ng sample, r- ang bahagi ng katangian sa pangkalahatang populasyon, Z- kritikal na halaga ng standardized normal distribution, n- laki ng sample.

Halimbawa 3. Ipagpalagay natin na ang isang sample na binubuo ng 100 invoice na napunan noong nakaraang buwan ay nakuha mula sa sistema ng impormasyon. Sabihin nating 10 sa mga invoice na ito ay pinagsama-sama ng mga error. kaya, r= 10/100 = 0.1. Ang 95% na antas ng kumpiyansa ay tumutugma sa kritikal na halaga Z = 1.96.

Kaya, ang posibilidad na sa pagitan ng 4.12% at 15.88% ng mga invoice ay naglalaman ng mga error ay 95%.

Para sa isang ibinigay na laki ng sample, ang agwat ng kumpiyansa na naglalaman ng proporsyon ng katangian sa populasyon ay lumilitaw na mas malawak kaysa sa isang tuluy-tuloy na random na variable. Ito ay dahil ang mga sukat ng isang tuluy-tuloy na random na variable ay naglalaman ng mas maraming impormasyon kaysa sa mga sukat ng pang-kategoryang data. Sa madaling salita, ang kategoryang data na kumukuha lamang ng dalawang halaga ay naglalaman ng hindi sapat na impormasyon upang matantya ang mga parameter ng kanilang pamamahagi.

SApagkalkula ng mga pagtatantya na nakuha mula sa isang may hangganang populasyon

Pagtatantya ng inaasahan sa matematika. Salik ng pagwawasto para sa panghuling populasyon ( fpc) ay ginamit upang bawasan ang karaniwang error sa pamamagitan ng isang kadahilanan. Kapag kinakalkula ang mga agwat ng kumpiyansa para sa mga pagtatantya ng parameter ng populasyon, inilalapat ang isang salik ng pagwawasto sa mga sitwasyon kung saan kinukuha ang mga sample nang hindi ibinabalik. Kaya, isang agwat ng kumpiyansa para sa inaasahan sa matematika na may antas ng kumpiyansa na katumbas ng (1 – α)x100%, ay kinakalkula ng formula:

Halimbawa 4. Upang ilarawan ang paggamit ng correction factor para sa isang limitadong populasyon, bumalik tayo sa problema ng pagkalkula ng confidence interval para sa average na halaga ng mga invoice, na tinalakay sa itaas sa Halimbawa 3. Ipagpalagay na ang isang kumpanya ay nag-isyu ng 5,000 invoice bawat buwan, at Xᅳ=110.27 dolyar, S= $28.95, N = 5000, n = 100, α = 0.05, t 99 = 1.9842. Gamit ang formula (6) nakukuha natin:

Pagtatantya ng bahagi ng isang tampok. Kapag pumipili nang walang pagbabalik, ang agwat ng kumpiyansa para sa proporsyon ng katangian na may antas ng kumpiyansa na katumbas ng (1 – α)x100%, ay kinakalkula ng formula:

Mga Pagitan ng Kumpiyansa at Mga Isyu sa Etikal

Kapag nagsa-sample ng isang populasyon at gumuhit ng mga istatistikal na konklusyon, madalas na lumitaw ang mga isyu sa etika. Ang pangunahing isa ay kung paano nagkakasundo ang mga agwat ng kumpiyansa at mga pagtatantya ng punto ng mga sample na istatistika. Ang mga pagtatantya ng punto ng pag-publish nang hindi tinukoy ang nauugnay na mga pagitan ng kumpiyansa (karaniwan ay nasa 95% na antas ng kumpiyansa) at ang laki ng sample kung saan nagmula ang mga ito ay maaaring lumikha ng kalituhan. Maaari itong magbigay ng impresyon sa user na ang pagtatantya ng punto ay eksaktong kailangan niya upang mahulaan ang mga katangian ng buong populasyon. Kaya, kinakailangang maunawaan na sa anumang pananaliksik ang pagtutuon ay hindi dapat sa mga pagtatantya ng punto, ngunit sa mga pagtatantya ng pagitan. Bilang karagdagan, ang espesyal na pansin ay dapat bayaran sa tamang pagpili ng mga laki ng sample.

Kadalasan, ang mga bagay ng istatistikal na pagmamanipula ay ang mga resulta ng mga sociological survey ng populasyon sa ilang mga isyung pampulitika. Kasabay nito, ang mga resulta ng survey ay nai-publish sa mga front page ng mga pahayagan, at ang sampling error at statistical analysis methodology ay nai-publish sa isang lugar sa gitna. Upang patunayan ang bisa ng nakuha na mga pagtatantya ng punto, kinakailangang ipahiwatig ang laki ng sample batay sa kung saan nakuha ang mga ito, ang mga hangganan ng agwat ng kumpiyansa at ang antas ng kahalagahan nito.

Susunod na tala

Ginamit ang mga materyales mula sa aklat na Levin et al. – M.: Williams, 2004. – p. 448–462

Central limit theorem nagsasaad na may sapat na malaking sample size, ang sample distribution ng mga paraan ay maaaring tantiyahin sa pamamagitan ng normal na distribution. Ang ari-arian na ito ay hindi nakadepende sa uri ng pamamahagi ng populasyon.

Agwat ng kumpiyansa(CI; sa English, confidence interval - CI) na nakuha sa isang pag-aaral na may sample ay nagbibigay ng sukatan ng katumpakan (o kawalan ng katiyakan) ng mga resulta ng pag-aaral upang makagawa ng mga konklusyon tungkol sa populasyon ng lahat ng naturang mga pasyente (ang pangkalahatang populasyon). Ang tamang kahulugan ng isang 95% CI ay maaaring buuin tulad ng sumusunod: 95% ng naturang mga pagitan ay maglalaman ng tunay na halaga sa populasyon. Ang interpretasyong ito ay medyo hindi gaanong tumpak: Ang CI ay ang hanay ng mga halaga kung saan maaari kang maging 95% sigurado na naglalaman ito ng tunay na halaga. Kapag gumagamit ng isang CI, ang diin ay sa pagtukoy sa dami ng epekto, kumpara sa halaga ng P, na nakukuha sa pamamagitan ng pagsubok sa istatistikal na kahalagahan. Ang halaga ng P ay hindi tinatantya ang anumang dami, ngunit sa halip ay nagsisilbing sukatan ng lakas ng ebidensya laban sa null hypothesis ng "walang epekto." Ang halaga ng P mismo ay hindi nagsasabi sa amin ng anuman tungkol sa laki ng pagkakaiba, o kahit tungkol sa direksyon nito. Samakatuwid, ang mga independiyenteng halaga ng P ay ganap na hindi nagbibigay-kaalaman sa mga artikulo o abstract. Sa kabaligtaran, ang CI ay nagpapahiwatig ng parehong laki ng epekto ng agarang interes, tulad ng benepisyo ng isang paggamot, at ang lakas ng ebidensya. Samakatuwid, ang DI ay direktang nauugnay sa pagsasanay ng EBM.

Ang diskarte sa pagtatantya sa pagsusuri sa istatistika, na ipinakita ng CI, ay naglalayong sukatin ang dami ng isang epekto ng interes (sensitivity ng isang diagnostic test, rate ng mga hinulaang kaso, relatibong pagbabawas ng panganib sa paggamot, atbp.) at upang masukat din ang kawalan ng katiyakan doon epekto. Kadalasan, ang CI ay ang hanay ng mga halaga sa magkabilang panig ng pagtatantya kung saan ang totoong halaga ay malamang na magsinungaling, at maaari kang maging 95% sigurado dito. Ang kasunduan na gamitin ang 95% na posibilidad ay arbitrary, gayundin ang P value.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

Ang CI ay batay sa ideya na ang parehong pag-aaral na ginawa sa iba't ibang mga sample ng mga pasyente ay hindi magbubunga ng magkatulad na mga resulta, ngunit ang kanilang mga resulta ay ibabahagi sa paligid ng isang totoo ngunit hindi kilalang halaga. Sa madaling salita, inilalarawan ito ng CI bilang "sample-dependent variability." Ang CI ay hindi nagpapakita ng karagdagang kawalan ng katiyakan dahil sa iba pang mga dahilan; sa partikular, hindi kasama dito ang epekto ng selective loss sa follow-up, mahinang pagsunod o hindi tumpak na pagsukat ng resulta, kawalan ng pagbulag, atbp. Ang CI samakatuwid ay palaging minamaliit ang kabuuang halaga ng kawalan ng katiyakan.

Pagkalkula ng Interval ng Kumpiyansa

Talahanayan A1.1. Mga karaniwang error at agwat ng kumpiyansa para sa mga piling klinikal na sukat

Karaniwan, ang isang CI ay kinakalkula mula sa isang naobserbahang pagtatantya ng isang dami, tulad ng pagkakaiba (d) sa pagitan ng dalawang proporsyon, at ang karaniwang error (SE) sa pagtatantya ng pagkakaibang iyon. Ang tinatayang 95% CI na nakuha sa ganitong paraan ay d ± 1.96 SE. Ang formula ay nagbabago ayon sa likas na katangian ng sukatan ng kinalabasan at ang saklaw ng CI. Halimbawa, sa isang randomized, placebo-controlled na pagsubok ng isang acellular pertussis vaccine, 72 sa 1670 (4.3%) na mga sanggol na nakatanggap ng bakuna ay nagkaroon ng pertussis at 240 sa 1665 (14.4%) sa control group. Ang pagkakaiba sa porsyento, na kilala bilang ganap na pagbabawas ng panganib, ay 10.1%. Ang SE ng pagkakaibang ito ay 0.99%. Alinsunod dito, ang 95% CI ay 10.1% + 1.96 x 0.99%, ibig sabihin. mula 8.2 hanggang 12.0.

Sa kabila ng kanilang magkakaibang pamamaraang pilosopikal, ang mga CI at mga pagsusulit sa kahalagahan ng istatistika ay malapit na nauugnay sa matematika.

Kaya, ang halaga ng P ay "makabuluhan", i.e. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Ang kawalan ng katiyakan (pagkakamali) ng pagtatantya, na ipinahayag sa CI, ay higit na nauugnay sa square root ng sample size. Ang mga maliliit na sample ay nagbibigay ng mas kaunting impormasyon kaysa sa mga malalaki, at ang CI ay katumbas na mas malawak sa isang mas maliit na sample. Halimbawa, ang isang artikulong naghahambing sa pagganap ng tatlong pagsubok na ginamit upang masuri ang impeksyon sa Helicobacter pylori ay nag-ulat ng pagiging sensitibo ng urea breath test na 95.8% (95% CI 75–100). Habang ang 95.8% na bilang ay kahanga-hanga, ang maliit na sample ng 24 na pasyenteng may sapat na gulang na may J. pylori ay nangangahulugan na mayroong makabuluhang kawalan ng katiyakan sa pagtatantya na ito, tulad ng ipinapakita ng malawak na CI. Sa katunayan, ang mas mababang limitasyon ng 75% ay mas mababa kaysa sa 95.8% na pagtatantya. Kung ang parehong sensitivity ay naobserbahan sa isang sample ng 240 tao, ang 95% CI ay magiging 92.5-98.0, na nagbibigay ng higit na katiyakan na ang pagsubok ay lubos na sensitibo.

Sa mga randomized na kinokontrol na pagsubok (RCT), ang mga hindi makabuluhang resulta (ibig sabihin, ang mga may P >0.05) ay partikular na madaling kapitan ng maling interpretasyon. Ang CI ay partikular na kapaki-pakinabang dito dahil ipinapakita nito kung gaano kaayon ang mga resulta sa klinikal na kapaki-pakinabang na totoong epekto. Halimbawa, sa isang RCT na naghahambing ng colonic suture at staple anastomosis, ang impeksyon sa sugat ay nabuo sa 10.9% at 13.5% ng mga pasyente, ayon sa pagkakabanggit (P = 0.30). Ang 95% CI para sa pagkakaibang ito ay 2.6% (−2 hanggang +8). Kahit na sa pag-aaral na ito ng 652 mga pasyente, nananatiling posible na mayroong katamtamang pagkakaiba sa saklaw ng mga impeksyon na nagreresulta mula sa dalawang pamamaraan. Ang mas kaunting pananaliksik, mas malaki ang kawalan ng katiyakan. Sung et al. nagsagawa ng isang RCT upang ihambing ang pagbubuhos ng octreotide na may talamak na sclerotherapy para sa talamak na pagdurugo ng variceal sa 100 mga pasyente. Sa pangkat ng octreotide, ang bleeding control rate ay 84%; sa sclerotherapy group - 90%, na nagbibigay ng P = 0.56. Tandaan na ang mga rate ng patuloy na pagdurugo ay katulad ng para sa impeksyon sa sugat sa pag-aaral na nabanggit. Sa kasong ito, gayunpaman, ang 95% CI para sa pagkakaiba sa pagitan ng mga interbensyon ay 6% (−7 hanggang +19). Ang saklaw na ito ay medyo malawak kumpara sa 5% na pagkakaiba na magiging interes sa klinikal. Maliwanag, ang pag-aaral ay hindi nagbubukod ng isang makabuluhang pagkakaiba sa pagiging epektibo. Samakatuwid, ang konklusyon ng mga may-akda na "octreotide infusion at sclerotherapy ay pantay na epektibo sa paggamot ng pagdurugo mula sa varicose veins" ay tiyak na hindi wasto. Sa mga kasong tulad nito, kung saan, tulad dito, ang 95% CI para sa absolute risk reduction (ARR) ay may kasamang zero, ang CI para sa NNT (numero na kailangan upang gamutin) ay medyo mahirap bigyang-kahulugan . Ang NPL at ang CI nito ay nakuha mula sa mga reciprocal ng ACP (multiply ng 100 kung ang mga halagang ito ay ibinibigay bilang mga porsyento). Dito nakukuha natin ang NPL = 100: 6 = 16.6 na may 95% CI na -14.3 hanggang 5.3. Tulad ng makikita mula sa talababa na "d" sa talahanayan. A1.1, ang CI na ito ay kinabibilangan ng mga halaga ng NPL mula 5.3 hanggang infinity at NPL mula 14.3 hanggang infinity.

Maaaring buuin ang mga CI para sa pinakakaraniwang ginagamit na istatistikal na pagtatantya o paghahambing. Para sa mga RCT, kabilang dito ang pagkakaiba sa pagitan ng mga mean na proporsyon, mga kamag-anak na panganib, mga ratio ng odds, at mga NLR. Katulad nito, ang mga CI ay maaaring makuha para sa lahat ng pangunahing pagtatantya na ginawa sa diagnostic test accuracy studies—sensitivity, specificity, positive predictive value (lahat ng mga ito ay simpleng proporsyon), at likelihood ratios—mga pagtatantya na nakuha sa meta-analyses at paghahambing-may-kontrol. pag-aaral. Ang isang personal na programa sa computer na sumasaklaw sa marami sa mga paggamit na ito ng mga MDI ay magagamit sa ikalawang edisyon ng Statistics with Confidence. Ang mga macro para sa pagkalkula ng mga CI para sa mga proporsyon ay magagamit nang walang bayad para sa Excel at ang mga programang istatistikal na SPSS at Minitab sa http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Maramihang mga pagtatantya ng epekto ng paggamot

Habang ang pagbuo ng mga CI ay kanais-nais para sa mga pangunahing resulta ng pag-aaral, ang mga ito ay hindi kinakailangan para sa lahat ng mga resulta. Ang CI ay may kinalaman sa mga klinikal na mahahalagang paghahambing. Halimbawa, kapag naghahambing ng dalawang grupo, ang tamang CI ay ang ginawa para sa pagkakaiba sa pagitan ng mga grupo, tulad ng ipinapakita sa mga halimbawa sa itaas, at hindi ang CI na maaaring itayo para sa pagtatantya sa bawat pangkat. Hindi lamang nakatutulong na magbigay ng hiwalay na mga CI para sa mga pagtatantya sa bawat pangkat, ang pagtatanghal na ito ay maaaring mapanlinlang. Gayundin, ang tamang diskarte kapag inihahambing ang pagiging epektibo ng mga paggamot sa iba't ibang subgroup ay direktang ihambing ang dalawa (o higit pang) subgroup. Hindi tama na ipagpalagay na ang isang paggamot ay epektibo sa isang subgroup lamang kung ang CI nito ay nagbubukod ng halaga na walang epekto at ang iba ay hindi. Kapaki-pakinabang din ang mga CI kapag naghahambing ng mga resulta sa maraming subgroup. Sa Fig. Ang 1.1 ay nagpapakita ng relatibong panganib ng eclampsia sa mga babaeng may preeclampsia sa mga subgroup ng kababaihan mula sa isang placebo-controlled na RCT ng magnesium sulfate.

kanin. A1.2. Ipinapakita ng forest plot ang mga resulta ng 11 randomized na klinikal na pagsubok ng bovine rotavirus vaccine para sa pag-iwas sa pagtatae kumpara sa placebo. Ang isang 95% na agwat ng kumpiyansa ay ginamit upang tantiyahin ang kamag-anak na panganib ng pagtatae. Ang laki ng itim na parisukat ay proporsyonal sa dami ng impormasyon. Bilang karagdagan, ang buod na pagtatantya ng pagiging epektibo ng paggamot at ang 95% na agwat ng kumpiyansa (ipinahiwatig ng isang brilyante) ay ipinapakita. Gumamit ang meta-analysis ng random effects na modelo na mas malaki kaysa sa ilang paunang tinukoy; halimbawa, maaaring ito ang sukat na ginamit sa pagkalkula ng laki ng sample. Ang isang mas mahigpit na pamantayan ay nangangailangan na ang buong hanay ng CI ay magpakita ng benepisyong higit sa isang itinakdang minimum.

Napag-usapan na natin ang kamalian ng pagkuha ng kakulangan ng istatistikal na kahalagahan bilang isang indikasyon na ang dalawang paggamot ay pantay na epektibo. Parehong mahalaga na huwag ipantay ang istatistikal na kahalagahan sa klinikal na kahalagahan. Maaaring ipalagay ang klinikal na kahalagahan kapag ang resulta ay makabuluhan ayon sa istatistika at ang laki ng pagtatantya ng pagiging epektibo ng paggamot

Maaaring ipakita ng mga pag-aaral kung ang mga resulta ay makabuluhan sa istatistika at alin ang mahalaga sa klinika at alin ang hindi. Sa Fig. Ipinapakita ng A1.2 ang mga resulta ng apat na pagsubok, kung saan ang buong CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Ang "Katren-Style" ay patuloy na naglalathala ng serye ni Konstantin Kravchik sa mga medikal na istatistika. Sa dalawang nakaraang artikulo, tinalakay ng may-akda ang pagpapaliwanag ng mga konsepto tulad ng at.

Konstantin Kravchik

Mathematician-analyst. Espesyalista sa istatistikal na pananaliksik sa medisina at humanities

Lungsod: Moscow

Kadalasan sa mga artikulo tungkol sa mga klinikal na pag-aaral ay makakahanap ka ng mahiwagang parirala: “confidence interval” (95 % CI o 95 % CI - confidence interval). Halimbawa, maaaring sumulat ang isang artikulo ng: "Upang masuri ang kahalagahan ng mga pagkakaiba, ginamit ang t-test ng Estudyante upang kalkulahin ang 95 % na agwat ng kumpiyansa."

Ano ang halaga ng "95 % confidence interval" at bakit ito kinakalkula?

Ano ang confidence interval? - Ito ang saklaw kung saan ang tunay na populasyon ay nangangahulugan ng kasinungalingan. Mayroon bang "hindi totoo" na mga average? Sa isang kahulugan, oo, ginagawa nila. Sa aming ipinaliwanag na imposibleng sukatin ang isang parameter ng interes sa buong populasyon, kaya ang mga mananaliksik ay gumagawa ng isang limitadong sample. Sa sample na ito (halimbawa, batay sa timbang ng katawan) mayroong isang average na halaga (isang tiyak na timbang), kung saan hinuhusgahan namin ang average na halaga sa buong populasyon. Gayunpaman, hindi malamang na ang average na timbang sa isang sample (lalo na ang isang maliit) ay magkakasabay sa average na timbang sa pangkalahatang populasyon. Samakatuwid, mas tama na kalkulahin at gamitin ang hanay ng mga average na halaga ng populasyon.

Halimbawa, isipin na ang 95% confidence interval (95% CI) para sa hemoglobin ay 110 hanggang 122 g/L. Nangangahulugan ito na mayroong 95% na pagkakataon na ang tunay na average na halaga ng hemoglobin sa populasyon ay nasa pagitan ng 110 at 122 g/L. Sa madaling salita, hindi natin alam ang average na halaga ng hemoglobin sa populasyon, ngunit maaari nating, na may 95 % na posibilidad, ipahiwatig ang isang hanay ng mga halaga para sa katangiang ito.

Partikular na nauugnay ang mga agwat ng kumpiyansa para sa mga pagkakaiba sa paraan sa pagitan ng mga grupo, o laki ng epekto kung tawagin ang mga ito.

Sabihin nating ikinumpara natin ang pagiging epektibo ng dalawang paghahanda ng bakal: ang isa na matagal nang nasa merkado at ang isa na kakarehistro pa lang. Pagkatapos ng kurso ng therapy, sinuri namin ang konsentrasyon ng hemoglobin sa mga pinag-aralan na grupo ng mga pasyente, at kinakalkula ng statistical program na ang pagkakaiba sa pagitan ng mga average na halaga ng dalawang grupo ay, na may 95 % na posibilidad, sa saklaw mula 1.72 hanggang 14.36 g/l (Talahanayan 1).

mesa 1. Subukan para sa mga independiyenteng sample
(ang mga pangkat ay inihambing sa antas ng hemoglobin)

Dapat itong bigyang-kahulugan bilang mga sumusunod: sa ilang mga pasyente sa pangkalahatang populasyon na umiinom ng bagong gamot, ang hemoglobin ay magiging mas mataas sa average ng 1.72–14.36 g/l kaysa sa mga umiinom na ng kilalang gamot.

Sa madaling salita, sa pangkalahatang populasyon, ang pagkakaiba sa average na mga halaga ng hemoglobin sa pagitan ng mga grupo ay nasa loob ng mga limitasyong ito na may 95% na posibilidad. Bahala na ang mananaliksik kung ito ay marami o kaunti. Ang punto ng lahat ng ito ay hindi kami nagtatrabaho sa isang average na halaga, ngunit sa isang hanay ng mga halaga, samakatuwid, mas mapagkakatiwalaan naming tinatantya ang pagkakaiba sa isang parameter sa pagitan ng mga pangkat.

Sa mga pakete ng istatistika, sa pagpapasya ng mananaliksik, maaari mong independiyenteng paliitin o palawakin ang mga hangganan ng agwat ng kumpiyansa. Sa pamamagitan ng pagpapababa ng mga probabilidad ng agwat ng kumpiyansa, pinaliit namin ang hanay ng mga paraan. Halimbawa, sa 90 % CI ang hanay ng mga paraan (o pagkakaiba sa paraan) ay magiging mas makitid kaysa sa 95 %.

Sa kabaligtaran, ang pagtaas ng posibilidad sa 99 % ay nagpapalawak sa hanay ng mga halaga. Kapag naghahambing ng mga grupo, ang mas mababang limitasyon ng CI ay maaaring tumawid sa zero mark. Halimbawa, kung pinalawak namin ang mga hangganan ng agwat ng kumpiyansa sa 99 %, kung gayon ang mga hangganan ng agwat ay mula sa -1 hanggang 16 g/l. Nangangahulugan ito na sa pangkalahatang populasyon ay may mga pangkat, ang pagkakaiba sa pagitan ng kung saan para sa katangiang pinag-aaralan ay katumbas ng 0 (M = 0).

Gamit ang isang agwat ng kumpiyansa, maaari mong subukan ang mga istatistikal na hypotheses. Kung ang pagitan ng kumpiyansa ay tumawid sa zero na halaga, kung gayon ang null hypothesis, na ipinapalagay na ang mga pangkat ay hindi naiiba sa parameter na pinag-aaralan, ay totoo. Ang halimbawa ay inilarawan sa itaas kung saan pinalawak namin ang mga hangganan sa 99 %. Sa isang lugar sa pangkalahatang populasyon nakakita kami ng mga grupo na hindi naiiba sa anumang paraan.

95% confidence interval ng pagkakaiba sa hemoglobin, (g/l)


Ipinapakita ng figure ang 95% na agwat ng kumpiyansa para sa pagkakaiba sa ibig sabihin ng mga halaga ng hemoglobin sa pagitan ng dalawang grupo. Ang linya ay dumadaan sa zero mark, samakatuwid mayroong isang pagkakaiba sa pagitan ng mga paraan ng zero, na nagpapatunay sa null hypothesis na ang mga grupo ay hindi naiiba. Ang saklaw ng pagkakaiba sa pagitan ng mga grupo ay mula –2 hanggang 5 g/L. Nangangahulugan ito na ang hemoglobin ay maaaring bumaba ng 2 g/L o tumaas ng 5 g/L.

Ang agwat ng kumpiyansa ay isang napakahalagang tagapagpahiwatig. Salamat dito, makikita mo kung ang mga pagkakaiba sa mga grupo ay dahil sa pagkakaiba sa paraan o dahil sa isang malaking sample, dahil sa isang malaking sample ang mga pagkakataon na makahanap ng mga pagkakaiba ay mas malaki kaysa sa isang maliit na sample.

Sa pagsasagawa, maaaring ganito ang hitsura nito. Kumuha kami ng sample ng 1000 tao, sinukat ang mga antas ng hemoglobin at nalaman na ang agwat ng kumpiyansa para sa pagkakaiba sa ibig sabihin ay mula 1.2 hanggang 1.5 g/l. Ang antas ng istatistikal na kahalagahan sa kasong ito p

Nakita namin na ang konsentrasyon ng hemoglobin ay tumaas, ngunit halos hindi mahahalata, samakatuwid, ang istatistikal na kahalagahan ay lumitaw nang tumpak dahil sa laki ng sample.

Ang mga pagitan ng kumpiyansa ay maaaring kalkulahin hindi lamang para sa mga paraan, kundi pati na rin para sa mga proporsyon (at mga ratio ng panganib). Halimbawa, interesado kami sa agwat ng kumpiyansa ng mga proporsyon ng mga pasyente na nakamit ang pagpapatawad habang umiinom ng binuong gamot. Ipagpalagay natin na ang 95 % CI para sa mga proporsyon, ibig sabihin, para sa proporsyon ng mga naturang pasyente, ay nasa hanay na 0.60–0.80. Kaya, maaari nating sabihin na ang ating gamot ay may therapeutic effect sa 60 hanggang 80 % ng mga kaso.