Bahay Madla 3 Agwat ng kumpiyansa. ABC ng mga medikal na istatistika

Agwat ng kumpiyansa. ABC ng mga medikal na istatistika

Mayroong dalawang uri ng mga pagtatantya sa mga istatistika: punto at pagitan. Pagtatantya ng punto ay isang solong sample na istatistika na ginagamit upang tantyahin ang isang parameter ng populasyon. Halimbawa, ang ibig sabihin ng sample ay isang puntong pagtatantya ng mathematical na inaasahan ng populasyon, at ang sample na pagkakaiba-iba S 2- punto ng pagtatantya ng pagkakaiba-iba ng populasyon σ 2. ipinakita na ang sample mean ay isang walang pinapanigan na pagtatantya ng matematikal na inaasahan ng populasyon. Ang isang sample mean ay tinatawag na walang kinikilingan dahil ang average ng lahat ng sample ay nangangahulugan (na may parehong laki ng sample) n) ay katumbas ng mathematical na inaasahan ng pangkalahatang populasyon.

Upang ang sample na pagkakaiba-iba S 2 naging walang pinapanigan na pagtatantya ng pagkakaiba-iba ng populasyon σ 2, ang denominator ng sample na variance ay dapat itakda na katumbas ng n – 1 , hindi n. Sa madaling salita, ang pagkakaiba-iba ng populasyon ay ang average ng lahat ng posibleng pagkakaiba-iba ng sample.

Kapag tinatantya ang mga parameter ng populasyon, dapat tandaan na ang mga sample na istatistika tulad ng , depende sa mga partikular na sample. Upang isaalang-alang ang katotohanang ito, upang makuha pagtatantya ng pagitan pag-asa sa matematika ng pangkalahatang populasyon, pag-aralan ang pamamahagi ng mga sample na paraan (para sa higit pang mga detalye, tingnan). Ang itinayong agwat ay nailalarawan sa pamamagitan ng isang tiyak na antas ng kumpiyansa, na kumakatawan sa posibilidad na ang tunay na parameter ng populasyon ay natantiya nang tama. Maaaring gamitin ang mga katulad na agwat ng kumpiyansa upang tantiyahin ang proporsyon ng isang katangian r at ang pangunahing ibinahagi na masa ng populasyon.

I-download ang tala sa o format, mga halimbawa sa format

Pagbubuo ng agwat ng kumpiyansa para sa mathematical na inaasahan ng populasyon na may kilalang standard deviation

Pagbuo ng agwat ng kumpiyansa para sa bahagi ng isang katangian sa populasyon

Pinapalawak ng seksyong ito ang konsepto ng agwat ng kumpiyansa sa pangkategoryang data. Ito ay nagpapahintulot sa amin na matantya ang bahagi ng katangian sa populasyon r gamit ang sample share rS= X/n. Tulad ng ipinahiwatig, kung ang mga dami nr At n(1 – p) lumampas sa numero 5, ang binomial distribution ay maaaring tantiyahin bilang normal. Samakatuwid, upang tantiyahin ang bahagi ng isang katangian sa populasyon r posible na bumuo ng isang pagitan na ang antas ng kumpiyansa ay katumbas ng (1 – α)x100%.

saan pS- sample na proporsyon ng katangian na katumbas ng X/n, ibig sabihin. bilang ng mga tagumpay na hinati sa laki ng sample, r- ang bahagi ng katangian sa pangkalahatang populasyon, Z- kritikal na halaga ng standardized normal distribution, n- laki ng sample.

Halimbawa 3. Ipagpalagay natin na ang isang sample na binubuo ng 100 invoice na napunan noong nakaraang buwan ay nakuha mula sa sistema ng impormasyon. Sabihin nating 10 sa mga invoice na ito ay pinagsama-sama ng mga error. kaya, r= 10/100 = 0.1. Ang 95% na antas ng kumpiyansa ay tumutugma sa kritikal na halaga Z = 1.96.

Kaya, ang posibilidad na sa pagitan ng 4.12% at 15.88% ng mga invoice ay naglalaman ng mga error ay 95%.

Para sa isang ibinigay na laki ng sample, ang agwat ng kumpiyansa na naglalaman ng proporsyon ng katangian sa populasyon ay lumilitaw na mas malawak kaysa sa isang tuluy-tuloy na random na variable. Ito ay dahil ang mga sukat ng isang tuluy-tuloy na random na variable ay naglalaman ng mas maraming impormasyon kaysa sa mga sukat ng pang-kategoryang data. Sa madaling salita, ang mga kategoryang data na kumukuha lamang ng dalawang halaga ay naglalaman ng hindi sapat na impormasyon upang matantya ang mga parameter ng kanilang pamamahagi.

SApagkalkula ng mga pagtatantya na nakuha mula sa isang may hangganang populasyon

Pagtatantya ng inaasahan sa matematika. Salik ng pagwawasto para sa huling populasyon ( fpc) ay ginamit upang bawasan ang karaniwang error sa pamamagitan ng isang kadahilanan. Kapag kinakalkula ang mga agwat ng kumpiyansa para sa mga pagtatantya ng parameter ng populasyon, isang salik ng pagwawasto ay inilalapat sa mga sitwasyon kung saan ang mga sample ay kinukuha nang hindi ibinabalik. Kaya, isang agwat ng kumpiyansa para sa inaasahan sa matematika na may antas ng kumpiyansa na katumbas ng (1 – α)x100%, ay kinakalkula ng formula:

Halimbawa 4. Upang ilarawan ang paggamit ng correction factor para sa isang limitadong populasyon, bumalik tayo sa problema ng pagkalkula ng confidence interval para sa average na halaga ng mga invoice, na tinalakay sa itaas sa Halimbawa 3. Ipagpalagay na ang isang kumpanya ay nag-isyu ng 5,000 invoice bawat buwan, at Xᅳ=110.27 dolyar, S= $28.95 N = 5000, n = 100, α = 0.05, t 99 = 1.9842. Gamit ang formula (6) nakukuha natin:

Pagtatantya ng bahagi ng isang tampok. Kapag pumipili nang walang pagbabalik, ang agwat ng kumpiyansa para sa proporsyon ng katangian na may antas ng kumpiyansa na katumbas ng (1 – α)x100%, ay kinakalkula ng formula:

Mga Pagitan ng Kumpiyansa at Mga Isyu sa Etikal

Kapag nagsa-sample ng isang populasyon at gumuhit ng mga istatistikal na konklusyon, madalas na lumitaw ang mga isyu sa etika. Ang pangunahing isa ay kung paano nagkakasundo ang mga agwat ng kumpiyansa at mga pagtatantya ng punto ng mga sample na istatistika. Ang mga pagtatantya ng punto ng pag-publish nang hindi tinukoy ang nauugnay na mga pagitan ng kumpiyansa (karaniwan ay nasa 95% na antas ng kumpiyansa) at ang laki ng sample kung saan nagmula ang mga ito ay maaaring lumikha ng kalituhan. Maaari itong magbigay ng impresyon sa user na ang pagtatantya ng punto ay eksaktong kailangan niya upang mahulaan ang mga katangian ng buong populasyon. Kaya, kinakailangang maunawaan na sa anumang pananaliksik ang pagtutuon ay hindi dapat sa mga pagtatantya ng punto, ngunit sa mga pagtatantya ng pagitan. Bilang karagdagan, ang espesyal na pansin ay dapat bayaran sa tamang pagpili ng mga laki ng sample.

Kadalasan, ang mga bagay ng istatistikal na pagmamanipula ay ang mga resulta ng mga sociological survey ng populasyon sa ilang mga isyung pampulitika. Kasabay nito, ang mga resulta ng survey ay nai-publish sa mga front page ng mga pahayagan, at ang sampling error at statistical analysis methodology ay nai-publish sa isang lugar sa gitna. Upang patunayan ang bisa ng nakuha na mga pagtatantya ng punto, kinakailangang ipahiwatig ang laki ng sample batay sa kung saan nakuha ang mga ito, ang mga hangganan ng agwat ng kumpiyansa at ang antas ng kahalagahan nito.

Susunod na tala

Ginamit ang mga materyales mula sa aklat na Levin et al. – M.: Williams, 2004. – p. 448–462

Central limit theorem nagsasaad na may sapat na malaking sample size, ang sample distribution ng mga paraan ay maaaring tantiyahin sa pamamagitan ng normal na distribution. Ang ari-arian na ito ay hindi nakadepende sa uri ng pamamahagi ng populasyon.

Ang isa sa mga pamamaraan para sa paglutas ng mga problema sa istatistika ay ang pagkalkula ng agwat ng kumpiyansa. Ito ay ginagamit bilang mas mainam na alternatibo sa point estimation kapag maliit ang sample size. Dapat pansinin na ang proseso ng pagkalkula ng agwat ng kumpiyansa mismo ay medyo kumplikado. Ngunit pinapayagan ka ng mga tool sa programa ng Excel na pasimplehin ito. Alamin natin kung paano ito ginagawa sa pagsasanay.

Ginagamit ang paraang ito para sa pagtatantya ng pagitan ng iba't ibang istatistikal na dami. Ang pangunahing gawain ng pagkalkula na ito ay upang mapupuksa ang mga kawalan ng katiyakan ng pagtatantya ng punto.

Sa Excel, mayroong dalawang pangunahing opsyon para sa pagsasagawa ng mga kalkulasyon gamit ang paraang ito: kapag alam ang pagkakaiba at kapag hindi ito kilala. Sa unang kaso, ang function ay ginagamit para sa mga kalkulasyon TIWALA.NORM, at sa pangalawa - PINAGTItiwala.ESTUDYANTE.

Paraan 1: function ng CONFIDENCE NORM

Operator TIWALA.NORM, na kabilang sa pangkat ng istatistika ng mga function, ay unang lumitaw sa Excel 2010. Ang mga naunang bersyon ng program na ito ay gumagamit ng analogue nito TIWALA. Ang layunin ng operator na ito ay kalkulahin ang isang normal na ibinabahagi na agwat ng kumpiyansa para sa average ng populasyon.

Ang syntax nito ay ang mga sumusunod:

CONFIDENCE.NORM(alpha;standard_off;size)

"Alpha"— isang argumento na nagsasaad ng antas ng kahalagahan na ginagamit upang kalkulahin ang antas ng kumpiyansa. Ang antas ng kumpiyansa ay katumbas ng sumusunod na expression:

(1-"Alpha")*100

"Pamantayang Paglihis"- Ito ay isang argumento, ang kakanyahan nito ay malinaw sa pangalan. Ito ang karaniwang paglihis ng iminungkahing sample.

"Laki"— argumento na tumutukoy sa laki ng sample.

Ang lahat ng mga argumento sa operator na ito ay kinakailangan.

Function TIWALA ay may eksaktong parehong mga argumento at posibilidad tulad ng nauna. Ang syntax nito ay:

TRUST(alpha, standard_off, size)

Tulad ng nakikita mo, ang mga pagkakaiba ay nasa pangalan lamang ng operator. Para sa mga kadahilanang compatibility, ang function na ito ay naiwan sa Excel 2010 at mga mas bagong bersyon sa isang espesyal na kategorya "Pagkatugma". Sa mga bersyon ng Excel 2007 at mas maaga, ito ay naroroon sa pangunahing pangkat ng mga istatistikal na operator.

Ang limitasyon sa pagitan ng kumpiyansa ay tinutukoy gamit ang sumusunod na formula:

X+(-)NORMA NG PAGTITIWALA

saan X ay ang average na halaga ng sample, na matatagpuan sa gitna ng napiling hanay.

Ngayon tingnan natin kung paano kalkulahin ang agwat ng kumpiyansa gamit ang isang partikular na halimbawa. 12 mga pagsubok ang isinagawa, na nagresulta sa iba't ibang mga resulta, na nakalista sa talahanayan. Ito ang ating kabuuan. Ang standard deviation ay 8. Kailangan nating kalkulahin ang confidence interval sa 97% confidence level.

Piliin ang cell kung saan ipapakita ang resulta ng pagproseso ng data. Mag-click sa pindutan "Insert Function".

Lumilitaw Function Wizard. Pumunta sa kategorya "Istatistika" at i-highlight ang pangalan "TIWALA.NORM". Pagkatapos nito, mag-click sa pindutan "OK".

Bubukas ang window ng mga argumento. Ang mga patlang nito ay natural na tumutugma sa mga pangalan ng mga argumento.
Ilagay ang cursor sa unang field - "Alpha". Dito dapat nating ipahiwatig ang antas ng kahalagahan. Sa ating natatandaan, ang ating antas ng pagtitiwala ay 97%. Kasabay nito, sinabi namin na ito ay kinakalkula sa ganitong paraan:
(1-level ng tiwala)/100

Iyon ay, pinapalitan ang halaga, nakukuha natin:

Sa pamamagitan ng mga simpleng kalkulasyon nalaman natin na ang argumento "Alpha" katumbas 0,03 . Ilagay ang value na ito sa field.

Tulad ng nalalaman, ayon sa kondisyon ang karaniwang paglihis ay katumbas ng 8 . Samakatuwid, sa larangan "Pamantayang Paglihis" isulat lamang ang numerong ito.

Sa bukid "Laki" kailangan mong ipasok ang bilang ng mga elemento ng pagsubok na ginawa. Tulad ng naaalala natin, ang kanilang 12 . Ngunit para ma-automate ang formula at hindi ito i-edit sa tuwing magsasagawa tayo ng bagong pagsubok, itakda natin ang halagang ito hindi sa ordinaryong numero, ngunit gamit ang operator. SURIIN. Kaya, ilagay natin ang cursor sa field "Laki", at pagkatapos ay mag-click sa tatsulok, na matatagpuan sa kaliwa ng formula bar.

Lumilitaw ang isang listahan ng mga kamakailang ginamit na function. Kung ang operator SURIIN ay ginamit mo kamakailan, dapat itong nasa listahang ito. Sa kasong ito, kailangan mo lamang i-click ang pangalan nito. Kung hindi, kung hindi mo mahanap ito, pagkatapos ay pumunta sa punto "Iba pang mga function...".

Lumilitaw ang isang pamilyar na Function Wizard. Bumalik tayo muli sa grupo "Istatistika". Pina-highlight namin ang pangalan doon "SURIIN". Mag-click sa pindutan "OK".

Ang window ng mga argumento para sa pahayag sa itaas ay lilitaw. Ang function na ito ay idinisenyo upang kalkulahin ang bilang ng mga cell sa isang tinukoy na hanay na naglalaman ng mga numerong halaga. Ang syntax nito ay ang mga sumusunod:
COUNT(value1,value2,…)

Grupo ng argumento "Mga halaga" ay isang reference sa hanay kung saan mo gustong kalkulahin ang bilang ng mga cell na puno ng numeric data. Maaaring magkaroon ng hanggang 255 ganoong mga argumento sa kabuuan, ngunit sa aming kaso kailangan lang namin ng isa.

Ilagay ang cursor sa field "Halaga1" at, habang pinipigilan ang kaliwang pindutan ng mouse, piliin sa sheet ang hanay na naglalaman ng aming koleksyon. Pagkatapos ang kanyang address ay ipapakita sa field. Mag-click sa pindutan "OK".

Pagkatapos nito, isasagawa ng application ang pagkalkula at ipapakita ang resulta sa cell kung saan ito matatagpuan. Sa aming partikular na kaso, ang formula ay ganito ang hitsura:
CONFIDENCE NORM(0.03,8,COUNT(B2:B13))

Ang kabuuang resulta ng mga kalkulasyon ay 5,011609 .

Ngunit hindi lang iyon. Tulad ng natatandaan natin, ang limitasyon sa pagitan ng kumpiyansa ay kinakalkula sa pamamagitan ng pagdaragdag at pagbabawas ng resulta ng pagkalkula mula sa sample mean. TIWALA.NORM. Sa ganitong paraan, kinakalkula ang kanan at kaliwang mga hangganan ng agwat ng kumpiyansa, ayon sa pagkakabanggit. Ang sample mean mismo ay maaaring kalkulahin gamit ang operator AVERAGE.
Ang operator na ito ay idinisenyo upang kalkulahin ang arithmetic mean ng isang napiling hanay ng mga numero. Mayroon itong sumusunod na medyo simpleng syntax:

AVERAGE(number1,number2,…)

Pangangatwiran "Numero" maaaring maging isang solong numeric na halaga o isang reference sa mga cell o kahit na buong hanay na naglalaman ng mga ito.

Kaya, piliin ang cell kung saan ipapakita ang pagkalkula ng average na halaga, at mag-click sa pindutan "Insert Function".

Nagbubukas Function Wizard. Balik sa kategorya "Istatistika" at pumili ng pangalan mula sa listahan "AVERAGE". Gaya ng nakasanayan, mag-click sa pindutan "OK".

Bubukas ang window ng mga argumento. Ilagay ang cursor sa field "Number1" at pagpindot sa kaliwang pindutan ng mouse, piliin ang buong hanay ng mga halaga. Matapos ipakita ang mga coordinate sa field, mag-click sa pindutan "OK".

Pagkatapos noon AVERAGE ipinapakita ang resulta ng pagkalkula sa isang elemento ng sheet.

Kinakalkula namin ang tamang hangganan ng agwat ng kumpiyansa. Upang gawin ito, pumili ng isang hiwalay na cell at ilagay ang sign «=» at dagdagan ang mga nilalaman ng mga elemento ng sheet kung saan matatagpuan ang mga resulta ng mga pagkalkula ng function AVERAGE At TIWALA.NORM. Upang maisagawa ang pagkalkula, pindutin ang pindutan Pumasok. Sa aming kaso, nakuha namin ang sumusunod na formula:
Resulta ng pagkalkula: 6,953276

Sa parehong paraan, kinakalkula namin ang kaliwang limitasyon ng agwat ng kumpiyansa, sa pagkakataong ito lamang mula sa resulta ng pagkalkula AVERAGE ibawas ang resulta ng pagkalkula ng operator TIWALA.NORM. Ang resultang pormula para sa aming halimbawa ay ang sumusunod na uri:
Resulta ng pagkalkula: -3,06994

Sinubukan naming ilarawan nang detalyado ang lahat ng mga hakbang para sa pagkalkula ng agwat ng kumpiyansa, kaya inilarawan namin nang detalyado ang bawat formula. Ngunit maaari mong pagsamahin ang lahat ng mga aksyon sa isang formula. Ang pagkalkula ng tamang hangganan ng agwat ng kumpiyansa ay maaaring isulat tulad ng sumusunod:
AVERAGE(B2:B13)+CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

Ang isang katulad na pagkalkula para sa kaliwang hangganan ay magiging ganito:
AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

Paraan 2: TRUST.STUDENT function

Bilang karagdagan, ang Excel ay may isa pang function na nauugnay sa pagkalkula ng agwat ng kumpiyansa - PINAGTItiwala.ESTUDYANTE. Ito ay lumitaw lamang sa Excel 2010. Kinakalkula ng operator na ito ang pagitan ng kumpiyansa ng populasyon gamit ang distribusyon ng Mag-aaral. Ito ay napaka-maginhawang gamitin kapag ang pagkakaiba at, nang naaayon, ang karaniwang paglihis ay hindi alam. Ang operator syntax ay:

CONFIDENCE.STUDENT(alpha,standard_off, size)

Tulad ng nakikita mo, ang mga pangalan ng mga operator ay nanatiling hindi nagbabago sa kasong ito.

Tingnan natin kung paano kalkulahin ang mga hangganan ng isang agwat ng kumpiyansa na may hindi kilalang standard deviation gamit ang halimbawa ng parehong populasyon na isinasaalang-alang namin sa nakaraang pamamaraan. Kunin natin ang antas ng tiwala bilang huling pagkakataon sa 97%.

Piliin ang cell kung saan isasagawa ang pagkalkula. Mag-click sa pindutan "Insert Function".

Sa binuksan Function Wizard pumunta sa kategorya "Istatistika". Pumili ng pangalan "TRUSTED STUDENT". Mag-click sa pindutan "OK".

Ang window ng mga argumento para sa tinukoy na operator ay inilunsad.
Sa bukid "Alpha", dahil ang antas ng kumpiyansa ay 97%, isinusulat namin ang numero 0,03 . Sa pangalawang pagkakataon ay hindi kami magtatagal sa mga prinsipyo ng pagkalkula ng parameter na ito.

Pagkatapos nito, ilagay ang cursor sa field "Pamantayang Paglihis". Sa pagkakataong ito ang indicator na ito ay hindi alam sa amin at kailangang kalkulahin. Ginagawa ito gamit ang isang espesyal na function - STDEV.V. Upang buksan ang window ng operator na ito, mag-click sa tatsulok sa kaliwa ng formula bar. Kung hindi namin mahanap ang nais na pangalan sa listahan na bubukas, pagkatapos ay pumunta sa item "Iba pang mga function...".

Nagsisimula Function Wizard. Lumipat sa kategorya "Istatistika" at markahan ang pangalan dito "STDEV.V". Pagkatapos ay mag-click sa pindutan "OK".

Bubukas ang window ng mga argumento. Ang gawain ng operator STDEV.V ay upang matukoy ang standard deviation ng isang sample. Mukhang ganito ang syntax nito:
STANDARD DEVIATION.B(number1;number2;…)

Ito ay hindi mahirap hulaan na ang argumento "Numero" ay ang address ng elemento ng pagpili. Kung ang pagpili ay inilagay sa isang array, pagkatapos ay maaari kang gumamit lamang ng isang argumento upang magbigay ng isang link sa hanay na ito.

Ilagay ang cursor sa field "Number1" at, gaya ng nakasanayan, pagpindot sa kaliwang pindutan ng mouse, piliin ang koleksyon. Matapos ang mga coordinate ay nasa field, huwag magmadali upang pindutin ang pindutan "OK", dahil magiging mali ang resulta. Una kailangan nating bumalik sa window ng mga argumento ng operator PINAGTItiwala.ESTUDYANTE upang idagdag ang huling argumento. Upang gawin ito, mag-click sa kaukulang pangalan sa formula bar.

Ang window ng argument para sa pamilyar na function ay bubukas muli. Ilagay ang cursor sa field "Laki". Muli, mag-click sa tatsulok na pamilyar na tayo upang pumunta sa pagpili ng mga operator. Tulad ng naiintindihan mo, kailangan namin ng isang pangalan "SURIIN". Dahil ginamit namin ang function na ito sa mga kalkulasyon sa nakaraang pamamaraan, naroroon ito sa listahang ito, kaya i-click lamang ito. Kung hindi mo ito mahanap, pagkatapos ay sundin ang algorithm na inilarawan sa unang paraan.

Sabay sa window ng arguments SURIIN, ilagay ang cursor sa field "Number1" at habang pinipigilan ang pindutan ng mouse, piliin ang koleksyon. Pagkatapos ay mag-click sa pindutan "OK".

Pagkatapos nito, ang programa ay nagsasagawa ng pagkalkula at ipinapakita ang halaga ng pagitan ng kumpiyansa.

Upang matukoy ang mga hangganan, kakailanganin nating kalkulahin muli ang sample mean. Ngunit, ibinigay na ang pagkalkula algorithm gamit ang formula AVERAGE katulad ng sa nakaraang pamamaraan, at kahit na ang resulta ay hindi nagbago, hindi namin ito tatalakayin nang detalyado sa pangalawang pagkakataon.

Pagdaragdag ng mga resulta ng pagkalkula AVERAGE At PINAGTItiwala.ESTUDYANTE, nakukuha namin ang tamang limitasyon ng agwat ng kumpiyansa.

Pagbabawas mula sa mga resulta ng pagkalkula ng operator AVERAGE resulta ng pagkalkula PINAGTItiwala.ESTUDYANTE, mayroon kaming kaliwang limitasyon ng agwat ng kumpiyansa.

Kung ang pagkalkula ay nakasulat sa isang formula, kung gayon ang pagkalkula ng tamang hangganan sa aming kaso ay magiging ganito:
AVERAGE(B2:B13)+CONFIDENCE.STUDENT(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

Alinsunod dito, ang formula para sa pagkalkula ng kaliwang hangganan ay magiging ganito:
AVERAGE(B2:B13)-CONFIDENCE.STUDENT(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

Tulad ng nakikita mo, ang mga tool ng Excel ay ginagawang mas madaling kalkulahin ang agwat ng kumpiyansa at ang mga hangganan nito. Para sa mga layuning ito, ang mga hiwalay na operator ay ginagamit para sa mga sample na ang pagkakaiba ay kilala at hindi alam.

Agwat ng kumpiyansa– ang paglilimita ng mga halaga ng isang istatistikal na dami na, na may ibinigay na probabilidad ng kumpiyansa γ, ay nasa pagitan na ito kapag nagsa-sample ng mas malaking volume. Tinutukoy bilang P(θ - ε. Sa pagsasagawa, ang probabilidad ng kumpiyansa na γ ay pinili mula sa mga halagang medyo malapit sa pagkakaisa: γ = 0.9, γ = 0.95, γ = 0.99.

Layunin ng serbisyo. Gamit ang serbisyong ito, matutukoy mo:

agwat ng kumpiyansa para sa pangkalahatang mean, agwat ng kumpiyansa para sa pagkakaiba;
confidence interval para sa standard deviation, confidence interval para sa general share;

Ang resultang solusyon ay nai-save sa isang Word file (tingnan ang halimbawa). Nasa ibaba ang isang video na pagtuturo kung paano punan ang paunang data.

Halimbawa Blg. 1. Sa isang kolektibong sakahan, sa kabuuang kawan ng 1000 tupa, 100 tupa ang sumailalim sa selective control shearing. Bilang isang resulta, ang isang average na gupit ng lana na 4.2 kg bawat tupa ay itinatag. Tukuyin na may probabilidad na 0.99 ang mean square error ng sample kapag tinutukoy ang average na paggugupit ng lana bawat tupa at ang mga limitasyon kung saan nakapaloob ang halaga ng paggugupit kung ang pagkakaiba ay 2.5. Ang sample ay hindi paulit-ulit.
Halimbawa Blg. 2. Mula sa isang batch ng mga imported na produkto sa post ng Moscow Northern Customs, 20 sample ng produktong "A" ang kinuha sa pamamagitan ng random na paulit-ulit na sampling. Bilang resulta ng pagsubok, ang average na nilalaman ng kahalumigmigan ng produkto na "A" sa sample ay itinatag, na naging katumbas ng 6% na may karaniwang paglihis ng 1%.
Tukuyin na may posibilidad na 0.683 ang mga limitasyon ng average na moisture content ng produkto sa buong batch ng mga imported na produkto.
Halimbawa Blg. 3. Sa isang survey sa 36 na mag-aaral ay nagpakita na ang average na bilang ng mga textbook na binabasa nila noong academic year ay katumbas ng 6. Ipagpalagay na ang bilang ng mga textbook na binabasa ng isang mag-aaral bawat semestre ay may normal na batas sa pamamahagi na may standard deviation na katumbas ng 6, hanapin : A) na may reliability na 0 .99 interval estimate para sa mathematical expectation ng random variable na ito; B) sa anong posibilidad na masasabi natin na ang average na bilang ng mga aklat-aralin na binabasa ng isang mag-aaral bawat semestre, na kinakalkula mula sa sample na ito, ay lilihis mula sa inaasahan sa matematika sa ganap na halaga ng hindi hihigit sa 2.

Pag-uuri ng mga agwat ng kumpiyansa

Sa pamamagitan ng uri ng parameter na sinusuri:

Ayon sa uri ng sample:

Agwat ng kumpiyansa para sa isang walang katapusang sample;
Agwat ng kumpiyansa para sa huling sample;

Ang sample ay tinatawag na resampling, kung ang napiling bagay ay ibinalik sa populasyon bago piliin ang susunod. Ang sample ay tinatawag na non-repeat, kung ang napiling bagay ay hindi ibinalik sa populasyon. Sa pagsasagawa, kadalasan ay nakikitungo kami sa mga hindi paulit-ulit na sample.

Pagkalkula ng average sampling error para sa random sampling

Ang pagkakaiba sa pagitan ng mga halaga ng mga tagapagpahiwatig na nakuha mula sa sample at ang kaukulang mga parameter ng pangkalahatang populasyon ay tinatawag pagkakamali sa pagiging kinatawan.
Mga pagtatalaga ng mga pangunahing parameter ng pangkalahatan at sample na populasyon.

Average na mga formula ng error sa pag-sample
muling pagpili		ulitin ang pagpili
para sa karaniwan	para ibahagi	para sa karaniwan	para ibahagi

Ang ugnayan sa pagitan ng limitasyon ng error sa pag-sample (Δ) ay ginagarantiyahan na may ilang posibilidad Р(t), at ang karaniwang error sa sampling ay may anyo: o Δ = t·μ, kung saan t– koepisyent ng kumpiyansa, tinutukoy depende sa antas ng posibilidad na P(t) ayon sa talahanayan ng Laplace integral function.

Mga formula para sa pagkalkula ng laki ng sample gamit ang isang random na paraan ng sampling

Mula sa artikulong ito matututunan mo ang:

Anong nangyari agwat ng kumpiyansa?

Ano ang punto 3 mga tuntunin ng sigma?

Paano mo magagamit ang kaalamang ito sa pagsasanay?

Sa ngayon, dahil sa labis na impormasyon na nauugnay sa isang malaking uri ng mga produkto, mga direksyon sa pagbebenta, mga empleyado, mga lugar ng aktibidad, atbp., maaaring mahirap i-highlight ang pangunahing bagay, na, una sa lahat, ay nagkakahalaga ng pagbibigay pansin at pagsisikap na pamahalaan. Kahulugan agwat ng kumpiyansa at pagsusuri ng mga aktwal na halaga na lampas sa mga hangganan nito - isang pamamaraan na ay tutulong sa iyo na i-highlight ang mga sitwasyon, nakakaimpluwensya sa nagbabagong uso. Magagawa mong bumuo ng mga positibong salik at mabawasan ang impluwensya ng mga negatibo. Ang teknolohiyang ito ay ginagamit sa maraming kilalang pandaigdigang kumpanya.

May mga tinatawag na " mga alerto", na ipaalam sa mga tagapamahala na ang susunod na halaga ay nasa isang tiyak na direksyon lumampas agwat ng kumpiyansa. Ano ang ibig sabihin nito? Isa itong senyales na may nangyaring hindi pangkaraniwang kaganapan, na maaaring magbago sa kasalukuyang trend sa direksyong ito. Ito ay isang senyales sa ganyan upang malaman ito sa sitwasyon at unawain kung ano ang nakaimpluwensya nito.

Halimbawa, isaalang-alang ang ilang sitwasyon. Kinakalkula namin ang forecast ng mga benta na may mga limitasyon sa pagtataya para sa 100 item ng produkto para sa 2011 ayon sa buwan at aktwal na mga benta noong Marso:

Para sa Sunflower Oil, nalampasan nila ang pinakamataas na limitasyon ng forecast at hindi nahulog sa pagitan ng kumpiyansa.
Para sa "Dry yeast" lumampas kami sa mas mababang limitasyon ng forecast.
Ang "Oatmeal Porridge" ay lumampas sa pinakamataas na limitasyon.

Para sa iba pang mga produkto, ang mga aktwal na benta ay nasa loob ng ibinigay na mga limitasyon sa pagtataya. Yung. ang kanilang mga benta ay nasa loob ng inaasahan. Kaya, natukoy namin ang 3 produkto na lumampas sa mga hangganan at nagsimulang malaman kung ano ang nakaimpluwensya sa kanila na lumampas sa mga hangganan:

Para sa Sunflower Oil, pumasok kami sa isang bagong network ng pamamahagi, na nagbigay sa amin ng karagdagang dami ng benta, na humantong sa amin na lumampas sa pinakamataas na limitasyon. Para sa produktong ito, sulit na kalkulahin muli ang forecast hanggang sa katapusan ng taon, na isinasaalang-alang ang forecast ng mga benta para sa network na ito.
Para sa "Dry Yeast", ang kotse ay natigil sa customs, at nagkaroon ng kakulangan sa loob ng 5 araw, na nakaapekto sa pagbaba ng mga benta at lumampas sa mas mababang limitasyon. Maaaring sulit na malaman kung ano ang sanhi nito at subukang huwag ulitin ang sitwasyong ito.
Isang kaganapan sa pag-promote ng benta ang inilunsad para sa Oatmeal Porridge, na nagbigay ng malaking pagtaas sa mga benta at humantong sa kumpanya na lumampas sa hula.

Natukoy namin ang 3 salik na nakaimpluwensya sa paglampas sa mga limitasyon ng hula. Maaaring magkaroon ng higit pa sa mga ito sa buhay Upang mapataas ang katumpakan ng pagtataya at pagpaplano, mga salik na humahantong sa katotohanan na ang aktwal na mga benta ay maaaring lumampas sa hula, ito ay nagkakahalaga ng pag-highlight at pagbuo ng mga pagtataya at mga plano para sa kanila nang hiwalay. At pagkatapos ay isaalang-alang ang kanilang epekto sa pangunahing pagtataya ng mga benta. Maaari mo ring regular na tasahin ang epekto ng mga salik na ito at baguhin ang sitwasyon para sa mas mahusay. sa pamamagitan ng pagbabawas ng impluwensya ng negatibo at pagtaas ng impluwensya ng mga positibong salik.

Sa pagitan ng kumpiyansa, magagawa nating:

Pumili ng mga direksyon, na kung saan ay nagkakahalaga ng pagbibigay pansin sa, dahil naganap ang mga kaganapan sa mga direksyong ito na maaaring makaapekto pagbabago sa kalakaran.
Tukuyin ang mga salik, na talagang nakakaimpluwensya sa pagbabago sa sitwasyon.
Tanggapin matalinong desisyon(halimbawa, tungkol sa pagbili, pagpaplano, atbp.).

Ngayon tingnan natin kung ano ang agwat ng kumpiyansa at kung paano kalkulahin ito sa Excel gamit ang isang halimbawa.

Ano ang confidence interval?

Ang pagitan ng kumpiyansa ay ang mga hangganan ng pagtataya (itaas at ibaba), kung saan na may ibinigay na posibilidad (sigma) lilitaw ang mga aktwal na halaga.

Yung. Kinakalkula namin ang forecast - ito ang aming pangunahing patnubay, ngunit naiintindihan namin na ang aktwal na mga halaga ay malamang na hindi 100% na katumbas ng aming pagtataya. At ang tanong ay lumitaw, sa loob ng kung anong mga hangganan maaaring bumaba ang aktwal na mga halaga, kung magpapatuloy ang kasalukuyang kalakaran? At ang tanong na ito ay makakatulong sa amin na masagot pagkalkula ng agwat ng kumpiyansa, ibig sabihin. - itaas at mas mababang mga limitasyon ng forecast.

Ano ang ibinigay na probability sigma?

Kapag nagkalkula confidence interval kaya natin itakda ang posibilidad mga hit aktwal na mga halaga sa loob ng ibinigay na mga limitasyon sa pagtataya. Paano ito gawin? Upang gawin ito, itinakda namin ang halaga ng sigma at, kung ang sigma ay katumbas ng:

3 sigma- pagkatapos, ang posibilidad ng susunod na aktwal na halaga na bumabagsak sa pagitan ng kumpiyansa ay magiging 99.7%, o 300 hanggang 1, o mayroong 0.3% na posibilidad na lumampas sa mga hangganan.

2 sigma- pagkatapos, ang posibilidad ng susunod na halaga na nahuhulog sa loob ng mga hangganan ay ≈ 95.5%, i.e. ang mga posibilidad ay humigit-kumulang 20 hanggang 1, o mayroong 4.5% na posibilidad na lumampas sa dagat.

1 sigma- kung gayon ang posibilidad ay ≈ 68.3%, i.e. ang mga logro ay humigit-kumulang 2 hanggang 1, o mayroong 31.7% na pagkakataon na ang susunod na halaga ay mahuhulog sa labas ng agwat ng kumpiyansa.

Nag-formula kami 3 sigma na panuntunan,na nagsasabing hit probability isa pang random na halaga sa pagitan ng kumpiyansa na may ibinigay na halaga tatlong sigma ay 99.7%.

Pinatunayan ng mahusay na Russian mathematician na si Chebyshev ang theorem na mayroong 10% na posibilidad na lumampas sa mga limitasyon ng forecast na may ibinigay na halaga ng tatlong sigma. Yung. ang posibilidad na mahulog sa loob ng 3-sigma na agwat ng kumpiyansa ay hindi bababa sa 90%, habang ang isang pagtatangka upang kalkulahin ang forecast at ang mga hangganan nito "sa pamamagitan ng mata" ay puno ng mas makabuluhang mga error.

Paano kalkulahin ang isang agwat ng kumpiyansa sa iyong sarili sa Excel?

Tingnan natin ang pagkalkula ng agwat ng kumpiyansa sa Excel (ibig sabihin, ang itaas at mas mababang mga limitasyon ng forecast) gamit ang isang halimbawa. Mayroon kaming serye ng oras - mga benta ayon sa buwan sa loob ng 5 taon. Tingnan ang naka-attach na file.

Upang kalkulahin ang mga limitasyon ng pagtataya, kinakalkula namin:

Pagtataya ng benta().
Sigma - karaniwang paglihis mga modelo ng hula mula sa mga aktwal na halaga.
Tatlong sigma.
Agwat ng kumpiyansa.

1. Pagtataya ng benta.

=(RC[-14] (data ng time series)- RC[-1] (halaga ng modelo))^2(kuwadrado)

3. Para sa bawat buwan, buuin natin ang mga halaga ng deviation mula sa stage 8 Sum((Xi-Ximod)^2), i.e. Isama natin ang Enero, Pebrero... para sa bawat taon.

Upang gawin ito, gamitin ang formula =SUMIF()

SUMIF(array na may mga period number sa loob ng cycle (para sa mga buwan mula 1 hanggang 12); link sa period number sa cycle; link sa array na may mga parisukat ng pagkakaiba sa pagitan ng source data at period values)

4. Kalkulahin ang standard deviation para sa bawat panahon sa cycle mula 1 hanggang 12 (stage 10 sa kalakip na file).

Upang gawin ito, kinukuha namin ang ugat mula sa halaga na kinakalkula sa yugto 9 at hinahati sa bilang ng mga yugto sa siklong ito na minus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Gamitin natin ang mga formula sa Excel =ROOT(R8 (link sa (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (link sa array na may mga cycle number); O8 (link sa isang partikular na cycle number na binibilang namin sa array))-1))

Gamit ang formula ng Excel = COUNTIF binibilang namin ang bilang n

Ang pagkakaroon ng pagkalkula ng karaniwang paglihis ng aktwal na data mula sa modelo ng pagtataya, nakuha namin ang halaga ng sigma para sa bawat buwan - yugto 10 sa kalakip na file.

3. Kalkulahin natin ang 3 sigma.

Sa yugto 11 itinakda namin ang bilang ng mga sigma - sa aming halimbawa na "3" (yugto 11 sa kalakip na file):

Maginhawa din para sa mga halaga ng sigma ng pagsasanay:

1.64 sigma - 10% na pagkakataon na lumampas sa limitasyon (1 pagkakataon sa 10);

1.96 sigma - 5% na posibilidad na lumampas sa mga limitasyon (1 pagkakataon sa 20);

2.6 sigma - 1% na posibilidad na lumampas sa mga limitasyon (1 pagkakataon sa 100).

5) Pagkalkula ng tatlong sigma, para dito pinarami namin ang mga halaga ng "sigma" para sa bawat buwan ng "3".

3. Tukuyin ang pagitan ng kumpiyansa.

Pinakamataas na limitasyon sa pagtataya- forecast ng mga benta na isinasaalang-alang ang paglago at seasonality + (plus) 3 sigma;
Mababang limitasyon sa pagtataya- forecast ng mga benta na isinasaalang-alang ang paglago at seasonality - (minus) 3 sigma;

Para sa kaginhawahan ng pagkalkula ng agwat ng kumpiyansa sa mahabang panahon (tingnan ang nakalakip na file), gagamitin namin ang formula ng Excel =Y8+VLOOKUP(W8,$U$8:$V$19,2,0), Saan

Y8- pagtataya ng mga benta;

W8- ang bilang ng buwan kung saan kukuha kami ng 3-sigma na halaga;

Yung. Pinakamataas na limitasyon sa pagtataya= “sales forecast” + “3 sigma” (sa halimbawa, VLOOKUP(month number; table with 3 sigma values; column kung saan kinukuha namin ang sigma value na katumbas ng buwan na numero sa kaukulang row; 0)).

Mababang limitasyon sa pagtataya= "pagtataya ng benta" bawas "3 sigma".

Kaya, kinakalkula namin ang agwat ng kumpiyansa sa Excel.

Ngayon ay mayroon kaming isang forecast at isang saklaw na may mga hangganan kung saan ang mga aktwal na halaga ay mahuhulog na may isang ibinigay na posibilidad ng sigma.

Sa artikulong ito, tiningnan namin kung ano ang sigma at ang tatlong-sigma na panuntunan, kung paano matukoy ang agwat ng kumpiyansa, at kung bakit maaari mong gamitin ang diskarteng ito sa pagsasanay.

Hangad namin sa iyo ang tumpak na mga hula at tagumpay!

Paano Matutulungan ka ng Forecast4AC PROkapag kinakalkula ang agwat ng kumpiyansa?:

Awtomatikong kakalkulahin ng Forecast4AC PRO ang upper o lower bounds ng forecast para sa higit sa 1000 time series nang sabay-sabay;

Ang kakayahang pag-aralan ang mga hangganan ng forecast kumpara sa forecast, trend at aktwal na mga benta sa chart na may isang keystroke;

Sa programang Forcast4AC PRO posibleng itakda ang halaga ng sigma mula 1 hanggang 3.

Samahan mo kami!

Mag-download ng mga libreng app para sa pagtataya at pagtatasa ng negosyo:

Novo Forecast Lite- awtomatiko pagkalkula ng pagtataya V Excel.
4analytics - Pagsusuri ng ABC-XYZ at pagsusuri sa emisyon Excel.
Qlik Sense Desktop at QlikViewPersonal na Edisyon - Mga sistema ng BI para sa pagsusuri at visualization ng data.

Subukan ang mga kakayahan ng mga bayad na solusyon:

Novo Forecast PRO- pagtataya sa Excel para sa malalaking set ng data.