Ang standard deviation ay may praktikal na kahulugan. Pagtatantya ng pagkakaiba, karaniwang paglihis

Aralin Blg. 4

Paksa: “Mga istatistikal na naglalarawan. Mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa pinagsama-samang"

Ang pangunahing pamantayan para sa pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay: limitasyon, amplitude, standard deviation, coefficient of oscillation at coefficient of variation. Sa nakaraang aralin, tinalakay na ang mga average na halaga ay nagbibigay lamang ng isang pangkalahatang katangian ng katangian na pinag-aaralan sa pinagsama-samang at hindi isinasaalang-alang ang mga halaga ng mga indibidwal na variant nito: minimum at maximum na mga halaga, sa itaas ng average, sa ibaba karaniwan, atbp.

Halimbawa. Mga average na halaga ng dalawang magkaibang pagkakasunud-sunod ng numero: -100; -20; 100; 20 at 0.1; -0.2; 0.1 ay ganap na magkapareho at pantayTUNGKOL SA.Gayunpaman, ang mga scatter range ng mga relatibong mean sequence data na ito ay ibang-iba.

Ang pagpapasiya ng nakalistang pamantayan para sa pagkakaiba-iba ng isang katangian ay pangunahing isinasagawa na isinasaalang-alang ang halaga nito sa mga indibidwal na elemento ng istatistikal na populasyon.

Ang mga tagapagpahiwatig para sa pagsukat ng pagkakaiba-iba ng isang katangian ay ganap At kamag-anak. Ang mga ganap na tagapagpahiwatig ng variation ay kinabibilangan ng: hanay ng variation, limitasyon, standard deviation, dispersion. Ang coefficient ng variation at ang coefficient ng oscillation ay tumutukoy sa mga relatibong sukat ng variation.

Limitasyon (lim)– Ito ay isang criterion na tinutukoy ng matinding halaga ng isang variant sa isang serye ng variation. Sa madaling salita, ang pamantayang ito ay nililimitahan ng pinakamababa at pinakamataas na halaga ng katangian:

Amplitude (Am) o saklaw ng pagkakaiba-iba - Ito ang pagkakaiba sa pagitan ng mga matinding opsyon. Ang pagkalkula ng pamantayang ito ay isinasagawa sa pamamagitan ng pagbabawas ng pinakamababang halaga nito mula sa pinakamataas na halaga ng katangian, na nagpapahintulot sa amin na tantiyahin ang antas ng scatter ng opsyon:

Ang kawalan ng limitasyon at amplitude bilang pamantayan ng pabagu-bago ay ganap silang umaasa sa mga matinding halaga ng katangian sa serye ng pagkakaiba-iba. Sa kasong ito, ang mga pagbabago sa mga halaga ng katangian sa loob ng isang serye ay hindi isinasaalang-alang.

Ang pinakakumpletong paglalarawan ng pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay ibinigay ng karaniwang paglihis(sigma), na isang pangkalahatang sukatan ng paglihis ng isang opsyon mula sa average na halaga nito. Ang karaniwang paglihis ay madalas na tinatawag karaniwang paglihis.

Ang standard deviation ay batay sa paghahambing ng bawat opsyon sa arithmetic mean ng isang naibigay na populasyon. Dahil sa pinagsama-samang mayroong palaging mga pagpipilian sa parehong mas mababa at higit pa kaysa dito, kung gayon ang kabuuan ng mga paglihis na may sign na "" ay kakanselahin ng kabuuan ng mga deviations na may sign "", i.e. ang kabuuan ng lahat ng deviations ay zero. Upang maiwasan ang impluwensya ng mga palatandaan ng mga pagkakaiba, ang mga paglihis mula sa arithmetic mean squared ay kinuha, i.e. . Ang kabuuan ng mga squared deviations ay hindi katumbas ng zero. Upang makakuha ng isang koepisyent na may kakayahang sukatin ang pagkakaiba-iba, kunin ang average ng kabuuan ng mga parisukat - ang halagang ito ay tinatawag mga pagkakaiba-iba:

Sa esensya, ang pagpapakalat ay ang average na parisukat ng mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa average na halaga nito. Pagpapakalat parisukat ng karaniwang paglihis.

Ang pagkakaiba ay isang dimensional na dami (pinangalanan). Kaya, kung ang mga variant ng isang serye ng numero ay ipinahayag sa metro, kung gayon ang pagkakaiba ay nagbibigay ng square meters; kung ang mga opsyon ay ipinahayag sa kilo, kung gayon ang pagkakaiba ay nagbibigay ng parisukat ng sukat na ito (kg 2), atbp.

Standard deviation– square root ng variance:

, pagkatapos ay kapag kinakalkula ang dispersion at standard deviation sa denominator ng fraction, sa halip nadapat ilagay.

Ang pagkalkula ng karaniwang paglihis ay maaaring nahahati sa anim na yugto, na dapat isagawa sa isang tiyak na pagkakasunud-sunod:

Application ng standard deviation:

a) para sa paghusga sa pagkakaiba-iba ng mga serye ng variation at paghahambing na pagtatasa ng typicality (representativeness) ng mga arithmetic average. Ito ay kinakailangan sa differential diagnosis kapag tinutukoy ang katatagan ng mga sintomas.

b) upang muling buuin ang serye ng variation, i.e. pagpapanumbalik ng frequency response nito batay sa tatlong sigma panuntunan. Sa pagitan (М±3σ) 99.7% ng lahat ng variant ng serye ay matatagpuan sa pagitan (М±2σ) - 95.5% at nasa hanay (М±1σ) - 68.3% na opsyon sa hilera(Larawan 1).

c) upang matukoy ang mga opsyon na "pop-up".

d) upang matukoy ang mga parameter ng pamantayan at patolohiya gamit ang mga pagtatantya ng sigma

e) upang kalkulahin ang koepisyent ng pagkakaiba-iba

f) upang kalkulahin ang average na error ng arithmetic mean.

Upang makilala ang anumang populasyon na mayroonnormal na uri ng pamamahagi , sapat na upang malaman ang dalawang parameter: ang arithmetic mean at ang standard deviation.

Figure 1. Three Sigma rule

Halimbawa.

Sa pediatrics, ang standard deviation ay ginagamit upang masuri ang pisikal na pag-unlad ng mga bata sa pamamagitan ng paghahambing ng data ng isang partikular na bata na may kaukulang standard indicator. Ang arithmetic average ng pisikal na pag-unlad ng malusog na mga bata ay kinuha bilang pamantayan. Ang paghahambing ng mga tagapagpahiwatig na may mga pamantayan ay isinasagawa gamit ang mga espesyal na talahanayan kung saan ang mga pamantayan ay ibinigay kasama ang kanilang kaukulang mga sukat ng sigma. Ito ay pinaniniwalaan na kung ang tagapagpahiwatig ng pisikal na pag-unlad ng isang bata ay nasa loob ng pamantayan (arithmetic mean) ±σ, kung gayon ang pisikal na pag-unlad ng bata (ayon sa tagapagpahiwatig na ito) ay tumutugma sa pamantayan. Kung ang tagapagpahiwatig ay nasa loob ng pamantayan ± 2σ, pagkatapos ay mayroong isang bahagyang paglihis mula sa pamantayan. Kung ang tagapagpahiwatig ay lumampas sa mga limitasyong ito, kung gayon ang pisikal na pag-unlad ng bata ay naiiba nang husto mula sa pamantayan (posible ang patolohiya).

Bilang karagdagan sa mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga ganap na halaga, ang istatistikal na pananaliksik ay gumagamit ng mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga kaugnay na halaga. Oscillation coefficient - ito ang ratio ng hanay ng variation sa average na halaga ng katangian. Koepisyent ng pagkakaiba-iba - Ito ang ratio ng standard deviation sa average na halaga ng katangian. Karaniwan, ang mga halagang ito ay ipinahayag bilang mga porsyento.

Mga formula para sa pagkalkula ng mga relatibong tagapagpahiwatig ng pagkakaiba-iba:

Mula sa mga formula sa itaas ay malinaw na mas malaki ang koepisyent V ay mas malapit sa zero, mas maliit ang pagkakaiba-iba sa mga halaga ng katangian. Ang higit pa V, mas maraming variable ang sign.

Sa pagsasagawa ng istatistika, ang koepisyent ng pagkakaiba-iba ay kadalasang ginagamit. Ito ay ginagamit hindi lamang para sa paghahambing na pagtatasa ng pagkakaiba-iba, ngunit din upang makilala ang homogeneity ng populasyon. Ang populasyon ay itinuturing na homogenous kung ang koepisyent ng variation ay hindi lalampas sa 33% (para sa mga distribusyon na malapit sa normal). Sa aritmetika, ang ratio ng σ at ang arithmetic mean ay neutralisahin ang impluwensya ng ganap na halaga ng mga katangiang ito, at ang ratio ng porsyento ay ginagawang ang coefficient ng variation ay isang walang sukat (walang pangalan) na halaga.

Ang resultang halaga ng koepisyent ng pagkakaiba-iba ay tinatantya alinsunod sa mga tinatayang gradasyon ng antas ng pagkakaiba-iba ng katangian:

Mahina - hanggang 10%

Average - 10 - 20%

Malakas - higit sa 20%

Ang paggamit ng koepisyent ng pagkakaiba-iba ay ipinapayong sa mga kaso kung saan kinakailangan upang ihambing ang mga katangian na naiiba sa laki at sukat.

Ang pagkakaiba sa pagitan ng koepisyent ng pagkakaiba-iba at iba pang pamantayan ng scatter ay malinaw na ipinakita halimbawa.

Talahanayan 1

Komposisyon ng mga manggagawa sa negosyong pang-industriya

Batay sa mga istatistikal na katangian na ibinigay sa halimbawa, maaari tayong gumawa ng isang konklusyon tungkol sa kamag-anak na homogeneity ng komposisyon ng edad at antas ng edukasyon ng mga empleyado ng negosyo, dahil sa mababang propesyonal na katatagan ng surveyed contingent. Madaling makita na ang isang pagtatangka na hatulan ang mga panlipunang uso sa pamamagitan ng karaniwang paglihis ay hahantong sa isang maling konklusyon, at ang pagtatangkang ihambing ang mga katangian ng accounting na "karanasan sa trabaho" at "edad" sa tagapagpahiwatig ng accounting na "edukasyon" ay karaniwang magiging. hindi tama dahil sa heterogeneity ng mga katangiang ito.

Median at percentiles

Para sa ordinal (ranggo) na mga distribusyon, kung saan ang criterion para sa gitna ng serye ay ang median, ang standard deviation at dispersion ay hindi maaaring magsilbi bilang mga katangian ng dispersion ng variant.

Ang parehong ay totoo para sa bukas na serye ng variation. Ang pangyayaring ito ay dahil sa katotohanan na ang mga paglihis kung saan ang pagkakaiba at σ ay kinakalkula ay sinusukat mula sa arithmetic mean, na hindi kinakalkula sa bukas na serye ng variation at sa serye ng mga distribusyon ng mga katangiang husay. Samakatuwid, para sa isang naka-compress na paglalarawan ng mga distribusyon, isa pang parameter ng scatter ang ginagamit - dami(kasingkahulugan - "percentile"), na angkop para sa paglalarawan ng mga katangian ng husay at dami sa anumang anyo ng kanilang pamamahagi. Ang parameter na ito ay maaari ding gamitin upang i-convert ang mga quantitative na katangian sa mga qualitative. Sa kasong ito, ang mga naturang rating ay itinalaga depende sa kung aling pagkakasunud-sunod ng dami tumutugma sa isang partikular na opsyon.

Sa pagsasagawa ng biomedical na pananaliksik, ang mga sumusunod na dami ay kadalasang ginagamit:

– panggitna;

, – quartile (quarters), kung saan – lower quartile, nangungunang kuwarts.

Hinahati ng mga quantiles ang lugar ng mga posibleng pagbabago sa isang serye ng variation sa ilang mga agwat. Ang Median (quantile) ay isang opsyon na nasa gitna ng isang variation series at hinahati ang seryeng ito sa kalahati sa dalawang pantay na bahagi ( 0,5 At 0,5 ). Hinahati ng quartile ang isang serye sa apat na bahagi: ang unang bahagi (lower quartile) ay isang opsyon na naghihiwalay sa mga opsyon na ang mga numerical na halaga ay hindi lalampas sa 25% ng maximum na posible sa isang naibigay na serye; hanggang sa 50% ng maximum na posible. Ang itaas na quartile () ay naghihiwalay ng mga opsyon hanggang sa 75% ng pinakamataas na posibleng halaga.

Sa kaso ng asymmetric distribution variable na may kaugnayan sa arithmetic mean, ang median at quartiles ay ginagamit upang makilala ito. Sa kasong ito, ang sumusunod na anyo ng pagpapakita ng average na halaga ay ginagamit - Meh (;). Halimbawa, ang pinag-aralan na tampok - "ang panahon kung saan ang bata ay nagsimulang lumakad nang nakapag-iisa" - ay may walang simetrya na pamamahagi sa pangkat ng pag-aaral. Kasabay nito, ang mas mababang quartile () ay tumutugma sa simula ng paglalakad - 9.5 na buwan, ang median - 11 buwan, ang itaas na quartile () - 12 buwan. Alinsunod dito, ang katangian ng average na trend ng tinukoy na katangian ay ipapakita bilang 11 (9.5; 12) na buwan.

Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral

Ang istatistikal na kahalagahan ng data ay nauunawaan bilang ang antas kung saan ito tumutugma sa ipinakitang katotohanan, i.e. Ang data na makabuluhang istatistika ay ang mga hindi nakakasira at wastong sumasalamin sa layunin ng katotohanan.

Ang pagtatasa sa istatistikal na kahalagahan ng mga resulta ng pananaliksik ay nangangahulugan ng pagtukoy sa kung anong posibilidad na mailipat ang mga resultang nakuha mula sa sample na populasyon sa buong populasyon. Ang pagtatasa ng istatistikal na kabuluhan ay kinakailangan upang maunawaan kung gaano karami ng isang phenomenon ang maaaring gamitin upang hatulan ang phenomenon sa kabuuan at ang mga pattern nito.

Ang pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pananaliksik ay binubuo ng:

1. mga error sa pagiging kinatawan (mga error ng average at relative values) - m;

2. mga limitasyon ng kumpiyansa ng average o kamag-anak na mga halaga;

3. pagiging maaasahan ng pagkakaiba sa average o kamag-anak na mga halaga ayon sa pamantayan t.

Standard error ng arithmetic mean o pagkakamali sa pagiging kinatawan nailalarawan ang pagbabagu-bago ng average. Dapat tandaan na kung mas malaki ang laki ng sample, mas maliit ang pagkalat ng mga average na halaga. Ang karaniwang error ng mean ay kinakalkula gamit ang formula:

Sa modernong siyentipikong panitikan, ang arithmetic mean ay isinusulat kasama ng error sa representasyon:

o kasama ng karaniwang paglihis:

Bilang halimbawa, isaalang-alang ang data sa 1,500 mga klinika ng lungsod sa bansa (pangkalahatang populasyon). Ang average na bilang ng mga pasyente na nagsilbi sa klinika ay 18,150 katao. Ang random na pagpili ng 10% ng mga site (150 klinika) ay nagbibigay ng average na bilang ng mga pasyente na katumbas ng 20,051 katao. Ang error sa sampling, malinaw naman dahil sa katotohanan na hindi lahat ng 1500 na klinika ay kasama sa sample, ay katumbas ng pagkakaiba sa pagitan ng mga average na ito - ang pangkalahatang average ( M gene) at sample mean ( M napili). Kung bubuo tayo ng isa pang sample na may parehong laki mula sa ating populasyon, magbibigay ito ng ibang halaga ng error. Ang lahat ng sample na ito, na may sapat na malalaking sample, ay karaniwang ipinamamahagi sa paligid ng pangkalahatang mean na may sapat na malaking bilang ng mga pag-uulit ng sample ng parehong bilang ng mga bagay mula sa pangkalahatang populasyon. Standard error ng mean m- ito ang hindi maiiwasang pagkalat ng sample na paraan sa paligid ng pangkalahatang mean.

Sa kaso kapag ang mga resulta ng pananaliksik ay ipinakita sa mga kamag-anak na dami (halimbawa, mga porsyento) - kinakalkula karaniwang error ng fraction:

kung saan ang P ay ang indicator sa %, n ay ang bilang ng mga obserbasyon.

Ang resulta ay ipinapakita bilang (P ± m)%. Halimbawa, ang porsyento ng paggaling sa mga pasyente ay (95.2±2.5)%.

Sa kaganapan na ang bilang ng mga elemento ng populasyon, pagkatapos ay kapag kinakalkula ang mga karaniwang error ng mean at ang fraction sa denominator ng fraction, sa halip nadapat ilagay.

Para sa isang normal na distribusyon (normal ang distribusyon ng sample na paraan), alam natin kung anong bahagi ng populasyon ang nasa loob ng anumang pagitan sa paligid ng mean. Sa partikular:

Sa pagsasagawa, ang problema ay ang mga katangian ng pangkalahatang populasyon ay hindi alam sa amin, at ang sample ay ginawa nang tumpak para sa layunin ng pagtantya sa kanila. Nangangahulugan ito na kung gumawa kami ng mga sample ng parehong laki n mula sa pangkalahatang populasyon, pagkatapos ay sa 68.3% ng mga kaso ang pagitan ay maglalaman ng halaga M(sa 95.5% ng mga kaso ito ay nasa pagitan at sa 99.7% ng mga kaso - sa pagitan).

Dahil isang sample lamang ang aktwal na kinuha, ang pahayag na ito ay nabuo sa mga tuntunin ng posibilidad: na may posibilidad na 68.3%, ang average na halaga ng katangian sa populasyon ay nasa pagitan, na may posibilidad na 95.5% - sa pagitan, atbp.

Sa pagsasagawa, ang isang agwat ay binuo sa paligid ng sample na halaga na, na may ibinigay na (sapat na mataas) na posibilidad, posibilidad ng kumpiyansa -"sasaklawin" ang tunay na halaga ng parameter na ito sa pangkalahatang populasyon. Ang agwat na ito ay tinatawag agwat ng kumpiyansa.

probabilidad ng kumpiyansaP ito ang antas ng kumpiyansa na ang agwat ng kumpiyansa ay talagang maglalaman ng tunay (hindi kilalang) halaga ng parameter sa populasyon.

Halimbawa, kung ang posibilidad ng kumpiyansa R ay 90%, nangangahulugan ito na 90 sample sa 100 ang magbibigay ng tamang pagtatantya ng parameter sa populasyon. Alinsunod dito, ang posibilidad ng pagkakamali, i.e. maling pagtatantya ng pangkalahatang average para sa sample ay katumbas ng porsyento: . Para sa halimbawang ito, nangangahulugan ito na ang 10 sample sa 100 ay magbibigay ng maling pagtatantya.

Malinaw, ang antas ng kumpiyansa (confidence probability) ay nakasalalay sa laki ng agwat: mas malawak ang pagitan, mas mataas ang kumpiyansa na mahuhulog dito ang isang hindi kilalang halaga para sa populasyon. Sa pagsasagawa, hindi bababa sa dalawang beses ang sampling error ay ginagamit upang bumuo ng isang confidence interval upang magbigay ng hindi bababa sa 95.5% kumpiyansa.

Ang pagtukoy sa mga limitasyon ng kumpiyansa ng mga average at kamag-anak na mga halaga ay nagbibigay-daan sa amin upang mahanap ang kanilang dalawang matinding halaga - ang pinakamababang posible at ang maximum na posible, kung saan ang pinag-aralan na tagapagpahiwatig ay maaaring mangyari sa buong populasyon. Batay dito, mga limitasyon ng kumpiyansa (o agwat ng kumpiyansa)- ito ang mga hangganan ng average o kamag-anak na mga halaga, na higit sa kung saan dahil sa mga random na pagbabagu-bago ay mayroong isang hindi gaanong posibilidad.

Ang agwat ng kumpiyansa ay maaaring muling isulat bilang: , kung saan t– pamantayan ng kumpiyansa.

Ang mga limitasyon ng kumpiyansa ng arithmetic mean sa populasyon ay tinutukoy ng formula:

M gene = M pumili + t m M

para sa relatibong halaga:

R gene = P pumili + t m R

saan M gene At R gene- mga halaga ng average at kamag-anak na mga halaga para sa pangkalahatang populasyon; M pumili At R pumili- mga halaga ng average at kamag-anak na mga halaga na nakuha mula sa sample na populasyon; m M At m P- mga error ng average at kamag-anak na mga halaga; t- criterion ng kumpiyansa (criterion ng katumpakan, na itinatag kapag nagpaplano ng pag-aaral at maaaring katumbas ng 2 o 3); t m- ito ay isang confidence interval o Δ - ang pinakamataas na error ng indicator na nakuha sa isang sample na pag-aaral.

Dapat pansinin na ang halaga ng criterion t sa isang tiyak na lawak na nauugnay sa posibilidad ng isang walang error na pagtataya (p), na ipinahayag sa %. Pinili ito ng mismong mananaliksik, ginagabayan ng pangangailangang makuha ang resulta na may kinakailangang antas ng katumpakan. Kaya, para sa posibilidad ng isang walang error na forecast na 95.5%, ang halaga ng criterion t ay 2, para sa 99.7% - 3.

Ang ibinigay na mga pagtatantya sa pagitan ng kumpiyansa ay tinatanggap lamang para sa mga istatistikal na populasyon na may higit sa 30 mga obserbasyon Sa mas maliit na laki ng populasyon (maliit na mga sample), ang mga espesyal na talahanayan ay ginagamit upang matukoy ang t criterion. Sa mga talahanayang ito, ang nais na halaga ay matatagpuan sa intersection ng linya na tumutugma sa laki ng populasyon (n-1), at isang column na tumutugma sa antas ng posibilidad ng isang walang error na pagtataya (95.5%; 99.7%) na pinili ng mananaliksik. Sa medikal na pananaliksik, kapag nagtatatag ng mga limitasyon ng kumpiyansa para sa anumang tagapagpahiwatig, ang posibilidad ng isang walang error na pagtataya ay 95.5% o higit pa. Nangangahulugan ito na ang halaga ng indicator na nakuha mula sa sample na populasyon ay dapat matagpuan sa pangkalahatang populasyon sa hindi bababa sa 95.5% ng mga kaso.

    Mga tanong sa paksa ng aralin:

    Kaugnayan ng mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa isang istatistikal na populasyon.

    Pangkalahatang katangian ng absolute variation indicators.

    Standard deviation, pagkalkula, aplikasyon.

    Mga kamag-anak na sukat ng pagkakaiba-iba.

    Median, quartile na marka.

    Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral.

    Standard error ng arithmetic mean, formula ng pagkalkula, halimbawa ng paggamit.

    Pagkalkula ng proporsyon at ang karaniwang error nito.

    Ang konsepto ng posibilidad ng kumpiyansa, isang halimbawa ng paggamit.

10. Ang konsepto ng isang agwat ng kumpiyansa, ang aplikasyon nito.

    Subukan ang mga gawain sa paksa na may karaniwang mga sagot:

1. MGA GANAP NA INDICATOR NG VARIATION AY TUNGKOL SA

1) koepisyent ng pagkakaiba-iba

2) koepisyent ng oscillation

4) panggitna

2. MGA RELATIVE INDICATOR NG VARIATION RELATE

1) pagpapakalat

4) koepisyent ng pagkakaiba-iba

3. CRITERION NA TINUTUKOY NG MGA SOBRANG HALAGA NG ISANG OPTION SA ISANG VARIATION SERIES

2) amplitude

3) pagpapakalat

4) koepisyent ng pagkakaiba-iba

4. ANG PAGKAKAIBA NG MGA SOBRANG OPSYON AY

2) amplitude

3) karaniwang paglihis

4) koepisyent ng pagkakaiba-iba

5. ANG AVERAGE SQUARE NG MGA PAGLILIHIS NG INDIBIDWAL NA HALAGA NG ISANG KATANGIAN MULA SA AVERAGE NA HALAGA NITO AY

1) koepisyent ng oscillation

2) panggitna

3) pagpapakalat

6. ANG RATIO NG SCALE OF VARIATION SA AVERAGE VALUE NG ISANG CHARACTER AY

1) koepisyent ng pagkakaiba-iba

2) karaniwang paglihis

4) koepisyent ng oscillation

7. ANG RATIO NG AVERAGE SQUARE DEVIATION SA AVERAGE VALUE NG ISANG KATANGIAN AY

1) pagpapakalat

2) koepisyent ng pagkakaiba-iba

3) koepisyent ng oscillation

4) amplitude

8. ANG OPTION NA NASA GITNA NG VARIATION SERIES AT HINATI ITO SA DALAWANG PANTAY NA BAHAGI AY

1) panggitna

3) amplitude

9. SA MEDIKAL NA PANANALIKSIK, KAPAG NAGTATATAG NG MGA LIMITASYON NG PAGTIWALA PARA SA ANUMANG INDICATOR, ANG PROBABILIDAD NG WALANG ERROR NA PREDICTION AY TATANGGAP.

10. KUNG 90 SAMPLE SA 100 ANG NAGBIBIGAY NG TAMANG TANTA NG ISANG PARAMETER SA POPULASYON, IBIG SABIHIN NITO NA ANG PROBABILIDAD NG PAGTIWALA P PANTAY

11. KUNG 10 SAMPLE SA 100 ANG MAGBIBIGAY NG MALING PAGTAYA, ANG PROBABILIDAD NG ERROR AY PANTAY.

12. MGA LIMITASYON NG AVERAGE O KAUGNAY NA MGA HALAGA, HIGIT PA NA DAHIL SA RANDOM OSCILLATIONS AY MAY MALIIT NA PROBABILIDAD – ITO AY

1) agwat ng kumpiyansa

2) amplitude

4) koepisyent ng pagkakaiba-iba

13. ISANG MALIIT NA HALIMBAWA AY ITINURAD NA POPULASYON NA KUNG SAAN

1) ang n ay mas mababa sa o katumbas ng 100

2) ang n ay mas mababa sa o katumbas ng 30

3) ang n ay mas mababa sa o katumbas ng 40

4) n ay malapit sa 0

14. PARA SA PROBABILIDAD NG WALANG ERROR na PAGTATAYA 95% NA HALAGA NG CRITERION t AY

15. PARA SA PROBABILIDAD NG WALANG ERROR na PAGTATAYA 99% NA HALAGA NG CRITERION t AY

16. PARA SA MGA DISTRIBUTION NA MALAPIT SA NORMAL, ANG POPULASYON AY ITINUTURING HOMOGENEOUS KUNG ANG COEFFICIENT OF VARIATION AY HINDI HIGIT SA

17. OPTION, SEPARATING OPTIONS, NUMERICAL VALUES NA HINDI HIGIT SA 25% NG MAXIMUM POSSIBLE SA ISANG BIGAY NA SERYE – ITO AY

2) mas mababang quartile

3) itaas na quartile

4) quartile

18. ANG DATOS NA HINDI NAKAKABIT AT TAMA NA NAGSASALIN ANG LAYUNIN NA REALIDAD AY TINAWAG

1) imposible

2) pantay na posible

3) maaasahan

4) random

19. AYON SA PANUNTUNAN NG "THREE Sigma", NA MAY NORMAL NA PAGHAHATID NG KATANGIAN SA LOOB.
MATATAGPUAN

1) 68.3% na opsyon

Pag-asa at pagkakaiba-iba

Sukatin natin ang isang random na variable N beses, halimbawa, sinusukat namin ang bilis ng hangin nang sampung beses at gustong hanapin ang average na halaga. Paano nauugnay ang average na halaga sa function ng pamamahagi?

Pagulungin namin ang dice nang maraming beses. Ang bilang ng mga puntos na lilitaw sa mga dice sa bawat paghagis ay isang random na variable at maaaring tumagal ng anumang natural na halaga mula 1 hanggang 6. Ang arithmetic average ng mga ibinabang puntos na kinakalkula para sa lahat ng dice throws ay isa ring random na variable, ngunit para sa malaking N ito ay may posibilidad sa isang napaka-tiyak na numero - inaasahan sa matematika M x. Sa kasong ito M x = 3,5.

Paano mo nakuha ang halagang ito? Papasukin N pagsusulit, kapag nakakuha ka ng 1 puntos, kapag nakakuha ka ng 2 puntos, at iba pa. Tapos Kailan N→ ∞ bilang ng mga kinalabasan kung saan ang isang punto ay pinagsama, Katulad nito, Kaya

Modelo 4.5. Dice

Ipagpalagay natin ngayon na alam natin ang batas ng pamamahagi ng random variable x, ibig sabihin, alam natin na ang random variable x maaaring kumuha ng mga halaga x 1 , x 2 , ..., x k may probabilidad p 1 , p 2 , ..., p k.

Pag-asa M x random variable x katumbas ng:

Sagot. 2,8.

Ang inaasahan sa matematika ay hindi palaging isang makatwirang pagtatantya ng ilang random na variable. Kaya, upang tantiyahin ang average na suweldo, mas makatwirang gamitin ang konsepto ng median, iyon ay, tulad ng isang halaga na ang bilang ng mga taong tumatanggap ng suweldo ay mas mababa kaysa sa median at isang mas mataas na nag-tutugma.

Median Ang random variable ay tinatawag na numero x 1/2 ay ganyan p (x < x 1/2) = 1/2.

Sa madaling salita, ang posibilidad p 1 na ang random variable x magiging mas maliit x 1/2, at posibilidad p 2 na ang random variable x magiging mas malaki x Ang 1/2 ay magkapareho at katumbas ng 1/2. Ang median ay hindi natatanging tinutukoy para sa lahat ng mga distribusyon.

Bumalik tayo sa random variable x, na maaaring kumuha ng mga halaga x 1 , x 2 , ..., x k may probabilidad p 1 , p 2 , ..., p k.

Pagkakaiba random variable x Ang average na halaga ng squared deviation ng isang random variable mula sa inaasahan ng matematika nito ay tinatawag na:

Halimbawa 2

Sa ilalim ng mga kondisyon ng nakaraang halimbawa, kalkulahin ang pagkakaiba at karaniwang paglihis ng random variable x.

Sagot. 0,16, 0,4.

Modelo 4.6. Pamamaril sa isang target

Halimbawa 3

Hanapin ang probability distribution ng bilang ng mga puntos na nakuha sa unang roll ng dice, ang median, ang mathematical expectation, ang variance at ang standard deviation.

Anumang gilid ay pantay na malamang na mahulog, kaya ang pamamahagi ay magiging ganito:

Standard deviation Makikita na ang deviation ng value mula sa average na value ay napakalaki.

Mga katangian ng inaasahan sa matematika:

  • Ang pag-asa sa matematika ng kabuuan ng mga independiyenteng random na variable ay katumbas ng kabuuan ng kanilang mga inaasahan sa matematika:

Halimbawa 4

Hanapin ang mathematical na inaasahan ng kabuuan at produkto ng mga puntos na pinagsama sa dalawang dice.

Sa halimbawa 3 nakita namin iyon para sa isang kubo M (x) = 3.5. Kaya para sa dalawang cubes

Mga katangian ng pagpapakalat:

  • Ang pagkakaiba ng kabuuan ng mga independiyenteng random na variable ay katumbas ng kabuuan ng mga pagkakaiba:

Dx + y = Dx + Dy.

Hayaan para sa N gumulong sa dice na ginulong y puntos. Pagkatapos

Ang resultang ito ay totoo hindi lamang para sa mga dice roll. Sa maraming kaso, tinutukoy nito ang katumpakan ng pagsukat ng mathematical na inaasahan sa empirically. Ito ay makikita na sa pagtaas ng bilang ng mga sukat N ang pagkalat ng mga halaga sa paligid ng average, iyon ay, ang karaniwang paglihis, ay bumababa nang proporsyonal

Ang pagkakaiba ng isang random na variable ay nauugnay sa matematikal na inaasahan ng parisukat ng random na variable na ito sa pamamagitan ng sumusunod na kaugnayan:

Hanapin natin ang mga inaasahan sa matematika ng magkabilang panig ng pagkakapantay-pantay na ito. Sa pamamagitan ng kahulugan,

Ang pag-asa sa matematika ng kanang bahagi ng pagkakapantay-pantay, ayon sa pag-aari ng mga inaasahan sa matematika, ay katumbas ng

Standard deviation

Standard deviation katumbas ng square root ng variance:
Kapag tinutukoy ang standard deviation para sa isang sapat na malaking volume ng populasyon na pinag-aaralan (n > 30), ang mga sumusunod na formula ay ginagamit:

Kaugnay na impormasyon.


Ito ay nagkakahalaga na tandaan na ang pagkalkula ng pagkakaiba-iba na ito ay may isang sagabal - ito ay lumalabas na bias, i.e. ang mathematical expectation nito ay hindi katumbas ng tunay na halaga ng variance. Magbasa pa tungkol dito. Kasabay nito, hindi lahat ay napakasama. Habang tumataas ang laki ng sample, lumalapit pa rin ito sa teoretikal na analogue nito, i.e. ay asymptotically walang kinikilingan. Samakatuwid, kapag nagtatrabaho sa malalaking sukat ng sample, maaari mong gamitin ang formula sa itaas.

Kapaki-pakinabang na isalin ang wika ng mga palatandaan sa wika ng mga salita. Lumalabas na ang pagkakaiba ay ang average na parisukat ng mga paglihis. Iyon ay, ang average na halaga ay unang kinakalkula, pagkatapos ay ang pagkakaiba sa pagitan ng bawat orihinal at average na halaga ay kinuha, squared, idinagdag, at pagkatapos ay hinati sa bilang ng mga halaga sa populasyon. Ang pagkakaiba sa pagitan ng isang indibidwal na halaga at ang average ay sumasalamin sa sukatan ng paglihis. Ito ay parisukat upang ang lahat ng mga paglihis ay maging eksklusibong positibong mga numero at upang maiwasan ang magkaparehong pagkasira ng mga positibo at negatibong mga paglihis kapag nagbubuod ng mga ito. Pagkatapos, dahil sa mga squared deviations, kinakalkula lang namin ang arithmetic mean. Average - parisukat - deviations. Ang mga deviations ay squared at ang average ay kinakalkula. Ang solusyon ay nasa tatlong salita lamang.

Gayunpaman, sa dalisay nitong anyo, tulad ng arithmetic mean, o index, hindi ginagamit ang dispersion. Ito ay isang pantulong at intermediate na tagapagpahiwatig na kinakailangan para sa iba pang mga uri ng istatistikal na pagsusuri. Wala man lang itong normal na yunit ng pagsukat. Sa paghusga sa formula, ito ang parisukat ng yunit ng pagsukat ng orihinal na data. Kung walang bote, gaya ng sinasabi nila, hindi mo ito maiisip.

(module 111)

Upang maibalik ang pagkakaiba-iba sa katotohanan, iyon ay, upang magamit ito para sa higit pang mga makamundong layunin, ang square root ay nakuha mula dito. Ito pala ang tinatawag na karaniwang paglihis (RMS). May mga pangalan na "standard deviation" o "sigma" (mula sa pangalan ng Greek letter). Ang standard deviation formula ay:

Upang makuha ang indicator na ito para sa sample, gamitin ang formula:

Tulad ng pagkakaiba, mayroong bahagyang naiibang opsyon sa pagkalkula. Ngunit habang lumalaki ang sample, nawawala ang pagkakaiba.

Ang karaniwang paglihis, malinaw naman, ay nagpapakilala rin sa sukat ng pagpapakalat ng data, ngunit ngayon (hindi tulad ng pagpapakalat) maaari itong ihambing sa orihinal na data, dahil mayroon silang parehong mga yunit ng pagsukat (ito ay malinaw mula sa formula ng pagkalkula). Ngunit kahit na ang tagapagpahiwatig na ito sa dalisay na anyo nito ay hindi masyadong nagbibigay-kaalaman, dahil naglalaman ito ng napakaraming mga intermediate na kalkulasyon na nakalilito (paglihis, squared, sum, average, root). Gayunpaman, posible nang gumana nang direkta sa karaniwang paglihis, dahil ang mga katangian ng tagapagpahiwatig na ito ay mahusay na pinag-aralan at kilala. Halimbawa, may ganito tatlong sigma na panuntunan, na nagsasaad na 997 sa 1000 mga halaga ng data ay nasa loob ng ±3 sigma ng arithmetic mean. Ang karaniwang paglihis, bilang isang sukatan ng kawalan ng katiyakan, ay kasangkot din sa maraming istatistikal na pagkalkula. Sa tulong nito, natutukoy ang antas ng katumpakan ng iba't ibang mga pagtatantya at pagtataya. Kung ang pagkakaiba-iba ay napakalaki, kung gayon ang karaniwang paglihis ay magiging malaki din, at samakatuwid ang pagtataya ay magiging hindi tumpak, na ipahahayag, halimbawa, sa napakalawak na mga pagitan ng kumpiyansa.

Koepisyent ng pagkakaiba-iba

Ang karaniwang paglihis ay nagbibigay ng ganap na pagtatantya ng sukat ng pagpapakalat. Samakatuwid, upang maunawaan kung gaano kalaki ang scatter na nauugnay sa mga halaga mismo (ibig sabihin, anuman ang kanilang sukat), kinakailangan ang isang kamag-anak na tagapagpahiwatig. Ang tagapagpahiwatig na ito ay tinatawag koepisyent ng pagkakaiba-iba at kinakalkula gamit ang sumusunod na formula:

Ang koepisyent ng variation ay sinusukat bilang isang porsyento (kung i-multiply sa 100%). Gamit ang tagapagpahiwatig na ito, maaari mong ihambing ang iba't ibang mga phenomena, anuman ang kanilang sukat at mga yunit ng pagsukat. Ang katotohanang ito ang nagpapasikat sa koepisyent ng pagkakaiba-iba.

Sa mga istatistika, tinatanggap na kung ang halaga ng koepisyent ng pagkakaiba-iba ay mas mababa sa 33%, kung gayon ang populasyon ay itinuturing na homogenous kung ito ay higit sa 33%, kung gayon ito ay heterogenous. Nahihirapan akong mag-comment ng kahit ano dito. Hindi ko alam kung sino ang nagtukoy nito at bakit, ngunit ito ay itinuturing na isang axiom.

Pakiramdam ko ay nadadala ako ng tuyong teorya at kailangang magdala ng isang bagay na visual at matalinghaga. Sa kabilang banda, ang lahat ng mga tagapagpahiwatig ng pagkakaiba-iba ay naglalarawan ng humigit-kumulang sa parehong bagay, tanging ang mga ito ay kinakalkula nang iba. Samakatuwid, mahirap ipakita ang iba't ibang mga halimbawa lamang ang mga halaga ng mga tagapagpahiwatig na maaaring magkakaiba, ngunit hindi ang kanilang kakanyahan. Kaya't ihambing natin kung paano naiiba ang mga halaga ng iba't ibang mga tagapagpahiwatig ng variation para sa parehong hanay ng data. Kunin natin ang halimbawa ng pagkalkula ng average na linear deviation (mula sa ). Narito ang source data:

At isang iskedyul na magpapaalala sa iyo.

Gamit ang data na ito, kinakalkula namin ang iba't ibang mga tagapagpahiwatig ng pagkakaiba-iba.

Ang average na halaga ay ang karaniwang arithmetic average.

Ang hanay ng variation ay ang pagkakaiba sa pagitan ng maximum at minimum:

Ang average na linear deviation ay kinakalkula gamit ang formula:

Standard Deviation:

Ibuod natin ang pagkalkula sa isang talahanayan.

Tulad ng makikita, ang linear mean at standard deviation ay nagbibigay ng magkatulad na halaga para sa antas ng pagkakaiba-iba ng data. Ang pagkakaiba-iba ay sigma squared, kaya ito ay palaging isang medyo malaking bilang, na, sa katunayan, ay walang ibig sabihin. Ang hanay ng pagkakaiba-iba ay ang pagkakaiba sa pagitan ng matinding mga halaga at maaaring magsalita ng mga volume.

Ibuod natin ang ilang resulta.

Ang pagkakaiba-iba ng isang tagapagpahiwatig ay sumasalamin sa pagkakaiba-iba ng isang proseso o phenomenon. Ang antas nito ay maaaring masukat gamit ang ilang mga tagapagpahiwatig.

1. Range of variation - ang pagkakaiba sa pagitan ng maximum at minimum. Sinasalamin ang hanay ng mga posibleng halaga.
2. Average na linear deviation – sumasalamin sa average ng absolute (modulo) deviations ng lahat ng values ​​ng nasuri na populasyon mula sa kanilang average na halaga.
3. Dispersion - ang average na parisukat ng mga deviations.
4. Ang standard deviation ay ang ugat ng dispersion (ang ibig sabihin ng square of deviations).
5. Ang koepisyent ng pagkakaiba-iba ay ang pinaka-unibersal na tagapagpahiwatig, na sumasalamin sa antas ng pagkakalat ng mga halaga, anuman ang kanilang sukat at mga yunit ng pagsukat. Ang koepisyent ng pagkakaiba-iba ay sinusukat bilang isang porsyento at maaaring gamitin upang ihambing ang pagkakaiba-iba ng iba't ibang mga proseso at phenomena.

Kaya, sa pagsusuri sa istatistika mayroong isang sistema ng mga tagapagpahiwatig na sumasalamin sa homogeneity ng mga phenomena at ang katatagan ng mga proseso. Kadalasan ang mga tagapagpahiwatig ng pagkakaiba-iba ay walang independiyenteng kahulugan at ginagamit para sa karagdagang pagsusuri ng data (pagkalkula ng mga agwat ng kumpiyansa

Ang karaniwang paglihis ay isang klasikong tagapagpahiwatig ng pagkakaiba-iba mula sa mga istatistikang naglalarawan.

Standard Deviation, standard deviation, standard deviation, sample standard deviation (eng. standard deviation, STD, STDev) - isang napakakaraniwang indicator ng dispersion sa mga deskriptibong istatistika. Pero, kasi ang teknikal na pagsusuri ay katulad ng mga istatistika; ang tagapagpahiwatig na ito ay maaaring (at dapat) gamitin sa teknikal na pagsusuri upang makita ang antas ng pagpapakalat ng presyo ng nasuri na instrumento sa paglipas ng panahon. Tinutukoy ng simbolong Griyego na Sigma "σ".

Salamat kina Karl Gauss at Pearson sa pagpayag sa amin na gumamit ng standard deviation.

Gamit standard deviation sa teknikal na pagsusuri, iikot natin ito "index ng pagpapakalat""V "tagapagpahiwatig ng pagkasumpungin", pinapanatili ang kahulugan, ngunit binabago ang mga termino.

Ano ang standard deviation

Ngunit bukod sa mga intermediate auxiliary kalkulasyon, ang karaniwang paglihis ay lubos na katanggap-tanggap para sa independiyenteng pagkalkula at mga aplikasyon sa teknikal na pagsusuri. Bilang isang aktibong mambabasa ng aming magazine burdock nabanggit, " Hindi ko pa rin maintindihan kung bakit hindi kasama ang standard deviation sa set ng standard indicators ng domestic dealing centers«.

talaga, masusukat ng standard deviation ang pagkakaiba-iba ng isang instrumento sa isang klasiko at "dalisay" na paraan. Ngunit sa kasamaang palad, ang tagapagpahiwatig na ito ay hindi karaniwan sa pagsusuri ng seguridad.

Paglalapat ng standard deviation

Ang manu-manong pagkalkula ng karaniwang paglihis ay hindi masyadong kawili-wili, ngunit kapaki-pakinabang para sa karanasan. Maaaring ipahayag ang standard deviation formula STD=√[(∑(x-x ) 2)/n] , na parang ugat ng kabuuan ng mga parisukat ng mga pagkakaiba sa pagitan ng mga elemento ng sample at ng mean, na hinati sa bilang ng mga elemento sa sample.

Kung ang bilang ng mga elemento sa sample ay lumampas sa 30, kung gayon ang denominator ng fraction sa ilalim ng ugat ay kukuha ng halaga n-1. Kung hindi n ay ginagamit.

Hakbang-hakbang karaniwang pagkalkula ng paglihis:

  1. kalkulahin ang arithmetic mean ng sample ng data
  2. ibawas ang average na ito mula sa bawat sample na elemento
  3. parisukat namin ang lahat ng mga resultang pagkakaiba
  4. buuin ang lahat ng resultang mga parisukat
  5. hatiin ang nagresultang halaga sa bilang ng mga elemento sa sample (o sa n-1, kung n>30)
  6. kalkulahin ang square root ng nagresultang quotient (tinatawag na pagpapakalat)

Sa statistical testing ng mga hypotheses, kapag sinusukat ang isang linear na relasyon sa pagitan ng mga random na variable.

Standard deviation:

Standard Deviation(pagtantiya ng karaniwang paglihis ng random variable Floor, ang mga dingding sa paligid natin at ang kisame, x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

nasaan ang pagpapakalat; - Ang sahig, ang mga dingding sa paligid natin at ang kisame, i ika elemento ng pagpili; - laki ng sample; - arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. Sa pangkalahatang kaso, imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang pagtatantya batay sa walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

Tatlong sigma na panuntunan

Tatlong sigma na panuntunan() - halos lahat ng mga halaga ng isang normal na ibinahagi na random na variable ay nasa pagitan. Mas mahigpit - na may hindi bababa sa 99.7% kumpiyansa, ang halaga ng isang normal na ibinabahagi na random na variable ay nasa tinukoy na agwat (sa kondisyon na ang halaga ay totoo at hindi nakuha bilang resulta ng pagpoproseso ng sample).

Kung ang tunay na halaga ay hindi alam, kung gayon hindi natin dapat gamitin, kundi ang Sahig, ang mga dingding sa paligid natin at ang kisame, s. Kaya, ang panuntunan ng tatlong sigma ay binago sa panuntunan ng tatlong Palapag, mga pader sa paligid natin at sa kisame, s .

Interpretasyon ng standard deviation value

Ang isang malaking karaniwang halaga ng paglihis ay nagpapakita ng isang malaking pagkalat ng mga halaga sa ipinakita na hanay na may average na halaga ng hanay; ang isang maliit na halaga, nang naaayon, ay nagpapakita na ang mga halaga sa hanay ay nakapangkat sa paligid ng gitnang halaga.

Halimbawa, mayroon kaming tatlong hanay ng numero: (0, 0, 14, 14), (0, 6, 8, 14) at (6, 6, 8, 8). Ang lahat ng tatlong set ay may mga mean value na katumbas ng 7, at standard deviations, ayon sa pagkakabanggit, katumbas ng 7, 5 at 1. Ang huling set ay may maliit na standard deviation, dahil ang mga value sa set ay pinagsama-sama sa average na halaga; ang unang hanay ay may pinakamalaking karaniwang halaga ng paglihis - ang mga halaga sa loob ng hanay ay lubos na nag-iiba mula sa average na halaga.

Sa pangkalahatang kahulugan, ang karaniwang paglihis ay maaaring ituring na isang sukatan ng kawalan ng katiyakan. Halimbawa, sa physics, ang standard deviation ay ginagamit upang matukoy ang error ng isang serye ng sunud-sunod na mga sukat ng ilang dami. Napakahalaga ng halagang ito para sa pagtukoy ng katumpakan ng hindi pangkaraniwang bagay na pinag-aaralan kung ihahambing sa halaga na hinulaang ng teorya: kung ang average na halaga ng mga sukat ay naiiba nang malaki sa mga halaga na hinulaan ng teorya (malaking standard deviation), pagkatapos ay ang mga nakuha na halaga o ang paraan para sa pagkuha ng mga ito ay dapat na muling suriin.

Praktikal na Aplikasyon

Sa pagsasagawa, pinapayagan ka ng standard deviation na matukoy kung magkano ang mga halaga sa isang set ay maaaring mag-iba mula sa average na halaga.

Klima

Ipagpalagay na mayroong dalawang lungsod na may parehong average na maximum na pang-araw-araw na temperatura, ngunit ang isa ay matatagpuan sa baybayin at ang isa ay nasa loob ng bansa. Ito ay kilala na ang mga lungsod na matatagpuan sa baybayin ay may maraming iba't ibang pinakamataas na temperatura sa araw na mas mababa kaysa sa mga lungsod na matatagpuan sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng pinakamataas na pang-araw-araw na temperatura para sa isang baybaying lungsod ay magiging mas mababa kaysa sa pangalawang lungsod, sa kabila ng katotohanan na ang average na halaga ng halagang ito ay pareho, na sa pagsasanay ay nangangahulugan na ang posibilidad na ang pinakamataas na temperatura ng hangin sa anumang partikular na araw ng taon ay magiging mas mataas na naiiba mula sa average na halaga, mas mataas para sa isang lungsod na matatagpuan sa loob ng bansa.

Palakasan

Ipagpalagay natin na mayroong ilang mga koponan ng football na na-rate sa ilang hanay ng mga parameter, halimbawa, ang bilang ng mga layunin na nakapuntos at natanggap, mga pagkakataon sa pag-iskor, atbp. Malamang na ang pinakamahusay na koponan sa pangkat na ito ay magkakaroon ng mas mahusay na mga halaga sa higit pang mga parameter. Kung mas maliit ang standard deviation ng team para sa bawat isa sa mga ipinakitang parameter, mas mahuhulaan ang resulta ng team ay balanse. Sa kabilang banda, ang isang koponan na may malaking standard deviation ay mahirap hulaan ang resulta, na kung saan ay ipinaliwanag sa pamamagitan ng isang kawalan ng timbang, halimbawa, isang malakas na depensa ngunit isang mahinang pag-atake.

Ang paggamit ng karaniwang paglihis ng mga parameter ng koponan ay ginagawang posible, sa isang antas o iba pa, upang mahulaan ang resulta ng isang laban sa pagitan ng dalawang koponan, pagtatasa ng mga lakas at kahinaan ng mga koponan, at samakatuwid ang mga napiling paraan ng pakikipaglaban.

Teknikal na pagsusuri

Tingnan din

Panitikan

* Borovikov, V. STATISTICA. Ang sining ng pagsusuri ng data sa isang computer: Para sa mga propesyonal / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.