Bahay Madla 6 Mga Batayan ng pagsusuri ng data. Ang pagsusuri ng regression ay isang istatistikal na pamamaraan para sa pag-aaral ng pagdepende ng isang random na variable sa mga variable

Mga Batayan ng pagsusuri ng data. Ang pagsusuri ng regression ay isang istatistikal na pamamaraan para sa pag-aaral ng pagdepende ng isang random na variable sa mga variable

Ang paraan ng pagsusuri ng regression ay ginagamit upang matukoy ang mga teknikal at pang-ekonomiyang parameter ng mga produkto na kabilang sa isang partikular na serye ng parametric upang bumuo at ihanay ang mga relasyon sa halaga. Ang pamamaraang ito ay ginagamit upang pag-aralan at bigyang-katwiran ang antas at mga ratio ng presyo ng mga produkto na nailalarawan sa pagkakaroon ng isa o higit pang teknikal at pang-ekonomiyang mga parameter na nagpapakita ng mga pangunahing katangian ng consumer. Ang pagsusuri ng regression ay nagpapahintulot sa amin na makahanap ng isang empirical na formula na naglalarawan sa pagtitiwala ng presyo sa mga teknikal at pang-ekonomiyang parameter ng mga produkto:

P=f(X1X2,...,Xn),

kung saan ang P ay ang halaga ng presyo ng yunit ng produkto, rub.; (X1, X2, ... Xn) - teknikal at pang-ekonomiyang mga parameter ng mga produkto.

Ang pamamaraan ng pagsusuri ng regression - ang pinaka-advanced sa mga ginamit na normative-parametric na pamamaraan - ay epektibo kapag nagsasagawa ng mga kalkulasyon batay sa paggamit ng mga modernong teknolohiya at sistema ng impormasyon. Kasama sa aplikasyon nito ang mga sumusunod na pangunahing hakbang:

pagpapasiya ng klasipikasyon parametric na mga grupo ng mga produkto;
pagpili ng mga parameter na higit na nakakaimpluwensya sa presyo ng produkto;
pagpili at pagbibigay-katwiran sa anyo ng koneksyon sa pagitan ng mga pagbabago sa presyo kapag nagbabago ang mga parameter;
pagbuo ng isang sistema ng mga normal na equation at pagkalkula ng mga coefficient ng regression.

Ang pangunahing pangkat ng kwalipikasyon ng mga produkto, ang presyo kung saan ay napapailalim sa equalization, ay isang parametric series, kung saan ang mga produkto ay maaaring pagsama-samahin sa iba't ibang mga disenyo depende sa kanilang aplikasyon, mga kondisyon ng operating at mga kinakailangan, atbp. Kapag bumubuo ng parametric series, awtomatikong pag-uuri ng mga pamamaraan ay maaaring gamitin na nagpapahintulot na makilala ang mga homogenous na grupo mula sa kabuuang masa ng mga produkto. Ang pagpili ng mga teknikal at pang-ekonomiyang parameter ay ginawa batay sa mga sumusunod na pangunahing kinakailangan:

kasama sa mga napiling parameter ang mga parameter na naitala sa mga pamantayan at teknikal na detalye; bilang karagdagan sa mga teknikal na parameter (kapangyarihan, kapasidad ng pag-load, bilis, atbp.), Ang mga tagapagpahiwatig ng serialization ng produkto, mga koepisyent ng kumplikado, pag-iisa, atbp.
ang hanay ng mga napiling parameter ay dapat sapat na ganap na makilala ang disenyo, teknolohikal at pagpapatakbo na mga katangian ng mga produkto na kasama sa serye, at may medyo malapit na ugnayan sa presyo;
ang mga parameter ay hindi dapat magkakaugnay.

Upang pumili ng mga teknikal at pang-ekonomiyang parameter na makabuluhang nakakaapekto sa presyo, kinakalkula ang isang matrix ng mga coefficient ng ugnayan ng pares. Batay sa magnitude ng mga koepisyent ng ugnayan sa pagitan ng mga parameter, maaaring hatulan ng isa ang pagiging malapit ng kanilang koneksyon. Kasabay nito, ang isang ugnayang malapit sa zero ay nagpapakita ng hindi gaanong impluwensya ng parameter sa presyo. Ang pangwakas na pagpili ng mga teknikal at pang-ekonomiyang mga parameter ay isinasagawa sa proseso ng hakbang-hakbang na pagsusuri ng regression gamit ang teknolohiya ng computer at naaangkop na mga standard na programa.

Sa pagsasanay sa pagpepresyo, ginagamit ang sumusunod na hanay ng mga function:

linear

P = ao + alXl + ... + antXn,

linear-power

P = ao + a1X1 + ... + anXn + (an+1Xn) (an+1Xn) +... + (an+nXn2) (an+nXn2)

baligtad na logarithm

P = a0 + a1: Sa X1 + ... + an: Sa Xn,

kapangyarihan

P = a0 (X1^a1) (X2^a2) .. (Xn^an)

nagpapakilala

P = e^(a1+a1X1+...+anXn)

hyperbolic

P = ao + a1:X1 + a2:X2 + ... + ap:Xn,

kung saan ang P ay pagkakapantay-pantay ng presyo; X1 X2,..., Xn - ang halaga ng mga teknikal at pang-ekonomiyang parameter ng mga produkto ng serye; a0, a1 ..., аn - kinakalkula na mga coefficient ng equation ng regression.

Sa praktikal na gawain sa pagpepresyo, depende sa anyo ng relasyon sa pagitan ng mga presyo at teknikal at pang-ekonomiyang mga parameter, maaaring gamitin ang iba pang mga equation ng regression. Ang uri ng function ng koneksyon sa pagitan ng presyo at isang hanay ng mga teknikal at pang-ekonomiyang parameter ay maaaring i-preset o awtomatikong piliin sa panahon ng pagpoproseso ng computer. Ang lapit ng ugnayan sa pagitan ng presyo at ng hanay ng mga parameter ay tinatasa ng halaga ng maramihang koepisyent ng ugnayan. Ang kalapitan nito sa isa ay nagpapahiwatig ng malapit na koneksyon. Gamit ang equation ng regression, ang equalized (kinakalkula) na mga halaga ng presyo para sa mga produkto ng isang ibinigay na parametric series ay nakuha. Upang suriin ang mga resulta ng pagkakapantay-pantay, ang mga kamag-anak na halaga ng paglihis ng kinakalkula na mga halaga ng presyo mula sa aktwal na mga halaga ay kinakalkula:

Tsr = Rf - Rr: R x 100

kung saan Рф, Рр - aktwal at kinakalkula na mga presyo.

Ang halaga ng CR ay hindi dapat lumampas sa 8-10%. Sa kaso ng mga makabuluhang paglihis ng mga kinakalkula na halaga mula sa mga aktwal, kinakailangang siyasatin:

ang kawastuhan ng pagbuo ng isang parametric series, dahil maaaring naglalaman ito ng mga produkto na, sa kanilang mga parameter, ay naiiba nang husto mula sa iba pang mga produkto sa serye. Dapat silang hindi kasama;
tamang pagpili ng mga teknikal at pang-ekonomiyang parameter. Posible ang isang hanay ng mga parameter na mahina ang pagkakaugnay sa presyo. Sa kasong ito, kinakailangan upang magpatuloy sa paghahanap at pagpili ng mga parameter.

Ang pamamaraan at pamamaraan para sa pagsasagawa ng pagsusuri ng regression, paghahanap ng hindi kilalang mga parameter ng equation at pang-ekonomiyang pagtatasa ng mga resulta na nakuha ay isinasagawa alinsunod sa mga kinakailangan ng mga istatistika ng matematika.

Ang mga konsepto ng ugnayan at regression ay direktang nauugnay. Mayroong maraming mga karaniwang computational techniques sa pagsusuri ng ugnayan at regression. Ginagamit ang mga ito upang matukoy ang mga ugnayang sanhi-at-epekto sa pagitan ng mga phenomena at mga proseso. Gayunpaman, kung pagsusuri ng ugnayan nagbibigay-daan sa amin na tantyahin ang lakas at direksyon ng stochastic na koneksyon, pagkatapos pagsusuri ng regression- isa ring anyo ng pagtitiwala.

Ang pagbabalik ay maaaring:

a) depende sa bilang ng mga phenomena (mga variable):

Simple (regression sa pagitan ng dalawang variable);

Maramihang (regression sa pagitan ng dependent variable (y) at ilang paliwanag na variable (x1, x2...xn);

b) depende sa anyo:

Linear (ipinapakita ng isang linear function, at may mga linear na relasyon sa pagitan ng mga variable na pinag-aaralan);

Nonlinear (ipinapakita ng isang nonlinear function; ang relasyon sa pagitan ng mga variable na pinag-aaralan ay nonlinear);

c) sa likas na katangian ng ugnayan sa pagitan ng mga variable na kasama sa pagsasaalang-alang:

Positibo (ang pagtaas sa halaga ng nagpapaliwanag na variable ay humahantong sa isang pagtaas sa halaga ng umaasa na variable at vice versa);

Negatibo (habang tumataas ang halaga ng nagpapaliwanag na variable, bumababa ang halaga ng ipinaliwanag na variable);

d) ayon sa uri:

Direkta (sa kasong ito, ang sanhi ay may direktang epekto sa epekto, ibig sabihin, ang mga umaasa at nagpapaliwanag na mga variable ay direktang nauugnay sa isa't isa);

Di-tuwiran (ang nagpapaliwanag na variable ay may hindi direktang epekto sa pamamagitan ng isang ikatlo o isang bilang ng iba pang mga variable sa umaasa na variable);

Mali (nonsense regression) - maaaring lumabas sa isang mababaw at pormal na diskarte sa mga proseso at phenomena na pinag-aaralan. Ang isang halimbawa ng isang walang katuturan ay isang regression na nagtatatag ng koneksyon sa pagitan ng pagbawas sa dami ng nainom na alak sa ating bansa at pagbaba sa pagbebenta ng washing powder.

Kapag nagsasagawa ng pagsusuri ng regression, ang mga sumusunod na pangunahing gawain ay malulutas:

1. Pagpapasiya ng anyo ng pagtitiwala.

2. Kahulugan ng regression function. Upang gawin ito, ginagamit ang isang mathematical equation ng isang uri o iba pa, na nagpapahintulot, una, upang maitatag ang pangkalahatang takbo ng pagbabago sa dependent variable, at, pangalawa, upang kalkulahin ang impluwensya ng explanatory variable (o ilang mga variable) sa ang dependent variable.

3. Pagtatantya ng mga hindi kilalang halaga ng dependent variable. Ang resultang matematikal na relasyon (regression equation) ay nagbibigay-daan sa iyo upang matukoy ang halaga ng dependent variable sa loob ng pagitan ng tinukoy na mga halaga ng mga paliwanag na variable at higit pa dito. Sa huling kaso, ang pagsusuri ng regression ay gumaganap bilang isang kapaki-pakinabang na tool sa paghula ng mga pagbabago sa mga proseso at phenomena ng sosyo-ekonomiko (sa kondisyon na pinananatili ang mga kasalukuyang uso at relasyon). Karaniwan, ang haba ng yugto ng panahon kung saan isinasagawa ang pagtataya ay pinipili na hindi hihigit sa kalahati ng agwat ng oras kung saan isinagawa ang mga obserbasyon ng mga paunang tagapagpahiwatig. Posibleng magsagawa ng parehong passive forecast, paglutas ng extrapolation na problema, at isang aktibo, pangangatwiran ayon sa kilalang "if..., then" scheme at pagpapalit ng iba't ibang mga halaga sa isa o higit pang mga paliwanag na variable ng regression .

Para sa pagbuo ng regression isang espesyal na pamamaraan na tinatawag paraan ng least squares. Ang pamamaraang ito ay may mga pakinabang sa iba pang mga pamamaraan ng pagpapakinis: isang medyo simpleng pagpapasiya sa matematika ng mga kinakailangang parameter at isang mahusay na teoretikal na katwiran mula sa isang probabilistikong punto ng view.

Kapag pumipili ng isang modelo ng regression, isa sa mga mahahalagang kinakailangan para dito ay upang matiyak ang pinakamalaking posibleng pagiging simple, na nagpapahintulot sa iyo na makakuha ng isang solusyon na may sapat na katumpakan. Samakatuwid, upang magtatag ng mga istatistikal na relasyon, una, bilang isang panuntunan, isinasaalang-alang namin ang isang modelo mula sa klase ng mga linear na function (bilang ang pinakasimpleng sa lahat ng posibleng mga klase ng mga function):

kung saan ang bi, b2...bj ay mga coefficient na tumutukoy sa impluwensya ng mga independent variable xij sa halaga yi; ai - libreng miyembro; ei - random deviation, na sumasalamin sa impluwensya ng hindi nabilang na mga kadahilanan sa dependent variable; n - bilang ng mga independiyenteng variable; Ang N ay ang bilang ng mga obserbasyon, at ang kundisyon (N . n+1) ay dapat matugunan.

Linear na modelo maaaring ilarawan ang isang napakalawak na klase ng iba't ibang mga gawain. Gayunpaman, sa pagsasagawa, partikular sa mga sistemang sosyo-ekonomiko, kung minsan ay mahirap gumamit ng mga linear na modelo dahil sa malalaking error sa pagtatantya. Samakatuwid, madalas na ginagamit ang mga nonlinear na multiple regression function na maaaring linearized. Kabilang dito, halimbawa, ang production function (Cobb-Douglas power function), na natagpuan ang aplikasyon sa iba't ibang socio-economic na pag-aaral. Mukhang:

kung saan ang b 0 ay ang normalization factor, b 1 ...b j ang hindi kilalang coefficient, e i ay ang random deviation.

Gamit ang natural na logarithms, maaari mong baguhin ang equation na ito sa linear form:

Ang resultang modelo ay nagpapahintulot sa paggamit ng mga karaniwang pamamaraan ng linear regression na inilarawan sa itaas. Sa pamamagitan ng pagbuo ng mga modelo ng dalawang uri (additive at multiplicative), maaari mong piliin ang pinakamahusay at magsagawa ng karagdagang pananaliksik na may mas maliit na mga error sa pagtatantya.

Mayroong isang mahusay na binuo na sistema para sa pagpili ng approximating function - paraan ng group accounting ng mga argumento(MGUA).

Ang kawastuhan ng napiling modelo ay maaaring hatulan ng mga resulta ng pag-aaral ng mga nalalabi, na kung saan ay ang mga pagkakaiba sa pagitan ng mga sinusunod na halaga y i at ang kaukulang mga halaga y i hinulaang gamit ang regression equation. Sa kasong ito upang suriin ang kasapatan ng modelo kalkulado average na error sa pagtatantya:

Ang modelo ay itinuturing na sapat kung ang e ay nasa loob ng hindi hihigit sa 15%.

Lalo naming binibigyang-diin na may kaugnayan sa mga sistemang sosyo-ekonomiko, ang mga pangunahing kondisyon para sa kasapatan ng modelo ng klasikal na regression ay hindi palaging natutugunan.

Nang hindi isinasaalang-alang ang lahat ng mga dahilan para sa kakulangan na lumitaw, pangalanan lamang natin multicollinearity- ang pinakamahirap na problema ng epektibong paglalapat ng mga pamamaraan ng pagsusuri ng regression sa pag-aaral ng mga dependency sa istatistika. Sa ilalim multicollinearity nauunawaan na mayroong isang linear na relasyon sa pagitan ng mga paliwanag na variable.

Ang phenomenon na ito:

a) binabaluktot ang kahulugan ng mga coefficient ng regression kapag binibigyang kahulugan ang mga ito nang makahulugan;

b) binabawasan ang katumpakan ng pagtatasa (ang pagpapakalat ng mga pagtatasa ay tumataas);

c) pinapataas ang sensitivity ng mga coefficient na pagtatantya sa sample na data (ang pagtaas ng sample size ay maaaring makaapekto nang malaki sa mga pagtatantya).

Mayroong iba't ibang mga pamamaraan para sa pagbabawas ng multicollinearity. Ang pinaka-naa-access na paraan ay upang alisin ang isa sa dalawang variable kung ang koepisyent ng ugnayan sa pagitan ng mga ito ay lumampas sa isang halaga na katumbas ng ganap na halaga sa 0.8. Alin sa mga variable na dapat panatilihin ang napagpasyahan batay sa mahahalagang pagsasaalang-alang. Pagkatapos ang mga coefficient ng regression ay kinakalkula muli.

Ang paggamit ng stepwise regression algorithm ay nagbibigay-daan sa iyong sunud-sunod na isama ang isang independent variable sa modelo at pag-aralan ang kahalagahan ng regression coefficients at multicollinearity ng mga variable. Sa wakas, ang mga variable na iyon lamang ang nananatili sa relasyon sa ilalim ng pag-aaral na nagbibigay ng kinakailangang kabuluhan ng mga coefficient ng regression at minimal na impluwensya ng multicollinearity.

Ang regression at correlation analysis ay mga istatistikal na pamamaraan ng pananaliksik. Ito ang mga pinakakaraniwang paraan upang ipakita ang pagtitiwala ng isang parameter sa isa o higit pang mga independiyenteng variable.

Sa ibaba, gamit ang mga partikular na praktikal na halimbawa, isasaalang-alang namin ang dalawang napakasikat na pagsusuring ito sa mga ekonomista. Magbibigay din kami ng isang halimbawa ng pagkuha ng mga resulta kapag pinagsama ang mga ito.

Pagsusuri ng Pagbabalik sa Excel

Ipinapakita ang impluwensya ng ilang mga halaga (independiyente, independyente) sa umaasa na variable. Halimbawa, paano nakadepende ang bilang ng aktibong populasyon sa ekonomiya sa bilang ng mga negosyo, sahod at iba pang mga parameter. O: paano nakakaapekto ang mga dayuhang pamumuhunan, presyo ng enerhiya, atbp. sa antas ng GDP.

Ang resulta ng pagsusuri ay nagpapahintulot sa iyo na i-highlight ang mga priyoridad. At batay sa mga pangunahing kadahilanan, hulaan, planuhin ang pagbuo ng mga priyoridad na lugar, at gumawa ng mga desisyon sa pamamahala.

Nangyayari ang pagbabalik:

linear (y = a + bx);
parabolic (y = a + bx + cx 2);
exponential (y = a * exp(bx));
kapangyarihan (y = a*x^b);
hyperbolic (y = b/x + a);
logarithmic (y = b * 1n(x) + a);
exponential (y = a * b^x).

Tingnan natin ang isang halimbawa ng pagbuo ng modelo ng regression sa Excel at pagbibigay-kahulugan sa mga resulta. Kunin natin ang linear na uri ng regression.

Gawain. Sa 6 na negosyo, nasuri ang average na buwanang suweldo at ang bilang ng mga humihintong empleyado. Ito ay kinakailangan upang matukoy ang pag-asa ng bilang ng mga humihinto sa mga empleyado sa average na suweldo.

Ang linear regression model ay ganito ang hitsura:

Y = a 0 + a 1 x 1 +…+a k x k.

Kung ang a ay mga coefficient ng regression, ang x ay nakakaimpluwensya sa mga variable, ang k ay ang bilang ng mga salik.

Sa aming halimbawa, ang Y ay ang tagapagpahiwatig ng pagtigil sa mga empleyado. Ang salik na nakakaimpluwensya ay sahod (x).

Ang Excel ay may mga built-in na function na makakatulong sa iyong kalkulahin ang mga parameter ng isang linear regression model. Ngunit gagawin ito ng add-on na "Analysis Package" nang mas mabilis.

Ina-activate namin ang isang malakas na tool sa pagsusuri:

Kapag na-activate na, magiging available ang add-on sa tab na Data.

Ngayon gawin natin ang pagsusuri ng regression mismo.

Una sa lahat, binibigyang pansin natin ang R-squared at coefficients.

Ang R-squared ay ang koepisyent ng determinasyon. Sa aming halimbawa - 0.755, o 75.5%. Nangangahulugan ito na ang mga kinakalkula na parameter ng modelo ay nagpapaliwanag ng 75.5% ng ugnayan sa pagitan ng mga pinag-aralan na parameter. Ang mas mataas na koepisyent ng pagpapasiya, mas mahusay ang modelo. Mabuti - higit sa 0.8. Masama – mas mababa sa 0.5 (halos hindi maituturing na makatwiran ang naturang pagsusuri). Sa aming halimbawa - "hindi masama".

Ang koepisyent na 64.1428 ay nagpapakita kung ano ang magiging Y kung ang lahat ng mga variable sa modelong isinasaalang-alang ay katumbas ng 0. Ibig sabihin, ang halaga ng nasuri na parameter ay naiimpluwensyahan din ng iba pang mga kadahilanan na hindi inilarawan sa modelo.

Ang koepisyent -0.16285 ay nagpapakita ng bigat ng variable X sa Y. Ibig sabihin, ang average na buwanang suweldo sa loob ng modelong ito ay nakakaapekto sa bilang ng mga umalis na may timbang na -0.16285 (ito ay isang maliit na antas ng impluwensya). Ang sign na "-" ay nagpapahiwatig ng isang negatibong epekto: kung mas mataas ang suweldo, mas kaunting mga tao ang huminto. Alin ang patas.

Pagsusuri ng Correlation sa Excel

Tumutulong ang pagsusuri ng ugnayan na matukoy kung may kaugnayan sa pagitan ng mga tagapagpahiwatig sa isa o dalawang sample. Halimbawa, sa pagitan ng oras ng pagpapatakbo ng isang makina at ang halaga ng pag-aayos, ang presyo ng kagamitan at ang tagal ng operasyon, ang taas at bigat ng mga bata, atbp.

Kung may koneksyon, ang pagtaas sa isang parameter ay humahantong sa pagtaas (positibong ugnayan) o pagbaba (negatibo) ng isa pa. Ang pagsusuri ng ugnayan ay tumutulong sa analyst na matukoy kung ang halaga ng isang tagapagpahiwatig ay maaaring gamitin upang mahulaan ang posibleng halaga ng isa pa.

Ang koepisyent ng ugnayan ay tinutukoy ng r. Nag-iiba mula +1 hanggang -1. Magiiba ang klasipikasyon ng mga ugnayan para sa iba't ibang lugar. Kapag ang coefficient ay 0, walang linear na relasyon sa pagitan ng mga sample.

Tingnan natin kung paano hanapin ang koepisyent ng ugnayan gamit ang Excel.

Upang makahanap ng mga ipinares na coefficient, ginagamit ang CORREL function.

Layunin: Tukuyin kung may kaugnayan sa pagitan ng oras ng pagpapatakbo ng isang lathe at ang halaga ng pagpapanatili nito.

Ilagay ang cursor sa anumang cell at pindutin ang fx button.

Sa kategoryang “Statistical,” piliin ang function na CORREL.
Argumentong "Array 1" - ang unang hanay ng mga halaga - oras ng pagpapatakbo ng makina: A2:A14.
Argumentong "Array 2" - pangalawang hanay ng mga halaga - gastos sa pagkumpuni: B2:B14. I-click ang OK.

Upang matukoy ang uri ng koneksyon, kailangan mong tingnan ang ganap na bilang ng koepisyent (bawat larangan ng aktibidad ay may sariling sukat).

Para sa pagsusuri ng ugnayan ng ilang mga parameter (higit sa 2), mas maginhawang gamitin ang "Pagsusuri ng Data" (ang add-on na "Analysis Package"). Kailangan mong pumili ng ugnayan mula sa listahan at italaga ang array. Lahat.

Ang mga resultang coefficient ay ipapakita sa correlation matrix. ganito:

Pagsusuri ng ugnayan at regression

Sa pagsasagawa, ang dalawang pamamaraan na ito ay madalas na ginagamit nang magkasama.

Halimbawa:

Ngayon ang data ng pagsusuri ng regression ay naging nakikita.

KONKLUSYON NG MGA RESULTA

Talahanayan 8.3a.

Mga istatistika ng regression
Mga istatistika ng regression	0,998364
Maramihang R	0,99673
R-square	0,996321
Normalized R-squared	0,42405
Karaniwang error	10

Mga obserbasyon

Una, tingnan natin ang tuktok na bahagi ng mga kalkulasyon, na ipinakita sa talahanayan 8.3a - mga istatistika ng regression.

Ang halaga ng R-square, na tinatawag ding sukatan ng katiyakan, ay nagpapakilala sa kalidad ng resultang linya ng regression. Ang kalidad na ito ay ipinahayag sa pamamagitan ng antas ng pagsusulatan sa pagitan ng pinagmumulan ng data at ng modelo ng regression (kinakalkulang data). Ang sukatan ng katiyakan ay palaging nasa pagitan.

Sa karamihan ng mga kaso, ang R-squared value ay nasa pagitan ng mga value na ito, na tinatawag na extreme value, i.e. sa pagitan ng zero at isa.

Kung ang halaga ng R-square ay malapit sa isa, nangangahulugan ito na ipinapaliwanag ng binuong modelo ang halos lahat ng pagkakaiba-iba sa mga nauugnay na variable. Sa kabaligtaran, ang isang R-squared na halaga na malapit sa zero ay nangangahulugan na ang kalidad ng itinayong modelo ay hindi maganda.

Sa aming halimbawa, ang sukat ng katiyakan ay 0.99673, na nagsasaad ng napakagandang akma ng linya ng regression sa orihinal na data. Maramihang R

- multiple correlation coefficient R - nagpapahayag ng antas ng pag-asa ng mga independiyenteng variable (X) at ng dependent variable (Y).

Ang maramihang R ay katumbas ng square root ng coefficient of determination, ang halagang ito ay kumukuha ng mga halaga sa hanay mula sa zero hanggang isa.

Sa simpleng pagsusuri ng linear regression, ang maramihang R ay katumbas ng coefficient ng ugnayan ng Pearson. Sa katunayan, ang maramihang R sa aming kaso ay katumbas ng koepisyent ng ugnayan ng Pearson mula sa nakaraang halimbawa (0.998364).

	Talahanayan 8.3b.	Normalized R-squared	Mga coefficient ng regression
Logro	2,694545455	0,33176878	8,121757129
t-statistic	2,305454545	0,04668634	49,38177965
Y-intersection

Variable X 1

Batay sa mga kalkulasyon, maaari nating isulat ang equation ng regression tulad ng sumusunod:

Y= x*2.305454545+2.694545455

Ang direksyon ng ugnayan sa pagitan ng mga variable ay tinutukoy batay sa mga palatandaan (negatibo o positibo) regression coefficients(coefficient b).

Kung ang sign sa koepisyent ng regression- positibo, magiging positibo ang relasyon sa pagitan ng dependent variable at independent variable. Sa aming kaso, ang tanda ng koepisyent ng regression ay positibo, samakatuwid, ang relasyon ay positibo din.

Kung ang sign sa koepisyent ng regression- negatibo, ang relasyon sa pagitan ng dependent variable at independent variable ay negatibo (inverse).

Sa talahanayan 8.3c. Ang mga resulta ng derivation ng residuals ay ipinakita. Upang lumitaw ang mga resultang ito sa ulat, dapat mong i-activate ang checkbox na "Residuals" kapag pinapatakbo ang tool na "Regression".

WITHDRAWAL NG NAtitira

Talahanayan 8.3c.

Mga natira	Pagmamasid	Hinulaan si Y	Mga natira
1	9,610909091	-0,610909091	-1,528044662
2	7,305454545	-0,305454545	-0,764022331
3	11,91636364	0,083636364	0,209196591
4	14,22181818	0,778181818	1,946437843
5	16,52727273	0,472727273	1,182415512
6	18,83272727	0,167272727	0,418393181
7	21,13818182	-0,138181818	-0,34562915
8	23,44363636	-0,043636364	-0,109146047
9	25,74909091	-0,149090909	-0,372915662
10	28,05454545	-0,254545455	-0,636685276

Mga karaniwang balanse

Gamit ang bahaging ito ng ulat, makikita natin ang mga paglihis ng bawat punto mula sa itinayong linya ng regression. Pinakamalaking ganap na halaga

Sinusuri ng pagsusuri ng regression ang pagdepende ng isang tiyak na dami sa ibang dami o ilang iba pang dami. Ang pagsusuri ng regression ay pangunahing ginagamit sa medium-term na pagtataya, gayundin sa pangmatagalang pagtataya. Ginagawang posible ng mga katamtaman at pangmatagalang panahon na matukoy ang mga pagbabago sa kapaligiran ng negosyo at isinasaalang-alang ang epekto ng mga pagbabagong ito sa indicator na pinag-aaralan.

Upang maisagawa ang pagsusuri ng regression kailangan mo:

pagkakaroon ng taunang data sa mga pinag-aralan na tagapagpahiwatig,

ang pagkakaroon ng isang beses na mga pagtataya, i.e. tulad ng mga pagtataya na hindi naitama sa pagdating ng bagong data.

Karaniwang isinasagawa ang pagsusuri ng regression para sa mga bagay na may kumplikado, multifactorial na kalikasan, tulad ng dami ng pamumuhunan, kita, dami ng benta, atbp. Sa pamamaraan ng normatibong pagtataya

Sa kaso ng paggamit ng isang quantitative expression, halimbawa, physiological at rational norms ng pagkonsumo ng ilang mga produkto ng pagkain at hindi pagkain, na binuo ng mga espesyalista para sa iba't ibang grupo ng populasyon, posibleng matukoy ang antas ng pagkonsumo ng mga produktong ito para sa ang mga taon bago ang pagkamit ng tinukoy na pamantayan. Ang ganitong mga kalkulasyon ay tinatawag na interpolation. Ang interpolation ay isang paraan ng pagkalkula ng mga indicator na nawawala sa dynamic na serye ng isang phenomenon batay sa isang itinatag na relasyon. Isinasaalang-alang ang aktwal na halaga ng tagapagpahiwatig at ang halaga ng mga pamantayan nito bilang mga matinding miyembro ng dynamic na serye, posibleng matukoy ang mga halaga ng mga halaga sa loob ng seryeng ito. Samakatuwid, ang interpolation ay itinuturing na isang normatibong pamamaraan. Ang dating ibinigay na formula (4), na ginamit sa extrapolation, ay maaaring gamitin sa interpolation, kung saan ang y ay hindi na maglalarawan sa aktwal na data, ngunit ang karaniwang tagapagpahiwatig.

Sa kaso ng paggamit ng isang sukat (patlang, spectrum) sa pamamaraang normatibo, ang mga kakayahan ng pag-andar ng pagsusuri, ibig sabihin, ang function ng pamamahagi ng kagustuhan, ay nagpapahiwatig ng humigit-kumulang sa sumusunod na gradasyon: hindi kanais-nais - hindi gaanong kanais-nais - mas kanais-nais - pinaka-kanais-nais - pinakamainam ( pamantayan).

Ang pamamaraan ng normative forecasting ay nakakatulong upang bumuo ng mga rekomendasyon upang mapataas ang antas ng objectivity, at samakatuwid ang pagiging epektibo ng mga desisyon.

Pagmomodelo, marahil ang pinakakomplikadong paraan ng pagtataya. Ang pagmomodelo ng matematika ay nangangahulugan ng paglalarawan ng isang pang-ekonomiyang phenomenon sa pamamagitan ng mga mathematical formula, equation at hindi pagkakapantay-pantay. Ang mathematical apparatus ay dapat na tumpak na sumasalamin sa background ng pagtataya, bagama't medyo mahirap na ganap na ipakita ang buong lalim at pagiging kumplikado ng hinulaang bagay. Ang terminong "modelo" ay nagmula sa salitang Latin na modelus, na nangangahulugang "sukat". Samakatuwid, mas tama na isaalang-alang ang pagmomodelo hindi isang paraan ng pagtataya, ngunit isang paraan ng pag-aaral ng katulad na phenomenon gamit ang isang modelo.

Sa isang malawak na kahulugan, ang mga modelo ay mga pamalit para sa object ng pag-aaral na katulad nito sa paraang nagpapahintulot sa isa na makakuha ng bagong kaalaman tungkol sa bagay. Ang isang modelo ay dapat isaalang-alang bilang isang mathematical na paglalarawan ng isang bagay. Sa kasong ito, ang isang modelo ay tinukoy bilang isang kababalaghan (object, setting) na nasa ilang mga sulat sa bagay na pinag-aaralan at maaaring palitan ito sa proseso ng pananaliksik, na nagpapakita ng impormasyon tungkol sa bagay.

Sa isang mas makitid na pag-unawa sa modelo, ito ay itinuturing na isang bagay ng hula; Sa kasong ito, ang layunin ng predictive na modelo ay upang makakuha ng impormasyon hindi tungkol sa bagay sa pangkalahatan, ngunit tungkol lamang sa mga estado nito sa hinaharap. Pagkatapos, kapag gumagawa ng isang modelo, maaaring imposibleng direktang suriin ang pagsunod nito sa bagay, dahil kinakatawan lamang ng modelo ang kalagayan nito sa hinaharap, at ang bagay mismo ay maaaring kasalukuyang wala o may ibang pag-iral.

Ang mga modelo ay maaaring materyal o perpekto.

Ang ekonomiks ay gumagamit ng mga huwarang modelo. Ang pinaka-advanced na ideal na modelo para sa isang quantitative na paglalarawan ng isang socio-economic (economic) phenomenon ay isang mathematical model gamit ang mga numero, formula, equation, algorithm o graphical na representasyon. Gamit ang mga modelong pang-ekonomiya, tinutukoy nila:

pag-asa sa pagitan ng iba't ibang mga tagapagpahiwatig ng ekonomiya;

iba't ibang uri ng mga paghihigpit na ipinataw sa mga tagapagpahiwatig;

pamantayan upang ma-optimize ang proseso.

Ang isang makabuluhang paglalarawan ng isang bagay ay maaaring iharap sa anyo ng pormal na diagram nito, na nagpapahiwatig kung anong mga parameter at paunang impormasyon ang kailangang kolektahin upang makalkula ang mga kinakailangang dami. Ang isang mathematical model, sa kaibahan sa isang pormal na scheme, ay naglalaman ng partikular na numerical data na nagpapakilala sa object Ang pagbuo ng isang mathematical model ay higit sa lahat ay nakasalalay sa pag-unawa ng forecaster sa kakanyahan ng prosesong ginagampanan. Batay sa kanyang mga ideya, inilalagay niya ang isang gumaganang hypothesis, sa tulong kung saan ang isang analytical record ng modelo ay nilikha sa anyo ng mga formula, equation at hindi pagkakapantay-pantay. Bilang resulta ng paglutas ng sistema ng mga equation, ang mga tiyak na parameter ng function ay nakuha, na naglalarawan ng pagbabago sa nais na mga variable sa paglipas ng panahon.

Ang pagkakasunud-sunod at pagkakasunud-sunod ng trabaho bilang isang elemento ng organisasyon ng pagtataya ay tinutukoy depende sa paraan ng pagtataya na ginamit. Karaniwan ang gawaing ito ay isinasagawa sa maraming yugto.

Stage 1 - predictive retrospection, ibig sabihin, pagtatatag ng forecast object at ang forecast background. Ang gawain sa unang yugto ay isinasagawa sa sumusunod na pagkakasunud-sunod:

pagbuo ng isang paglalarawan ng isang bagay sa nakaraan, na kinabibilangan ng isang pre-forecast na pagsusuri ng bagay, pagtatasa ng mga parameter nito, ang kanilang kahalagahan at ugnayan sa isa't isa,

pagkilala at pagtatasa ng mga mapagkukunan ng impormasyon, ang pamamaraan at organisasyon ng trabaho sa kanila, pagkolekta at paglalagay ng retrospective na impormasyon;

pagtatakda ng mga layunin ng pananaliksik.

Isinasagawa ang mga gawain ng pagbabalik ng pagtataya, sinusuri ng mga forecaster ang kasaysayan ng pag-unlad ng bagay at ang background ng pagtataya upang makakuha ng isang sistematikong paglalarawan ng mga ito.

Stage 2 - predictive diagnosis, kung saan ang isang sistematikong paglalarawan ng forecast object at forecast background ay sinusuri upang matukoy ang mga uso sa kanilang pag-unlad at pumili ng mga modelo at mga pamamaraan ng pagtataya. Ang gawain ay isinasagawa sa sumusunod na pagkakasunud-sunod:

pagbuo ng isang modelo ng forecast object, kabilang ang isang pormal na paglalarawan ng object, pagsuri sa antas ng kasapatan ng modelo sa object;

pagpili ng mga pamamaraan ng pagtataya (pangunahin at pantulong), pagbuo ng algorithm at mga programa sa trabaho.

Stage 3 - proteksyon, i.e. ang proseso ng malawak na pag-unlad ng forecast, kabilang ang: 1) pagkalkula ng mga hinulaang parameter para sa isang naibigay na panahon ng lead; 2) synthesis ng mga indibidwal na bahagi ng forecast.

Stage 4 - pagtatasa ng forecast, kasama ang pagpapatunay nito, ibig sabihin, pagtukoy sa antas ng pagiging maaasahan, katumpakan at bisa.

Sa kurso ng prospect at pagtatasa, batay sa mga nakaraang yugto, ang mga problema sa pagtataya at pagtatasa nito ay nalutas.

Ang mga ipinahiwatig na yugto ay tinatayang at depende sa pangunahing paraan ng pagtataya.

Ang mga resulta ng pagtataya ay iginuhit sa anyo ng isang sertipiko, ulat o iba pang materyal at ipinakita sa customer.

Sa pagtataya, ang halaga ng paglihis ng forecast mula sa aktwal na estado ng bagay ay maaaring ipahiwatig, na tinatawag na error sa forecast, na kinakalkula ng formula:

;
;
. (9.3)

Mga mapagkukunan ng mga pagkakamali sa pagtataya

Ang mga pangunahing mapagkukunan ay maaaring:

1. Simpleng paglilipat (extrapolation) ng data mula sa nakaraan patungo sa hinaharap (halimbawa, ang kumpanya ay walang ibang mga opsyon sa pagtataya maliban sa 10% na paglago ng benta).

2. Ang kawalan ng kakayahang tumpak na matukoy ang posibilidad ng isang kaganapan at ang epekto nito sa bagay na pinag-aaralan.

3. Mga hindi inaasahang paghihirap (mga nakakagambalang kaganapan) na nakakaapekto sa pagpapatupad ng plano, halimbawa, ang biglaang pagpapaalis ng pinuno ng departamento ng pagbebenta.

Sa pangkalahatan, tumataas ang katumpakan ng pagtataya habang naiipon ang karanasan sa pagtataya at ang mga pamamaraan nito ay pino.