Vähimruutude meetod Excelis – trendifunktsiooni kasutamine. Vähimruutude meetod Excelis. Regressioonanalüüs


  • Õpetus

Sissejuhatus

Olen matemaatik ja programmeerija. Suurim hüpe, mille ma oma karjääri jooksul tegin, oli see, kui õppisin ütlema: "Ma ei saa millestki aru!" Nüüd ma ei häbene öelda teaduse valgustajale, et ta peab mulle loengut, et ma ei saa aru, mida tema, valgusti, mulle räägib. Ja see on väga raske. Jah, oma teadmatuse tunnistamine on raske ja piinlik. Kellele meeldib tunnistada, et ta ei tea millegi põhitõdesid? Oma ametist tulenevalt pean kohal käima suured hulgad ettekanded ja loengud, kus, tunnistan, tahan enamikul juhtudel magada, sest ma ei saa millestki aru. Aga ma ei saa aru, sest teaduse praeguse olukorra suur probleem seisneb matemaatikas. See eeldab, et kõik kuulajad tunnevad absoluutselt kõiki matemaatika valdkondi (mis on absurdne). Tunnistada, et te ei tea, mis on tuletis (mis see on, räägime sellest veidi hiljem), on häbiväärne.

Aga ma olen õppinud ütlema, et ma ei tea, mis on korrutamine. Jah, ma ei tea, mis on alamgebra üle Lie algebra. Jah, ma ei tea, miks neid elus vaja on ruutvõrrandid. Muide, kui olete kindel, et teate, siis on meil millestki rääkida! Matemaatika on trikkide jada. Matemaatikud püüavad avalikkust segadusse ajada ja hirmutada; kus pole segadust, pole ka mainet ega autoriteeti. Jah, prestiižne on rääkida võimalikult abstraktses keeles, mis on täielik jama.

Kas sa tead, mis on tuletis? Tõenäoliselt räägite mulle erinevuse suhte piirist. Peterburi Riikliku Ülikooli matemaatika ja mehaanika esimesel kursusel rääkis mulle Viktor Petrovitš Khavin kindlaks määratud tuletis kui funktsiooni Taylori seeria esimese liikme koefitsient punktis (see oli eraldi võimlemine Taylori seeria määramiseks ilma tuletisi). Naersin selle määratluse üle kaua, kuni lõpuks sain aru, millega tegu. Tuletis pole midagi muud kui lihtne mõõt selle kohta, kui sarnane on eristatav funktsioon funktsiooniga y=x, y=x^2, y=x^3.

Nüüd on mul au pidada loenguid üliõpilastele, kes kardan matemaatika. Kui kardad matemaatikat, siis oleme samal teel. Niipea, kui proovite mõnda teksti lugeda ja teile tundub, et see on liiga keeruline, teadke, et see on halvasti kirjutatud. Ma väidan, et pole ühtegi matemaatika valdkonda, mida ei saaks arutada "näpuga" ilma täpsust kaotamata.

Lähituleviku ülesanne: andsin oma õpilastele ülesandeks mõista, mis on lineaarne ruutregulaator. Ärge olge häbelik, kulutage kolm minutit oma elust ja järgige linki. Kui te millestki aru ei saa, siis oleme samal teel. Ka mina (professionaalne matemaatik-programmeerija) ei saanud millestki aru. Ja ma kinnitan teile, et saate selle "näpuga" välja mõelda. Peal Sel hetkel Ma ei tea, mis see on, aga ma kinnitan teile, et saame selle välja mõelda.

Niisiis, esimene loeng, mille ma oma õpilastele pean pärast seda, kui nad õudusega minu juurde jooksevad ja ütlevad, et lineaar-ruutregulaator on kohutav asi, mida te kunagi oma elus ei valda. meetodid vähimruudud . Kas saate otsustada lineaarvõrrandid? Kui sa seda teksti loed, siis suure tõenäosusega mitte.

Seega, kui on antud kaks punkti (x0, y0), (x1, y1), näiteks (1,1) ja (3,2), on ülesandeks leida neid kahte punkti läbiva sirge võrrand:

illustratsioon

Sellel real peaks olema järgmine võrrand:

Siin on alfa ja beeta meile tundmatud, kuid selle joone kaks punkti on teada:

Selle võrrandi saame kirjutada maatriksi kujul:

Mida siin tegema peaks lüüriline kõrvalepõige: Mis on maatriks? Maatriks pole midagi muud kui kahemõõtmeline massiiv. See on andmete salvestamise viis, millele ei tohiks lisada täiendavaid tähendusi. See, kuidas teatud maatriksit täpselt tõlgendada, sõltub meist endist. Perioodiliselt tõlgendan seda lineaarse kaardistusena, perioodiliselt ruutvormina ja mõnikord lihtsalt vektorite kogumina. Seda kõike selgitatakse kontekstis.

Asendame betoonmaatriksid nende sümboolse esitusega:

Siis (alfa, beeta) saab hõlpsasti leida:

Täpsemalt meie varasemate andmete kohta:

Mis annab punkte (1,1) ja (3,2) läbiva sirge järgmise võrrandi:

Olgu, siin on kõik selge. Leiame läbiva sirge võrrandi kolm punktid: (x0,y0), (x1,y1) ja (x2,y2):

Oi-oi-oi, aga kahe tundmatu jaoks on meil kolm võrrandit! Tavaline matemaatik ütleb, et lahendust pole. Mida programmeerija ütleb? Ja kõigepealt kirjutab ta eelmise võrrandisüsteemi ümber järgmisel kujul:

Meie puhul vektorid i,j,b on kolmemõõtmelised, mistõttu (üldjuhul) sellele süsteemile lahendust ei ole. Iga vektor (alfa\*i + beeta\*j) asub vektorite (i, j) poolt katval tasapinnal. Kui b ei kuulu sellele tasapinnale, siis pole lahendust (võrrandis ei saa võrdsust saavutada). Mida teha? Otsime kompromissi. Tähistagem e (alfa, beeta) täpselt, kui kaugele me pole võrdsust saavutanud:

Ja me püüame seda viga minimeerida:

Miks ruut?

Me ei otsi lihtsalt normi miinimumi, vaid normi ruudu miinimumi. Miks? Miinimumpunkt ise langeb kokku ja ruut annab sujuva funktsiooni (argumentide ruutfunktsioon (alfa, beeta)), samas kui lihtsalt pikkus annab koonusekujulise funktsiooni, mis ei ole miinimumpunktis eristatav. Brr. Ruut on mugavam.

Ilmselt on viga minimeeritud, kui vektor e vektorite poolt hõlmatud tasapinnaga risti i Ja j.

Illustratsioon

Teisisõnu: otsime sirgjoont, mille kõigi punktide ja selle sirge kauguste ruudu pikkuste summa on minimaalne:

VÄRSKENDUS: Mul on siin probleem, kaugust sirgest tuleks mõõta vertikaalselt, mitte ortogonaalprojektsiooniga. Sellel kommentaatoril on õigus.

Illustratsioon

Täiesti erinevate sõnadega (hoolsalt, halvasti vormistatud, kuid see peaks olema selge): võtame kõik võimalikud jooned kõigi punktipaaride vahel ja otsime kõigi vahelt keskmist joont:

Illustratsioon

Veel üks selgitus sõrmede kohta: kinnitame vedru kõigi andmepunktide (siin on kolm) ja otsitava sirge ja sirge vahele tasakaaluseisund seal on täpselt see, mida otsime.

Minimaalne ruutvorm

Niisiis, arvestades seda vektorit b ja maatriksi veeruvektoritega hõlmatud tasapind A(V sel juhul(x0,x1,x2) ja (1,1,1)), otsime vektorit e minimaalse ruudu pikkusega. Ilmselgelt on miinimum saavutatav ainult vektori puhul e, risti maatriksi veeruvektoritega kaetud tasapinnaga A:

Teisisõnu otsime vektorit x=(alfa, beeta), et:

Lubage mul teile meelde tuletada, et see vektor x=(alfa, beeta) on minimaalne ruutfunktsioon||e(alfa, beeta)||^2:

Siinkohal oleks kasulik meeles pidada, et maatriksit saab tõlgendada ka ruutvormina, näiteks identiteedimaatriksit ((1,0),(0,1)) saab tõlgendada funktsioonina x^2 + y^ 2:

ruutvorm

Kogu see võimlemine on tuntud lineaarse regressiooni nime all.

Laplace'i võrrand Dirichlet' piirtingimusega

Nüüd kõige lihtsam tõeline väljakutse: on teatud kolmnurkne pind, seda on vaja siluda. Näiteks laadime minu näo mudeli:

Algne kohustus on saadaval. Väliste sõltuvuste minimeerimiseks võtsin oma tarkvara renderdaja koodi, juba Habré peal. Lahenduste jaoks lineaarne süsteem Kasutan OpenNL-i, see on suurepärane lahendaja, mida on aga väga raske paigaldada: pead kopeerima kaks faili (.h+.c) oma projektiga kausta. Kogu silumine toimub järgmise koodiga:

For (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = näod[i]; jaoks (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y ja Z koordinaadid on eraldatavad, silun eraldi. See tähendab, et lahendan kolm lineaarvõrrandisüsteemi, millest igaühel on minu mudeli tippude arvuga võrdne muutujate arv. Maatriksi A esimesel n real on ainult üks 1 rea kohta ja vektori b esimesel n real on mudeli algsed koordinaadid. See tähendab, et seon tipu uue asukoha ja tipu vana asendi vahele vedru - uued ei tohiks vanadest liiga kaugele liikuda.

Kõigil järgnevatel maatriksi A ridadel (faces.size()*3 = kõigi võrgusilma kolmnurkade servade arv) on üks esinemine 1 ja üks esinemine -1, kusjuures vektoril b on nullkomponente. See tähendab, et panen meie kolmnurkse võrgu igale servale vedru: kõik servad püüavad saada sama tipu algus- ja lõpp-punktiga.

Veel kord: kõik tipud on muutujad ja nad ei saa oma algsest asukohast kaugele liikuda, kuid samal ajal püüavad nad muutuda üksteisega sarnaseks.

Siin on tulemus:

Kõik oleks hästi, mudel on tõesti silutud, kuid see on oma esialgsest servast eemaldunud. Muudame veidi koodi:

For (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Meie maatriksis A serval olevate tippude jaoks ei lisa ma rida kategooriast v_i = verts[i][d], vaid 1000*v_i = 1000*verts[i][d]. Mida see muudab? Ja see muudab meie vea ruutlikku vormi. Nüüd maksab üks kõrvalekalle ülemisest servast mitte ühe ühiku, nagu varem, vaid 1000*1000 ühikut. See tähendab, et äärmiste tippude külge riputasime tugevama vedru, lahendus eelistab teisi tugevamalt venitada. Siin on tulemus:

Kahekordistame tippude vahelist vedru tugevust:
nlKoefitsient(nägu[ j ], 2); nlKoefitsient(nägu[(j+1)%3], -2);

On loogiline, et pind on muutunud siledamaks:

Ja nüüd isegi sada korda tugevam:

Mis see on? Kujutage ette, et oleme kastnud traatrõnga seebivette. Selle tulemusena püüab saadud seebikile olla võimalikult väike kumerus, puudutades piiri - meie traatrõngast. Täpselt selle saimegi, kui kinnitasime piirde ja palusime seest sileda pinna. Õnnitleme, lahendasime just Laplace'i võrrandi Dirichlet' piirtingimustega. Kõlab lahedalt? Kuid tegelikult peate lihtsalt lahendama ühe lineaarvõrrandisüsteemi.

Poissoni võrrand

Meenutagem veel üht lahedat nime.

Oletame, et mul on selline pilt:

Tundub kõigile hea, aga mulle see tool ei meeldi.

Ma lõikan pildi pooleks:



Ja ma valin oma kätega tooli:

Seejärel tõmban kõik, mis maskis on valge, pildi vasakusse serva ja samal ajal kogu pildi ulatuses ütlen, et kahe naaberpiksli vahe peaks olema võrdne kahe parema naaberpiksli vahega. pilt:

For (int i=0; i

Siin on tulemus:

Kood ja pildid olemas

Eksperimentaalsete andmete lähendamine on meetod, mis põhineb katseliselt saadud andmete asendamisel analüütilise funktsiooniga, mis sõlmpunktides kõige täpsemalt läbib või langeb kokku algväärtustega (katse või katse käigus saadud andmed). Praegu on analüütilise funktsiooni määratlemiseks kaks võimalust:

Konstrueerides n-kraadise interpolatsioonipolünoomi, mis läbib otse läbi kõigi punktide antud andmemassiivi. Sel juhul esitatakse lähendusfunktsioon järgmisel kujul: interpolatsioonipolünoom Lagrange'i kujul või interpolatsioonipolünoom Newtoni kujul.

Konstrueerides n-kraadise lähendava polünoomi, mis läbib punktide vahetus läheduses antud andmemassiivist. Seega ühtlustab ligikaudne funktsioon kõik juhuslikud mürad (või vead), mis võivad katse käigus tekkida: katse ajal mõõdetud väärtused sõltuvad juhuslikest teguritest, mis kõikuvad vastavalt oma juhuslikele seadustele (mõõtmis- või instrumendivead, ebatäpsus või katseviga vead). Sel juhul määratakse ligikaudne funktsioon vähimruutude meetodil.

Vähima ruudu meetod(ingliskeelses kirjanduses Ordinary Least Squares, OLS) on matemaatiline meetod, mis põhineb ligikaudse funktsiooni määramisel, mis konstrueeritakse antud katseandmete massiivi punktide lähimasse lähedusse. Originaal- ja lähendusfunktsioonide F(x) lähedus määratakse numbrilise mõõduga, nimelt: katseandmete ruutude kõrvalekallete summa lähenduskõverast F(x) peaks olema väikseim.

Ligikaudne kõver, mis on koostatud vähimruutude meetodil

Kasutatakse vähimruutude meetodit:

Ülemääratud võrrandisüsteemide lahendamiseks, kui võrrandite arv ületab tundmatute arvu;

Leida lahendus tavaliste (mitte ülemääratletud) mittelineaarsete võrrandisüsteemide korral;

Punktväärtuste ligikaudseks määramiseks mõne ligikaudse funktsiooniga.

Vähimruutude meetodit kasutav ligikaudne funktsioon määratakse kindlaks antud katseandmete massiivi arvutatud lähendusfunktsiooni hälbete miinimumsumma tingimusest. See vähimruutude meetodi kriteerium on kirjutatud järgmise avaldisena:

Arvutatud lähendusfunktsiooni väärtused sõlmpunktides,

Antud massiiv katseandmeid sõlmepunktides.

Ruutkriteeriumil on mitmeid "häid" omadusi, nagu diferentseeritavus, mis pakub ainulaadse lahenduse lähendusprobleemile polünoomide lähendusfunktsioonidega.

Sõltuvalt ülesande tingimustest on lähendusfunktsioon polünoom astmega m

Lähendamisfunktsiooni aste ei sõltu sõlmpunktide arvust, kuid selle dimensioon peab alati olema väiksem kui antud eksperimentaalse andmemassiivi dimensioon (punktide arv).

∙ Kui lähendava funktsiooni aste on m=1, siis lähendame tabelifunktsiooni sirgjoonega (lineaarne regressioon).

∙ Kui lähendamisfunktsiooni aste on m=2, siis lähendame tabelifunktsiooni ruutparabooliga (ruutlähendus).

∙ Kui lähendava funktsiooni aste on m=3, siis lähendame tabelifunktsiooni kuupparabooliga (kuupproksimatsioon).

Üldjuhul, kui antud tabeliväärtuste jaoks on vaja konstrueerida ligikaudne polünoom kraadiga m, kirjutatakse kõigi sõlmpunktide hälvete ruudu summa miinimumi tingimus ümber järgmisel kujul:

- astme m lähendava polünoomi tundmatud koefitsiendid;

Määratud tabeli väärtuste arv.

Funktsiooni miinimumi olemasolu vajalik tingimus on selle osatuletise võrdsus nulliga tundmatute muutujate suhtes . Selle tulemusena saame järgmise võrrandisüsteemi:

Teisendame saadud lineaarset võrrandisüsteemi: avage sulud ja liigutage vabad liikmed avaldise paremale poole. Selle tulemusena kirjutatakse saadud lineaarsete algebraavaldiste süsteem järgmisel kujul:

Seda lineaarsete algebraavaldiste süsteemi saab maatriksi kujul ümber kirjutada:

Selle tulemusena saadi lineaarvõrrandi süsteem mõõtmetega m+1, mis koosneb m+1 tundmatutest. Seda süsteemi saab lahendada mis tahes lineaarsete algebraliste võrrandite lahendamise meetodiga (näiteks Gaussi meetod). Lahenduse tulemusena leitakse aproksimeeriva funktsiooni tundmatud parameetrid, mis annavad minimaalse lähendusfunktsiooni ruutude hälbete summa algandmetest, s.o. parim võimalik ruutlähendus. Tuleb meeles pidada, et kui lähteandmete isegi üks väärtus muutub, muudavad kõik koefitsiendid oma väärtusi, kuna need on täielikult määratud lähteandmetega.

Lähteandmete lähendamine lineaarse sõltuvuse järgi

(lineaarne regressioon)

Vaatleme näitena ligikaudse funktsiooni määramise tehnikat, mis on määratud lineaarse sõltuvuse kujul. Vähimruutude meetodi kohaselt kirjutatakse hälvete ruutude summa miinimumtingimus järgmisel kujul:

Tabeli sõlmede koordinaadid;

Lähendava funktsiooni tundmatud koefitsiendid, mis on määratud lineaarse sõltuvusena.

Funktsiooni miinimumi olemasolu vajalik tingimus on selle osatuletise võrdsus nulliga tundmatute muutujate suhtes. Selle tulemusena saame järgmise võrrandisüsteemi:

Teisendame saadud lineaarset võrrandisüsteemi.

Lahendame saadud lineaarvõrrandisüsteemi. Lähendusfunktsiooni koefitsiendid analüütilisel kujul määratakse järgmiselt (Crameri meetod):

Need koefitsiendid tagavad lineaarse lähendusfunktsiooni konstrueerimise vastavalt kriteeriumile, mille kohaselt minimeeritakse antud tabeliväärtustest (katseandmed) lähendava funktsiooni ruutude summa.

Algoritm vähimruutude meetodi rakendamiseks

1. Algandmed:

Määratakse katseandmete massiiv mõõtmiste arvuga N

Määratakse lähendava polünoomi aste (m).

2. Arvutusalgoritm:

2.1. Koefitsiendid määratakse mõõtmetega võrrandisüsteemi koostamiseks

Võrrandisüsteemi koefitsiendid (võrrandi vasak pool)

- võrrandisüsteemi ruutmaatriksi veeru numbri indeks

Lineaarvõrrandisüsteemi vabad liikmed (võrrandi parem pool)

- võrrandisüsteemi ruutmaatriksi reanumbri indeks

2.2. Mõõtmega lineaarvõrrandisüsteemi moodustamine .

2.3. Lineaarvõrrandisüsteemi lahendamine astme m lähendava polünoomi tundmatute koefitsientide määramiseks.

2.4. Ligikaudse polünoomi algväärtustest kõrvalekallete ruudu summa määramine kõigis sõlmpunktides

Ruuthälvete summa leitud väärtus on minimaalne võimalik.

Lähendamine teiste funktsioonide abil

Tuleb märkida, et algandmete lähendamisel vastavalt vähimruutude meetodile kasutatakse mõnikord lähendava funktsioonina logaritmilist funktsiooni, eksponentsiaalfunktsiooni ja võimsusfunktsiooni.

Logaritmiline lähendus

Vaatleme juhtumit, kui ligikaudne funktsioon on antud vormi logaritmilise funktsiooniga:

Vähimruutude meetodi olemus on trendimudeli parameetrite leidmisel, mis kõige paremini kirjeldab mis tahes juhusliku nähtuse arengutendentsi ajas või ruumis (trend on joon, mis iseloomustab selle arengu tendentsi). Vähimruutude meetodi (LSM) ülesanne taandub mitte ainult trendimudeli leidmisele, vaid ka parima või optimaalse mudeli leidmisele. See mudel on optimaalne, kui vaadeldud tegelike väärtuste ja vastavate arvutatud trendi väärtuste ruudu hälvete summa on minimaalne (väikseim):

kus on vaadeldud tegeliku väärtuse vaheline ruuthälve

ja vastav arvutatud trendi väärtus,

uuritava nähtuse tegelik (täheldatud) väärtus,

trendimudeli arvutatud väärtus,

Uuritava nähtuse vaatluste arv.

MNC-d kasutatakse iseseisvalt üsna harva. Reeglina kasutatakse seda korrelatsiooniuuringutes enamasti ainult vajaliku tehnilise tehnikana. Tuleb meeles pidada, et OLS-i teabebaas saab olla ainult usaldusväärne statistiline jada ja vaatluste arv ei tohiks olla väiksem kui 4, vastasel juhul võivad OLS-i silumisprotseduurid kaotada terve mõistuse.

MNC tööriistakomplekt taandub järgmistele protseduuridele:

Esimene protseduur. Selgub, kas valitud faktori-argumendi muutumisel on üldse kalduvus resultantatribuuti muuta või teisisõnu, kas on seos " juures "Ja" X ».

Teine protseduur. Määratakse kindlaks, milline joon (trajektoor) suudab seda suundumust kõige paremini kirjeldada või iseloomustada.

Kolmas protseduur.

Näide. Oletame, et meil on andmed uuritava talu keskmise päevalillesaagi kohta (tabel 9.1).

Tabel 9.1

Vaatluse number

Tootlikkus, c/ha

Kuna meie riigis on päevalilletootmise tehnoloogia tase viimase 10 aasta jooksul praktiliselt muutumatuna püsinud, tähendab see, et ilmselt sõltusid saagikuse kõikumised analüüsitud perioodil suurel määral ilmastiku- ja kliimatingimuste kõikumisest. Kas see on tõesti tõsi?

Esimene OLS-protseduur. Kontrollitakse hüpoteesi päevalillesaagi muutumise trendi olemasolu kohta sõltuvalt ilmastiku- ja kliimatingimuste muutustest analüüsitud 10 aasta jooksul.

Selles näites " y "Soovitav on võtta päevalillesaak ja " x » – vaadeldud aasta number analüüsitud perioodil. Hüpoteesi kontrollimine mis tahes seose olemasolu kohta " x "Ja" y "saab teha kahel viisil: käsitsi ja arvutiprogrammide abil. Muidugi saab arvutitehnoloogia olemasolu korral selle probleemi iseenesest lahendada. Kuid MNC tööriistade paremaks mõistmiseks on soovitatav testida hüpoteesi seose olemasolu kohta x "Ja" y » käsitsi, kui käepärast on vaid pliiats ja tavaline kalkulaator. Sellistel juhtudel saab hüpoteesi trendi olemasolu kohta kõige paremini visuaalselt kontrollida analüüsitud dünaamikaseeria graafilise kujutise asukohaga - korrelatsiooniväljaga:

Meie näite korrelatsiooniväli asub aeglaselt kasvava joone ümber. See iseenesest viitab päevalille saagikuse muutumise teatud trendi olemasolule. Ühegi tendentsi olemasolust on võimatu rääkida ainult siis, kui korrelatsiooniväli näeb välja nagu ring, ring, rangelt vertikaalne või rangelt horisontaalne pilv või koosneb kaootiliselt hajutatud punktidest. Kõigil muudel juhtudel on hüpotees seose olemasolu kohta " x "Ja" y "ja jätkake uurimist.

Teine OLS-protseduur. Määratakse kindlaks, milline joon (trajektoor) suudab kõige paremini kirjeldada või iseloomustada päevalillesaagi muutuste trendi analüüsitud perioodil.

Kui teil on arvutitehnoloogia, siis optimaalse trendi valik toimub automaatselt. Käsitsi töötlemisel valitakse optimaalne funktsioon reeglina visuaalselt - korrelatsioonivälja asukoha järgi. See tähendab, et graafiku tüübi põhjal valitakse empiirilise trendiga (tegeliku trajektoori) kõige paremini sobiva joone võrrand.

Looduses on teadaolevalt tohutult erinevaid funktsionaalseid sõltuvusi, mistõttu on isegi väikest osa neist äärmiselt raske visuaalselt analüüsida. Õnneks saab reaalses majanduspraktikas enamikku seoseid üsna täpselt kirjeldada kas parabooli või hüperbooli või sirgjoonega. Sellega seoses saate parima funktsiooni "käsitsi" valikuga piirduda ainult nende kolme mudeliga.

Hüperbool:

Teist järku parabool: :

On lihtne näha, et meie näites iseloomustab päevalillesaagi muutumise trendi analüüsitud 10 aasta jooksul kõige paremini sirgjoon, seega saab regressioonivõrrandiks sirge võrrandi.

Kolmas protseduur. Arvutatakse seda rida iseloomustava regressioonivõrrandi parameetrid ehk teisisõnu määratakse analüütiline valem, mis kirjeldab parimat trendimudelit.

Regressioonivõrrandi parameetrite väärtuste leidmine, meie puhul parameetrid ja , on OLS-i tuum. See protsess taandub normaalvõrrandisüsteemi lahendamisele.

(9.2)

Seda võrrandisüsteemi saab Gaussi meetodiga üsna lihtsalt lahendada. Tuletame meelde, et lahenduse tulemusena leitakse meie näites parameetrite väärtused ja. Seega on leitud regressioonivõrrandil järgmine vorm:

Seda kasutatakse ökonomeetrias laialdaselt selle parameetrite selge majandusliku tõlgendamise vormis.

Lineaarne regressioon taandub vormi võrrandi leidmisele

või

Vormi võrrand võimaldab kindlaksmääratud parameetri väärtuste alusel X neil on saadud karakteristiku teoreetilised väärtused, asendades sellega teguri tegelikud väärtused X.

Lineaarse regressiooni konstrueerimine taandub selle parameetrite hindamisele - A Ja V. Lineaarse regressiooni parameetrite hinnanguid saab leida erinevate meetodite abil.

Klassikaline lähenemine lineaarse regressiooni parameetrite hindamisel põhineb vähimruutude meetod(MNC).

Vähimruutude meetod võimaldab meil saada selliseid parameetrite hinnanguid A Ja V, mille juures saadud karakteristiku tegelike väärtuste hälvete ruudu summa (y) arvutatud (teoreetilisest) miinimum:

Funktsiooni miinimumi leidmiseks peate arvutama iga parameetri osatuletised A Ja b ja seadke need võrdseks nulliga.

Tähistame läbi S, siis:

Valemit teisendades saame parameetrite hindamiseks järgmise normaalvõrrandi süsteemi A Ja V:

Lahendades normaalvõrrandisüsteemi (3.5) kas muutujate järjestikuse elimineerimise meetodil või determinantide meetodil, leiame parameetrite nõutavad hinnangud A Ja V.

Parameeter V nimetatakse regressioonikoefitsiendiks. Selle väärtus näitab tulemuse keskmist muutust teguri muutusega ühe ühiku võrra.

Regressioonivõrrandile lisandub alati seose tiheduse näitaja. Lineaarse regressiooni kasutamisel on selliseks näitajaks lineaarne korrelatsioonikordaja. Lineaarse korrelatsioonikordaja valemil on erinevaid modifikatsioone. Mõned neist on toodud allpool:

Nagu teada, on lineaarne korrelatsioonikordaja piirides: -1 1.

Lineaarfunktsiooni valiku kvaliteedi hindamiseks arvutatakse ruut

Nimetatud lineaarne korrelatsioonikordaja määramiskoefitsient. Determinatsioonikordaja iseloomustab saadud tunnuse dispersiooni osakaalu y, seletatav regressiooniga saadud tunnuse koguvariatsioonis:

Vastavalt sellele iseloomustab väärtus 1 dispersiooni osakaalu y, põhjustatud muude tegurite mõjust, mida mudelis arvesse ei võeta.

Küsimused enesekontrolliks

1. Vähimruutude meetodi olemus?

2. Mitu muutujat annab paaripõhine regressioon?

3. Milline koefitsient määrab muutustevahelise seose tiheduse?

4. Millistes piirides määratakse determinatsioonikoefitsient?

5. Parameetri b hindamine korrelatsioon-regressioonanalüüsis?

1. Christopher Dougherty. Sissejuhatus ökonomeetriasse. - M.: INFRA - M, 2001 - 402 lk.

2. S.A. Boroditš. Ökonomeetria. Minsk LLC “Uued teadmised” 2001.


3. R.U. Rakhmetova Ökonomeetria lühikursus. Õpetus. Almatõ. 2004. -78lk.

4. I.I. Eliseeva, ökonomeetria. - M.: "Finants ja statistika", 2002

5. Igakuine info- ja analüütiline ajakiri.

Mittelineaarsed majandusmudelid. Mittelineaarsed regressioonimudelid. Muutujate teisendus.

Mittelineaarsed majandusmudelid..

Muutujate teisendus.

Elastsustegur.

Kui majandusnähtuste vahel on mittelineaarsed seosed, siis väljendatakse neid vastavate mittelineaarsete funktsioonide abil: näiteks võrdkülgne hüperbool. , teise astme paraboolid ja jne.

Mittelineaarseid regressioone on kahte klassi:

1. Regressioonid, mis on analüüsis sisalduvate selgitavate muutujate suhtes mittelineaarsed, kuid hinnanguliste parameetrite suhtes lineaarsed, näiteks:

Erineva astme polünoomid - , ;

Võrdkülgne hüperbool - ;

Poollogaritmiline funktsioon - .

2. Hinnatavates parameetrites mittelineaarsed regressioonid, näiteks:

Võimsus - ;

Demonstratiivne - ;

Eksponentsiaalne - .

Saadud karakteristiku üksikute väärtuste kõrvalekallete ruudu summa juures keskmisest väärtusest on põhjustatud paljude põhjuste mõjust. Jagame tinglikult kogu põhjuste komplekti kahte rühma: uuritav tegur x Ja muud tegurid.

Kui tegur tulemust ei mõjuta, on graafikul olev regressioonisirge teljega paralleelne Oh Ja

Siis tuleneb kogu saadud karakteristiku dispersioon muude tegurite mõjust ja hälvete ruudu summa langeb kokku jääkväärtusega. Kui muud tegurid tulemust ei mõjuta, siis y seotud Koos X funktsionaalselt ja ruutude jääksumma on null. Sel juhul on regressiooniga seletatav ruutude hälvete summa võrdne ruutude kogusummaga.

Kuna kõik korrelatsioonivälja punktid ei asu regressioonisirgel, tekib nende hajumine alati teguri mõju tulemusena. X, st regressioon juures Kõrval X, ja põhjustatud muudest põhjustest (seletamatu variatsioon). Regressioonijoone sobivus ennustamiseks sõltub sellest, milline osa tunnuse koguvariatsioonist juures seletatud variatsiooni

Ilmselgelt, kui regressioonist tingitud hälvete ruudu summa on suurem kui ruutude jääksumma, siis on regressioonivõrrand statistiliselt oluline ja tegur X mõjutab oluliselt tulemust u.

, st tunnuse sõltumatu varieerumise vabaduse arvuga. Vabadusastmete arv on seotud üldkogumi n ühikute arvu ja sellest määratud konstantide arvuga. Seoses uuritava probleemiga peaks vabadusastmete arv näitama, kui paljudest sõltumatutest kõrvalekalletest P

Regressioonivõrrandi kui terviku olulisuse hinnang antakse kasutades F- Fisheri kriteerium. Sel juhul esitatakse nullhüpotees, et regressioonikordaja on võrdne nulliga, s.t. b = 0 ja seega tegur X tulemust ei mõjuta u.

F-testi kohesele arvutamisele eelneb dispersioonanalüüs. Keskse koha selles hõivab muutuja hälvete ruutude kogusumma lagunemine juures keskmisest väärtusest juures kaheks osaks - "seletatud" ja "seletamatu":

- hälvete ruudu summa;

- regressiooniga seletatavate hälvete ruudu summa;

- hälvete ruudu jääksumma.

Igasugune hälvete ruudu summa on seotud vabadusastmete arvuga , st tunnuse sõltumatu varieerumise vabaduse arvuga. Vabadusastmete arv on seotud rahvastikuühikute arvuga n ja sellest määratud konstantide arvuga. Seoses uuritava probleemiga peaks vabadusastmete arv näitama, kui paljudest sõltumatutest kõrvalekalletest P võimalik etteantud ruutude summa moodustamiseks.

Dispersioon vabadusastme kohtaD.

F-suhted (F-test):

Kui nullhüpotees on tõene, siis tegur ja jääkvariatsioonid ei erine üksteisest. H 0 puhul on ümberlükkamine vajalik selleks, et teguri dispersioon ületaks mitu korda jääkdispersiooni. Inglise statistik Snedekor töötas välja kriitiliste väärtuste tabelid F-seosed nullhüpoteesi erinevatel olulisuse tasanditel ja erinevatel vabadusastmete arvudel. Tabeli väärtus F-kriteerium on dispersioonide suhte maksimaalne väärtus, mis võib tekkida juhusliku lahknemise korral nullhüpoteesi esinemise tõenäosuse antud tasemel. Arvutatud väärtus F-suhteid peetakse usaldusväärseks, kui o on tabelist suurem.

Sel juhul lükatakse tagasi nullhüpotees märkidevahelise seose puudumise kohta ja tehakse järeldus selle seose olulisuse kohta: F fakt > F tabel H 0 lükatakse tagasi.

Kui väärtus on tabelis esitatud väärtusest väiksem F fakt ‹, F tabel, siis on nullhüpoteesi tõenäosus suurem kui määratud tase ja seda ei saa tagasi lükata ilma tõsise riskita teha vale järelduse seose olemasolu kohta. Sel juhul peetakse regressioonivõrrandit statistiliselt ebaoluliseks. Kuid ta ei kaldu kõrvale.

Regressioonikordaja standardviga

Regressioonikordaja olulisuse hindamiseks võrreldakse selle väärtust standardveaga, st määratakse tegelik väärtus t- õpilase test: mida seejärel võrreldakse tabeli väärtusega teatud olulisuse tasemel ja vabadusastmete arvul ( n- 2).

Standardparameetri viga A:

Lineaarse korrelatsioonikordaja olulisust kontrollitakse vea suuruse alusel korrelatsioonikordaja t r:

Kogu tunnuse dispersioon X:

Mitmekordne lineaarne regressioon

Mudeli ehitamine

Mitmekordne regressioon tähistab efektiivse tunnuse regressiooni kahe või enama teguriga, st vormi mudelit

Regressioon võib anda modelleerimisel häid tulemusi, kui jätta tähelepanuta teiste uuritavat objekti mõjutavate tegurite mõju. Üksikute majandusmuutujate käitumist ei saa kontrollida, st ühe uuritava teguri mõju hindamisel ei ole võimalik tagada kõigi teiste tingimuste võrdsust. Sel juhul peaksite proovima tuvastada muude tegurite mõju, lisades need mudelisse, st koostama mitmekordse regressiooni võrrandi: y = a+b 1 x 1 +b 2 +…+b p x p + .

Mitmekordse regressiooni põhieesmärk on koostada mudel suure hulga teguritega, määrates samal ajal nende igaühe mõju eraldi, aga ka nende koosmõju modelleeritavale näitajale. Mudeli spetsifikatsioon sisaldab kahte probleemivahemikku: tegurite valik ja regressioonivõrrandi tüübi valik

Toimetaja valik
Õunapuu õuntega on valdavalt positiivne sümbol. Enamasti lubab see uusi plaane, meeldivaid uudiseid, huvitavaid...

Nikita Mihhalkov tunnistati 2017. aastal kultuuriesindajate seas suurimaks kinnisvaraomanikuks. Ta deklareeris korteri...

Miks sa näed öösel unes kummitust? Unistuste raamat ütleb: selline märk hoiatab vaenlaste mahhinatsioonide, murede, heaolu halvenemise eest....

Nikita Mihhalkov on rahvakunstnik, näitleja, režissöör, produtsent ja stsenarist. Viimastel aastatel on ta tegelenud aktiivselt ettevõtlusega.Sündis aastal...
S. Karatovi unenägude tõlgendus Kui naine unistas nõiast, siis oli tal tugev ja ohtlik rivaal. Kui mees unistas nõiast, siis...
Rohelised alad unenägudes on imeline sümbol, mis tähistab inimese vaimset maailma, tema loominguliste jõudude õitsengut. Märk lubab tervist,...
5 /5 (4) Enda unes nägemine pliidi ääres kokana on tavaliselt hea märk, mis sümboliseerib hästi toidetud elu ja õitsengut. Aga et...
Unenäos olev kuristik on eelseisvate muutuste, võimalike katsumuste ja takistuste sümbol. Sellel süžeel võib aga olla teisigi tõlgendusi....
M.: 2004. - 768 lk. Õpikus käsitletakse sotsioloogilise uurimistöö metoodikat, meetodeid ja tehnikaid. Erilist tähelepanu pööratakse...