Keskmise väärtuse arvutamise valem. Keskmised statistikas


Valdkonna järgi: statistika

Valik number 2

Statistikas kasutatud keskmised

Sissejuhatus …………………………………………………………………………… .3

Teoreetiline ülesanne

Keskmine väärtus statistikas, selle olemus ja kasutustingimused.

1.1. Keskmise suuruse ja kasutustingimuste olemus ...................... 4

1.2. Keskmiste väärtuste tüübid ……………………………………………… 8

Praktiline ülesanne

Ülesanne 1, 2, 3 ………………………………………………………………………… 14

Järeldus …………………………………………………………………………… .21

Kasutatud kirjanduse loetelu ……………………………………………… 23

Sissejuhatus

See test koosneb kahest osast – teoreetilisest ja praktilisest. Teoreetilises osas käsitletakse üksikasjalikult sellist olulist statistilist kategooriat nagu keskmine, et teha kindlaks selle olemus ja kasutustingimused, samuti tuua välja keskmiste tüübid ja nende arvutamise meetodid.

Statistika uurib, nagu teate, massilisi sotsiaal-majanduslikke nähtusi. Kõigil neil nähtustel võib olla sama atribuudi erinev kvantitatiivne väljendus. Näiteks sama eriala töötajate palgad või sama toote turuhinnad jne. Keskmised väärtused iseloomustavad äritegevuse kvalitatiivseid näitajaid: turustuskulud, kasum, kasumlikkus jne.

Erinevate (kvantitatiivselt muutuvate) tunnuste kogumi uurimiseks kasutab statistika keskmisi.

Keskmine essents

Keskmine väärtus on sama tüüpi nähtuste kogumi üldistav kvantitatiivne tunnus ühe muutuva tunnuse järgi. Majanduspraktikas kasutatakse laia valikut näitajaid, mis arvutatakse keskmistena.

Keskmise kõige olulisem omadus on see, et see esindab kogu hulga teatud tunnuse väärtust ühe numbri võrra, hoolimata selle kvantitatiivsetest erinevustest komplekti üksikutes ühikutes, ja väljendab üldist, mis on omane kõigile uuritava hulga ühikutele. . Seega iseloomustab see rahvastiku ühiku tunnuste kaudu kogu populatsiooni tervikuna.

Keskmised väärtused on seotud suurte arvude seadusega. Selle seose olemus seisneb selles, et keskmistamisel üksikute väärtuste juhuslikud kõrvalekalded suurte arvude seaduse toimel tühistavad üksteist ning see tähendab, et peamine arengusuund, vajalikkus ja regulaarsus on paljastatud. Keskmised võimaldavad võrrelda erineva ühikute arvuga populatsioonidega seotud näitajaid.

Kaasaegsetes majanduse turusuhete arengu tingimustes on keskmised sotsiaalmajanduslike nähtuste objektiivsete seaduste uurimise tööriist. Majandusanalüüs ei saa aga piirduda ainult keskmiste näitajatega, sest üldised soodsad keskmised võivad varjata nii suuri tõsiseid puudujääke üksikute majandusüksuste tegevuses kui ka uue, progressiivse võsu. Näiteks rahvastiku jaotus sissetulekute järgi võimaldab tuvastada uute sotsiaalsete rühmade teket. Seetõttu on keskmiste statistiliste andmete kõrval vaja arvestada ka rahvastiku üksikute üksuste tunnuseid.

Keskmine väärtus on kõigi uuritavat nähtust mõjutavate tegurite tulemus. See tähendab, et keskmiste väärtuste arvutamisel tühistatakse juhuslike (häiringu, individuaalsete) tegurite mõju ja seega on võimalik kindlaks teha uuritavale nähtusele omane seaduspärasus. Adolphe Quetelet rõhutas, et keskmiste väärtuste meetodi olulisus seisneb võimaluses üleminekul üksikult üldisele, juhuslikult regulaarsele ning keskmiste väärtuste olemasolu on objektiivse reaalsuse kategooria.

Statistika uurib massinähtusi ja -protsesse. Kõigil neil nähtustel on nii kogu komplektile ühised kui ka erilised individuaalsed omadused. Üksikute nähtuste eristamist nimetatakse variatsiooniks. Teine massinähtuste omadus on nende olemuslik lähedus üksikute nähtuste omadustele. Seega piirab hulga elementide interaktsioon vähemalt osa nende omaduste varieerumist. See tendents eksisteerib objektiivselt. Just selle objektiivsuses peitub põhjus keskmiste väärtuste laialdasemaks rakendamiseks praktikas ja teoorias.

Keskmist väärtust statistikas nimetatakse üldistavaks näitajaks, mis iseloomustab nähtuse tüüpilist taset konkreetsetes koha- ja ajatingimustes, peegeldades muutuva atribuudi väärtust kvalitatiivselt homogeense populatsiooni ühiku kohta.

Majanduspraktikas kasutatakse laia valikut näitajaid, mis arvutatakse keskmistena.

Keskmiste meetodit kasutades lahendab statistika palju probleeme.

Keskmiste põhitähendus seisneb nende üldistavas funktsioonis, st paljude erinevate tunnuse individuaalsete väärtuste asendamises keskmisega, mis iseloomustab kogu nähtuste kogumit.

Kui keskmine võtab kokku tunnuse kvalitatiivselt homogeensed väärtused, siis on see tunnuse tüüpiline tunnus antud populatsioonis.

Siiski on vale taandada keskmiste väärtuste rolli ainult atribuutide tüüpiliste väärtuste tunnusele populatsioonides, mis on antud atribuudi jaoks homogeensed. Praktikas kasutab kaasaegne statistika palju sagedamini keskmisi, mis üldistavad selgelt homogeenseid nähtusi.

Rahvatulu keskmine väärtus elaniku kohta, teravilja keskmine saagikus kogu riigis, erinevate toiduainete keskmine tarbimine - need on riigi kui ühtse rahvamajandussüsteemi tunnused, need on nn süsteemi keskmised. .

Süsteemi keskmised võivad iseloomustada nii üheaegselt eksisteerivaid ruumi- või objektisüsteeme (riik, tööstusharu, piirkond, planeet Maa jne) kui ka ajaliselt pikendatud (aasta, kümnend, aastaaeg jne) dünaamilisi süsteeme.

Keskmise kõige olulisem omadus on see, et see peegeldab üldist, mis on omane kõigile uuritava üldkogumi üksustele. Rahvastiku üksikute üksuste atribuudi väärtused kõiguvad ühes või teises suunas paljude tegurite mõjul, mille hulgas võib olla nii põhilisi kui ka juhuslikke. Näiteks ettevõtte kui terviku aktsiahinna määrab tema finantsseisund. Samas võib teatud päevadel ja teatud börsidel praeguste olude tõttu neid aktsiaid müüa kõrgema või madalama kursiga. Keskmise olemus seisneb selles, et see tühistab juhuslike tegurite toimest põhjustatud kõrvalekalded populatsiooni üksikute üksuste atribuudi väärtustes ja võtab arvesse peamiste tegurite mõjust põhjustatud muutusi. tegurid. See võimaldab keskmisel kajastada tunnuse tüüpilist taset ja võtta välja üksikutele üksustele omased individuaalsed omadused.

Keskmise arvutamine on üks levinumaid üldistusvõtteid; keskmine peegeldab ühist, mis on tüüpiline (tüüpiline) uuritava üldkogumi kõikidele üksustele, samas eirab üksikute üksuste erinevusi. Igas nähtuses ja selle arengus on kombinatsioon juhusest ja vajadusest.

Keskmine on kokkuvõtlik iseloomustus protsessi seaduspärasustest tingimustes, milles see toimub.

Iga keskmine iseloomustab uuritavat populatsiooni mis tahes ühe kriteeriumi jaoks, kuid iga populatsiooni iseloomustamiseks, selle tüüpiliste tunnuste ja kvalitatiivsete tunnuste kirjeldamiseks on vaja keskmiste näitajate süsteemi. Seetõttu arvutatakse sotsiaal-majanduslike nähtuste uurimiseks siseriikliku statistika praktikas reeglina keskmiste näitajate süsteem. Nii hinnatakse näiteks keskmise palga näitajat koos keskmise toodangu, kapitali ja tööjõu suhte ning võimsuse ja tööjõu suhte, töö mehhaniseerituse ja automatiseerituse astme näitajatega jne.

Keskmine tuleks arvutada, võttes arvesse uuritava näitaja majanduslikku sisu. Seetõttu saab sotsiaal-majanduslikus analüüsis kasutatava konkreetse näitaja puhul teaduslikul arvutusmeetodil välja arvutada ainult ühe keskmise tegeliku väärtuse.

Keskmine väärtus on üks olulisemaid üldistavaid statistilisi näitajaid, mis iseloomustavad sama tüüpi nähtuste kogumit mõne kvantitatiivselt muutuva tunnuse järgi. Statistikas on keskmised üldistavad näitajad, arvud, mis väljendavad sotsiaalsete nähtuste tüüpilisi iseloomulikke dimensioone ühes kvantitatiivselt muutuvas atribuudis.

Keskmiste tüübid

Keskmiste väärtuste tüübid erinevad peamiselt selle poolest, millist omadust, millist atribuudi individuaalsete väärtuste algse muutuva massi parameetrit tuleks muutmata jätta.

Aritmeetiline keskmine

Aritmeetiline keskmine on tunnuse selline keskmine väärtus, mille arvutamisel jääb tunnuse kogusumma agregaadis muutumatuks. Vastasel juhul võime öelda, et aritmeetiline keskmine on keskmine. Selle arvutamisel jaotatakse atribuudi kogumaht vaimselt võrdselt kõigi populatsiooni üksuste vahel.

Aritmeetilist keskmist kasutatakse juhul, kui on teada keskmise atribuudi (x) väärtused ja teatud atribuudi (f) väärtusega üldkogumi ühikute arv.

Aritmeetiline keskmine on lihtne ja kaalutud.

Lihtne aritmeetiline keskmine

Lihtsat kasutatakse juhul, kui atribuudi x iga väärtus esineb üks kord, s.t. iga x puhul tunnuse väärtus f = 1 või kui algandmed ei ole järjestatud ja pole teada, mitmel ühikul on teatud tunnusväärtused.

Lihtsa aritmeetilise keskmise valemil on vorm.

,

Enamikul juhtudel on andmed koondunud mõne keskse punkti ümber. Seega piisab mis tahes andmekogumi kirjeldamiseks keskmise väärtuse märkimisest. Vaatleme järjestikku kolme arvulist tunnust, mida kasutatakse jaotuse keskmise väärtuse hindamiseks: aritmeetiline keskmine, mediaan ja moodus.

Keskmine

Aritmeetiline keskmine (mida sageli nimetatakse lihtsalt keskmiseks) on jaotuse keskmise kõige levinum hinnang. See on kõigi vaadeldud arvväärtuste summa jagamise tulemus nende arvuga. Numbrinäidise jaoks X 1, X 2, ..., Xn, valimi keskmine (tähistatud sümboliga ) võrdub = (X 1 + X 2 + ... + Xn) / n, või

kus on valimi keskmine, n- näidissuurus, Xi- valimi i-s element.

Laadige alla märge vormingus või näited vormingus

Kaaluge 15 väga kõrge riskiga investeerimisfondi viie aasta keskmise aastase tootluse aritmeetilise keskmise arvutamist (joonis 1).

Riis. 1. 15 väga kõrge riskiga investeerimisfondi keskmine aastane tootlus

Valimi keskmine arvutatakse järgmiselt:

See on hea tootlus, eriti võrreldes 3–4% sissetulekuga, mida pangad või krediidiühistute hoiustajad sama aja jooksul said. Kui tootlusi sorteerida, on lihtne näha, et kaheksal fondil on suurem tootlus ja seitsmel fondil on keskmisest madalam. Aritmeetiline keskmine toimib tasakaalupunktina, nii et madala sissetulekuga fondid tasakaalustavad suure sissetulekuga fonde. Kõik valimi elemendid on kaasatud keskmise arvutamisse. Ühelgi teisel jaotuse keskmise hinnangul pole seda omadust.

Millal arvutada aritmeetiline keskmine. Kuna aritmeetiline keskmine sõltub kõigist valimi elementidest, mõjutab äärmuslike väärtuste olemasolu tulemust oluliselt. Sellistes olukordades võib aritmeetiline keskmine arvandmete tähendust moonutada. Seetõttu tuleb äärmuslikke väärtusi sisaldava andmekogumi kirjeldamisel märkida mediaan ehk aritmeetiline keskmine ja mediaan. Näiteks kui eemaldada valimist RS Emerging Growth fondi tootlus, siis 14 fondi valimi keskmine tootlus väheneb ligi 1% võrra 5,19%-le.

Mediaan

Mediaan on järjestatud arvude massiivi mediaan. Kui massiiv ei sisalda dubleerivaid numbreid, on pooled selle elementidest mediaanist vähem ja pooled rohkem. Kui valim sisaldab äärmuslikke väärtusi, on keskmise hindamiseks parem kasutada mediaani, mitte aritmeetilist keskmist. Valimi mediaani arvutamiseks tuleb see kõigepealt sorteerida.

See valem on mitmetähenduslik. Selle tulemus sõltub sellest, kas arv on paaris või paaritu. n:

  • Kui valim sisaldab paaritu arvu elemente, on mediaan (n + 1) / 2 th element.
  • Kui valim sisaldab paarisarv elemente, jääb mediaan valimi kahe keskmise elemendi vahele ja on võrdne nende kahe elemendi alusel arvutatud aritmeetilise keskmisega.

15 väga kõrge riskiga investeerimisfondi tootluse valimi mediaani arvutamiseks peate esmalt tellima algandmed (joonis 2). Siis on mediaan valimi keskmise elemendi numbri vastas; meie näites nr 8. Excelil on spetsiaalne funktsioon = MEDIAN (), mis töötab ka järjestamata massiividega.

Riis. 2. Mediaan 15 fondi

Seega on mediaan 6,5. See tähendab, et ühe poolte väga kõrge riskitasemega fondide kasumlikkus ei ületa 6,5, teise poole kasumlikkus aga ei ületa seda. Pange tähele, et mediaan 6,5 ei ole palju kõrgem kui keskmine 6,08.

Kui võtta valimist välja RS Emerging Growth fondi tootlus, siis ülejäänud 14 fondi mediaan väheneb 6,2%-ni ehk mitte nii oluliselt kui aritmeetiline keskmine (joonis 3).

Riis. 3. Mediaan 14 fondi

Mood

Selle termini võttis esmakordselt kasutusele Pearson aastal 1894. Mood on number, mis näidises kõige sagedamini esineb (kõige moekam). Mood kirjeldab hästi näiteks juhtide tüüpilist reaktsiooni fooritulele sõidu lõpetamiseks. Klassikaline näide moekasutusest on toodetava kingade partii suuruse või tapeedi värvi valimine. Kui jaotusel on mitu režiimi, siis öeldakse, et see on multimodaalne või multimodaalne (sellel on kaks või enam tippu). Jaotuse multimodaalsus annab olulist teavet uuritava muutuja olemuse kohta. Näiteks arvamusküsitlustes, kui muutuja esindab eelistust või suhtumist millegi suhtes, võib multimodaalsus tähendada, et on mitu kindlasti erinevat arvamust. Multimodaalsus toimib ka indikaatorina, et valim ei ole homogeenne ja vaatlused võivad olla genereeritud kahe või enama "kattunud" jaotuse kaudu. Erinevalt aritmeetilisest keskmisest ei mõjuta kõrvalekalded moodi. Pidevalt jaotatud juhuslike muutujate puhul, näiteks investeerimisfondide keskmise aastase tootluse näitajate puhul, pole moodi mõnikord üldse olemas (või pole sellel mõtet). Kuna need näitajad võivad omandada väga erinevaid väärtusi, on korduvad väärtused äärmiselt haruldased.

Kvartiilid

Kvartiilid on mõõdikud, mida kasutatakse kõige sagedamini andmete jaotuse hindamiseks suurte numbrivalimite omaduste kirjeldamisel. Kui mediaan jagab järjestatud massiivi pooleks (50% massiivi elementidest on mediaanist väiksemad ja 50% rohkem), jagavad kvartiilid järjestatud andmestiku neljaks osaks. Q 1, mediaan ja Q 3 väärtused on vastavalt 25., 50. ja 75. protsentiil. Esimene kvartiil, Q 1, on arv, mis jagab valimi kaheks osaks: 25% üksustest on vähem ja 75% rohkem kui esimene kvartiil.

Kolmas kvartiil, Q 3, on arv, mis jagab ka valimi kaheks osaks: 75% elemente on vähem ja 25% on rohkem kui kolmas kvartiil.

Kvartiilide arvutamiseks Exceli versioonides enne 2007. aastat kasutati funktsiooni = QUARTILE (massiiv; osa). Alates versioonist Excel2010 kehtivad kaks funktsiooni:

  • = QUARTILE.INC (massiiv, osa)
  • = QUARTILE.EXC (massiiv, osa)

Need kaks funktsiooni annavad veidi erinevad väärtused (joonis 4). Näiteks 15 väga kõrge riskiga investeerimisfondi keskmise aastase tootluse andmeid sisaldava valimi kvartiilide arvutamisel on Q 1 = 1,8 või –0,7 vastavalt QUARTILE.INCL ja QUARTILE.EXCL puhul. Muide, varem kasutatud funktsioon QUARTILE vastab tänapäevasele funktsioonile QUARTILE. Kvartiilide arvutamiseks Excelis ülaltoodud valemite abil pole andmemassiivi vaja järjestada.

Riis. 4. Kvartiilide arvutamine Excelis

Rõhutame veel kord. Excel saab arvutada kvartiile ühemõõtmelise jaoks diskreetne seeria mis sisaldab juhusliku suuruse väärtusi. Sageduspõhise jaotuse kvartiilide arvutamine on toodud allolevas jaotises.

Geomeetriline keskmine

Erinevalt aritmeetilisest keskmisest võimaldab geomeetriline keskmine hinnata muutuja muutumise astet ajas. Geomeetriline keskmine on juur n-th kraad töölt n väärtused (Excelis kasutatakse funktsiooni = SRGEOM):

G= (X 1 * X 2 *… * X n) 1 / n

Sarnane parameeter - tulumäära geomeetriline keskmine - määratakse järgmise valemiga:

G = [(1 + R 1) * (1 + R 2) *… * (1 + R n)] 1 / n - 1,

kus R i- tulumäär i ajaperiood.

Oletagem näiteks, et esialgne investeering on 100 000 dollarit. Esimese aasta lõpuks langeb see 50 000 dollarini ja teise aasta lõpuks taastub see algse 100 000 dollarini. Selle investeeringu tasuvus kaheaastase perioodi jooksul võrdub 0, kuna esialgne ja lõppfond on üksteisega võrdsed. Aasta tulumäärade aritmeetiline keskmine on aga = (–0,5 + 1) / 2 = 0,25 ehk 25%, kuna esimese aasta tootlus R 1 = (50 000 - 100 000) / 100 000 = –0,5 , ja teises R 2 = (100 000 - 50 000) / 50 000 = 1. Samal ajal on kahe aasta kasumimäära geomeetriline keskmine: G = [(1-0,5) * (1 + 1 )] 1 /2 - 1 = ½ - 1 = 1 - 1 = 0. Seega peegeldab geomeetriline keskmine täpsemalt investeeringute mahu muutust (täpsemalt muutuste puudumist) kahe aasta jooksul kui aritmeetiline keskmine.

Huvitavaid fakte. Esiteks on geomeetriline keskmine alati väiksem kui samade arvude aritmeetiline keskmine. Välja arvatud juhul, kui kõik võetud arvud on üksteisega võrdsed. Teiseks, arvestades täisnurkse kolmnurga omadusi, saate aru, miks keskmist nimetatakse geomeetriliseks. Täisnurkse kolmnurga kõrgus, mis on langetatud hüpotenuusile, on võrdeline keskmine jalgade projektsioonide vahel hüpotenuusile ja iga jalg on keskmine proportsionaalne hüpotenuusi ja selle hüpotenuusile projektsiooni vahel (joonis 5). See annab geomeetrilise meetodi kahe segmendi (pikkuse) geomeetrilise keskmise konstrueerimiseks: nende kahe segmendi summale tuleb ehitada ring nagu läbimõõdule, seejärel taastatakse kõrgus nende ühenduspunktist lõikumispunktini. ring annab soovitud väärtuse:

Riis. 5. Geomeetrilise keskmise geomeetriline olemus (joonis Wikipediast)

Arvandmete teine ​​oluline omadus on nende variatsioon iseloomustavad andmete dispersiooni astet. Kaks erinevat proovi võivad erineda nii keskmiste väärtuste kui ka variatsioonide poolest. Kuid nagu on näidatud joonisel fig. 6 ja 7, võib kahel näidisel olla sama variatsioon, kuid erinevad keskmised või samad vahendid ja täiesti erinevad variatsioonid. Hulknurgale B vastavad andmed joonisel fig. 7, muutub palju vähem kui andmed, millel hulknurk A.

Riis. 6. Kaks sümmeetrilist kellukesekujulist jaotust, millel on sama levi ja erinevad keskmised väärtused

Riis. 7. Kaks sümmeetrilist kellakujulist jaotust, millel on samad keskmised väärtused ja erinev hajumine

Andmete varieerumisel on viis hinnangut:

  • ulatus,
  • interkvartiilne vahemik,
  • dispersioon,
  • standardhälve,
  • variatsioonikoefitsient.

Kiik

Vahemik on erinevus valimi suurima ja väikseima elemendi vahel:

Pühkimine = XMax – XMin

Valimi vahemiku, mis sisaldab andmeid 15 väga kõrge riskiga investeerimisfondi keskmise aastatootluse kohta, saab arvutada järjestatud massiivi abil (vt joonis 4): Span = 18,5 - (–6,1) = 24,6. See tähendab, et väga kõrge riskitasemega fondide kõrgeima ja madalaima keskmise aastatootluse vahe on 24,6%.

Span mõõdab andmete üldist hajumist. Kuigi valimi suurus on andmete üldise leviku väga lihtne hinnang, on selle nõrkus see, et see ei võta arvesse seda, kuidas andmed jaotuvad miinimum- ja maksimumelementide vahel. See efekt on selgelt näha joonisel fig. 8, mis illustreerib sama ulatusega proove. Skaala B näitab, et kui valim sisaldab vähemalt ühte äärmuslikku väärtust, osutub valimi ulatus andmete hajumise väga ebatäpseks hinnanguks.

Riis. 8. Kolme sama vahemikuga proovi võrdlus; kolmnurk sümboliseerib tasakaalu toetust ja selle asend vastab valimi keskmisele

Interkvartiilne vahemik

Interkvartiil ehk keskmine vahemik on erinevus valimi kolmanda ja esimese kvartiili vahel:

Kvartiilide vahemik = Q 3 - Q 1

See väärtus võimaldab hinnata 50% elementide levikut ja mitte arvestada äärmuslike elementide mõju. 15 väga kõrge riskiga investeerimisfondi keskmise aastatootluse andmeid sisaldava valimi kvartiilide vahemikku saab arvutada joonisel fig. 4 (näiteks funktsiooni QUARTILE.EXC jaoks): kvartiilidevaheline vahemik = 9,8 – (–0,7) = 10,5. Numbritega 9,8 ja –0,7 piiratud intervalli nimetatakse sageli keskmiseks pooleks.

Tuleb märkida, et Q 1 ja Q 3 väärtused ning seega ka kvartiilidevaheline vahemik ei sõltu kõrvalekallete olemasolust, kuna nende arvutamisel ei võeta arvesse väärtusi, mis oleksid väiksemad kui Q 1 või rohkem. kui Q3. Kvantitatiivsete tunnuste summat, nagu mediaan, esimene ja kolmas kvartiil ning kvartiilidevaheline vahemik, mida kõrvalekalded ei mõjuta, nimetatakse robustseteks mõõtmeteks.

Kuigi vahemik ja kvartiilidevaheline vahemik annavad hinnangu vastavalt valimi üldisele ja keskmisele levikule, ei võta ükski neist hinnangutest arvesse andmete jaotumist. Dispersioon ja standardhälve neil puudub see puudus. Need mõõdikud annavad hinnangu selle kohta, mil määral andmed kõikuvad keskmise ümber. Valimi dispersioon on aritmeetilise keskmise ligikaudne väärtus, mis arvutatakse iga valimi elemendi ja valimi keskmise vahe ruutudest. Valimi X 1, X 2, ... X n korral saadakse valimi dispersioon (tähistatud sümboliga S 2) järgmise valemiga:

Üldiselt on valimi dispersioon valimi elementide ja valimi keskmise erinevuste ruutude summa jagatuna väärtusega, mis on võrdne valimi suurusega miinus üks:

kus - aritmeetiline keskmine, n- näidissuurus, X i - i näidiselement X... Excelis kasutati enne 2007. aastat valimi dispersiooni arvutamiseks funktsiooni = VARP (), alates 2010. aastast on kasutusel funktsioon = VARV ().

Kõige praktilisem ja laialdasemalt aktsepteeritud hinnang andmete leviku kohta on valimi standardhälve... Seda indikaatorit tähistatakse sümboliga S ja see on võrdne valimi dispersiooni ruutjuurega:

Excelis kasutati enne 2007. aastat valimi standardhälbe arvutamiseks funktsiooni = STDEV (), alates 2010. aastast kasutatakse funktsiooni = STDEV.V (). Nende funktsioonide arvutamiseks võib andmestik olla järjestamata.

Valimi dispersioon ega standardhälve ei saa olla negatiivsed. Ainus olukord, kus näitajad S 2 ja S võivad olla nullid, on see, kui kõik valimi elemendid on üksteisega võrdsed. Sel väga ebatõenäolisel juhul on ulatus ja kvartiilide vahemik samuti null.

Numbrilised andmed on oma olemuselt kõikuvad. Iga muutuja võib võtta palju erinevaid väärtusi. Näiteks on erinevatel investeerimisfondidel erinev tulu- ja kahjumäär. Arvandmete varieeruvuse tõttu on väga oluline uurida mitte ainult keskväärtuse hinnanguid, mis on olemuselt kumulatiivsed, vaid ka dispersioonihinnanguid, mis iseloomustavad andmete levikut.

Dispersioon ja standardhälve võimaldavad hinnata andmete levikut keskmise ümber ehk teisisõnu määrata, mitu valimielementi on keskmisest väiksemad ja kui paljud rohkem. Dispersioonil on mõned väärtuslikud matemaatilised omadused. Selle väärtus on aga mõõtühiku ruut – ruutprotsent, ruutdollar, ruuttoll jne. Seetõttu on dispersiooni loomulik mõõde standardhälve, mida väljendatakse tavalistes mõõtühikutes – protsentides sissetulekust, dollarites või tollides.

Standardhälve võimaldab hinnata valimi elementide kõikumise suurust keskmise ümber. Peaaegu kõigis olukordades on suurem osa vaadeldud väärtustest intervallis pluss või miinus üks standardhälve keskmisest. Seega, teades valimi elementide aritmeetilist keskmist ja valimi standardhälvet, on võimalik määrata intervall, kuhu kuulub suurem osa andmetest.

15 väga kõrge riskiga investeerimisfondi tootluse standardhälve on 6,6 (joonis 9). See tähendab, et suurema osa fondide kasumlikkus erineb keskmisest väärtusest mitte rohkem kui 6,6% (st kõigub vahemikus alates - S= 6,2 - 6,6 = -0,4 kuni + S= 12,8). Tegelikult jääb sellesse intervalli viie aasta keskmine aastane tootlus 53,3% (8 15-st) fondidest.

Riis. 9. Valimi standardhälve

Pange tähele, et kui ruudus erinevused liidetakse, võtab keskmisest kaugemal olev valim kaalu juurde kui lähem valim. See omadus on peamine põhjus, miks jaotuse keskmise hindamiseks kasutatakse kõige sagedamini aritmeetilist keskmist.

Variatsioonikoefitsient

Erinevalt varasematest hinnavahe hinnangutest on variatsioonikordaja suhteline hinnang. Seda mõõdetakse alati protsendina, mitte algandmetena. Variatsioonikoefitsient, mida tähistatakse CV-ga, mõõdab andmete hajumist keskmise suhtes. Variatsioonikoefitsient võrdub standardhälbega, mis on jagatud aritmeetilise keskmisega ja korrutatud 100%-ga:

kus S- proovi standardhälve, - näidise keskmine.

Variatsioonikoefitsient võimaldab võrrelda kahte näidist, mille elemendid on väljendatud erinevates mõõtühikutes. Näiteks kavatseb posti kohaletoimetamise juht uuendada veoautoparki. Pakendite laadimisel tuleb arvestada kahte tüüpi piirangutega: iga pakendi kaal (naelates) ja maht (kuupjalgades). Oletame, et 200 kotist koosneva proovi keskmine kaal on 26,0 naela, kaalu standardhälve on 3,9 naela, keskmine koti maht on 8,8 kuupjalga ja mahu standardhälve on 2,2 kuupjalga. Kuidas võrrelda kottide kaalu ja mahu erinevusi?

Kuna kaalu ja mahu mõõtühikud erinevad üksteisest, peab juht võrdlema nende väärtuste suhtelist levikut. Kaalu variatsioonikoefitsient on CV W = 3,9 / 26,0 * 100% = 15% ja mahu variatsioonikoefitsient CV V = 2,2 / 8,8 * 100% = 25%. Seega on pakettide mahu suhteline erinevus palju suurem kui nende kaalu suhteline erinevus.

Jaotusvorm

Valimi kolmas oluline omadus on selle jaotuse kuju. See jaotus võib olla sümmeetriline või asümmeetriline. Jaotuse kuju kirjeldamiseks on vaja arvutada selle keskmine ja mediaan. Kui need kaks näitajat langevad kokku, loetakse muutuja sümmeetriliselt jaotunud. Kui muutuja keskmine väärtus on mediaanist suurem, on selle jaotus positiivse kaldega (joonis 10). Kui mediaan on keskmisest suurem, on muutuja jaotus negatiivselt kallutatud. Positiivne kalduvus ilmneb siis, kui keskmine tõuseb ebatavaliselt kõrgetele väärtustele. Negatiivne kalduvus tekib siis, kui keskmine väheneb ebatavaliselt väikesteks väärtusteks. Muutuja jaotub sümmeetriliselt, kui see ei võta kummaski suunas äärmuslikke väärtusi, nii et muutuja kõrged ja madalad väärtused tasakaalustavad üksteist.

Riis. 10. Kolm tüüpi jaotust

A-skaalal kujutatud andmetel on negatiivne kalduvus. Sellel joonisel on kujutatud pikka saba ja kaldus vasakule, mis on põhjustatud ebatavaliselt madalatest väärtustest. Need äärmiselt väikesed väärtused nihutavad keskmist vasakule ja see muutub mediaanist väiksemaks. B-skaalal näidatud andmed on jaotatud sümmeetriliselt. Jaotuse vasak ja parem pool on nende peegelpildid. Kõrged ja madalad väärtused tühistavad üksteist ning keskmine ja mediaan on võrdsed. B-skaalal näidatud andmed on positiivselt kallutatud. See joonis näitab pikka saba ja kaldu paremale, mis on põhjustatud ebatavaliselt kõrgetest väärtustest. Need liiga kõrged väärtused nihutavad keskmist paremale ja see muutub mediaanist suuremaks.

Excelis saab kirjeldavat statistikat hankida lisandmooduli abil Analüüsi pakett... Minge menüüst läbi AndmedAndmete analüüs, valige avanevas aknas rida Kirjeldav statistika ja klõpsake Okei... Aknas Kirjeldav statistika kindlasti märkige Sisestusintervall(joon. 11). Kui soovite näha kirjeldavat statistikat algandmetega samal lehel, valige raadionupp Väljundi intervall ja määrake lahter, kuhu tuleks paigutada väljundstatistika vasak ülanurk (meie näites $ C $ 1). Kui soovite andmeid väljastada uuele lehele või uude töövihikusse, peate lihtsalt valima vastava raadionupu. Märkige kõrval olev ruut Kokkuvõtlik statistika... Soovi korral saate ka valida Raskusaste,kth väikseim jak-s suurim.

Kui deposiidil Andmed piirkonnas Analüüs teil pole kuvatud ikooni Andmete analüüs, peate esmalt installima lisandmooduli Analüüsi pakett(vt näiteks).

Riis. 11. Väga kõrge riskitasemega fondide viie aasta keskmise aastase tootluse kirjeldav statistika, mis on arvutatud lisandmooduli abil Andmete analüüs Exceli programmid

Excel arvutab mitmesuguseid ülalkirjeldatud statistikat: keskmine, mediaan, režiim, standardhälve, dispersioon, vahemik ( intervall), minimaalne, maksimaalne ja valimi suurus ( Kontrollima). Lisaks arvutab Excel välja mõned meie jaoks uued statistikad: standardviga, kurtoos ja kalduvus. Standardviga võrdne standardhälbega, mis on jagatud valimi suuruse ruutjuurega. Asümmeetria iseloomustab hälvet jaotuse sümmeetriast ja on funktsioon, mis sõltub valimi elementide erinevuste kuubist ja keskmisest. Kurtoos on andmete suhtelise kontsentratsiooni mõõt keskmise ja jaotuse sabade ümber ning see sõltub erinevustest valimi ja neljanda astmeni tõstetud keskmise vahel.

Rahvastiku kirjeldava statistika arvutamine

Eespool käsitletud jaotuse keskmine, levik ja kuju on valimi põhjal määratud omadused. Kui aga andmestik sisaldab kogu populatsiooni numbrilisi dimensioone, saate arvutada selle parameetrid. Need parameetrid hõlmavad üldkogumi matemaatilisi ootusi, dispersiooni ja standardhälvet.

Oodatud väärtus on võrdne üldkogumi kõigi väärtuste summaga, mis on jagatud üldkogumi suurusega:

kus µ - oodatud väärtus, Xi- i-muutuja vaatlus X, N- üldrahvastiku maht. Excel kasutab matemaatilise ootuse arvutamiseks sama funktsiooni, mis aritmeetilise keskmise jaoks: = KESKMINE ().

Rahvastiku dispersioon võrdne üldkogumi ja mati elementide erinevuste ruutude summaga. ootus jagatud üldpopulatsiooni suurusega:

kus σ 2- üldpopulatsiooni dispersioon. Excelis enne 2007. aastat kasutatakse populatsiooni dispersiooni arvutamiseks funktsiooni = VARP (), alates 2010. aastast = VARP.G ().

Populatsiooni standardhälve võrdub populatsiooni dispersiooni ruutjuurega:

Excelis enne 2007. aastat kasutatakse populatsiooni standardhälbe arvutamiseks funktsiooni = STDEVP () alates 2010. aastast = STDEV.Y (). Pange tähele, et üldkogumi dispersiooni ja standardhälbe valemid erinevad valimi dispersiooni ja standardhälbe valemitest. Näidisstatistika arvutamisel S 2 ja S murdosa nimetaja on n - 1, ja parameetrite arvutamisel σ 2 ja σ - üldrahvastiku maht N.

Pöidlareegel

Enamikul juhtudel on suur osa vaatlustest koondunud mediaani ümber, moodustades klastri. Positiivse kaldsusega andmekogumites asub see klaster matemaatilisest ootusest vasakul (st allpool) ja negatiivse kaldususega andmekogumites asub see klaster matemaatilisest ootusest paremal (st ülalpool). Sümmeetriliste andmete puhul on keskmine ja mediaan samad ning vaatlused koonduvad keskmise ümber, moodustades kellakujulise jaotuse. Kui jaotus ei ole väljendunud viltu ja andmed on koondunud teatud raskuskeskme ümber, võib varieeruvuse hindamiseks rakendada rusikareeglit, mis ütleb: kui andmetel on kellakujuline jaotus, siis ligikaudu 68%. vaatlustest ei ole rohkem kui üks standardhälve matemaatilisest ootusest, ligikaudu 95% vaatlustest ei ole rohkem kui kaks standardhälvet matemaatilisest ootusest ja 99,7% vaatlustest ei ole rohkem kui kolm standardhälvet matemaatilisest ootusest.

Seega aitab standardhälve, mis on keskmise variatsiooni hinnang keskmise ümber, mõista, kuidas vaatlused jagunevad, ja tuvastada kõrvalekaldeid. Rusikareeglist tuleneb, et kellakujuliste jaotuste korral erineb ainult üks väärtus kahekümnest matemaatilisest ootusest rohkem kui kahe standardhälbe võrra. Seetõttu väärtused väljaspool intervalli µ ± 2σ, võib pidada kõrvalekalleteks. Lisaks erinevad vaid kolm 1000-st vaatlusest matemaatilisest ootusest rohkem kui kolme standardhälbe võrra. Seega väärtused väljaspool intervalli µ ± 3σ on peaaegu alati kõrvalekalded. Väga viltu või mitte kellukesekujuliste jaotuste puhul saab rakendada Biename-Chebyshev empiirilist reeglit.

Rohkem kui sada aastat tagasi avastasid matemaatikud Biename ja Chebyshev iseseisvalt standardhälbe kasuliku omaduse. Nad leidsid, et mis tahes andmestiku puhul, olenemata jaotuse kujust, on vaatluste protsent, mis asetseb kõige kaugemal kui k standardhälbed matemaatilisest ootusest, mitte vähem (1 – 1/ k 2) * 100%.

Näiteks kui k= 2, Biename-Chebyshev reegel ütleb, et vähemalt (1 - (1/2) 2) x 100% = 75% vaatlustest peab jääma intervallisse µ ± 2σ... See reegel kehtib kõigile k suurem kui üks. Biename-Chebyshev reegel on väga üldine ja kehtib igasuguste distributsioonide puhul. See näitab minimaalset vaatluste arvu, mille kaugus matemaatilisest ootusest ei ületa määratud väärtust. Kui jaotus on aga kellakujuline, hindab rusikareegel andmete kontsentratsiooni eeldatava väärtuse ümber täpsemalt.

Sageduspõhise jaotuse kirjeldava statistika arvutamine

Kui algandmed pole saadaval, muutub sagedusjaotus ainsaks teabeallikaks. Sellistes olukordades saate arvutada kvantitatiivsete jaotusnäitajate ligikaudsed väärtused, nagu aritmeetiline keskmine, standardhälve, kvartiilid.

Kui näidisandmed esitatakse sagedusjaotuse kujul, saab arvutada aritmeetilise keskmise ligikaudse väärtuse, eeldades, et kõik väärtused igas klassis on koondunud klassi keskpunkti:

kus - näidise keskmine, n- vaatluste arv või valimi suurus, koos- sagedusjaotuse klasside arv, m j- keskpunkt j- mine klassi, fj on sagedusele vastav j klass.

Sagedusjaotuse standardhälbe arvutamiseks eeldatakse ka, et kõik väärtused igas klassis on tsentreeritud klassi keskpunktis.

Et mõista, kuidas seeria kvartiilid sageduste alusel määratakse, vaatleme alumise kvartiili arvutamist 2013. aasta andmete põhjal Venemaa rahvastiku jaotuse kohta keskmise rahatulu järgi elaniku kohta (joonis 12).

Riis. 12. Keskmiste rahasissetulekutega Venemaa elanike osakaal keskmiselt kuus, rubla

Intervalli variatsioonirea esimese kvartiili arvutamiseks võite kasutada valemit:

kus Q1 on esimese kvartiili väärtus, хQ1 on esimest kvartiili sisaldava intervalli alumine piir (intervall määratakse kumulatiivse sagedusega, esimene ületab 25%); i on intervalli suurus; Σf on kogu valimi sageduste summa; tõenäoliselt alati 100%; SQ1–1 on alumist kvartiili sisaldavale intervallile eelneva intervalli kumulatiivne sagedus; fQ1 on alumist kvartiili sisaldava intervalli sagedus. Kolmanda kvartiili valem erineb selle poolest, et kõigis kohtades peate Q1 asemel kasutama Q3 ja ¼ asemel asendama ¾.

Meie näites (joonis 12) on alumine kvartiil vahemikus 7000,1 - 10 000, mille kumulatiivne sagedus on 26,4%. Selle intervalli alumine piir on 7000 rubla, intervalli väärtus on 3000 rubla, alumist kvartiili sisaldavale intervallile eelneva intervalli kumulatiivne sagedus on 13,4%, alumist kvartiili sisaldava intervalli sagedus on 13,0%. Seega: Q1 = 7000 + 3000 * (¼ * 100 - 13,4) / 13 = 9677 rubla.

Lõksud kirjeldava statistikaga

Selles postituses vaatlesime, kuidas kirjeldada andmestikku, kasutades erinevat statistikat, mis hindab selle keskmist, levikut ja jaotust. Järgmine samm on andmete analüüs ja tõlgendamine. Siiani oleme uurinud andmete objektiivseid omadusi ja nüüd pöördume nende subjektiivse tõlgendamise poole. Teadlast ootavad kaks viga: valesti valitud analüüsiobjekt ja tulemuste vale tõlgendamine.

15 väga kõrge riskiga investeerimisfondi tootluse analüüs on üsna erapooletu. See tõi kaasa täiesti objektiivsed järeldused: kõik investeerimisfondid on erineva tootlusega, fondi tootluste vahe jääb vahemikku –6,1 kuni 18,5 ning keskmine tootlus on 6,08. Andmeanalüüsi objektiivsuse tagab summaarsete kvantitatiivsete jaotusnäitajate õige valik. Arutati mitmeid keskmise ja andmete leviku hindamise meetodeid, toodi välja nende eelised ja puudused. Kuidas valida õiget statistikat, mis pakub objektiivset ja erapooletut analüüsi? Kui teie andmete jaotus on veidi viltu, kas peaksite valima mediaani aritmeetilise keskmise asemel? Milline näitaja iseloomustab andmete levikut täpsemalt: standardhälve või vahemik? Kas peaks osutama jaotuse positiivsele kalduvusele?

Teisest küljest on andmete tõlgendamine subjektiivne protsess. Erinevad inimesed jõuavad samu tulemusi tõlgendades erinevatele järeldustele. Igaühel on oma vaatenurk. Keegi peab 15 väga kõrge riskitasemega fondi aastase keskmise kasumlikkuse kogunäitajaid heaks ja on saadud tuluga üsna rahul. Teised võivad arvata, et nende fondide tootlus on liiga madal. Seega peaks subjektiivsust kompenseerima ausus, neutraalsus ja järelduste selgus.

Eetilised probleemid

Andmeanalüüs on lahutamatult seotud eetiliste küsimustega. Kriitiline peaks olema ajalehtede, raadio, televisiooni ja Interneti kaudu levitatava teabe suhtes. Aja jooksul õpite olema skeptiline mitte ainult tulemuste, vaid ka uurimistöö eesmärkide, teema ja objektiivsuse suhtes. Kuulus Briti poliitik Benjamin Disraeli ütles seda kõige paremini: "Valet on kolme tüüpi: valed, jultunud valed ja statistika."

Nagu märkuses märgitud, tekivad aruannete esitamise tulemuste valikul eetilised probleemid. Avaldada tuleks nii positiivsed kui ka negatiivsed tulemused. Lisaks tuleb aruande või kirjaliku aruande tegemisel tulemused esitada ausalt, neutraalselt ja objektiivselt. Tehke vahet ebaõnnestunud ja ebaausal esitlusel. Selleks on vaja kindlaks teha, millised olid kõneleja kavatsused. Mõnikord jätab esineja teadmatusest olulise teabe vahele ja mõnikord - tahtlikult (näiteks kui ta kasutab soovitud tulemuse saamiseks aritmeetilist keskmist selgelt asümmeetriliste andmete keskmise hindamiseks). Samuti on ebaõiglane varjutada tulemusi, mis ei vasta uurija vaatenurgale.

Kasutatud materjale raamatust Levin ja muu Statistika juhtidele. - M .: Williams, 2004 .-- lk. 178-209

Funktsioon QUARTILE on säilitatud Exceli varasemate versioonidega ühilduvuse tagamiseks

Kokkuvõtte ja rühmitamise tulemuste analüüsimiseks ja statistiliste järelduste tegemiseks arvutatakse üldistavad näitajad - keskmised ja suhtelised väärtused.

Keskmise väärtuse probleem - iseloomustada kõiki statistilise üldkogumi üksusi ühe tunnuse väärtusega.

Keskmised väärtused iseloomustavad ettevõtlustegevuse kvalitatiivseid näitajaid: turustuskulud, kasum, kasumlikkus jne.

keskmine väärtus- See on populatsiooni ühikute üldistav omadus mõne muutuva atribuudi puhul.

Keskmised väärtused võimaldavad võrrelda sama tunnuse taset erinevates populatsioonides ja leida nende erinevuste põhjused.

Uuritavate nähtuste analüüsimisel on keskmiste väärtuste roll tohutu. Inglise majandusteadlane W. Petty (1623-1687) kasutas laialdaselt keskmisi. V. Petty soovis kasutada keskmisi väärtusi, et mõõta keskmise päevase toidukulu ühe töötaja kohta. Keskmise väärtuse stabiilsus peegeldab uuritavate protsesside mustreid. Ta uskus, et teavet saab teisendada, isegi kui algandmeid pole piisavalt.

Inglise teadlane G. King (1648-1712) kasutas Inglismaa rahvastiku andmete analüüsimisel keskmisi ja suhtelisi väärtusi.

Belgia statistiku A. Quetelet' (1796-1874) teoreetilised arengud põhinevad sotsiaalsete nähtuste vastuolulisusel - massiliselt väga stabiilsel, kuid puhtalt individuaalsel.

A. Quetelet’ järgi mõjuvad püsivad põhjused igale uuritavale nähtusele ühtemoodi ja muudavad need nähtused üksteisega sarnaseks, loovad neile kõigile ühiseid seaduspärasusi.

A. Quetelet' õpetuste tagajärg oli keskmiste väärtuste määramine statistilise analüüsi peamise meetodina. Ta ütles, et statistilised keskmised ei ole objektiivse reaalsuse kategooria.

A. Quetelet väljendas oma seisukohti keskmise kohta oma keskmise inimese teoorias. Keskmine inimene on inimene, kellel on kõik keskmise suurusega omadused (keskmine suremus või sündimuskordaja, keskmine pikkus ja kaal, keskmine jooksukiirus, keskmine kalduvus abielluda ja enesetapuks, heategudeks jne). A. Quetelet’ jaoks on keskmine inimene inimese ideaal. Keskmise inimese A. Quetelet' teooria ebaühtlust tõestas vene statistikakirjandus XIX-XX sajandi lõpus.

Kuulus vene statistik Yu. E. Yanson (1835-1893) kirjutas, et A. Quetelet eeldab keskmise inimese tüübi olemasolu looduses kui midagi ette antud, millest elu on tõrjunud antud ühiskonna ja antud keskmised inimesed. aega ja see viib ta täiesti mehaanilise vaate ja ühiskonnaelu liikumise seaduspärasusteni: liikumine on inimese keskmiste omaduste järkjärguline tõus, tüübi järkjärguline taastamine; järelikult selline ühiskondliku keha elu kõigi ilmingute nivelleerimine, mille järel igasugune edasiliikumine lakkab.

Selle teooria olemus leidis oma edasise arengu mitmete statistikateoreetikute töödes tõeliste väärtuste teooriana. A. Queteletil oli järgijaid - saksa majandusteadlane ja statistik V. Lexis (1837-1914), kes kandis tõeliste väärtuste teooria üle ühiskonnaelu majanduslikele nähtustele. Tema teooriat tuntakse stabiilsuse teooriana. Teist tüüpi idealistlik keskmiste teooria põhineb filosoofial

Selle asutaja, inglise statistik A. Bowley (1869–1957), on uusaja silmapaistvamaid teoreetikuid keskmiste teooria alal. Tema kontseptsioon keskmistest on välja toodud raamatus Elements of Statistics.

A. Bowley arvestab keskmisi väärtusi ainult kvantitatiivsest küljest, eraldades seeläbi kvantiteedi kvaliteedist. Keskmiste väärtuste (või "nende funktsiooni") tähenduse määramisel esitab A. Bowley Machi mõtlemise põhimõtte. A. Bowley kirjutas, et vahendite funktsioon peaks väljendama kompleksset rühma

kasutades mõnda algarvu. Statistilisi andmeid tuleks lihtsustada, rühmitada ja taandada keskmisteks. Neid seisukohti jagasid R. Fisher (1890-1968), J. Yule (1871-1951), Frederick S. Mills (1892) jt.

30ndatel. XX sajand. ja järgnevatel aastatel käsitletakse keskmist väärtust sotsiaalselt olulise tunnusena, mille infosisu sõltub andmete homogeensusest.

Itaalia koolkonna silmapaistvamad esindajad R. Benini (1862-1956) ja C. Gini (1884-1965), pidades statistikat loogikaharuks, laiendasid statistilise induktsiooni ulatust, kuid nad ühendasid loogika kognitiivseid printsiipe ja statistika koos uuritavate nähtuste olemusega, järgides statistika sotsioloogilise tõlgendamise traditsioone.

K. Marxi ja V. I. Lenini töödes omistatakse keskmistele väärtustele eriline roll.

K. Marx väitis, et keskmises väärtuses kustuvad üksikud kõrvalekalded üldisest tasemest ja keskmine tase muutub massinähtuse üldistavaks tunnuseks. Keskväärtus muutub selliseks massinähtuse tunnuseks alles siis, kui võtta märkimisväärne arv ühikuid. ja need üksused on kvalitatiivselt homogeensed. Marx kirjutas, et leitud keskmine väärtus oli "paljude erinevate sama tüüpi individuaalsete väärtuste keskmine".

Keskmine väärtus on turumajanduses eriti oluline. See aitab kindlaks teha vajaliku ja üldise, majandusarengu seaduste tendentsi otse läbi individuaalse ja juhusliku.

Keskmised väärtused on üldistavad näitajad, milles väljendub üldtingimuste toime, uuritava nähtuse regulaarsus.

Statistilised keskmised arvutatakse statistiliselt korrektselt korraldatud massivaatluse massiandmete põhjal. Kui statistiline keskmine arvutatakse kvalitatiivselt homogeense populatsiooni (massinähtuste) massiandmetest, siis on see objektiivne.

Keskmine on abstraktne, kuna see iseloomustab abstraktse ühiku väärtust.

Keskmine on võetud üksikute objektide atribuutide mitmekesisusest. Abstraktsioon on teadusliku uurimistöö etapp. Keskmiselt realiseerub üksikisiku ja üldise dialektiline ühtsus.

Keskmisi väärtusi tuleks kohaldada indiviidi ja üldise, üksiku ja massi kategooriate dialektilise mõistmise alusel.

Keskmine peegeldab midagi ühist, mis liidetakse kindlas üksikus objektis.

Massiliste sotsiaalsete protsesside mustrite tuvastamiseks on keskmine väärtus väga oluline.

Indiviidi kõrvalekaldumine üldisest on arenguprotsessi ilming.

Keskmine väärtus peegeldab uuritavate nähtuste iseloomulikku, tüüpilist, tegelikku taset. Keskmiste ülesanne on iseloomustada neid tasemeid ja nende muutusi ajas ja ruumis.

Keskmine on tavaline väärtus, kuna see kujuneb teatud massinähtuse normaalsetes, loomulikes, üldistes tingimustes, kui seda tervikuna vaadelda.

Statistilise protsessi või nähtuse objektiivset omadust peegeldab keskmine väärtus.

Uuritava statistilise tunnuse individuaalsed väärtused populatsiooni iga ühiku kohta on erinevad. Üht tüüpi individuaalsete väärtuste keskmine väärtus on vajaduse tulemus, mis on kõigi elanikkonna üksuste koondtegevuse tulemus, mis väljendub korduvate õnnetuste massis.

Mõnel üksikul nähtusel on märke, mis esinevad kõigis nähtustes, kuid erinevates kogustes – see on inimese pikkus või vanus. Individuaalse nähtuse muud märgid, mis on erinevates nähtustes kvalitatiivselt erinevad, see tähendab, et need esinevad mõnel ja teistel neid ei täheldata (mehest ei saa naist). Keskmine väärtus arvutatakse kvalitatiivselt homogeensete ja ainult kvantitatiivselt erinevate tunnuste jaoks, mis on omased kõikidele antud populatsiooni nähtustele.

Keskmine väärtus peegeldab uuritava tunnuse väärtusi ja seda mõõdetakse selle tunnusega samas mõõdus.

Dialektilise materialismi teooria õpetab, et kõik maailmas muutub ja areneb. Ja ka keskmised väärtused iseloomustavad märgid muutuvad ja vastavalt ka keskmised väärtused ise.

Elus toimub pidev millegi uue loomise protsess. Üksikud objektid on uue kvaliteedi kandjad, siis nende objektide arv suureneb ja uus muutub massiliseks, tüüpiliseks.

Keskmine väärtus iseloomustab uuritavat populatsiooni ainult ühe tunnuse järgi. Uuritud populatsiooni täielikuks ja terviklikuks esitlemiseks mitmete spetsiifiliste tunnuste jaoks on vaja keskmiste väärtuste süsteemi, mis kirjeldaks nähtust erinevatest vaatenurkadest.

2. Keskmiste väärtuste tüübid

Materjali statistilisel töötlemisel tekivad erinevad lahendamist vajavad probleemid ja seetõttu kasutatakse statistilises praktikas erinevaid keskmisi väärtusi. Matemaatilises statistikas kasutatakse erinevaid keskmisi, näiteks: aritmeetiline keskmine; geomeetriline keskmine; keskmine harmooniline; ruutkeskmine.

Ühe ülaltoodud keskmise tüüpide rakendamiseks on vaja analüüsida uuritavat üldkogumit, määrata uuritava nähtuse aineline sisu, seda kõike tehakse kaalumisel tulemuste mõttekuse põhimõttest saadud järelduste alusel. või summeerides.

Keskmiste uurimisel kasutatakse järgmisi näitajaid ja tähistusi.

Märki, mille järgi keskmine asub, nimetatakse keskmistatud funktsioon ja on tähistatud x-ga; nimetatakse statistilise üldkogumi mis tahes ühiku keskmistatud tunnuse väärtust selle individuaalne tähendus, või valikuid ja tähistatud kui x 1 , NS 2 , x 3 ,… NS NS ; sagedus on karakteristiku üksikute väärtuste korratavus, mida tähistatakse tähega f.

Aritmeetiline keskmine

Üks levinumaid meediumitüüpe - aritmeetiline keskmine, mis arvutatakse siis, kui keskmistatud atribuudi maht moodustatakse selle väärtuste summana uuritud statistilise üldkogumi üksikute üksuste jaoks.

Aritmeetilise keskmise arvutamiseks jagatakse tunnuse kõigi tasemete summa nende arvuga.


Kui mõned valikud esinevad mitu korda, siis saab tunnuse tasemete summa saada, korrutades iga taseme vastava üldkogumi ühikute arvuga, millele järgneb saadud korrutiste liitmine, selliselt arvutatud aritmeetiline keskmine on nimetatakse kaalutud aritmeetiliseks keskmiseks.

Aritmeetilise kaalutud keskmise valem on järgmine:


kus i - valikud,

f i - sagedused või kaalud.

Kaalutud keskmist tuleks kasutada kõigil juhtudel, kui variantidel on erinevad numbrid.

Aritmeetiline keskmine jaotab justkui võrdselt üksikute objektide vahel atribuudi koguväärtuse, mis tegelikkuses on igaühe puhul erinev.

Keskmiste väärtuste arvutamine toimub vastavalt andmetele, mis on rühmitatud jaotuse intervallide seeriate kujul, kui atribuudi variandid, millest keskmine arvutatakse, esitatakse intervallidena (alates - kuni ).

Aritmeetilise keskmise omadused:

1) muutuvate väärtuste summa aritmeetiline keskmine on võrdne aritmeetiliste keskmiste väärtuste summaga: Kui x i = y i + z i, siis


See omadus näitab, millistel juhtudel saab keskmisi väärtusi summeerida.

2) varieeruva atribuudi üksikute väärtuste keskmisest kõrvalekallete algebraline summa on võrdne nulliga, kuna ühesuunaliste kõrvalekallete summa hüvitatakse teises suunas kõrvalekallete summaga:


See reegel näitab, et keskmine on resultant.

3) kui seeria kõiki variante suurendatakse või vähendatakse sama arvu võrra?, kas keskmine suureneb või väheneb sama numbri võrra?:


4) kui kõiki rea variante suurendatakse või vähendatakse A korda, siis ka keskmine suureneb või väheneb A korda:


5) keskmise viies omadus näitab meile, et see ei sõltu kaalude suurusest, vaid sõltub nendevahelisest suhtest. Kaaludena saab võtta mitte ainult suhtelisi, vaid ka absoluutväärtusi.

Kui kõik seeria sagedused jagada või korrutada sama arvuga d, siis keskmine ei muutu.


Keskmine harmooniline. Aritmeetilise keskmise määramiseks on vaja mitmeid valikuid ja sagedusi, st väärtusi NS ja f.

Oletame, et tunnuse individuaalsed väärtused on teada NS ja töötab NS/, ja sagedused f teadmata, siis keskmise arvutamiseks tähistame korrutist = NS/; kus:



Keskmist sellel kujul nimetatakse harmooniliseks kaalutud keskmiseks ja seda tähistatakse x kahju. nt

Sellest lähtuvalt on harmooniline keskmine identne aritmeetilise keskmisega. Seda kohaldatakse juhul, kui tegelik kaal pole teada. f, ja toode on teada fx = z

Millal töötab fx on samad või võrdsed ühikud (m = 1), kasutatakse lihtsat harmoonilist keskmist, mis arvutatakse järgmise valemiga:


kus NS- individuaalsed valikud;

n- number.

Geomeetriline keskmine

Kui kasvumäärasid on n, on keskmise kiiruse valem järgmine:


See on geomeetrilise keskmise valem.

Geomeetriline keskmine on võrdne võimsuse juurega n kasvutegurite korrutisest, iseloomustades iga järgneva perioodi väärtuse ja eelmise perioodi väärtuse suhet.

Kui ruutfunktsioonidena väljendatud väärtused tuleb keskmistada, kasutatakse ruutkeskmist. Näiteks ruutkeskmise abil saate määrata torude, rataste jne läbimõõdud.

Lihtsa ruutkeskmise määramiseks eraldatakse ruutjuur tunnuse üksikute väärtuste ruutude summa jagatisest nende arvuga.


Kaalutud keskmine ruut on:

3. Struktuursed vahendid. Mood ja mediaan

Statistilise üldkogumi struktuuri iseloomustamiseks kasutatakse näitajaid, mida nimetatakse struktuursed keskmised. Nende hulka kuuluvad mood ja mediaan.

Mood (M O ) - kõige levinum variant. Mood nimetatakse tunnuse väärtuseks, mis vastab teoreetilise jaotuskõvera maksimumpunktile.

Mood esindab kõige tavalisemat või tüüpilisemat tähendust.

Moodi kasutatakse kaubanduspraktikas tarbijate nõudluse uurimiseks ja hindade registreerimiseks.

Diskreetses reas on režiimiks kõrgeima sagedusega variant. Intervalli variatsioonide seerias peetakse režiimi intervalli keskseks variandiks, millel on kõrgeim sagedus (eriti).

Intervalli sees on vaja leida tunnuse väärtus, milleks on režiim.


kus NS O- modaalintervalli alumine piir;

h- modaalintervalli väärtus;

f m- modaalintervalli sagedus;

f t-1 - modaalile eelneva intervalli sagedus;

f m+1 on modaalile järgneva intervalli sagedus.

Režiim sõltub rühmade suurusest, rühmade piiride täpsest asukohast.

Mood- kõige sagedamini esinev arv (on teatud väärtus), millel on praktikas kõige laiem rakendus (kõige levinum ostjatüüp).

Mediaan (M e- See on väärtus, mis jagab järjestatud variatsiooniseeriate arvu kaheks võrdseks osaks: ühel osal on muutuva atribuudi väärtused keskmisest variandist väiksemad ja teises on suured.

Mediaan On element, mis on suurem või võrdne jaotuserea ülejäänud elementidest ja samal ajal väiksem või võrdne poolega.

Mediaani omadus on see, et atribuudi väärtuste absoluutsete kõrvalekallete summa mediaanist on väiksem kui mis tahes muust väärtusest.

Mediaani kasutamine annab täpsemad tulemused kui muud vahendid.

Intervallide variatsioonirea mediaani leidmise järjekord on järgmine: järjestame atribuudi individuaalsed väärtused järjestuse järgi; määrame antud järjestatud seeria akumuleeritud sagedused; akumuleeritud sageduste andmete põhjal leiame mediaanintervalli:


kus x mina- mediaanintervalli alumine piir;

i Mina- mediaanintervalli väärtus;

f / 2- seeria sageduste poolsumma;

S Mina-1 - mediaanintervallile eelnevate akumuleeritud sageduste summa;

f Mina Kas mediaanintervalli sagedus.

Mediaan jagab rea arvu pooleks, seega on see koht, kus akumuleeritud sagedus on pool või üle poole sageduste kogusummast ja eelnev (akumuleeritud) sagedus on väiksem kui pool populatsiooni suurusest.

Keskmised väärtused on statistikas laialt levinud. Keskmised väärtused iseloomustavad äritegevuse kvalitatiivseid näitajaid: turustuskulud, kasum, kasumlikkus jne.

Keskmine on üks levinumaid üldistustehnikaid. Keskmise olemuse õige mõistmine määrab selle erilise tähtsuse turumajanduse tingimustes, kui keskmine võimaldab üksiku ja juhusliku kaudu tuvastada üldist ja vajalikku, paljastada seaduste tendentsi. majandusareng.

keskmine väärtus - need on üldistavad näitajad, milles väljendatakse uuritava nähtuse üldiste tingimuste, mustrite toimet.

Statistilised keskmised arvutatakse õigesti statistiliselt korraldatud massivaatluse (pideva ja valikulise) massiandmete põhjal. Statistiline keskmine on aga objektiivne ja tüüpiline, kui see arvutatakse kvalitatiivselt homogeense populatsiooni (massinähtused) massiandmete põhjal. Näiteks kui arvutada ühistute ja riigiettevõtete keskmine palk ja laiendada tulemus kogu elanikkonnale, siis on keskmine fiktiivne, kuna see arvutatakse heterogeense elanikkonna kohta ja selline keskmine kaotab igasuguse tähenduse.

Keskmise abil toimub justkui atribuudi väärtuse erinevuste silumine, mis ühel või teisel põhjusel üksikutes vaatlusühikutes tekivad.

Näiteks müüja keskmine toodang sõltub paljudest põhjustest: kvalifikatsioon, tööstaaž, vanus, teenistuse vorm, tervis jne.

Keskmine toodang peegeldab kogu elanikkonna üldist omadust.

Keskmine väärtus peegeldab uuritava tunnuse väärtusi, seetõttu mõõdetakse seda selle tunnusega samas mõõdus.

Iga keskmine väärtus iseloomustab uuritud populatsiooni mis tahes atribuudi puhul. Uuritavast populatsioonist mitmete oluliste tunnuste osas täieliku ja tervikliku pildi saamiseks on üldiselt vaja keskmiste väärtuste süsteemi, mis kirjeldaks nähtust erinevate nurkade alt.

Keskmisi on erinevaid:

    aritmeetiline keskmine;

    geomeetriline keskmine;

    keskmine harmooniline;

    ruutkeskmine;

    keskmine kronoloogiline.

Vaatleme mõnda tüüpi keskmisi, mida statistikas kõige sagedamini kasutatakse.

Aritmeetiline keskmine

Lihtne aritmeetiline keskmine (kaalumata) võrdub atribuudi üksikute väärtuste summaga, mis on jagatud nende väärtuste arvuga.

Funktsiooni üksikuid väärtusi nimetatakse variantideks ja neid tähistatakse x-ga (); ühikute arvu üldkogumis tähistatakse n-ga, tunnuse keskmist väärtust tähistatakse tähega ... Seetõttu on lihtne aritmeetiline keskmine:

Diskreetse jaotusseeria andmetel on näha, et atribuudi (variantide) samu väärtusi korratakse mitu korda. Niisiis, valik x esineb kokku 2 korda ja variant x - 16 korda jne.

Tunnuse identsete väärtuste arvu jaotuseseerias nimetatakse sageduseks või kaaluks ja seda tähistatakse sümboliga n.

Arvutame välja ühe töölise keskmise palga rublades:

Iga töötajate rühma palgakulu võrdub optsioonide korrutisega sagedusega ja nende toodete summa annab kõigi töötajate kogupalgasumma.

Vastavalt sellele saab arvutused esitada üldkujul:

Saadud valemit nimetatakse kaalutud aritmeetiliseks keskmiseks.

Töötlemise tulemusena saadud statistilist materjali saab esitada mitte ainult diskreetsete jaotusridadena, vaid ka suletud või avatud intervallidega intervallvariatsiooniridadena.

Grupeeritud andmete keskmine arvutatakse aritmeetilise kaalutud keskmise valemi järgi:

Majandusstatistika praktikas on mõnikord vaja arvutada keskmist rühmade kaupa või elanikkonna üksikute osade (eravahendite) abil. Sellistel juhtudel võetakse valikutena (x) grupi- või osakeskmised, mille alusel arvutatakse kogukeskmine tavalise kaalutud aritmeetilise keskmisena.

Aritmeetilise keskmise põhiomadused .

Aritmeetilisel keskmisel on mitmeid omadusi:

1. Atribuudi x iga väärtuse sageduste vähenemisest või suurenemisest n korda aritmeetilise keskmise väärtus ei muutu.

Kui kõik sagedused jagada või korrutada suvalise arvuga, siis keskmise väärtus ei muutu.

2. Atribuudi üksikute väärtuste ühisteguri võib keskmisest märgist välja võtta:

3. Kahe või enama väärtuse summa (erinevus) keskmine on võrdne nende keskmise summaga (erinevus):

4. Kui x = c, kus c on konstant, siis
.

5. Atribuudi X väärtuste kõrvalekallete summa aritmeetilisest keskmisest x on võrdne nulliga:

Keskmine harmooniline.

Statistika kasutab koos aritmeetilise keskmisega harmoonilist keskmist, atribuudi vastastikuste väärtuste aritmeetilise keskmise pöördväärtust. Nagu aritmeetiline keskmine, võib see olla lihtne ja kaalutud.

Variatsioonirea karakteristikud koos keskmisega on režiim ja mediaan.

Mood - See on tunnuse (valiku) väärtus, mida kõige sagedamini korratakse uuritavas populatsioonis. Diskreetsete jaotusseeriate puhul on režiimiks kõrgeima sagedusega variandi väärtus.

Võrdsete intervallidega jaotuse intervallide jaoks määratakse režiim järgmise valemiga:

kus
- režiimi sisaldava intervalli algväärtus;

- modaalintervalli väärtus;

- modaalintervalli sagedus;

- modaalile eelneva intervalli sagedus;

on modaalile järgneva intervalli sagedus.

Mediaan - see on variant, mis asub variatsiooniseeria keskel. Kui jaotusseeria on diskreetne ja paaritu arvu liikmetega, on mediaan järjestatud rea keskel asuv valik (järjestatud rida on rahvastiku ühikute paigutus kasvavas või kahanevas järjekorras).

Kõige tavalisem keskmise tüüp on aritmeetiline keskmine.

Lihtne aritmeetiline keskmine

Lihtne aritmeetiline keskmine on keskmine liige, mille määramisel jaotatakse antud tunnuse kogumaht andmetes võrdselt kõigi selles komplektis sisalduvate ühikute vahel. Seega on keskmine aastane toodang töötaja kohta toodangu kogus, mis langeks igale töötajale, kui kogu toodangumaht jaguneks võrdselt kõigi organisatsiooni töötajate vahel. Aritmeetiline keskmine lihtväärtus arvutatakse järgmise valemiga:

Lihtne aritmeetiline keskmine- võrdub objekti üksikute väärtuste summa ja koondtunnuste arvu suhtega

Näide 1 ... 6-liikmeline meeskond saab 3 3,2 3,3 3,5 3,8 3,1 tuhat rubla kuus.

Leidke keskmine palk
Lahendus: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 tuhat rubla.

Kaalutud aritmeetiline keskmine

Kui andmestiku maht on suur ja esindab jaotusrida, siis arvutatakse kaalutud aritmeetiline keskmine. Nii määratakse toodanguühiku kaalutud keskmine hind: tootmise kogumaksumus (selle koguse toodete summa toodanguühiku hinnaga) jagatakse toodangu kogumahuga.

Esitame seda järgmise valemi kujul:

Kaalutud aritmeetiline keskmine- on võrdne (tunnuse väärtuse ja antud tunnuse kordussageduse korrutiste summa) suhtega (kõikide tunnuste sageduste summa) .Seda kasutatakse siis, kui uuritud variandid rahvastikust esineb ebavõrdne arv kordi.

Näide 2 ... Leia töökoja töötaja keskmine kuupalk

Keskmise palga saab, jagades kogupalga töötajate koguarvuga:

Vastus: 3,35 tuhat rubla.

Intervallide jadade aritmeetiline keskmine

Intervalli variatsioonirea aritmeetilise keskmise arvutamisel määrake esmalt iga intervalli keskmine ülemise ja alumise piiri poolsummana ning seejärel kogu seeria keskmine. Avatud intervallide puhul määrab alumise või ülemise intervalli väärtuse nendega külgnevate intervallide suurus.

Intervalli seeriatest arvutatud keskmised on ligikaudsed.

Näide 3... Määrake õhtuste õpilaste keskmine vanus.

Intervalli seeriatest arvutatud keskmised on ligikaudsed. Nende lähendamise määr sõltub sellest, mil määral läheneb populatsiooniüksuste tegelik jaotus intervalli sees ühtlaseks.

Keskmiste arvutamisel saab kaaludena kasutada mitte ainult absoluutseid, vaid ka suhtelisi väärtusi (sagedust):

Aritmeetilisel keskmisel on mitmeid omadusi, mis paljastavad selle olemuse täielikumalt ja lihtsustavad arvutamist:

1. Keskmise korrutis sageduste summaga on alati võrdne variandi korrutiste summaga sageduste kaupa, s.o.

2. Erinevate suuruste summa aritmeetiline keskmine on võrdne nende suuruste aritmeetilise keskmise summaga:

3. Atribuudi üksikute väärtuste keskmisest kõrvalekallete algebraline summa on võrdne nulliga:

4. Variantide keskmisest kõrvalekallete ruutude summa on väiksem kui mis tahes muu suvalise väärtuse kõrvalekallete ruutude summa, s.o.

Toimetaja valik
Kus kogu romaan on lihtsalt armastuse teemast läbi imbunud. See teema on kõigile lähedane, seetõttu loetakse teost hõlpsalt ja mõnuga ...

Teoste kogumik: Oblomov ja oblomovism kui vene elu fenomen I. A. Gontšarovi romaan Oblomov ilmus 1859. aastal, et ...

Prostakov, kelle iseloomustus on käesoleva arvustuse teema, on D.I.Fonvizini kuulsa komöödia alaealine tegelane ...

Klassitsismi ja romantismi traditsioonid ühendav A.S. Gribojedovi värss "Häda vaimukust" on üks eredamaid ...
Paljude inimeste meelest, kes pole isegi A. Greeni loominguga kursis, seostub fraas "punased purjed" tugevalt mõistega "unistus" ...
Otsige sellist ja sellist kirujat nagu meie Savel Prokofich! .. Ka-banikha on ka hea. A. Ostrovski. Äikesetorm Tema draamas "The Thunderstorm" ...
1. variant Petr Andreevitš Grinev (Petrusha) on loo peategelane. Tema nimel toimub jutustamine (vormis "märkmed mälestuseks ...
Pärisnimi: Daniil German Daniil Aleksandrovitš Granin - vene prosaist, stsenarist ja publitsist, üks juhtivaid meistreid ...
Iseloomu tugevus on omamoodi indikaator, mis näitab inimese võimet säilitada ja kaitsta end inimesena. Mis on jõud...