Jak obliczyć odchylenie standardowe. Odchylenie standardowe


Zdefiniowana jako uogólniająca cecha wielkości zmienności cechy w agregacie. Jest on równy pierwiastkowi kwadratowemu średniego kwadratowego odchylenia poszczególnych wartości atrybutu od średniej arytmetycznej, tj. Korzeń i można znaleźć w następujący sposób:

1. Dla wiersza podstawowego:

2. Dla serii zmian:

Transformacja wzoru na odchylenie standardowe sprowadza go do postaci wygodniejszej w praktycznych obliczeniach:

Odchylenie standardowe określa, o ile średnio poszczególne opcje odbiegają od ich średniej wartości, jest także bezwzględną miarą zmienności cechy i wyraża się w tych samych jednostkach co opcje, a zatem jest dobrze interpretowany.

Przykłady znajdowania odchylenia standardowego: ,

W przypadku alternatywnych charakterystyk wzór na odchylenie standardowe wygląda następująco:

gdzie p jest odsetkiem jednostek w populacji, które mają określoną cechę;

q to odsetek jednostek, które nie mają tej cechy.

Pojęcie średniego odchylenia liniowego

Średnie odchylenie liniowe definiuje się jako średnią arytmetyczną wartości bezwzględnych odchyleń poszczególnych opcji od .

1. Dla wiersza podstawowego:

2. Dla serii zmian:

gdzie suma n wynosi suma częstości szeregów zmienności.

Przykład znalezienia średniego odchylenia liniowego:

Przewaga średniego odchylenia bezwzględnego jako miary rozproszenia w zakresie zmienności jest oczywista, gdyż miara ta polega na uwzględnieniu wszystkich możliwych odchyleń. Ale ten wskaźnik ma znaczące wady. Arbitralne odrzucenie algebraicznych znaków odchyleń może prowadzić do tego, że właściwości matematyczne tego wskaźnika są dalekie od elementarnych. To sprawia, że ​​bardzo trudno jest zastosować średnie odchylenie bezwzględne przy rozwiązywaniu problemów obejmujących obliczenia probabilistyczne.

Dlatego też średnie odchylenie liniowe jako miara zmienności cechy jest rzadko stosowane w praktyce statystycznej, a mianowicie wtedy, gdy sumowanie wskaźników bez uwzględnienia znaków ma sens ekonomiczny. Za jego pomocą analizowane są na przykład obroty handlu zagranicznego, skład pracowników, rytm produkcji itp.

Średnia kwadratowa

Stosowany jest średni kwadrat, na przykład, aby obliczyć średni rozmiar boków n przekrojów kwadratowych, średnie średnice pni, rur itp. Dzieli się na dwa typy.

Prosty średni kwadrat. Jeżeli zastępując poszczególne wartości cechy wartością średnią, konieczne jest zachowanie sumy kwadratów wartości pierwotnych bez zmiany, wówczas średnia będzie średnią wartością kwadratową.

Jest to pierwiastek kwadratowy z ilorazu sumy kwadratów wartości poszczególnych atrybutów przez ich liczbę:

Średni ważony kwadrat oblicza się ze wzoru:

gdzie f jest znakiem wagi.

Przeciętny sześcienny

Obowiązuje średnia sześcienna na przykład podczas definiowania średnia długość boki i kostki. Dzieli się na dwa typy.
Średnio sześcienny prosty:

Przy obliczaniu wartości średnich i rozproszenia w szeregach rozkładów przedziałowych prawdziwe wartości atrybutu zastępowane są wartościami środkowymi przedziałów, które różnią się od średniej wartości arytmetyczne zawarte w przedziale. Prowadzi to do błędu systematycznego przy obliczaniu wariancji. V.F. Sheppard to ustalił błąd w obliczeniu wariancji, spowodowane wykorzystaniem zgrupowanych danych, wynosi 1/12 kwadratu przedziału zarówno w kierunku w górę, jak i w dół wariancji.

Poprawka Shepparda należy stosować, jeśli rozkład jest zbliżony do normalnego, dotyczy cechy o ciągłym charakterze zmienności i opiera się na znacznej ilości danych wyjściowych (n > 500). Opierając się jednak na fakcie, że w niektórych przypadkach oba błędy działają różne kierunki kompensują się nawzajem, czasami można odmówić wprowadzenia poprawek.

Jak mniejsza wartość wariancji i odchylenia standardowego, tym bardziej jednorodna będzie populacja i tym bardziej typowa będzie średnia.
W praktyce statystyki często istnieje potrzeba porównywania odmian różnych cech. Na przykład bardzo interesujące jest porównanie różnic w wieku pracowników i ich kwalifikacjach, stażu pracy i wielkości wynagrodzenie, koszty i zyski, staż pracy i wydajność pracy itp. Do takich porównań nie nadają się wskaźniki bezwzględnej zmienności cech: nie można porównać zmienności doświadczenia zawodowego wyrażonej w latach ze zmianą wynagrodzeń wyrażoną w rublach.

Do przeprowadzenia takich porównań, a także porównań zmienności tej samej cechy w kilku populacjach o różnych średnich arytmetycznych, stosuje się względny wskaźnik zmienności - współczynnik zmienności.

Średnie strukturalne

Aby scharakteryzować tendencję centralną w rozkładach statystycznych, często racjonalne jest użycie wraz ze średnią arytmetyczną pewnej wartości cechy X, która ze względu na pewne cechy jej umiejscowienia w szeregu rozkładów może charakteryzować jej poziom.

Jest to szczególnie ważne, gdy w szeregu rozkładu skrajne wartości cechy mają niejasne granice. W związku z tym dokładne określenie średniej arytmetycznej jest zwykle niemożliwe lub bardzo trudne. W takich sprawach średni poziom można określić biorąc na przykład wartość cechy znajdującą się w środku szeregu częstotliwościowego lub występującą najczęściej w bieżącym szeregu.

Wartości takie zależą jedynie od charakteru częstotliwości, czyli od struktury rozkładu. Są one typowe pod względem lokalizacji w szeregu częstotliwości, dlatego takie wartości są uważane za cechy środka rozkładu i dlatego otrzymały definicję średnich strukturalnych. Są przyzwyczajeni do nauki Struktura wewnętrzna oraz strukturę szeregu rozkładu wartości atrybutów. Do takich wskaźników należą:

Odchylenie standardowe(synonimy: odchylenie standardowe, odchylenie standardowe, odchylenie kwadratowe; terminy pokrewne: odchylenie standardowe, standardowy spread) - w teorii prawdopodobieństwa i statystyce najczęstszy wskaźnik rozproszenia wartości zmiennej losowej w stosunku do jej oczekiwań matematycznych. W przypadku ograniczonych tablic próbek wartości zamiast oczekiwanie matematyczne stosuje się średnią arytmetyczną populacji próbnej.

Encyklopedyczny YouTube

  • 1 / 5

    Przeciętny odchylenie standardowe mierzone w samych jednostkach miary zmienna losowa i jest stosowany przy obliczaniu błędu standardowego średniej arytmetycznej, przy konstruowaniu przedziałów ufności, przy statystycznym testowaniu hipotez, przy pomiarze liniowej zależności między zmiennymi losowymi. Zdefiniowany jako pierwiastek kwadratowy wariancji zmiennej losowej.

    Odchylenie standardowe:

    s = n n - 1 σ 2 = 1 n - 1 ∑ ja = 1 n (x ja - x ¯) 2 ; (\ Displaystyle s = (\ sqrt ({\ Frac (n) (n-1)) \ sigma ^ (2)}) = (\ sqrt ({\ Frac (1) (n-1)) \ suma _ ( i=1)^(n)\lewo(x_(i)-(\bar (x))\prawo)^(2)));)
    • Uwaga: Bardzo często występują rozbieżności w nazwach MSD (odchylenie średniokwadratowe) i STD (odchylenie standardowe) z ich wzorami. Na przykład w module numPy języka programowania Python funkcja std() jest opisana jako „odchylenie standardowe”, podczas gdy formuła odzwierciedla odchylenie standardowe (podzielenie przez pierwiastek próbki). W programie Excel funkcja STANDARDEVAL() jest inna (dzielenie przez pierwiastek z n-1).

    Odchylenie standardowe(oszacowanie odchylenia standardowego zmiennej losowej X w stosunku do oczekiwań matematycznych opartych na bezstronnym oszacowaniu wariancji) s (\ displaystyle s):

    σ = 1 n ∑ ja = 1 n (x ja - x ¯) 2 . (\ Displaystyle \ sigma = (\ sqrt ({\ Frac (1) (n)) \ suma _ (i = 1) ^ (n) \ lewo (x_ (i) - (\ bar (x)) \ prawo) ^(2))).)

    Gdzie σ 2 (\ Displaystyle \ sigma ^ (2))- dyspersja; x ja (\ displaystyle x_ (i)) - I element selekcji; n (\ displaystyle n)- wielkość próbki;

    - średnia arytmetyczna próbki:

    x ¯ = 1 n ∑ ja = 1 n x ja = 1 n (x 1 + … + x n) . (\ Displaystyle (\ bar (x)) = (\ Frac (1) (n)) \ suma _ (i = 1) ^ (n) x_ (i) = (\ Frac (1) (n)) (x_ (1)+\ldots +x_(n)).)

    Należy zauważyć, że oba szacunki są stronnicze. W ogólnym przypadku niemożliwe jest skonstruowanie obiektywnego oszacowania. Jednakże oszacowanie oparte na bezstronnym oszacowaniu wariancji jest spójne.

    Zgodnie z GOST R 8.736-2011 odchylenie standardowe oblicza się za pomocą drugiego wzoru z tej sekcji. Proszę sprawdzić wyniki.

    Zgodnie z GOST R 8.736-2011 odchylenie standardowe oblicza się za pomocą drugiego wzoru z tej sekcji. Proszę sprawdzić wyniki. (Reguła trzech sigm 3 σ (\ Displaystyle 3 \ sigma) ) - prawie wszystkie wartości zmiennej losowej o rozkładzie normalnym leżą w przedziale(x ¯ - 3 σ ; x ¯ + 3 σ) (\ Displaystyle \ lewo ({\ bar (x)) -3 \ sigma; (\ bar (x)) + 3 \ sigma \ prawo)} . Ściślej – z prawdopodobieństwem w przybliżeniu 0,9973 wartość zmiennej losowej o rozkładzie normalnym mieści się w określonym przedziale (pod warunkiem, że wartość x ¯ (\ Displaystyle (\ bar (x)))

    prawdziwe, a nie uzyskane w wyniku przetwarzania próbki). . Ściślej – z prawdopodobieństwem w przybliżeniu 0,9973 wartość zmiennej losowej o rozkładzie normalnym mieści się w określonym przedziale (pod warunkiem, że wartość Jeśli prawdziwa wartość jest nieznany, to nie powinieneś go używaćσ (\ displaystyle \ sigma) , A S . Zatem, zasada trzech , A .

    sigma zostaje zamieniona na regułę trzech

    Interpretacja wartości odchylenia standardowego

    Na przykład mamy trzy zestawy liczb: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Dla wszystkich trzech zestawów wartości średnie wynoszą odpowiednio 7, a odchylenia standardowe wynoszą odpowiednio 7, 5 i 1. ostatni zestaw odchylenie standardowe jest małe, ponieważ wartości w zestawie są zgrupowane wokół wartości średniej; pierwszy zestaw ma ich najwięcej bardzo ważne odchylenie standardowe - wartości w zestawie znacznie odbiegają od wartości średniej.

    W sensie ogólnym odchylenie standardowe można uznać za miarę niepewności. Na przykład w fizyce odchylenie standardowe służy do określenia błędu serii kolejnych pomiarów pewnej wielkości. Wartość ta jest bardzo istotna dla określenia prawdopodobieństwa badanego zjawiska w porównaniu z wartością przewidywaną przez teorię: jeżeli średnia wartość pomiarów znacznie różni się od wartości przewidywanych przez teorię (duże odchylenie standardowe), wówczas należy ponownie sprawdzić uzyskane wartości lub sposób ich uzyskania. utożsamiane z ryzykiem portfelowym.

    Klimat

    Załóżmy, że istnieją dwa miasta o tej samej średniej maksymalnej temperaturze dziennej, ale jedno położone jest na wybrzeżu, a drugie na równinie. Wiadomo, że w miastach położonych na wybrzeżu występuje wiele różnych maksymalnych temperatur w ciągu dnia, które są niższe niż w miastach położonych w głębi lądu. Zatem odchylenie standardowe maksymalnych dobowych temperatur dla miasta nadmorskiego będzie mniejsze niż dla drugiego miasta, mimo że średnia wartość tej wartości jest taka sama, co w praktyce oznacza, że ​​prawdopodobieństwo, że maksymalna temperatura powietrza na dowolny dzień w roku będzie wyższy od wartości średniej, wyższy dla miasta położonego w głębi lądu.

    Sport

    Załóżmy, że istnieje kilka drużyn piłkarskich, które są oceniane według pewnego zestawu parametrów, np. liczby strzelonych i straconych bramek, szans na zdobycie gola itp. Najprawdopodobniej najlepszy zespół w tej grupie będzie miał najlepsze wartości Przez więcej parametry. Im mniejsze odchylenie standardowe zespołu dla każdego z prezentowanych parametrów, tym bardziej przewidywalny jest wynik takiego zespołu; Z kolei dla zespołu o dużym odchyleniu standardowym trudno jest przewidzieć wynik, co z kolei tłumaczy się brakiem równowagi, np. silna obrona, ale ze słabym atakiem.

    Stosowanie odchylenia standardowego parametrów drużyn pozwala w mniejszym lub większym stopniu przewidzieć wynik meczu pomiędzy dwoma zespołami, ocenić mocne strony i słabe strony rozkazy, a co za tym idzie wybrane metody walki.

    • Odpowiedzi na pytania egzaminacyjne dotyczące zdrowia publicznego i opieki zdrowotnej.
    • 1. Zdrowie publiczne i opieka zdrowotna jako nauka i obszar działalności praktycznej. Główne cele. Przedmiot, przedmiot badań. Metody.
    • 2. Opieka zdrowotna. Definicja. Historia rozwoju opieki zdrowotnej. Współczesne systemy opieki zdrowotnej, ich charakterystyka.
    • 3. Polityka państwa w zakresie ochrony zdrowia publicznego (Ustawa Republiki Białorusi „O ochronie zdrowia”). Zasady organizacyjne publicznego systemu opieki zdrowotnej.
    • 4. Ubezpieczenia i prywatne formy opieki zdrowotnej.
    • 5. Profilaktyka, definicja, zasady, współczesne problemy. Rodzaje, poziomy, kierunki profilaktyki.
    • 6. Krajowe programy profilaktyczne. Ich rola w poprawie zdrowia publicznego.
    • 7. Etyka lekarska i deontologia. Definicja pojęcia. Współczesne problemy etyki lekarskiej i deontologii, charakterystyka.
    • 8. Zdrowy styl życia, definicja pojęcia. Społeczne i medyczne aspekty zdrowego stylu życia (zdrowy styl życia).
    • 9. Szkolenie i edukacja higieniczna, definicja, podstawowe zasady. Metody i środki szkolenia i edukacji higienicznej. Wymagania dotyczące wykładu, biuletyn sanitarny.
    • 10. Zdrowie ludności, czynniki wpływające na zdrowie publiczne. Formuła zdrowia. Wskaźniki charakteryzujące zdrowie publiczne. Schemat analizy.
    • 11. Demografia jako nauka, definicja, treść. Znaczenie danych demograficznych dla ochrony zdrowia.
    • 12. Statystyka ludności, metody badań. Spisy ludności. Rodzaje struktur wiekowych ludności.
    • 13. Mechaniczne przemieszczanie się ludności. Charakterystyka procesów migracyjnych, ich wpływ na wskaźniki zdrowia ludności.
    • 14. Płodność jako problem medyczny i społeczny. Metodyka obliczania wskaźników. Poziomy płodności według danych WHO. Współczesne tendencje.
    • 15. Specjalne wskaźniki płodności (wskaźniki płodności). Reprodukcja populacji, rodzaje reprodukcji. Wskaźniki, metody obliczeniowe.
    • 16. Śmiertelność jako problem medyczny i społeczny. Metodologia badań, wskaźniki. Ogólny poziom śmiertelności według danych WHO. Współczesne tendencje.
    • 17. Śmiertelność noworodków jako problem medyczny i społeczny. Czynniki determinujące jego poziom.
    • 18. Umieralność matek i okołoporodowa, główne przyczyny. Wskaźniki, metody obliczeniowe.
    • 19. Naturalne przemieszczanie się ludności, czynniki na nie wpływające. Wskaźniki, metody obliczeniowe. Podstawowe wzorce ruchu naturalnego na Białorusi.
    • 20. Planowanie rodziny. Definicja. Współczesne problemy. Organizacje medyczne i służby planowania rodziny w Republice Białorusi.
    • 21. Zachorowalność jako problem medyczny i społeczny. Nowoczesne trendy i cechy w Republice Białorusi.
    • 22. Medyczne i społeczne aspekty zdrowia neuropsychicznego populacji. Organizacja opieki psychoneurologicznej
    • 23. Alkoholizm i narkomania jako problem medyczny i społeczny
    • 24. Choroby układu krążenia jako problem medyczny i społeczny. Czynniki ryzyka. Kierunki profilaktyki. Organizacja opieki kardiologicznej.
    • 25. Nowotwory złośliwe jako problem medyczny i społeczny. Główne kierunki profilaktyki. Organizacja opieki onkologicznej.
    • 26. Międzynarodowa statystyczna klasyfikacja chorób. Zasady konstrukcji, procedura stosowania. Jego znaczenie w badaniu zachorowalności i umieralności populacji.
    • 27. Metody badania zachorowalności populacji, ich charakterystyka porównawcza.
    • Metodologia badania zachorowalności ogólnej i pierwotnej
    • Wskaźniki zachorowalności ogólnej i pierwotnej.
    • Wskaźniki zachorowalności na choroby zakaźne.
    • Główne wskaźniki charakteryzujące najważniejsze zachorowania nieepidemiczne.
    • Główne wskaźniki zachorowalności „szpitalnej”:
    • 4) Choroby powodujące czasową niepełnosprawność (pytanie 30)
    • Główne wskaźniki analizy zachorowalności za pomocą VUT.
    • 31. Badanie zachorowalności według badań profilaktycznych populacji, rodzaje badań profilaktycznych, postępowanie. Grupy zdrowia. Pojęcie „patologicznego uczucia”.
    • 32. Zachorowalność według danych o przyczynach zgonów. Metodologia badań, wskaźniki. Medyczny akt zgonu.
    • Główne wskaźniki zachorowalności oparte na przyczynach zgonów:
    • 33. Niepełnosprawność jako problem medyczny i społeczny Definicja pojęcia, wskaźniki. Trendy w zakresie niepełnosprawności w Republice Białorusi.
    • Trendy w zakresie niepełnosprawności w Republice Białorusi.
    • 34. Podstawowa opieka zdrowotna (POZ), definicja, treść, rola i miejsce w systemie opieki zdrowotnej ludności. Główne funkcje.
    • 35. Podstawowe zasady podstawowej opieki zdrowotnej. Organizacje medyczne podstawowej opieki zdrowotnej.
    • 36. Organizacja opieki medycznej świadczonej ludności w trybie ambulatoryjnym. Podstawowe zasady. Instytucje.
    • 37. Organizacja opieki medycznej w warunkach szpitalnych. Instytucje. Wskaźniki świadczenia opieki stacjonarnej.
    • 38. Rodzaje opieki medycznej. Organizacja specjalistycznej opieki medycznej dla ludności. Ośrodki specjalistycznej opieki medycznej, ich zadania.
    • 39. Główne kierunki doskonalenia opieki szpitalnej i specjalistycznej w Republice Białorusi.
    • 40. Ochrona zdrowia kobiet i dzieci w Republice Białorusi. Kontrola. Organizacje medyczne.
    • 41. Współczesne problemy zdrowia kobiet. Organizacja opieki położniczej i ginekologicznej w Republice Białorusi.
    • 42. Organizacja opieki lekarskiej i profilaktycznej nad dziećmi. Wiodące problemy zdrowia dzieci.
    • 43. Organizacja opieki zdrowotnej ludności wiejskiej, podstawowe zasady udzielania opieki medycznej mieszkańcom wsi. Gradacja. Organizacje.
    • Etap II – terytorialne stowarzyszenie lekarskie (TMO).
    • Etap III – szpital regionalny i regionalne placówki medyczne.
    • 45. Badanie lekarskie i społeczne (MSE), definicja, treść, podstawowe pojęcia.
    • 46. ​​​​Rehabilitacja, definicja, rodzaje. Ustawa Republiki Białorusi „O zapobieganiu niepełnosprawności i rehabilitacji osób niepełnosprawnych”.
    • 47. Rehabilitacja lecznicza: definicja pojęcia, etapy, zasady. Usługa rehabilitacji medycznej w Republice Białorusi.
    • 48. Przychodnia miejska, struktura, zadania, zarządzanie. Kluczowe wskaźniki wydajności kliniki.
    • Kluczowe wskaźniki wydajności kliniki.
    • 49. Lokalna zasada organizacji opieki ambulatoryjnej dla ludności. Rodzaje działek. Terytorialny obszar terapeutyczny. Standardy. Treść pracy lokalnego lekarza-terapeuty.
    • Organizacja pracy terapeuty lokalnego.
    • 50. Gabinet Chorób Zakaźnych przychodni. Działy i metody pracy lekarza w gabinecie chorób zakaźnych.
    • 52. Główne wskaźniki charakteryzujące jakość i skuteczność obserwacji przychodni. Sposób ich obliczania.
    • 53. Oddział rehabilitacji leczniczej (MR) kliniki. Struktura, zadania. Procedura kierowania pacjentów do OMR.
    • 54. Klinika dziecięca, struktura, zadania, działy pracy. Cechy opieki medycznej nad dziećmi w warunkach ambulatoryjnych.
    • 55. Główne sekcje pracy lokalnego pediatry. Treści leczenia i pracy profilaktycznej. Komunikacja w pracy z innymi placówkami leczniczymi i profilaktycznymi. Dokumentacja.
    • 56. Treść pracy profilaktycznej lekarza pediatry. Organizacja opieki pielęgniarskiej nad noworodkiem.
    • 57. Struktura, organizacja, treść pracy poradni położniczej. Wskaźniki pracy w zakresie obsługi kobiet w ciąży. Dokumentacja.
    • 58. Szpital położniczy, struktura, organizacja pracy, zarządzanie. Wskaźniki wydajności szpitala położniczego. Dokumentacja.
    • 59. Szpital miejski, jego zadania, struktura, główne wskaźniki efektywności. Dokumentacja.
    • 60. Organizacja pracy oddziału przyjęć szpitala. Dokumentacja. Środki zapobiegające zakażeniom szpitalnym. Reżim terapeutyczny i ochronny.
    • Oddział 1. Informacje o oddziałach i instalacjach organizacji leczniczo-profilaktycznej.
    • Oddział 2. Personel organizacji leczniczo-profilaktycznej na koniec roku sprawozdawczego.
    • Oddział 3. Praca lekarzy kliniki (przychodni), przychodni, konsultacji.
    • Sekcja 4. Profilaktyczne badania lekarskie i praca gabinetów stomatologicznych (stomatologicznych) i chirurgicznych organizacji medycznej i profilaktycznej.
    • Oddział 5. Praca oddziałów lekarskich i pomocniczych (gabinetów).
    • Oddział 6. Działalność zakładów diagnostycznych.
    • 62. Sprawozdanie roczne z działalności szpitala (formularz 14), procedura przygotowania, struktura. Kluczowe wskaźniki efektywności szpitala.
    • Rozdział 1. Skład pacjentów szpitala i wyniki ich leczenia
    • Oddział 2. Skład chorych noworodków przenoszonych do innych szpitali w wieku 0-6 dni i wyniki ich leczenia
    • Rozdział 3. Pojemność łóżek i jej wykorzystanie
    • Oddział 4. Praca chirurgiczna szpitala
    • 63. Raport o opiece medycznej nad kobietami w ciąży, w czasie porodu i po porodzie (f. 32), struktura. Podstawowe wskaźniki.
    • Dział I. Działalność poradni położniczej.
    • Sekcja II. Położnictwo w szpitalu
    • Sekcja III. Śmiertelność matek
    • Sekcja IV. Informacje o urodzeniach
    • 64. Medyczne poradnictwo genetyczne, główne instytucje. Jego rola w zapobieganiu śmiertelności okołoporodowej i noworodkowej.
    • 65. Statystyka medyczna, jej działy, zadania. Rola metody statystycznej w badaniu stanu zdrowia populacji i funkcjonowania systemu opieki zdrowotnej.
    • 66. Populacja statystyczna. Definicja, rodzaje, właściwości. Cechy prowadzenia badań statystycznych na próbie populacji.
    • 67. Próba populacji i wymagania wobec niej. Zasada i metody kształtowania populacji próbnej.
    • 68. Jednostka obserwacji. Definicja, charakterystyka cech księgowych.
    • 69. Organizacja badań statystycznych. Charakterystyka etapów.
    • 70. Treść planu i programu badań statystycznych. Rodzaje planów badań statystycznych. Program obserwacji.
    • 71. Obserwacja statystyczna. Badania statystyczne ciągłe i nieciągłe. Rodzaje niepełnych badań statystycznych.
    • 72. Obserwacja statystyczna (gromadzenie materiałów). Błędy obserwacji statystycznej.
    • 73. Grupowanie i podsumowanie statystyczne. Grupowanie typologiczne i wariacyjne.
    • 74. Tabele statystyczne, rodzaje, wymagania konstrukcyjne.

    81. Odchylenie standardowe, metoda obliczeń, zastosowanie.

    Przybliżoną metodą oceny zmienności szeregu zmian jest wyznaczenie granicy i amplitudy, ale nie są brane pod uwagę wartości wariantu w obrębie szeregu. Główną ogólnie przyjętą miarą zmienności cechy ilościowej w szeregu zmian jest odchylenie standardowe (σ - sigma). Im większe odchylenie standardowe, tym większy stopień fluktuacji tego szeregu.

    Metoda obliczania odchylenia standardowego obejmuje następujące kroki:

    1. Znajdź średnią arytmetyczną (M).

    2. Wyznacz odchylenia poszczególnych opcji od średniej arytmetycznej (d=V-M). W statystykach medycznych odchylenia od średniej oznacza się jako d (odchylenie). Suma wszystkich odchyleń wynosi zero.

    3. Podnieś każde odchylenie do kwadratu d 2.

    4. Pomnóż kwadraty odchyleń przez odpowiednie częstotliwości d 2 *p.

    5. Znajdź sumę produktów (d 2 *p)

    6. Oblicz odchylenie standardowe korzystając ze wzoru:

    gdy n jest większe niż 30, Lub
    gdy n jest mniejsze lub równe 30, gdzie n jest liczbą wszystkich opcji.

    Wartość odchylenia standardowego:

    1. Odchylenie standardowe charakteryzuje rozrzut wariantu względem wartości średniej (tj. zmienność szeregu zmian). Im większa sigma, tym większy stopień zróżnicowania tego szeregu.

    2. Odchylenie standardowe służy do porównawczej oceny stopnia zgodności średniej arytmetycznej z szeregiem zmian, dla którego została obliczona.

    Odmiany zjawisk masowych podlegają temu prawu normalna dystrybucja. Krzywa reprezentująca ten rozkład wygląda jak gładka symetryczna krzywa w kształcie dzwonu (krzywa Gaussa). Zgodnie z teorią prawdopodobieństwa w zjawiskach zgodnych z prawem rozkładu normalnego istnieje ścisły związek matematyczny między wartościami średniej arytmetycznej i odchylenia standardowego. Teoretyczny rozkład wariantu w jednorodnej serii zmian jest zgodny z zasadą trzech sigma.

    Jeżeli w układzie współrzędnych prostokątnych na osi odciętych wykreśla się wartości cechy ilościowej (wariantów), a na osi rzędnych częstotliwość występowania wariantu w szeregu zmian, to warianty z większymi i mniejszymi wartości są równomiernie rozmieszczone po bokach średniej arytmetycznej.

    Ustalono, że przy normalnym rozkładzie cechy:

    68,3% wartości opcji mieści się w granicach M1

    95,5% wartości opcji mieści się w granicach M2

    99,7% wartości opcji mieści się w granicach M3

    3. Odchylenie standardowe pozwala ustalić normalne wartości parametrów klinicznych i biologicznych. W medycynie za normalny zakres dla badanego zjawiska przyjmuje się zwykle przedział M1. Odchylenie oszacowanej wartości od średniej arytmetycznej o więcej niż 1 wskazuje na odchylenie badanego parametru od normy.

    4. W medycynie zasadę trzech sigma stosuje się w pediatrii do indywidualnej oceny poziomu rozwoju fizycznego dzieci (metoda odchylenia sigma), do opracowywania standardów odzieży dziecięcej

    5. Odchylenie standardowe jest niezbędne do scharakteryzowania stopnia zróżnicowania badanej cechy i obliczenia błędu średniej arytmetycznej.

    Wartość odchylenia standardowego jest zwykle używana do porównywania zmienności szeregów tego samego typu. Jeśli porówna się dwie serie o różnych cechach (wzrost i masa ciała, średni czas leczenia szpitalnego i śmiertelność szpitalna itp.), wówczas bezpośrednie porównanie rozmiarów sigma jest niemożliwe , ponieważ odchylenie standardowe to nazwana wartość wyrażona w liczbach bezwzględnych. W takich przypadkach użyj współczynnik zmienności (Cv) , co jest wartością względną: procentowym stosunkiem odchylenia standardowego do średniej arytmetycznej.

    Współczynnik zmienności oblicza się ze wzoru:

    Im wyższy współczynnik zmienności , tym większa zmienność tego szeregu. Uważa się, że współczynnik zmienności większy niż 30% wskazuje na jakościową heterogeniczność populacji.

    Lekcja nr 4

    Temat: „Statystyki opisowe. Wskaźniki różnorodności cech w agregacie”

    Głównymi kryteriami różnorodności cechy w populacji statystycznej są: granica, amplituda, odchylenie standardowe, współczynnik oscylacji i współczynnik zmienności. Na poprzedniej lekcji omówiono, że wartości średnie stanowią jedynie uogólnioną charakterystykę badanej cechy w sumie i nie uwzględniają wartości jej poszczególnych wariantów: wartości minimalnych i maksymalnych, powyżej średniej, poniżej średnia itp.

    Przykład. Średnie wartości dwóch różnych ciągów liczbowych: -100; -20; 100; 20 i 0,1; -0,2; 0,1 są absolutnie identyczne i równeO.Jednakże zakresy rozproszenia tych względnych średnich danych sekwencji są bardzo różne.

    Określenie wymienionych kryteriów różnorodności cechy odbywa się przede wszystkim z uwzględnieniem jej wartości w poszczególnych elementach populacja statystyczna.

    Wskaźnikami pomiaru zmienności cechy są absolutny I względny. Bezwzględnymi wskaźnikami zmienności są: zakres zmienności, granica, odchylenie standardowe, dyspersja. Współczynnik zmienności i współczynnik oscylacji odnoszą się do względnych miar zmienności.

    Limit (lim)– Jest to kryterium, które wyznaczają skrajne wartości wariantu w szeregu zmian. Innymi słowy, kryterium to jest ograniczone minimalnymi i maksymalnymi wartościami atrybutu:

    Amplituda (Am) Lub zakres zmienności – Na tym polega różnica między skrajnymi opcjami. Obliczenie tego kryterium odbywa się poprzez odjęcie jego minimalnej wartości od maksymalnej wartości atrybutu, co pozwala oszacować stopień rozproszenia opcji:

    Wadą granicy i amplitudy jako kryteriów zmienności jest to, że całkowicie zależą one od ekstremalnych wartości cechy w szeregu zmian. W takim przypadku nie są brane pod uwagę wahania wartości atrybutów w obrębie serii.

    Najbardziej kompletnego opisu różnorodności cechy w populacji statystycznej dostarcza: odchylenie standardowe(sigma), która jest ogólną miarą odchylenia opcji od jej średniej wartości. Często nazywane jest odchyleniem standardowym odchylenie standardowe.

    Odchylenie standardowe opiera się na porównaniu każdej opcji ze średnią arytmetyczną danej populacji. Ponieważ w agregacie zawsze będą opcje zarówno mniejsze, jak i większe, suma odchyleń ze znakiem „” zostanie anulowana przez sumę odchyleń ze znakiem „”, tj. suma wszystkich odchyleń wynosi zero. Aby uniknąć wpływu znaków różnic, przyjmuje się odchylenia od średniej arytmetycznej do kwadratu, tj. . Suma kwadratów odchyleń nie jest równa zeru. Aby uzyskać współczynnik umożliwiający pomiar zmienności, należy przyjąć średnią z sumy kwadratów - wartość tę nazywa się odchylenia:

    W istocie dyspersja to średni kwadrat odchyleń poszczególnych wartości cechy od jej wartości średniej. Dyspersja kwadrat odchylenia standardowego.

    Wariancja jest wielkością wymiarową (nazwaną). Jeśli więc warianty szeregu liczbowego są wyrażone w metrach, wówczas wariancja daje metry kwadratowe; jeśli opcje są wyrażone w kilogramach, wówczas wariancja daje kwadrat tej miary (kg 2) itp.

    Odchylenie standardowePierwiastek kwadratowy z dyspersji:

    , a następnie przy obliczaniu rozproszenia i odchylenia standardowego w mianowniku ułamka zamiasttrzeba położyć.

    Obliczanie odchylenia standardowego można podzielić na sześć etapów, które należy przeprowadzić w określonej kolejności:

    Zastosowanie odchylenia standardowego:

    a) do oceny zmienności szeregów zmienności i porównawczej oceny typowości (reprezentatywności) średnich arytmetycznych. Jest to konieczne w diagnostyce różnicowej przy ustalaniu stabilności objawów.

    b) zrekonstruować szereg zmian, tj. przywrócenie jego charakterystyki częstotliwościowej w oparciu o zasady trzech sigm. W przerwie (±3σ) 99,7% wszystkich wariantów serii mieści się w przedziale (±2σ) - 95,5% i w zakresie (±1σ) - Opcja rzędu 68,3%.(ryc. 1).

    c) w celu zidentyfikowania opcji „wyskakujących”.

    d) wyznaczanie parametrów normy i patologii za pomocą szacunków sigma

    e) obliczyć współczynnik zmienności

    f) obliczyć średni błąd średniej arytmetycznej.

    Aby scharakteryzować każdą populację, która matyp rozkładu normalnego , wystarczy znać dwa parametry: średnią arytmetyczną i odchylenie standardowe.

    Rysunek 1. Reguła trzech sigma

    Przykład.

    W pediatrii odchylenie standardowe służy do oceny rozwoju fizycznego dzieci poprzez porównanie danych konkretnego dziecka z odpowiednimi wskaźnikami standardowymi. Za standard przyjmuje się średnią arytmetyczną rozwoju fizycznego zdrowych dzieci. Porównanie wskaźników ze standardami odbywa się za pomocą specjalnych tabel, w których podane są standardy wraz z odpowiadającymi im skalami sigma. Uważa się, że jeśli wskaźnik rozwoju fizycznego dziecka mieści się w normie (średnia arytmetyczna) ±σ, to rozwój fizyczny dziecko (według tego wskaźnika) odpowiada normie. Jeżeli wskaźnik mieści się w normie ±2σ, wówczas występuje niewielkie odchylenie od normy. Jeśli wskaźnik przekroczy te granice, wówczas rozwój fizyczny dziecka znacznie odbiega od normy (możliwa jest patologia).

    Oprócz wskaźników zmienności wyrażonych w wartościach bezwzględnych, w badaniach statystycznych wykorzystuje się wskaźniki zmienności wyrażone w wartościach względnych. Współczynnik oscylacji - jest to stosunek zakresu zmienności do średniej wartości cechy. Współczynnik zmienności - jest stosunkiem odchylenia standardowego do przeciętny podpisać. Zazwyczaj wartości te wyrażane są w procentach.

    Wzory do obliczania wskaźników zmienności względnej:

    Z powyższych wzorów jasno wynika, że ​​im większy współczynnik V jest bliższa zeru, tym mniejsze jest zróżnicowanie wartości cechy. Więcej V, tym bardziej zmienny jest znak.

    W praktyce statystycznej najczęściej wykorzystuje się współczynnik zmienności. Służy nie tylko do porównawczej oceny zmienności, ale także do scharakteryzowania jednorodności populacji. Populację uważa się za jednorodną, ​​jeżeli współczynnik zmienności nie przekracza 33% (dla rozkładów zbliżonych do normalnego). Arytmetycznie stosunek σ do średniej arytmetycznej neutralizuje wpływ wartości bezwzględnej tych cech, a stosunek procentowy sprawia, że ​​współczynnik zmienności jest wartością bezwymiarową (nienazwaną).

    Otrzymaną wartość współczynnika zmienności szacuje się na podstawie przybliżonych stopni zróżnicowania cechy:

    Słabe - do 10%

    Średnia - 10 - 20%

    Silny - ponad 20%

    Stosowanie współczynnika zmienności jest wskazane w przypadkach, gdy konieczne jest porównanie cech różniących się wielkością i wymiarem.

    Wyraźnie ukazano różnicę między współczynnikiem zmienności a innymi kryteriami rozproszenia przykład.

    Tabela 1

    Skład pracowników przedsiębiorstw przemysłowych

    Na podstawie charakterystyk statystycznych podanych w przykładzie można wyciągnąć wniosek o względnej jednorodności struktury wiekowej i poziomu wykształcenia pracowników przedsiębiorstwa, biorąc pod uwagę niską stabilność zawodową badanej kontyngentu. Łatwo zauważyć, że próba oceny tych tendencji społecznych na podstawie odchylenia standardowego doprowadziłaby do błędnego wniosku, a próba porównania cech księgowych „doświadczenie zawodowe” i „wiek” ze wskaźnikiem księgowym „wykształcenie” byłaby w zasadzie nieprawidłowe ze względu na niejednorodność tych cech.

    Mediana i percentyle

    W przypadku rozkładów porządkowych (rangowych), gdzie kryterium środka szeregu jest mediana, odchylenie standardowe i rozproszenie nie mogą służyć jako charakterystyki rozproszenia wariantu.

    To samo dotyczy serii otwartych zmian. Okoliczność ta wynika z faktu, że odchylenia, z których obliczana jest wariancja i σ, mierzone są od średniej arytmetycznej, której nie oblicza się w otwartych szeregach zmienności oraz w szeregach rozkładów cech jakościowych. Dlatego do skompresowanego opisu rozkładów używany jest inny parametr rozproszenia - kwantyl(synonim - „percentyl”), odpowiedni do opisu cech jakościowych i ilościowych w dowolnej formie ich rozkładu. Parametr ten można również wykorzystać do przekształcenia cech ilościowych na jakościowe. W tym przypadku oceny te przydzielane są w zależności od rzędu kwantyla, któremu odpowiada dana opcja.

    W praktyce badań biomedycznych najczęściej wykorzystuje się następujące kwantyle:

    – mediana;

    , – kwartyle (ćwiartki), gdzie – kwartyl dolny, górny kwartyl.

    Kwantyle dzielą obszar możliwych zmian szeregu zmian na określone przedziały. Mediana (kwantyl) to opcja znajdująca się w środku szeregu wariacyjnego, która dzieli ten szereg na pół na dwie równe części ( 0,5 I 0,5 ). Kwartyl dzieli szereg na cztery części: pierwsza część (kwartyl dolny) to opcja oddzielająca opcje, których wartości liczbowe nie przekraczają 25% wartości maksymalnej możliwej w danym szeregu; do 50% maksymalnej możliwej kwoty. Górny kwartyl () oddziela opcje do 75% maksymalnych możliwych wartości.

    W przypadku rozkładu asymetrycznego zmienna w stosunku do średniej arytmetycznej, do jej scharakteryzowania stosuje się medianę i kwartyle. W tym przypadku stosowana jest następująca forma wyświetlania wartości średniej - Meh (;). Na przykład, badana cecha – „okres, w którym dziecko zaczęło samodzielnie chodzić” – ma w badanej grupie rozkład asymetryczny. Jednocześnie dolny kwartyl () odpowiada początkowi chodzenia - 9,5 miesiąca, mediana - 11 miesięcy, górny kwartyl () - 12 miesięcy. W związku z tym charakterystyka średniego trendu określonego atrybutu zostanie przedstawiona jako 11 (9,5; 12) miesięcy.

    Ocena istotności statystycznej wyników badań

    Przez istotność statystyczną danych rozumie się stopień ich zgodności z przedstawioną rzeczywistością, tj. dane istotne statystycznie to takie, które nie zniekształcają i prawidłowo odzwierciedlają obiektywną rzeczywistość.

    Ocena istotności statystycznej wyników badań oznacza określenie, z jakim prawdopodobieństwem możliwe jest przeniesienie wyników uzyskanych z populacji próbnej na całą populację. Ocena istotności statystycznej jest konieczna, aby zrozumieć, jaką część zjawiska można wykorzystać do oceny zjawiska jako całości i jego wzorców.

    Ocena istotności statystycznej wyników badań polega na:

    1. błędy reprezentatywności (błędy wartości średnich i względnych) - M;

    2. granice ufności wartości średnich lub względnych;

    3. wiarygodność różnicy wartości średnich lub względnych według kryterium T.

    Błąd standardowy średniej arytmetycznej Lub błąd reprezentatywności charakteryzuje wahania średniej. Należy zauważyć, że im większa liczebność próby, tym mniejszy rozrzut wartości średnich. Błąd standardowy średniej oblicza się ze wzoru:

    We współczesnej literaturze naukowej średnią arytmetyczną zapisuje się razem z błędem reprezentatywności:

    lub razem z odchyleniem standardowym:

    Jako przykład rozważmy dane dotyczące 1500 przychodni miejskich w kraju (populacja ogólna). Średnia liczba pacjentów obsługiwanych w przychodni wynosi 18 150 osób. Losowy wybór 10% placówek (150 przychodni) daje średnią liczbę pacjentów równą 20 051 osób. Błąd próby, wynikający oczywiście z faktu, że nie wszystkie 1500 klinik zostało objętych próbą, jest równy różnicy pomiędzy tymi średnimi – średniej ogólnej ( M gen) i średnia próbki ( M wybrany). Jeśli utworzymy kolejną próbkę tej samej wielkości z naszej populacji, otrzymamy inną wartość błędu. Wszystkie te średnie próbne o wystarczająco dużych próbach rozkładają się normalnie wokół średniej ogólnej przy wystarczająco dużej liczbie powtórzeń pobierania próbek tej samej liczby obiektów z populacja. Błąd standardowy średniej M- jest to nieuniknione rozproszenie średnich z próby wokół średniej ogólnej.

    W przypadku, gdy wyniki badań prezentowane są w ilościach względnych (np. procentach) – obliczonych błąd standardowy ułamka:

    gdzie P jest wskaźnikiem w %, n jest liczbą obserwacji.

    Wynik jest wyświetlany jako (P ± m)%. Na przykład, odsetek wyzdrowień wśród pacjentów wyniósł (95,2±2,5)%.

    W przypadku, gdy liczba elementów populacji, następnie przy obliczaniu błędów standardowych średniej i ułamka w mianowniku ułamka zamiasttrzeba położyć.

    W przypadku rozkładu normalnego (rozkład średnich z próby jest normalny) wiemy, jaka część populacji mieści się w dowolnym przedziale wokół średniej. W szczególności:

    W praktyce problem polega na tym, że cechy populacji ogólnej nie są nam znane, a próba jest dobierana właśnie po to, by je oszacować. Oznacza to, że jeśli wykonamy próbki tej samej wielkości N z populacji ogólnej, to w 68,3% przypadków przedział będzie zawierał wartość M(w 95,5% przypadków będzie to na interwale, a w 99,7% przypadków – na interwale).

    Ponieważ faktycznie pobierana jest tylko jedna próba, stwierdzenie to formułuje się w kategoriach prawdopodobieństwa: z prawdopodobieństwem 68,3% średnia wartość atrybutu w populacji mieści się w przedziale z prawdopodobieństwem 95,5% - w przerwie itp.

    W praktyce wokół wartości próbki budowany jest przedział taki, że przy danym (wystarczająco wysokim) prawdopodobieństwie: prawdopodobieństwo ufności –„pokryłoby” rzeczywistą wartość tego parametru w populacji ogólnej. Ten przedział nazywa się przedział ufności.

    Prawdopodobieństwo ufnościP jest to stopień pewności, że przedział ufności będzie faktycznie zawierał prawdziwą (nieznaną) wartość parametru w populacji.

    Na przykład, jeśli prawdopodobieństwo zaufania R wynosi 90%, oznacza to, że 90 próbek na 100 da prawidłowe oszacowanie parametru w populacji. W związku z tym prawdopodobieństwo błędu, tj. błędne oszacowanie średniej ogólnej dla próby jest równe procentowo: . W tym przykładzie oznacza to, że 10 próbek na 100 da nieprawidłowe oszacowanie.

    Oczywiście stopień ufności (prawdopodobieństwo ufności) zależy od wielkości przedziału: im szerszy przedział, tym większa pewność, że wpadnie w niego nieznana wartość dla populacji. W praktyce do skonstruowania przedziału ufności zapewniającego pewność co najmniej 95,5% stosuje się błąd co najmniej dwukrotnie większy od błędu próbkowania.

    Wyznaczenie granic ufności średnich i wartości względnych pozwala znaleźć ich dwie skrajne wartości – możliwie minimalną i maksymalną, w obrębie których badany wskaźnik może występować w całej populacji. Oparte na tym, granice ufności (lub przedział ufności)- są to granice wartości średnich lub względnych, poza którymi z powodu przypadkowych wahań istnieje niewielkie prawdopodobieństwo.

    Przedział ufności można przepisać jako: , gdzie T– kryterium ufności.

    Granice ufności średniej arytmetycznej w populacji wyznacza wzór:

    M gen = M wybierać + t m M

    dla wartości względnej:

    R gen = P wybierać + t m R

    Gdzie M gen I R gen- wartości wartości średnich i względnych dla populacji ogólnej; M wybierać I R wybierać- wartości wartości średnich i względnych uzyskanych z populacji próbnej; M M I M P- błędy wartości średnich i względnych; T- kryterium ufności (kryterium trafności, które ustala się przy planowaniu badania i może wynosić 2 lub 3); t m- jest to przedział ufności lub Δ - maksymalny błąd wskaźnika uzyskany w badaniu reprezentacyjnym.

    Należy zauważyć, że wartość kryterium T w pewnym stopniu związane z prawdopodobieństwem bezbłędnym prognozy (p), wyrażonym w %. Wybiera go sam badacz, kierując się koniecznością uzyskania wyniku o wymaganym stopniu dokładności. Zatem dla prawdopodobieństwa bezbłędnej prognozy wynoszącego 95,5% wartość kryterium T wynosi 2, dla 99,7% - 3.

    Podane oszacowania przedziałów ufności są dopuszczalne jedynie dla populacji statystycznych liczących powyżej 30 obserwacji. Przy mniejszej liczebności populacji (małe próby) do ustalenia kryterium t stosuje się specjalne tablice. W tych tabelach pożądana wartość znajduje się na przecięciu linii odpowiadającej wielkości populacji (n-1) oraz kolumnę odpowiadającą wybranemu przez badacza poziomowi prawdopodobieństwa wolnej od błędów prognozy (95,5%; 99,7%). W badaniach medycznych przy ustalaniu granic ufności dla dowolnego wskaźnika prawdopodobieństwo bezbłędnej prognozy wynosi 95,5% lub więcej. Oznacza to, że wartość wskaźnika uzyskana z populacji próbnej musi znajdować się w populacji ogólnej w co najmniej 95,5% przypadków.

      Pytania na temat lekcji:

      Znaczenie wskaźników różnorodności cech w populacji statystycznej.

      Ogólna charakterystyka wskaźników zmienności bezwzględnej.

      Odchylenie standardowe, obliczenia, zastosowanie.

      Względne miary zmienności.

      Mediana, wynik kwartylowy.

      Ocena istotności statystycznej wyników badań.

      Błąd standardowy średniej arytmetycznej, wzór obliczeniowy, przykład zastosowania.

      Obliczanie proporcji i jej błędu standardowego.

      Pojęcie prawdopodobieństwa ufności, przykład zastosowania.

    10. Pojęcie przedziału ufności, jego zastosowanie.

      Zadania testowe na ten temat ze standardowymi odpowiedziami:

    1. BEZWZGLĘDNE WSKAŹNIKI ZMIANY DOTYCZĄ

    1) współczynnik zmienności

    2) współczynnik oscylacji

    4) mediana

    2. WSKAŹNIKI WZGLĘDNE ZMIANY

    1) dyspersja

    4) współczynnik zmienności

    3. KRYTERIUM OKREŚLONE PRZEZ EKSTREMALNE WARTOŚCI OPCJI W SERII ZMIAN

    2) amplituda

    3) dyspersja

    4) współczynnik zmienności

    4. RÓŻNICA OPCJI EKSTREMALNYCH JEST

    2) amplituda

    3) odchylenie standardowe

    4) współczynnik zmienności

    5. ŚREDNI KWADRAT ODCHYLEŃ POSZCZEGÓLNYCH WARTOŚCI CHARAKTERYSTYKI OD JEJ WARTOŚCI ŚREDNICH WYNOSI

    1) współczynnik oscylacji

    2) mediana

    3) dyspersja

    6. STOSUNEK SKALI ZMIANY DO ŚREDNIEJ WARTOŚCI CHARAKTERU WYNOSI

    1) współczynnik zmienności

    2) odchylenie standardowe

    4) współczynnik oscylacji

    7. STOSUNEK ŚREDNIEGO ODCHYLENIA KWADRATOWEGO DO ŚREDNIEJ WARTOŚCI CHARAKTERYSTYKI WYNOSI

    1) dyspersja

    2) współczynnik zmienności

    3) współczynnik oscylacji

    4) amplituda

    8. OPCJA ZNAJDUJĄCA SIĘ W ŚRODKU SERII ZMIAN I DZIELĄCA JĄ NA DWIE RÓWNE CZĘŚCI JEST

    1) mediana

    3) amplituda

    9. W BADANIACH MEDYCZNYCH PRZY USTALANIU GRANIC UFNOŚCI DLA KAŻDEGO WSKAŹNIKA PRZYJMUJE SIĘ PRAWdopodobieństwo BEZBŁĘDNEJ PRZEWIDYWANIA

    10. JEŚLI 90 PRÓBEK NA 100 PODA PRAWIDŁOWE OSZACOWANIE PARAMETRA W POPULACJI, OZNACZA TO, ŻE PRAWdopodobieństwo UFNOŚCI P RÓWNY

    11. JEŚLI 10 PRÓBEK NA 100 PODA NIEPRAWIDŁOWE OSZACOWANIE, PRAWdopodobieństwo błędu jest równe

    12. GRANICE WARTOŚCI ŚREDNICH LUB WZGLĘDNYCH, POWYŻEJ KTÓRYCH Wskutek losowych oscylacji ma małe prawdopodobieństwo – TO JEST

    1) przedział ufności

    2) amplituda

    4) współczynnik zmienności

    13. ZA MAŁA PRÓBĘ UZNAJE SIĘ TĘ POpulację, W KTÓREJ

    1) n jest mniejsze lub równe 100

    2) n jest mniejsze lub równe 30

    3) n jest mniejsze lub równe 40

    4) n jest bliskie 0

    14. DLA PRAWIDŁOWOŚCI BEZBŁĘDNEJ PROGNOZY WARTOŚĆ KRYTERIA 95% T JEST

    15. DLA PRAWIDŁOWOŚCI BEZBŁĘDNEJ PROGNOZY WARTOŚĆ KRYTERIA 99% T JEST

    16. DLA ROZKŁADÓW BLISKO NORMALNEJ LUDNOŚĆ UZNAJE SIĘ ZA HOMOGENICZNĄ, JEŚLI WSPÓŁCZYNNIK ZMIANY NIE PRZEKRACZA

    17. OPCJA, OPCJE WYDZIELAJĄCE, KTÓRYCH WARTOŚCI LICZBOWE NIE PRZEKRACZAJĄ 25% MAKSYMALNEJ MOŻLIWEJ W DANEJ SERII – JEST TO

    2) dolny kwartyl

    3) górny kwartyl

    4) kwartyl

    18. DANE, KTÓRE NIE ZNIEKSZTAŁCAJĄ I PRAWIDŁOWO ODzwierciedlają OBIEKTYWNĄ RZECZYWISTOŚĆ, NAZYWAJĄ SIĘ

    1) niemożliwe

    2) równie możliwe

    3) niezawodny

    4) losowe

    19. ZGODNIE Z ZASADĄ „TRZECH SIGMA”, Z NORMALNYM ROZKŁADEM CHARAKTERYSTYKI WEWNĄTRZ
    BĘDZIE LOKALIZOWANY

    1) Opcja 68,3%.

    Odchylenie standardowe to jeden z tych terminów statystycznych w świecie korporacji, który dodaje wiarygodności osobom, którym uda się dobrze je zaprezentować w rozmowie lub prezentacji, pozostawiając jednocześnie niejasne zamieszanie dla tych, którzy nie wiedzą, co to jest, ale są zbyt zawstydzeni, aby zapytać. Tak naprawdę większość menedżerów nie rozumie koncepcji odchylenia standardowego i jeśli jesteś jednym z nich, czas przestać żyć w kłamstwie. W dzisiejszym artykule opowiem Ci, jak ta niedoceniana miara statystyczna może pomóc Ci lepiej zrozumieć dane, z którymi pracujesz.

    Co mierzy odchylenie standardowe?

    Wyobraź sobie, że jesteś właścicielem dwóch sklepów. Aby uniknąć strat, ważna jest jasna kontrola stanu zapasów. Próbując dowiedzieć się, który menedżer lepiej zarządza zapasami, decydujesz się przeanalizować ostatnie sześć tygodni zapasów. Średni tygodniowy koszt zapasów dla obu sklepów jest w przybliżeniu taki sam i wynosi około 32 jednostek konwencjonalnych. Na pierwszy rzut oka średni odpływ pokazuje, że obaj menedżerowie radzą sobie podobnie.

    Ale jeśli przyjrzysz się bliżej działalności drugiego sklepu, przekonasz się, że chociaż średnia wartość jest prawidłowa, zmienność zapasów jest bardzo duża (od 10 do 58 USD). Można zatem stwierdzić, że średnia nie zawsze poprawnie ocenia dane. Tutaj właśnie pojawia się odchylenie standardowe.

    Odchylenie standardowe pokazuje, jak wartości rozkładają się w stosunku do średniej w naszym . Innymi słowy, możesz zrozumieć, jak duża jest różnica w odpływie z tygodnia na tydzień.

    W naszym przykładzie użyliśmy Funkcja Excela ODCHYLENIE STANDARDOWE, aby obliczyć odchylenie standardowe wraz ze średnią.

    W przypadku pierwszego menedżera odchylenie standardowe wyniosło 2. Oznacza to, że każda wartość w próbie odbiega średnio o 2 od średniej. Czy to jest dobre? Spójrzmy na pytanie z innej strony - odchylenie standardowe równe 0 mówi nam, że każda wartość w próbie jest równa jej średniej (w naszym przypadku 32,2). Zatem odchylenie standardowe wynoszące 2 niewiele różni się od 0, co wskazuje, że większość wartości jest bliska średniej. Im odchylenie standardowe jest bliższe 0, tym bardziej wiarygodna jest średnia. Co więcej, odchylenie standardowe bliskie 0 wskazuje na niewielką zmienność danych. Oznacza to, że wartość odpływu z odchyleniem standardowym wynoszącym 2 wskazuje na niesamowitą spójność pierwszego menedżera.

    W przypadku drugiego sklepu odchylenie standardowe wyniosło 18,9. Oznacza to, że koszt spływu średnio odbiega o 18,9 od średniej wartości z tygodnia na tydzień. Szalony rozkład! Im odchylenie standardowe jest bardziej od 0, tym mniej dokładna jest średnia. W naszym przypadku liczba 18,9 oznacza, że ​​średniej wartości (32,8 USD tygodniowo) po prostu nie można ufać. Mówi nam to również, że tygodniowy odpływ jest bardzo zmienny.

    Tak w skrócie wygląda koncepcja odchylenia standardowego. Chociaż nie zapewnia wglądu w inne ważne pomiary statystyczne (tryb, mediana...), w rzeczywistości odchylenie standardowe odgrywa kluczową rolę w większości obliczeń statystycznych. Zrozumienie zasad odchylenia standardowego rzuci światło na wiele procesów biznesowych.

    Jak obliczyć odchylenie standardowe?

    Teraz wiemy, co mówi liczba odchylenia standardowego. Zastanówmy się, jak to obliczyć.

    Przyjrzyjmy się zbiorowi danych od 10 do 70 w przyrostach co 10. Jak widać, obliczyłem już dla nich wartość odchylenia standardowego za pomocą funkcji STANDARDEV w komórce H2 (na pomarańczowo).

    Poniżej znajdują się kroki, jakie wykonuje Excel, aby dotrzeć do wersji 21.6.

    Należy pamiętać, że wszystkie obliczenia są wizualizowane w celu lepszego zrozumienia. W rzeczywistości w programie Excel obliczenia odbywają się natychmiast, pozostawiając wszystkie kroki za kulisami.

    Najpierw Excel znajduje średnią próbki. W naszym przypadku średnia okazała się wynosić 40, co w kolejnym kroku jest odejmowane od wartości każdej próbki. Każda uzyskana różnica jest podnoszona do kwadratu i sumowana. Otrzymaliśmy sumę równą 2800, którą należy podzielić przez liczbę elementów próbki minus 1. Ponieważ mamy 7 elementów, okazuje się, że musimy podzielić 2800 przez 6. Z otrzymanego wyniku znajdujemy pierwiastek kwadratowy, to liczba będzie odchyleniem standardowym.

    Dla tych, którzy nie do końca rozumieją zasadę obliczania odchylenia standardowego za pomocą wizualizacji, podaję matematyczną interpretację znalezienia tej wartości.

    Funkcje do obliczania odchylenia standardowego w programie Excel

    W programie Excel dostępnych jest kilka typów formuł na odchylenie standardowe. Wszystko, co musisz zrobić, to wpisać =STDEV i sam się przekonasz.

    Warto zauważyć, że funkcje STDEV.V i STDEV.G (pierwsza i druga funkcja na liście) duplikują odpowiednio funkcje STDEV i STDEV (piąta i szósta funkcja na liście), które zostały zachowane ze względu na zgodność z wcześniejszymi wersje Excela.

    Generalnie różnica w zakończeniach funkcji .B i .G wskazuje na zasadę obliczania odchylenia standardowego próby lub populacji. Wyjaśniłem już różnicę między tymi dwiema tablicami w poprzednim.

    Cechą szczególną funkcji STANDARDEV i STANDDREV (trzecia i czwarta funkcja na liście) jest to, że przy obliczaniu odchylenia standardowego tablicy brane są pod uwagę wartości logiczne i tekstowe. Tekst i prawdziwe wartości logiczne to 1, a fałszywe wartości logiczne to 0. Nie wyobrażam sobie sytuacji, w której potrzebowałbym tych dwóch funkcji, więc myślę, że można je zignorować.

Wybór redaktorów
Ceres, łacina, greka. Demeter – rzymska bogini zbóż i zbiorów, żyjąca około V wieku. pne mi. utożsamiana z Greką Ceres była jedną z...

W hotelu w Bangkoku (Tajlandia). Do zatrzymania doszło przy udziale sił specjalnych tajlandzkiej policji oraz przedstawicieli USA, w tym...

[łac. cardinalis], najwyższa po papieżu godność w hierarchii Kościoła rzymskokatolickiego. Obowiązujący Kodeks Prawa Kanonicznego...

Znaczenie imienia Jarosław: imię dla chłopca oznacza „wielbienie Yarili”. Wpływa to na charakter i losy Jarosława. Pochodzenie nazwy...
tłumaczenie: Anna Ustyakina Shifa al-Quidsi trzyma w rękach fotografię swojego brata, Mahmouda al-Quidsiego, w swoim domu w Tulkram, północna część...
W cukierni można dziś kupić różnego rodzaju kruche ciasteczka. Ma różne kształty, własną wersję...
Dziś w każdym supermarkecie i małej cukierni zawsze możemy kupić szeroką gamę wyrobów z ciasta kruchego. Każdy...
Kotlety z indyka są cenione ze względu na stosunkowo niską zawartość tłuszczu i imponujące właściwości odżywcze. Panierowane lub bez, w złocistym cieście...
„. Dobry przepis, sprawdzony - i co najważniejsze, naprawdę leniwy. W związku z tym pojawiło się pytanie: „Czy mogę zrobić leniwe ciasto napoleońskie z...