Kako pronaći aritmetičku sredinu u statistici. Prosječne vrijednosti u statistici

Kako izračunati prosjek brojeva u Excelu

Pomoću funkcije možete pronaći aritmetičku sredinu brojeva u Excelu.

Sintaksa AVERAGE

=PROSEK(broj1,[broj2],…) - ruska verzija

Argumenti AVERAGE

  • broj 1– prvi broj ili raspon brojeva za izračunavanje aritmetičke sredine;
  • broj2(Neobavezno) – drugi broj ili raspon brojeva za izračunavanje aritmetičke sredine. Maksimalan broj argumenata funkcije je 255.

Da biste izračunali, slijedite ove korake:

  • Odaberite bilo koju ćeliju;
  • Napišite formulu u njemu =PROSJEČNO(
  • Odaberite opseg ćelija za koji želite da napravite proračun;
  • Pritisnite taster “Enter” na tastaturi

Funkcija će izračunati prosječnu vrijednost u navedenom rasponu između ćelija koje sadrže brojeve.

Kako pronaći prosječan dati tekst

Ako postoje prazni redovi ili tekst u rasponu podataka, funkcija ih tretira kao “nula”. Ako među podacima postoje logički izrazi FALSE ili TRUE, tada funkcija FALSE percipira kao “nula”, a TRUE kao “1”.

Kako pronaći aritmetičku sredinu po uslovu

Za izračunavanje prosjeka po uvjetu ili kriteriju koristite funkciju. Na primjer, zamislite da imamo podatke o prodaji proizvoda:

Naš zadatak je izračunati prosječnu vrijednost prodaje olovaka. Da bismo to učinili, poduzet ćemo sljedeće korake:

  • U ćeliji A13 napišite naziv proizvoda „Olovke“;
  • U ćeliji B13 hajde da predstavimo formulu:

=AVERAGEIF(A2:A10,A13,B2:B10)

Raspon ćelija” A2:A10” označava listu proizvoda u kojima ćemo tražiti riječ “olovke”. Argument A13 ovo je link do ćelije s tekstom koji ćemo pretraživati ​​među cijelom listom proizvoda. Raspon ćelija” B2:B10” je raspon s podacima o prodaji proizvoda, među kojima će funkcija pronaći “Handles” i izračunati prosječnu vrijednost.


Karakteristike jedinica statističkih agregata su različite po svom značenju, na primjer, plate radnika u istoj profesiji preduzeća nisu iste za isti vremenski period, tržišne cijene za iste proizvode, prinosi usjeva u okrugu farme itd. Stoga, kako bi se odredila vrijednost karakteristike koja je karakteristična za cjelokupnu populaciju jedinica koje se proučavaju, izračunavaju se prosječne vrijednosti.
prosječna vrijednost ovo je generalizirajuća karakteristika skupa pojedinačnih vrijednosti neke kvantitativne karakteristike.

Populacija koja se proučava na kvantitativnoj osnovi sastoji se od individualnih vrijednosti; na njih utiču i opšti uzroci i pojedinačna stanja. U prosječnoj vrijednosti poništavaju se odstupanja karakteristična za pojedinačne vrijednosti. Prosjek, kao funkcija skupa pojedinačnih vrijednosti, predstavlja cijeli agregat sa jednom vrijednošću i odražava ono što je zajedničko svim njegovim jedinicama.

Prosjek izračunat za populacije koje se sastoje od kvalitativno homogenih jedinica naziva se tipičan prosek. Na primjer, možete izračunati prosječnu mjesečnu platu zaposlenika određene profesionalne grupe (rudar, doktor, bibliotekar). Naravno, nivoi mjesečnih zarada rudara, zbog razlika u njihovim kvalifikacijama, stažu, mjesečnom radu i mnogim drugim faktorima, razlikuju se jedni od drugih i od nivoa prosječne plate. Međutim, prosječni nivo odražava glavne faktore koji utiču na visinu zarada, a razlike koje nastaju zbog individualnih karakteristika zaposlenog se poništavaju. Prosječna plata odražava tipičan nivo naknade za datu vrstu radnika. Dobijanju tipičnog prosjeka treba prethoditi analiza koliko je kvalitativno homogena data populacija. Ako se cjelina sastoji od pojedinačnih dijelova, treba je podijeliti u tipične grupe (prosječna temperatura u bolnici).

Zovu se prosječne vrijednosti koje se koriste kao karakteristike za heterogene populacije sistemske proseke. Na primjer, prosječna vrijednost bruto domaćeg proizvoda (BDP) po glavi stanovnika, prosječna vrijednost potrošnje različitih grupa dobara po osobi i druge slične vrijednosti koje predstavljaju opšte karakteristike države kao jedinstvenog ekonomskog sistema.

Prosjek se mora izračunati za populacije koje se sastoje od dovoljno velikog broja jedinica. Usklađenost s ovim uvjetom neophodna je da bi zakon velikih brojeva stupio na snagu, zbog čega se slučajna odstupanja pojedinačnih vrijednosti od općeg trenda međusobno poništavaju.

Vrste prosjeka i metode za njihovo izračunavanje

Izbor vrste prosjeka određen je ekonomskim sadržajem određenog indikatora i izvornim podacima. Međutim, svaka prosječna vrijednost mora biti izračunata tako da se, kada zamijeni svaku varijantu prosječne karakteristike, ne promijeni konačna, generalizirajuća ili, kako se to obično naziva. indikator definicije, što je povezano sa prosječnim indikatorom. Na primjer, kada se stvarne brzine na pojedinim dionicama rute zamjenjuju njihovom prosječnom brzinom, ukupna udaljenost koju je vozilo prešlo u isto vrijeme ne bi se trebalo mijenjati; pri zamjeni stvarnih plata pojedinačnih zaposlenih u preduzeću prosječnom zaradom, fond zarada se ne bi trebao mijenjati. Shodno tome, u svakom konkretnom slučaju, u zavisnosti od prirode dostupnih podataka, postoji samo jedna prava prosečna vrednost indikatora koja je adekvatna svojstvima i suštini socio-ekonomskog fenomena koji se proučava.
Najčešće korištene su aritmetička sredina, harmonijska sredina, geometrijska sredina, kvadratna sredina i kubična sredina.
Navedeni prosjeci pripadaju klasi smireno proseci i kombinovani su opštom formulom:
,
gdje je prosječna vrijednost karakteristike koja se proučava;
m – indeks prosječnog stepena;
– trenutna vrijednost (varijanta) karakteristike koja se prosječuje;
n – broj karakteristika.
U zavisnosti od vrednosti eksponenta m razlikuju se sledeće vrste proseka snage:
kada je m = -1 – harmonijska sredina;
pri m = 0 – geometrijska sredina;
za m = 1 – aritmetička sredina;
za m = 2 – srednji kvadrat;
pri m = 3 – prosječna kubna.
Kada koristite iste početne podatke, što je veći eksponent m u gornjoj formuli, to je veća prosječna vrijednost:
.
Ovo svojstvo proseka stepena da raste sa povećanjem eksponenta funkcije koja definiše naziva se pravilo većine prosjeka.
Svaki od označenih prosjeka može imati dva oblika: jednostavno I ponderisano.
Jednostavna srednja forma koristi se kada se prosjek izračunava iz primarnih (negrupisanih) podataka. Ponderisana forma– pri izračunavanju prosjeka na osnovu sekundarnih (grupisanih) podataka.

Aritmetička sredina

Aritmetička sredina se koristi kada je obim populacije zbir svih pojedinačnih vrijednosti različite karakteristike. Treba napomenuti da ako tip prosjeka nije specificiran, pretpostavlja se aritmetički prosjek. Njegova logična formula izgleda ovako:

Jednostavna aritmetička sredina izračunati na osnovu negrupisanih podataka prema formuli:
ili ,
gdje su pojedinačne vrijednosti karakteristike;
j je serijski broj jedinice posmatranja, koju karakteriše vrijednost ;
N – broj jedinica posmatranja (volumen populacije).
Primjer. Na predavanju „Sažetak i grupisanje statističkih podataka“ ispitani su rezultati posmatranja radnog iskustva tima od 10 ljudi. Izračunajmo prosječno radno iskustvo radnika tima. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

Koristeći formulu jednostavne aritmetičke sredine, također možemo izračunati proseci u hronološkim serijama, ako su vremenski intervali za koje su prikazane karakteristične vrijednosti jednaki.
Primjer. Obim prodatih proizvoda za prvi kvartal iznosio je 47 den. jedinica, za drugu 54, za treću 65 i za četvrtu 58 den. jedinice Prosečan kvartalni promet je (47+54+65+58)/4 = 56 den. jedinice
Ako se trenutni pokazatelji daju u hronološkom nizu, tada se pri izračunavanju prosjeka zamjenjuju polovičnim zbrojima vrijednosti na početku i na kraju perioda.
Ako postoji više od dva momenta i intervali između njih su jednaki, onda se prosjek izračunava pomoću formule za prosječnu hronologiju

,
gdje je n broj vremenskih tačaka
U slučaju kada su podaci grupirani po karakterističnim vrijednostima (tj. konstruiran je diskretni varijacioni niz raspodjele) sa ponderisan aritmetički prosjek izračunato pomoću frekvencija ili učestalosti opažanja specifičnih vrijednosti karakteristike, čiji je broj (k) znatno manji od broja opažanja (N).
,
,
gdje je k broj grupa varijacionih serija,
i – broj grupe varijantne serije.
Budući da , a , dobijamo formule koje se koriste za praktične proračune:
I
Primjer. Izračunajmo prosječan staž radnih timova u grupisanom redu.
a) korištenjem frekvencija:

b) korišćenjem frekvencija:

U slučaju kada su podaci grupirani po intervalima , tj. prikazani su u obliku intervalnih serija raspodjele pri izračunavanju aritmetičke sredine, kao vrijednost atributa uzima se sredina intervala, na osnovu pretpostavke o ravnomjernoj raspodjeli jedinica populacije u datom intervalu. Izračun se vrši pomoću formula:
I
gdje je sredina intervala: ,
gde su i donja i gornja granica intervala (pod uslovom da se gornja granica datog intervala poklapa sa donjom granicom sledećeg intervala).

Primjer. Izračunajmo aritmetičku sredinu intervalnih varijacionih serija konstruisanih na osnovu rezultata studije godišnjih zarada 30 radnika (videti predavanje „Sažetak i grupisanje statističkih podataka“).
Tabela 1 – Raspodjela serije intervalnih varijacija.

Intervali, UAH

Učestalost, ljudi

frekvencija,

Sredina intervala

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

UAH ili UAH
Aritmetičke sredine izračunate na osnovu izvornih podataka i nizova varijacija intervala možda se neće podudarati zbog neravnomjerne raspodjele vrijednosti atributa unutar intervala. U ovom slučaju, za preciznije izračunavanje ponderisane aritmetičke sredine, treba koristiti ne sredine intervala, već jednostavne aritmetičke sredine izračunate za svaku grupu ( grupni prosjeci). Prosjek izračunat iz grupnih sredstava korištenjem ponderirane formule izračuna se poziva opšti prosek.
Aritmetička sredina ima niz svojstava.
1. Zbir odstupanja od prosječne opcije je nula:
.
2. Ako se sve vrijednosti opcije povećaju ili smanje za iznos A, tada se prosječna vrijednost povećava ili smanjuje za isti iznos A:

3. Ako se svaka opcija poveća ili smanji za B puta, tada će se i prosječna vrijednost povećati ili smanjiti za isti broj puta:
ili
4. Zbir proizvoda opcije po frekvencijama jednak je proizvodu prosječne vrijednosti zbirom frekvencija:

5. Ako se sve frekvencije podijele ili pomnože sa bilo kojim brojem, tada se aritmetička sredina neće promijeniti:

6) ako su u svim intervalima frekvencije jednake jedna drugoj, onda je ponderisana aritmetička sredina jednaka jednostavnoj aritmetičkoj sredini:
,
gdje je k broj grupa varijacione serije.

Korištenje svojstava prosjeka omogućava vam da pojednostavite njegovo izračunavanje.
Pretpostavimo da su sve opcije (x) prvo smanjene za isti broj A, a zatim smanjene za faktor B. Najveće pojednostavljenje se postiže kada se vrednost sredine intervala sa najvećom frekvencijom odabere kao A, a vrednost intervala (za serije sa identičnim intervalima) se izabere kao B. Količina A naziva se ishodište, pa se ovaj metod izračunavanja prosjeka naziva način b om referenca od uvjetne nule ili način trenutaka.
Nakon takve transformacije, dobijamo novi niz varijacionih distribucija, čije su varijante jednake . Njihova aritmetička sredina, tzv trenutak prvog reda, izražava se formulom i, prema drugom i trećem svojstvu, aritmetička sredina je jednaka sredini originalne verzije, umanjena prvo za A, a zatim za B puta, tj.
Za dobijanje pravi prosek(prosjek originalne serije) trebate pomnožiti trenutak prvog reda sa B i dodati A:

Izračunavanje aritmetičke sredine metodom momenata ilustrovano je podacima u tabeli. 2.
Tabela 2 – Raspodjela radnika u radnji prema radnom stažu


Staž zaposlenih, godine

Broj radnika

Sredina intervala

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Pronalaženje trenutka prve narudžbe . Zatim, znajući da je A = 17,5 i B = 5, izračunavamo prosječan radni staž radnika u radionici:
godine

Harmonična sredina
Kao što je gore prikazano, aritmetička sredina se koristi za izračunavanje prosječne vrijednosti karakteristike u slučajevima kada su poznate njene varijante x i njihove frekvencije f.
Ako statistička informacija ne sadrži frekvencije f za pojedinačne opcije x populacije, već je prikazana kao njihov proizvod, primjenjuje se formula ponderisana harmonijska sredina. Za izračunavanje prosjeka, označimo gdje . Zamjenom ovih izraza u formulu za aritmetički ponderirani prosjek, dobijamo formulu za harmonijski ponderisani prosjek:
,
gdje je volumen (težina) vrijednosti atributa indikatora u intervalu označenom brojem i (i=1,2, …, k).

Dakle, harmonijska sredina se koristi u slučajevima kada nisu same opcije podložne sumiranju, već njihove recipročne vrijednosti: .
U slučajevima kada je težina svake opcije jednaka jedan, tj. pojedinačne vrijednosti inverzne karakteristike se javljaju jednom, primjenjuju se znači harmonično jednostavno:
,
gdje su pojedinačne varijante inverzne karakteristike, koje se javljaju jednom;
N – opcija broja.
Ako postoje harmonični prosjeki za dva dijela populacije, onda se ukupni prosjek za cijelu populaciju izračunava pomoću formule:

i zove se ponderisana harmonijska sredina grupnih sredina.

Primjer. Tokom trgovanja na berzi, u prvom satu rada zaključene su tri transakcije. Podaci o iznosu prodaje grivne i tečaju grivne prema američkom dolaru dati su u tabeli. 3 (kolone 2 i 3). Odredite prosječni tečaj grivne u odnosu na američki dolar za prvi sat trgovanja.
Tabela 3 – Podaci o toku trgovanja na devizama

Prosječni kurs dolara određen je omjerom količine prodane grivne tokom svih transakcija i iznosa dolara stečenih kao rezultat istih transakcija. Konačni iznos prodaje grivne poznat je iz kolone 2 tabele, a broj dolara kupljenih u svakoj transakciji određuje se dijeljenjem iznosa prodaje grivne s njenim tečajem (kolona 4). Ukupno je kupljeno 22 miliona dolara tokom tri transakcije. To znači da je prosječni tečaj grivna za jedan dolar bio
.
Rezultirajuća vrijednost je stvarna, jer zamjena stvarnim tečajem grivne u transakcijama neće promijeniti konačni iznos prodaje grivne, koji služi kao indikator definicije: miliona UAH
Ako bi se za izračunavanje koristila aritmetička sredina, tj. grivna, zatim po kursu za kupovinu od 22 miliona dolara. bilo bi potrebno potrošiti 110,66 miliona UAH, što nije tačno.

Geometrijska sredina
Geometrijska sredina se koristi za analizu dinamike pojava i omogućava određivanje prosječnog koeficijenta rasta. Prilikom izračunavanja geometrijske sredine, pojedinačne vrijednosti karakteristike su relativni pokazatelji dinamike, konstruirani u obliku lančanih vrijednosti, kao omjer svakog nivoa prema prethodnom.
Jednostavna geometrijska sredina izračunava se pomoću formule:
,
gdje je znak proizvoda,
N – broj prosječnih vrijednosti.
Primjer. Broj registrovanih krivičnih djela za 4 godine povećan je za 1,57 puta, i to za 1. – 1,08 puta, za 2. – 1,1 puta, za 3. – 1,18 i za 4. – 1,12 puta. Tada je prosječna godišnja stopa rasta broja krivičnih djela: , tj. broj registrovanih krivičnih djela rastao je godišnje u prosjeku za 12%.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Da bismo izračunali ponderisani srednji kvadrat, određujemo i unosimo u tabelu i . Tada je prosječno odstupanje dužine proizvoda od date norme jednako:

Aritmetički prosjek bi u ovom slučaju bio neprikladan, jer kao rezultat dobili bismo nultu devijaciju.
Korištenje srednjeg kvadrata će se dalje raspravljati u smislu varijacije.

Šta je aritmetička sredina

Aritmetička sredina nekoliko veličina je odnos zbira ovih veličina i njihovog broja.

Aritmetička sredina određenog niza brojeva je zbir svih ovih brojeva podijeljen sa brojem članova. Dakle, aritmetička sredina je prosječna vrijednost niza brojeva.

Koja je aritmetička sredina nekoliko brojeva? I jednaki su zbiru ovih brojeva, koji je podijeljen brojem članova u ovom zbiru.

Kako pronaći aritmetičku sredinu

Nema ništa komplikovano u izračunavanju ili pronalaženju aritmetičke sredine nekoliko brojeva, dovoljno je sabrati sve prikazane brojeve i rezultujući zbir podeliti sa brojem članova. Dobiveni rezultat će biti aritmetička sredina ovih brojeva.


Pogledajmo ovaj proces detaljnije. Šta trebamo učiniti da izračunamo aritmetičku sredinu i dobijemo konačni rezultat ovog broja.

Prvo, da biste ga izračunali, morate odrediti skup brojeva ili njihov broj. Ovaj skup može uključivati ​​velike i male brojeve, a njihov broj može biti bilo koji.

Drugo, sve ove brojeve treba sabrati i dobiti njihov zbir. Naravno, ako su brojevi jednostavni i ima ih mali broj, onda se izračuni mogu napraviti tako što ćete ih napisati rukom. Ali ako je skup brojeva impresivan, onda je bolje koristiti kalkulator ili proračunsku tablicu.

I četvrto, iznos dobiven sabiranjem mora se podijeliti s brojem brojeva. Kao rezultat, dobićemo rezultat, koji će biti aritmetička sredina ove serije.



Zašto vam je potrebna aritmetička sredina?

Aritmetička sredina može biti korisna ne samo za rješavanje primjera i zadataka na časovima matematike, već i u druge svrhe neophodne u svakodnevnom životu osobe. Takvi ciljevi mogu biti izračunavanje aritmetičkog prosjeka za izračunavanje prosječnog mjesečnog financijskog izdatka ili izračunavanje vremena koje provodite na putu, također kako biste saznali posjećenost, produktivnost, brzinu kretanja, prinos i još mnogo toga.

Pa, na primjer, hajde da pokušamo izračunati koliko vremena provedete putujući do škole. Kada idete u školu ili se vraćate kući, svaki put provodite drugačije vrijeme na putu, jer kada ste u žurbi, hodate brže, a samim tim i put traje manje vremena. Ali kada se vratite kući, možete hodati polako, komunicirati s kolegama iz razreda, diviti se prirodi, pa će vam putovanje trajati više vremena.

Stoga nećete moći precizno odrediti vrijeme provedeno na putu, ali zahvaljujući aritmetičkom prosjeku možete otprilike saznati vrijeme koje provedete na putu.

Pretpostavimo da ste prvog dana nakon vikenda proveli petnaest minuta na putu od kuće do škole, drugog dana vam je put trajao dvadeset minuta, u srijedu ste put prevalili za dvadeset pet minuta, a vaš put je trajao isto u četvrtak, a u petak niste žurili i vratili ste se punih pola sata.

Nađimo aritmetičku sredinu, dodajući vrijeme, za svih pet dana. dakle,

15 + 20 + 25 + 25 + 30 = 115

Sada podijelite ovaj iznos sa brojem dana

Zahvaljujući ovoj metodi, naučili ste da vam putovanje od kuće do škole traje otprilike dvadeset i tri minuta.

Zadaća

1. Koristeći jednostavne proračune, pronađite aritmetički prosjek pohađanja učenika u vašem razredu za sedmicu.

2. Pronađite aritmetičku sredinu:



3. Riješite problem:



Za potrebe analize i dobijanja statističkih zaključaka na osnovu rezultata sumiranja i grupisanja, izračunavaju se generalizujući indikatori - prosječne i relativne vrijednosti.

Problem sa prosjecima – okarakterizirati sve jedinice statističke populacije jednom karakterističnom vrijednošću.

Prosječne vrijednosti karakteriziraju kvalitativne pokazatelje poduzetničke aktivnosti: troškove distribucije, profit, profitabilnost itd.

prosječna vrijednost- ovo je generalizirajuća karakteristika jedinica stanovništva prema nekim varijabilnim karakteristikama.

Prosječne vrijednosti vam omogućavaju da uporedite nivoe iste osobine u različitim populacijama i pronađete razloge za ova odstupanja.

U analizi fenomena koji se proučavaju, uloga prosječnih vrijednosti je ogromna. Engleski ekonomista W. Petty (1623-1687) je široko koristio prosječne vrijednosti. V. Petty je želio da koristi prosječne vrijednosti kao meru troškova troškova za prosječnu dnevnu ishranu jednog radnika. Stabilnost prosječne vrijednosti je odraz pravilnosti procesa koji se proučavaju. Vjerovao je da se informacije mogu transformirati, čak i ako nema dovoljno originalnih podataka.

Engleski naučnik G. King (1648-1712) koristio je prosječne i relativne vrijednosti kada je analizirao podatke o stanovništvu Engleske.

Teorijski razvoj belgijskog statističara A. Queteleta (1796-1874) zasniva se na kontradiktornoj prirodi društvenih pojava - visoko stabilnih u masama, ali čisto individualnih.

Prema A. Queteletu, konstantni uzroci djeluju podjednako na svaku pojavu koja se proučava i čine te pojave sličnim jedni drugima, stvarajući obrasce zajedničke za sve.

Posljedica učenja A. Queteleta bila je identifikacija prosječnih vrijednosti kao glavne tehnike statističke analize. On je rekao da statistički prosjeci ne predstavljaju kategoriju objektivne realnosti.

A. Quetelet je izrazio svoje stavove o prosjeku u svojoj teoriji prosječnog čovjeka. Prosječan čovjek je osoba koja ima sve kvalitete prosječne veličine (prosječan mortalitet ili natalitet, prosječna visina i težina, prosječna brzina trčanja, prosječna sklonost braku i samoubistvu, dobrim djelima itd.). Za A. Queteleta, prosječna osoba je idealna osoba. Nedosljednost teorije prosječne osobe A. Quetelet-a dokazana je u ruskoj statističkoj literaturi krajem 19.-20. vijeka.

Čuveni ruski statističar Yu E. Yanson (1835-1893) napisao je da A. Quetelet pretpostavlja postojanje tipa prosječne osobe kao nečega datog, od čega je život odstupio od prosječnih ljudi datog društva i datog vremena. , a to ga dovodi do potpuno mehaničkog pogleda i do zakona kretanja društvenog života: kretanje je postepeno povećanje prosječnih svojstava osobe, postupna obnova tipa; sledstveno tome, takvo nivelisanje svih manifestacija života društvenog tela, iza koje prestaje svako kretanje napred.

Suština ove teorije našla je svoj dalji razvoj u radovima brojnih statističkih teoretičara kao teorije pravih veličina. A. Quetelet je imao sljedbenike - njemačkog ekonomistu i statističara V. Lexisa (1837-1914), koji je teoriju pravih vrijednosti prenio na ekonomske fenomene društvenog života. Njegova teorija je poznata kao teorija stabilnosti. Druga verzija idealističke teorije prosjeka zasnovana je na filozofiji

Njen osnivač je engleski statističar A. Bowley (1869–1957) - jedan od najistaknutijih teoretičara novijeg vremena u oblasti teorije prosjeka. Njegov koncept prosjeka izložen je u njegovoj knjizi Elementi statistike.

A. Boley razmatra prosječne vrijednosti samo s kvantitativne strane, odvajajući na taj način kvantitet od kvaliteta. Određujući značenje prosječnih vrijednosti (ili "njihove funkcije"), A. Boley iznosi makovski princip mišljenja. A. Boley je napisao da funkcija prosječnih vrijednosti treba da izražava kompleksnu grupu

koristeći nekoliko prostih brojeva. Statističke podatke treba pojednostaviti, grupisati i svesti na prosjek. Ova gledišta: dijele R. Fisher (1890-1968), J. Yule (1871 - 1951), Frederick S. Mills (1892) itd.

30-ih godina. XX vijek i narednih godina, prosječna vrijednost se smatra društveno značajnom karakteristikom, čiji informativni sadržaj zavisi od homogenosti podataka.

Najistaknutiji predstavnici italijanske škole R. Benini (1862-1956) i C. Gini (1884-1965), smatrajući statistiku granom logike, proširili su obim primjene statističke indukcije, ali su povezivali kognitivnu principe logike i statistike sa prirodom fenomena koji se proučava, prateći tradiciju sociološkog tumačenja statistike.

U djelima K. Marxa i V. I. Lenjina prosječne vrijednosti igraju posebnu ulogu.

K. Marx je tvrdio da se u prosječnoj vrijednosti gase pojedinačna odstupanja od opšteg nivoa i da prosječni nivo postaje opšta karakteristika fenomena mase. Prosječna vrijednost postaje takva karakteristika fenomena mase samo ako se uzme značajan broj jedinica a ove jedinice su kvalitativno homogene. Marx je napisao da bi prosječna pronađena vrijednost trebala biti prosjek "...mnogih različitih pojedinačnih vrijednosti iste vrste".

Prosječna vrijednost dobija poseban značaj u tržišnoj ekonomiji. Pomaže u određivanju neophodnog i opšteg, tendencija obrasca ekonomskog razvoja direktno preko individualnog i slučajnog.

Prosječne vrijednosti su opšti indikatori u kojima se izražava efekat opštih uslova i obrazac fenomena koji se proučava.

Statistički prosjeci se izračunavaju na osnovu masovnih podataka iz statistički ispravno organiziranog masovnog posmatranja. Ako se statistički prosjek izračuna iz masovnih podataka za kvalitativno homogenu populaciju (masovne pojave), onda će biti objektivan.

Prosječna vrijednost je apstraktna, jer karakterizira vrijednost apstraktne jedinice.

Prosjek se apstrahuje iz raznolikosti osobina u pojedinačnim objektima. Apstrakcija je faza naučnog istraživanja. U prosječnoj vrijednosti ostvaruje se dijalektičko jedinstvo pojedinačnog i opšteg.

Prosječne vrijednosti treba primijeniti na osnovu dijalektičkog razumijevanja kategorija pojedinačno i općenito, pojedinačno i masovno.

Srednji prikazuje nešto zajedničko što je sadržano u određenom pojedinačnom objektu.

Za identifikaciju obrazaca u masovnim društvenim procesima, prosječna vrijednost je od velike važnosti.

Odstupanje pojedinca od opšteg je manifestacija procesa razvoja.

Prosječna vrijednost odražava karakterističan, tipičan, stvarni nivo fenomena koji se proučava. Zadatak prosječnih vrijednosti je karakterizirati ove razine i njihove promjene u vremenu i prostoru.

Prosječni indikator je zajednička vrijednost, jer se formira u normalnim, prirodnim, općim uslovima postojanja specifične masovne pojave, posmatrane kao cjeline.

Objektivno svojstvo statističkog procesa ili fenomena odražava se kroz prosječnu vrijednost.

Pojedinačne vrijednosti statističkog atributa koji se proučavaju različite su za svaku jedinicu populacije. Prosječna vrijednost pojedinačnih vrijednosti jedne vrste je proizvod nužde, koji je rezultat zajedničkog djelovanja svih jedinica populacije, manifestiranog u masi ponavljajućih nezgoda.

Neki pojedinačni fenomeni imaju karakteristike koje postoje u svim pojavama, ali u različitim količinama - to je visina ili starost osobe. Ostali znaci pojedinačne pojave kvalitativno su različiti u različitim pojavama, odnosno kod nekih su prisutni, a kod drugih se ne primjećuju (muškarac neće postati žena). Prosječna vrijednost se izračunava za karakteristike koje su kvalitativno homogene i različite samo kvantitativno, koje su svojstvene svim pojavama u datom skupu.

Prosječna vrijednost je odraz vrijednosti karakteristike koja se proučava i mjeri se u istoj dimenziji kao i ova karakteristika.

Teorija dijalektičkog materijalizma uči da se sve u svijetu mijenja i razvija. A također se mijenjaju i karakteristike koje karakteriziraju prosječne vrijednosti, a shodno tome i sami prosjeci.

U životu postoji kontinuirani proces stvaranja nečeg novog. Nositelj novog kvaliteta su pojedinačni objekti, tada se broj tih objekata povećava, a novi postaje masovni, tipični.

Prosječna vrijednost karakterizira populaciju koja se proučava prema samo jednoj osobini. Za potpunu i sveobuhvatnu zastupljenost populacije koja se proučava prema nizu specifičnih karakteristika, potrebno je imati sistem prosječnih vrijednosti koji može opisati fenomen iz različitih uglova.

2. Vrste prosjeka

U statističkoj obradi materijala javljaju se različiti problemi koje je potrebno riješiti, te se stoga u statističkoj praksi koriste različite prosječne vrijednosti. Matematička statistika koristi različite proseke, kao što su: aritmetička sredina; geometrijska sredina; harmonična sredina; srednji kvadrat.

Da bi se primijenio jedan od navedenih tipova prosjeka, potrebno je analizirati populaciju koja se proučava, utvrditi materijalni sadržaj fenomena koji se proučava, a sve se to radi na osnovu zaključaka izvedenih iz principa smislenosti rezultata kada vaganje ili zbrajanje.

U proučavanju prosjeka koriste se sljedeći indikatori i oznake.

Znak po kojem se nalazi prosjek naziva se prosečna karakteristika i označava se sa x; naziva se vrijednost prosječne karakteristike za bilo koju jedinicu statističke populacije njegovo individualno značenje, ili opcije, i označeno kao x 1 , X 2 , x 3 ,… X P ; frekvencija je ponovljivost pojedinačnih vrijednosti karakteristike, označene slovom f.

Aritmetička sredina

Jedna od najčešćih vrsta medija je aritmetička sredina, koji se izračunava kada se obim prosječne karakteristike formira kao zbir njenih vrijednosti u pojedinačnim jedinicama statističke populacije koja se proučava.

Da bi se izračunao aritmetički prosjek, zbir svih nivoa atributa podijeli se s njihovim brojem.


Ako se neke opcije javljaju nekoliko puta, onda se zbir nivoa atributa može dobiti množenjem svakog nivoa sa odgovarajućim brojem jedinica u populaciji, a zatim dodavanjem rezultirajućih proizvoda izračunate aritmetičke sredine na ovaj način aritmetička sredina.

Formula za ponderisani aritmetički prosjek je sljedeća:


gdje su h i opcije,

f i – frekvencije ili težine.

Ponderisani prosjek treba koristiti u svim slučajevima kada opcije imaju različite brojeve.

Aritmetička sredina, takoreći, jednako raspoređuje između pojedinačnih objekata ukupnu vrijednost atributa, koja u stvarnosti varira za svaki od njih.

Izračunavanje prosječnih vrijednosti vrši se pomoću podataka grupiranih u obliku nizova intervalne distribucije, kada su varijante karakteristike iz kojih se izračunava prosjek prikazane u obliku intervala (od - do).

Svojstva aritmetičke sredine:

1) aritmetička sredina zbira promjenljivih vrijednosti jednaka je zbiru srednjih aritmetičkih vrijednosti: Ako je x i = y i +z i, tada


Ovo svojstvo pokazuje u kojim slučajevima je moguće sumirati prosječne vrijednosti.

2) algebarski zbir odstupanja pojedinačnih vrijednosti promjenjive karakteristike od prosjeka je nula, jer se zbir odstupanja u jednom smjeru kompenzira zbirom odstupanja u drugom smjeru:


Ovo pravilo pokazuje da je prosjek rezultanta.

3) ako se sve opcije u nizu povećaju ili smanje za isti broj?, hoće li se prosjek povećati ili smanjiti za isti broj?:


4) ako se sve varijante serije povećaju ili smanje za A puta, tada će se i prosječna također povećati ili smanjiti za A puta:


5) peto svojstvo prosjeka nam pokazuje da ono ne zavisi od veličine skale, već zavisi od odnosa između njih. Ne samo relativne, već i apsolutne vrijednosti mogu se uzeti kao skale.

Ako se sve frekvencije serije podijele ili pomnože sa istim brojem d, onda se prosjek neće promijeniti.


Harmonična sredina. Za određivanje aritmetičke sredine potrebno je imati niz opcija i frekvencija, tj. X I f.

Pretpostavimo da su pojedinačne vrijednosti karakteristike poznate X i radi X/, i frekvencije f su nepoznati, tada za izračunavanje prosjeka označavamo proizvod = X/; gdje:



Prosjek u ovom obliku naziva se harmonijski ponderirani prosjek i označava se x šteta. gore

Shodno tome, harmonijska sredina je identična aritmetičkoj sredini. Primjenjivo je kada su stvarne težine nepoznate f, a rad je poznat fx = z

Kada radi fx jedinice su iste ili jednake (m = 1), koristi se harmonijska prosta sredina izračunata po formuli:


Gdje X– odvojene opcije;

n- broj.

Geometrijska sredina

Ako postoji n koeficijenata rasta, onda je formula za prosječni koeficijent:


Ovo je formula geometrijske sredine.

Geometrijska sredina jednaka je korijenu stepena n iz proizvoda koeficijenata rasta koji karakterišu odnos vrednosti svakog narednog perioda prema vrednosti prethodnog.

Ako su vrijednosti izražene u obliku kvadratnih funkcija podložne usrednjavanju, koristi se srednji kvadrat. Na primjer, koristeći srednji kvadrat, možete odrediti promjere cijevi, kotača itd.

Jednostavan srednji kvadrat se određuje uzimanjem kvadratnog korijena količnika dijeljenja zbira kvadrata pojedinačnih vrijednosti atributa njihovim brojem.


Ponderisani srednji kvadrat je jednak:

3. Strukturni prosjeci. Mod i medijan

Za karakterizaciju strukture statističke populacije koriste se indikatori koji se nazivaju strukturni proseci. To uključuje mod i medijan.

Moda (M O ) - najčešća opcija. Moda je vrijednost atributa koja odgovara maksimalnoj tački teorijske krivulje distribucije.

Moda predstavlja najčešće javljano ili tipično značenje.

Moda se koristi u komercijalnoj praksi za proučavanje potražnje potrošača i rekordnih cijena.

U diskretnoj seriji, mod je varijanta sa najvećom frekvencijom. U nizu intervalnih varijacija, mod se smatra centralnom varijantom intervala, koja ima najveću frekvenciju (posebnost).

Unutar intervala morate pronaći vrijednost atributa koji je način rada.


Gdje X O– donja granica modalnog intervala;

h– vrijednost modalnog intervala;

f m– učestalost modalnog intervala;

f t-1 – frekvencija intervala koji prethodi modalnom;

f m+1 – frekvencija intervala koji slijedi nakon modalnog.

Način rada zavisi od veličine grupa i od tačnog položaja granica grupe.

Moda– broj koji se zapravo najčešće javlja (određena je vrijednost), u praksi ima najširu primjenu (najčešći tip kupca).

Medijan (M e je vrijednost koja dijeli broj uređenog varijantnog niza na dva jednaka dijela: jedan dio ima vrijednosti varijabilne karakteristike koje su manje od prosječne varijante, a drugi ima veće vrijednosti.

Medijan je element koji je veći ili jednak i istovremeno manji ili jednak polovini preostalih elemenata distributivnog niza.

Svojstvo medijane je da je zbir apsolutnih odstupanja vrijednosti atributa od medijane manji nego od bilo koje druge vrijednosti.

Korištenje medijane vam omogućava da dobijete preciznije rezultate od korištenja drugih oblika prosjeka.

Redoslijed pronalaženja medijane u nizu varijacija intervala je sljedeći: raspoređujemo pojedinačne vrijednosti karakteristike prema rangiranju; određujemo akumulirane frekvencije za datu rangiranu seriju; Koristeći akumulirane podatke o frekvenciji, nalazimo srednji interval:


Gdje x me– donja granica srednjeg intervala;

i Ja– vrijednost srednjeg intervala;

f/2– polovični zbir frekvencija serije;

S Ja-1 – zbir akumuliranih frekvencija koje prethode srednjem intervalu;

f Ja– frekvencija srednjeg intervala.

Medijan dijeli broj serije na pola, dakle, to je mjesto gdje je akumulirana frekvencija polovina ili više od polovine ukupnog zbira frekvencija, a prethodna (akumulirana) frekvencija je manja od polovine broja populacije.

Ovaj izraz ima druga značenja, pogledajte prosječno značenje.

Prosjek(u matematici i statistici) skupovi brojeva - zbir svih brojeva podijeljen njihovim brojem. To je jedna od najčešćih mjera centralne tendencije.

Predložili su ga (zajedno sa geometrijskom sredinom i harmonijskom sredinom) Pitagorejci.

Posebni slučajevi aritmetičke sredine su srednja vrijednost (opća populacija) i uzorkovana sredina (uzorak).

Uvod

Označimo skup podataka X = (x 1 , x 2 , …, x n), tada je srednja vrijednost uzorka obično označena horizontalnom crtom iznad varijable (x ¯ (\displaystyle (\bar (x))), izgovara se " x sa linijom").

Grčko slovo μ koristi se za označavanje aritmetičke sredine cjelokupne populacije. Za slučajnu varijablu za koju je određena srednja vrijednost, μ je prosek verovatnoće ili matematičko očekivanje slučajne varijable. Ako je set X je kolekcija slučajnih brojeva sa vjerovatnoćom srednje vrijednosti μ, tada za bilo koji uzorak x i iz ovog skupa μ = E( x i) je matematičko očekivanje ovog uzorka.

U praksi, razlika između μ i x ¯ (\displaystyle (\bar (x))) je u tome što je μ tipična varijabla jer možete vidjeti uzorak, a ne cijelu populaciju. Stoga, ako je uzorak predstavljen nasumično (u smislu teorije vjerovatnoće), tada se x ¯ (\displaystyle (\bar (x))) (ali ne μ) može tretirati kao slučajna varijabla koja ima distribuciju vjerovatnoće na uzorku ( distribucija vjerovatnoće srednje vrijednosti).

Obje ove količine se izračunavaju na isti način:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\suma _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Ako X je slučajna varijabla, zatim matematičko očekivanje X može se smatrati aritmetičkom sredinom vrijednosti u ponovljenim mjerenjima veličine X. Ovo je manifestacija zakona velikih brojeva. Stoga se srednja vrijednost uzorka koristi za procjenu nepoznate očekivane vrijednosti.

U osnovnoj algebri je dokazano da je srednja vrijednost n+ 1 broj iznad prosjeka n brojevi ako i samo ako je novi broj veći od starog prosjeka, manji ako i samo ako je novi broj manji od prosjeka i ne mijenja se ako i samo ako je novi broj jednak prosjeku. Više n, što je manja razlika između novog i starog prosjeka.

Imajte na umu da postoji nekoliko drugih dostupnih "prosjeka", uključujući srednju snagu, Kolmogorovljevu sredinu, harmonijsku sredinu, aritmetičko-geometrijsku sredinu i različite ponderisane prosjeke (npr. ponderirana aritmetička sredina, ponderirana geometrijska sredina, ponderirana harmonijska sredina).

Primjeri

  • Za tri broja, trebate ih sabrati i podijeliti sa 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Za četiri broja, trebate ih sabrati i podijeliti sa 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Ili jednostavnije 5+5=10, 10:2. Pošto smo sabirali 2 broja, što znači koliko brojeva sabiramo, dijelimo s tim brojem.

Kontinuirana slučajna varijabla

Za kontinuirano distribuiranu veličinu f (x) (\displaystyle f(x)), aritmetička sredina na intervalu [ a ; b ] (\displaystyle ) određuje se kroz određeni integral:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Neki problemi korištenja prosjeka

Nedostatak robusnosti

Glavni članak: Robusnost u statistici

Iako se aritmetičke sredine često koriste kao proseci ili centralne tendencije, ovaj koncept nije čvrsta statistika, što znači da je aritmetička sredina pod velikim uticajem "velikih odstupanja". Važno je napomenuti da za distribucije s velikim koeficijentom asimetrije, aritmetička sredina možda neće odgovarati konceptu „srednje vrijednosti“, a vrijednosti srednje vrijednosti iz robusne statistike (na primjer, medijan) mogu bolje opisati središnji sklonost.

Klasičan primjer je izračunavanje prosječnog prihoda. Aritmetička sredina se može pogrešno protumačiti kao medijana, što može dovesti do zaključka da ima više ljudi s većim primanjima nego što ih zapravo ima. “Prosječni” prihod se tumači tako da većina ljudi ima prihode oko ovog broja. Ovaj “prosječni” (u smislu aritmetičke sredine) prihod je veći od prihoda većine ljudi, budući da visok dohodak sa velikim odstupanjem od prosjeka čini aritmetičku sredinu jako iskrivljenom (nasuprot tome, prosječni prihod na medijani „opire se“ takvom iskošenju). Međutim, ovaj "prosječni" prihod ne govori ništa o broju ljudi blizu srednjeg prihoda (i ne govori ništa o broju ljudi blizu modalnog prihoda). Međutim, ako pojmove “prosjek” i “većina ljudi” shvatite olako, možete izvući pogrešan zaključak da većina ljudi ima prihode veće nego što jesu. Na primjer, izvještaj o "prosječnom" neto prihodu u Medini u Washingtonu, izračunatom kao aritmetički prosjek svih godišnjih neto prihoda stanovnika, dao bi iznenađujuće veliki broj zbog Billa Gatesa. Razmotrite uzorak (1, 2, 2, 2, 3, 9). Aritmetička sredina je 3,17, ali pet od šest vrijednosti je ispod ove sredine.

Složena kamata

Glavni članak: Povrat investicije

Ako su brojevi umnožiti, ali ne fold, trebate koristiti geometrijsku sredinu, a ne aritmetičku sredinu. Najčešće se ovaj incident dešava prilikom izračunavanja povrata ulaganja u finansije.

Na primjer, ako je dionica pala za 10% u prvoj godini i porasla za 30% u drugoj, onda je pogrešno izračunati „prosječan“ porast u te dvije godine kao aritmetičku sredinu (−10% + 30%) / 2 = 10%; tačan prosjek u ovom slučaju je dat složenom godišnjom stopom rasta, koja daje godišnju stopu rasta od samo oko 8,16653826392% ≈ 8,2%.

Razlog tome je što procenti svaki put imaju novu početnu tačku: 30% je 30% od broja manjeg od cijene na početku prve godine: ako je dionica počela na 30 dolara i pala za 10%, vrijedi 27 dolara na početku druge godine. Ako bi dionice porasle za 30%, na kraju druge godine vrijedile bi 35,1 dolara. Aritmetički prosjek ovog rasta je 10%, ali pošto je dionica porasla samo za 5,1 USD u 2 godine, prosječan rast od 8,2% daje konačni rezultat od 35,1 USD:

[30 USD (1 - 0,1) (1 + 0,3) = 30 USD (1 + 0,082) (1 + 0,082) = 35,1 USD]. Ako koristimo aritmetički prosjek od 10% na isti način, nećemo dobiti stvarnu vrijednost: [30 USD (1 + 0,1) (1 + 0,1) = 36,3 USD].

Složena kamata na kraju 2 godine: 90% * 130% = 117%, odnosno ukupno povećanje je 17%, a prosječna godišnja složena kamata je 117% ≈ 108,2% (\displaystyle (\sqrt (117\% ))\cca 108,2\%), odnosno prosječno godišnje povećanje od 8,2%.

Upute

Glavni članak: Statistika odredišta

Prilikom izračunavanja aritmetičke sredine neke varijable koja se ciklički mijenja (kao što je faza ili ugao), mora se obratiti posebna pažnja. Na primjer, prosjek od 1° i 359° bi bio 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Ovaj broj je netačan iz dva razloga.

  • Prvo, ugaone mere su definisane samo za opseg od 0° do 360° (ili od 0 do 2π kada se mere u radijanima). Dakle, isti par brojeva može se napisati kao (1° i -1°) ili kao (1° i 719°). Prosječne vrijednosti svakog para bit će različite: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ circ )).
  • Drugo, u ovom slučaju, vrijednost od 0° (ekvivalentno 360°) će biti geometrijski bolja prosječna vrijednost, pošto brojevi odstupaju manje od 0° nego od bilo koje druge vrijednosti (vrijednost 0° ima najmanju varijansu). uporedi:
    • broj 1° odstupa od 0° samo za 1°;
    • broj 1° odstupa od izračunatog prosjeka od 180° za 179°.

Prosječna vrijednost za cikličnu varijablu izračunatu korištenjem gornje formule bit će umjetno pomjerena u odnosu na stvarni prosjek prema sredini numeričkog raspona. Zbog toga se prosek izračunava na drugačiji način, naime, kao prosečna vrednost se bira broj sa najmanjom varijansom (centralna tačka). Također, umjesto oduzimanja, koristi se modularna udaljenost (tj. obodna udaljenost). Na primjer, modularna udaljenost između 1° i 359° je 2°, a ne 358° (na krugu između 359° i 360°==0° - jedan stepen, između 0° i 1° - također 1°, ukupno - 2°).

Vrste prosječnih vrijednosti i metode njihovog izračunavanja

U fazi statističke obrade mogu se postaviti različiti istraživački problemi za čije je rješavanje potrebno odabrati odgovarajući prosjek. U ovom slučaju potrebno je voditi se sljedećim pravilom: veličine koje predstavljaju brojnik i imenilac prosjeka moraju biti logički povezane jedna s drugom.

  • prosjeci snage;
  • strukturni proseci.

Hajde da predstavimo sledeće konvencije:

Količine za koje se izračunava prosjek;

Prosjek, gdje traka iznad pokazuje da se vrši usrednjavanje pojedinačnih vrijednosti;

Učestalost (ponovljivost pojedinačnih karakterističnih vrijednosti).

Različiti prosjeci su izvedeni iz opšte formule prosječne moći:

(5.1)

kada je k = 1 - aritmetička sredina; k = -1 - harmonijska sredina; k = 0 - geometrijska sredina; k = -2 - srednji kvadrat.

Prosječne vrijednosti mogu biti jednostavne ili ponderisane. Ponderisani proseci To su vrijednosti koje uzimaju u obzir da neke varijante vrijednosti atributa mogu imati različite brojeve, pa se stoga svaka opcija mora pomnožiti s ovim brojem. Drugim riječima, “skale” su brojevi agregatnih jedinica u različitim grupama, tj. Svaka opcija je "ponderisana" svojom frekvencijom. Frekvencija f se zove statistička težina ili Prosječna masa.

Aritmetička sredina- najčešći tip prosjeka. Koristi se kada se proračun vrši na negrupisanim statističkim podacima, gdje je potrebno dobiti prosječan termin. Aritmetička sredina je prosječna vrijednost neke karakteristike, po dobijanju koje ukupan volumen karakteristike u agregatu ostaje nepromijenjen.

Formula aritmetičke sredine ( jednostavno) ima oblik

gdje je n veličina populacije.

Na primjer, prosječna plata zaposlenih u preduzeću izračunava se kao aritmetički prosjek:

Odlučujući indikatori su plata svakog zaposlenog i broj zaposlenih u preduzeću. Prilikom izračunavanja prosjeka ukupan iznos zarada je ostao isti, ali ravnomjerno raspoređen na sve zaposlene. Na primjer, potrebno je izračunati prosječnu platu radnika u maloj kompaniji koja zapošljava 8 ljudi:

Prilikom izračunavanja prosječnih vrijednosti pojedinačne vrijednosti karakteristike koja se usrednjuje mogu se ponoviti, pa se prosječna vrijednost izračunava pomoću grupisanih podataka. U ovom slučaju govorimo o korištenju ponderisan aritmetički prosjek, koji ima oblik

(5.3)

Dakle, potrebno je izračunati prosječnu cijenu dionica akcionarskog društva na berzanskom trgovanju. Poznato je da su transakcije obavljene u roku od 5 dana (5 transakcija), a broj prodatih akcija po prodajnom kursu je raspoređen na sledeći način:

1 - 800 ak. - 1010 rub.

2 - 650 ak. - 990 rub.

3 - 700 ak. - 1015 rub.

4 - 550 ak. - 900 rub.

5 - 850 ak. - 1150 rub.

Početni omjer za određivanje prosječne cijene dionica je odnos ukupnog iznosa transakcija (TVA) i broja prodatih dionica (KPA):

OSS = 1010·800+990·650+1015·700+900·550+1150·850= 3,634,500;

KPA = 800+650+700+550+850=3550.

U ovom slučaju, prosječna cijena dionica bila je jednaka

Neophodno je poznavati svojstva aritmetičkog prosjeka, što je veoma važno kako za njegovu upotrebu tako i za izračunavanje. Možemo razlikovati tri glavna svojstva koja su najviše odredila raširenu upotrebu aritmetičkog prosjeka u statističkim i ekonomskim proračunima.

Svojstvo jedan (nula): zbir pozitivnih odstupanja pojedinačnih vrijednosti karakteristike od njene prosječne vrijednosti jednak je zbiru negativnih odstupanja. Ovo je vrlo važno svojstvo, jer pokazuje da će se sva odstupanja (i + i -) uzrokovana slučajnim razlozima međusobno poništavati.

dokaz:

Svojstvo dva (minimum): zbir kvadrata odstupanja pojedinačnih vrijednosti karakteristike od aritmetičke sredine je manji nego od bilo kojeg drugog broja (a), tj. postoji minimalni broj.

Dokaz.

Hajde da sastavimo zbir kvadrata odstupanja od varijable a:

(5.4)

Da bismo pronašli ekstremu ove funkcije, potrebno je njenu derivaciju u odnosu na a izjednačiti sa nulom:

Odavde dobijamo:

(5.5)

Posljedično, ekstremum sume kvadrata odstupanja se postiže na . Ovaj ekstrem je minimum, jer funkcija ne može imati maksimum.

Svojstvo tri: aritmetička sredina konstantne vrijednosti je jednaka ovoj konstanti: za a = const.

Pored ova tri najvažnija svojstva aritmetičke sredine, postoje i tzv svojstva dizajna, koji postepeno gube na značaju zbog upotrebe elektronske računarske tehnologije:

  • ako se pojedinačna vrijednost atributa svake jedinice pomnoži ili podijeli sa konstantnim brojem, tada će se aritmetička sredina povećati ili smanjiti za isti iznos;
  • aritmetička sredina se neće promijeniti ako se težina (učestalost) svake vrijednosti atributa podijeli sa konstantnim brojem;
  • ako se pojedinačne vrijednosti atributa svake jedinice smanjuju ili povećavaju za isti iznos, tada će se aritmetička sredina smanjiti ili povećati za isti iznos.

Harmonična sredina. Ovaj prosjek se naziva inverzni aritmetički prosjek jer se ova vrijednost koristi kada je k = -1.

Jednostavna harmonijska sredina koristi se kada su težine vrijednosti atributa iste. Njegova formula se može izvesti iz osnovne formule zamjenom k ​​= -1:

Na primjer, trebamo izračunati prosječnu brzinu dva automobila koji su prešli isti put, ali različitim brzinama: prvi pri brzini od 100 km/h, drugi pri 90 km/h. Koristeći metodu harmonijske sredine izračunavamo prosječnu brzinu:

U statističkoj praksi češće se koristi harmonijski ponderirani, čija formula ima oblik

Ova formula se koristi u slučajevima kada težine (ili zapremine fenomena) za svaki atribut nisu jednake. U početnom odnosu za izračunavanje prosjeka, brojilac je poznat, ali je imenilac nepoznat.

Na primjer, kada se izračunava prosječna cijena, moramo koristiti omjer iznosa prodaje i broja prodanih jedinica. Ne znamo broj prodanih jedinica (govorimo o različitim proizvodima), ali znamo kolike su prodajne količine tih različitih proizvoda. Recimo da trebate saznati prosječnu cijenu prodate robe:

Dobijamo

Geometrijska sredina. Najčešće, geometrijska sredina nalazi svoju primjenu u određivanju prosječnih stopa rasta (prosječnih koeficijenata rasta), kada se pojedinačne vrijednosti neke karakteristike prikazuju u obliku relativnih vrijednosti. Također se koristi ako je potrebno pronaći prosjek između minimalne i maksimalne vrijednosti karakteristike (na primjer, između 100 i 1000000). Postoje formule za jednostavnu i ponderisanu geometrijsku sredinu.

Za jednostavnu geometrijsku sredinu

Za ponderisanu geometrijsku sredinu

Srednja kvadratna vrijednost. Glavno područje njegove primjene je mjerenje varijacije karakteristike u agregatu (izračun standardne devijacije).

Jednostavna formula srednjeg kvadrata

Ponderirana formula srednjeg kvadrata

(5.11)

Kao rezultat toga, možemo reći da uspješno rješavanje problema statističkog istraživanja zavisi od pravilnog izbora vrste prosječne vrijednosti u svakom konkretnom slučaju. Odabir prosjeka uključuje sljedeći niz:

a) utvrđivanje opšteg indikatora stanovništva;

b) utvrđivanje matematičke veze veličina za dati opšti pokazatelj;

c) zamjenu pojedinačnih vrijednosti prosječnim vrijednostima;

d) izračunavanje prosjeka korištenjem odgovarajuće jednačine.

Prosjeci i varijacije

prosječna vrijednost- ovo je opšti pokazatelj koji karakteriše kvalitativno homogenu populaciju prema određenoj kvantitativnoj karakteristici. Na primjer, prosječna starost osoba osuđenih za krađu.

U pravosudnoj statistici prosječne vrijednosti se koriste za karakterizaciju:

Prosječno vrijeme za razmatranje predmeta ove kategorije;

Prosječna veličina potraživanja;

Prosječan broj optuženih po predmetu;

Prosječna šteta;

Prosječno opterećenje sudija itd.

Prosjek je uvijek imenovana vrijednost i ima istu dimenziju kao karakteristika pojedine jedinice populacije. Svaka prosječna vrijednost karakterizira populaciju koja se proučava prema bilo kojoj promjenjivoj karakteristici, stoga iza svake prosječne vrijednosti leži niz distribucije jedinica ove populacije prema osobini koja se proučava. Izbor vrste prosjeka određen je sadržajem indikatora i početnim podacima za izračunavanje prosječne vrijednosti.

Sve vrste prosjeka koji se koriste u statističkim istraživanjima podijeljeni su u dvije kategorije:

1) proseci snage;

2) strukturni proseci.

Prva kategorija prosjeka uključuje: aritmetička sredina, harmonijska sredina, geometrijska sredina I srednji kvadratni korijen . Druga kategorija je moda I medijana. Štaviše, svaki od navedenih tipova proseka snage može imati dva oblika: jednostavno I ponderisano . Jednostavan oblik prosjeka se koristi za dobivanje prosječne vrijednosti karakteristike koja se proučava kada se proračun vrši na negrupisanim statističkim podacima, ili kada se svaka opcija u zbiru javlja samo jednom. Ponderisani prosjeci su vrijednosti koje uzimaju u obzir da varijante vrijednosti atributa mogu imati različite brojeve, te se stoga svaka varijanta mora pomnožiti s odgovarajućom frekvencijom. Drugim riječima, svaka opcija je “ponderisana” svojom učestalošću. Učestalost se naziva statistička težina.

Jednostavna aritmetička sredina- najčešći tip prosjeka. Ona je jednaka zbroju pojedinačnih vrijednosti atributa podijeljenom s ukupnim brojem ovih vrijednosti:

,

Gdje x 1 ,x 2 , … ,x N su pojedinačne vrijednosti različite karakteristike (varijante), a N je broj jedinica u populaciji.

Ponderisan aritmetički prosjek koristi se u slučajevima kada su podaci predstavljeni u obliku distributivnih serija ili grupa. Izračunava se kao zbroj proizvoda opcija i njihovih odgovarajućih frekvencija, podijeljen sa zbirom frekvencija svih opcija:

Gdje x i- značenje i-te varijante karakteristike; f i– frekvencija i-th opcije.

Dakle, svaka vrijednost varijante je ponderisana svojom frekvencijom, zbog čega se frekvencije ponekad nazivaju statističkim ponderima.

Komentar. Kada govorimo o aritmetičkoj sredini bez navođenja njenog tipa, mislimo na jednostavnu aritmetičku sredinu.

Tabela 12.

Rješenje. Za izračunavanje koristimo formulu ponderiranog aritmetičkog prosjeka:

Dakle, u proseku postoje dva okrivljena po krivičnom predmetu.

Ako se izračunavanje prosječne vrijednosti vrši pomoću podataka grupiranih u obliku nizova intervalne distribucije, tada prvo morate odrediti srednje vrijednosti svakog intervala x"i, a zatim izračunati prosječnu vrijednost koristeći aritmetički ponderirani prosjek formule, u kojoj je x"i zamijenjen umjesto xi.

Primjer. Podaci o starosti kriminalaca osuđenih za krađu prikazani su u tabeli:

Tabela 13.

Odredite prosječnu starost kriminalaca osuđenih za krađu.

Rješenje. Da bi se odredila prosječna starost kriminalaca na osnovu niza intervalnih varijacija, potrebno je prvo pronaći srednje vrijednosti intervala. Pošto je data intervalna serija sa prvim i poslednjim otvorenim intervalom, vrednosti ovih intervala se uzimaju jednake vrednostima susednih zatvorenih intervala. U našem slučaju, vrijednosti prvog i posljednjeg intervala su jednake 10.

Sada pronalazimo prosječnu starost kriminalaca koristeći ponderiranu formulu aritmetičkog prosjeka:

Dakle, prosječna starost kriminalaca osuđenih za krađu je otprilike 27 godina.

Mean harmonic simple predstavlja recipročnu vrijednost aritmetičke sredine recipročnih vrijednosti karakteristike:

gdje je 1/ x i su inverzne vrijednosti opcija, a N je broj jedinica u populaciji.

Primjer. Radi utvrđivanja prosječnog godišnjeg opterećenja sudija okružnog suda prilikom razmatranja krivičnih predmeta, urađena je studija opterećenja 5 sudija ovog suda. Pokazalo se da je prosječno vrijeme provedeno na jednom krivičnom predmetu za svakog od ispitanih sudija jednako (u danima): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Nađite prosječne troškove na jednom krivični predmet i prosječno godišnje opterećenje sudija određenog okružnog suda prilikom razmatranja krivičnih predmeta.

Rješenje. Da bismo odredili prosječno vrijeme provedeno na jednom krivičnom predmetu, koristimo formulu harmoničnog prosjeka:

Da bismo pojednostavili proračune, u primjeru uzimamo broj dana u godini na 365, uključujući vikende (ovo ne utiče na metodologiju obračuna, a pri izračunavanju sličnog indikatora u praksi potrebno je zamijeniti broj radnih dana u određenoj godini umjesto 365 dana). Tada će prosječno godišnje opterećenje za sudije datog okružnog suda prilikom razmatranja krivičnih predmeta biti: 365 (dana) : 5,56 ≈ 65,6 (predmeti).

Ako bismo koristili jednostavnu formulu aritmetičkog prosjeka da odredimo prosječno vrijeme provedeno na jednom krivičnom predmetu, dobili bismo:

365 (dana): 5,64 ≈ 64,7 (slučajevi), tj. pokazalo se da je prosječno opterećenje sudija manje.

Provjerimo valjanost ovog pristupa. Za to ćemo koristiti podatke o vremenu provedenom na jednom krivičnom predmetu za svakog sudiju i izračunati broj krivičnih predmeta koje svaki od njih razmatra godišnje.

Dobijamo shodno tome:

365 (dani) : 6 ≈ 61 (slučajevi), 365 (dani) : 5,6 ≈ 65,2 (slučajevi), 365 (dani) : 6,3 ≈ 58 (slučajevi),

365 (dani) : 4,9 ≈ 74,5 (slučajevi), 365 (dani) : 5,4 ≈ 68 (slučajevi).

Sada izračunajmo prosječno godišnje opterećenje za sudije datog okružnog suda prilikom razmatranja krivičnih predmeta:

One. prosječno godišnje opterećenje je isto kao i kada se koristi harmonijski prosjek.

Stoga je korištenje aritmetičkog prosjeka u ovom slučaju nezakonito.

U slučajevima kada su poznate varijante karakteristike i njihove volumetrijske vrijednosti (proizvod varijanti i frekvencije), ali su same frekvencije nepoznate, koristi se ponderirana harmonijska prosječna formula:

,

Gdje x i su vrijednosti opcija atributa, a w i su volumetrijske vrijednosti opcija ( w i = x i f i).

Primjer. Podaci o cijeni jedinice iste vrste proizvoda koju proizvode različite ustanove kazneno-popravnog sistema, te o obimu njegove prodaje dati su u tabeli 14.

Tabela 14

Pronađite prosječnu prodajnu cijenu proizvoda.

Rješenje. Prilikom izračunavanja prosječne cijene moramo koristiti omjer iznosa prodaje i broja prodanih jedinica. Ne znamo broj prodatih jedinica, ali znamo količinu prodaje robe. Stoga, da bismo pronašli prosječnu cijenu prodane robe, koristit ćemo ponderiranu harmonijsku prosječnu formulu. Dobijamo

Ako ovdje koristite formulu aritmetičkog prosjeka, možete dobiti prosječnu cijenu koja će biti nerealna:

Geometrijska sredina izračunava se izdvajanjem korijena stepena N iz proizvoda svih vrijednosti varijanti atributa:

Gdje x 1 ,x 2 , … ,x N– pojedinačne vrijednosti različite karakteristike (varijante), i

N– broj jedinica u populaciji.

Ova vrsta prosjeka se koristi za izračunavanje prosječnih stopa rasta vremenskih serija.

Srednji kvadrat se koristi za izračunavanje standardne devijacije, koja je indikator varijacije, o čemu će biti riječi u nastavku.

Za utvrđivanje strukture stanovništva koriste se posebni prosječni pokazatelji, koji uključuju medijana I moda , ili takozvani strukturni proseci. Ako se aritmetička sredina izračunava na osnovu upotrebe svih varijanti vrijednosti atributa, tada medijan i mod karakteriziraju vrijednost varijante koja zauzima određenu prosječnu poziciju u rangiranoj (uređenoj) seriji. Jedinice statističke populacije mogu se poredati u rastućem ili opadajućem redosledu varijanti karakteristike koja se proučava.

medijana (ja)– ovo je vrijednost koja odgovara opciji koja se nalazi u sredini rangirane serije. Dakle, medijan je ona verzija rangiranog niza, na čijem obje strane u ovoj seriji treba biti jednak broj populacijskih jedinica.

Da biste pronašli medijan, prvo morate odrediti njegov serijski broj u rangiranoj seriji koristeći formulu:

gdje je N volumen serije (broj jedinica u populaciji).

Ako se niz sastoji od neparnog broja članova, tada je medijan jednak opciji sa brojem N Me. Ako se niz sastoji od parnog broja članova, tada se medijan definira kao aritmetička sredina dvije susjedne opcije koje se nalaze u sredini.

Primjer. Za rangiranu seriju 1, 2, 3, 3, 6, 7, 9, 9, 10. Obim serije je N = 9, što znači N Me = (9 + 1) / 2 = 5. Dakle, Me = 6, tj. peta opcija. Ako je red dat 1, 5, 7, 9, 11, 14, 15, 16, tj. niz sa parnim brojem članova (N = 8), tada je N Me = (8 + 1) / 2 = 4,5. To znači da je medijan jednak polovini zbira četvrte i pete opcije, tj. Ja = (9 + 11) / 2 = 10.

U seriji diskretnih varijacija, medijan je određen akumuliranim frekvencijama. Učestalosti opcije, počevši od prve, se zbrajaju sve dok se ne prekorači srednji broj. Vrijednost zadnjih zbrojenih opcija bit će medijana.

Primjer. Nađite medijan broja optuženih po krivičnom predmetu koristeći podatke u tabeli 12.

Rješenje. U ovom slučaju, volumen serije varijacija je N = 154, dakle, N Me = (154 + 1) / 2 = 77,5. Sumirajući frekvencije prve i druge opcije, dobijamo: 75 + 43 = 118, tj. premašili smo srednji broj. Dakle, ja = 2.

U nizu varijacija intervala, distribucija prvo ukazuje na interval u kojem će se nalaziti medijan. On je zvao medijana . Ovo je prvi interval čija akumulirana frekvencija prelazi polovinu volumena serije varijacije intervala. Tada se numerička vrijednost medijane određuje formulom:

Gdje x Me– donja granica srednjeg intervala; i – vrijednost srednjeg intervala; S Me-1– akumulirana frekvencija intervala koji prethodi medijani; f Me– frekvencija srednjeg intervala.

Primjer. Pronađite srednju starost prestupnika osuđenih za krađu na osnovu statistike predstavljene u tabeli 13.

Rješenje. Statistički podaci predstavljeni su nizom varijacije intervala, što znači da prvo određujemo srednji interval. Obim populacije je N = 162, dakle, srednji interval je interval 18-28, jer ovo je prvi interval čija akumulirana frekvencija (15 + 90 = 105) prelazi polovinu volumena (162: 2 = 81) serije varijacije intervala. Sada određujemo numeričku vrijednost medijane koristeći gornju formulu:

Tako je polovina osuđenih za krađu mlađa od 25 godina.

moda (pon.) Oni nazivaju vrijednost karakteristike koja se najčešće nalazi u jedinicama stanovništva. Moda se koristi za identifikaciju vrijednosti karakteristike koja je najrasprostranjenija. Za diskretnu seriju, način će biti opcija s najvećom frekvencijom. Na primjer, za diskretne serije prikazane u tabeli 3 Mo= 1, pošto ova vrijednost odgovara najvišoj frekvenciji - 75. Da biste odredili način intervalne serije, prvo odredite modalni interval (interval sa najvećom frekvencijom). Zatim se unutar ovog intervala pronađe vrijednost karakteristike, koja može biti mod.

Njegova vrijednost se nalazi pomoću formule:

Gdje x Mo– donja granica modalnog intervala; i – vrijednost modalnog intervala; f Mo– učestalost modalnog intervala; f Mo-1– učestalost intervala koji prethodi modalnom; f Mo+1– učestalost intervala koji slijedi nakon modalnog.

Primjer. Odredite godine starosti kriminalaca osuđenih za krađu, podaci o čemu su prikazani u tabeli 13.

Rješenje. Najviša frekvencija odgovara intervalu 18-28, stoga bi mod trebao biti u ovom intervalu. Njegova vrijednost je određena gornjom formulom:

Dakle, najveći broj kriminalaca osuđenih za krađe ima 24 godine.

Prosječna vrijednost daje opštu karakteristiku cjeline fenomena koji se proučava. Međutim, dvije populacije koje imaju iste prosječne vrijednosti mogu se značajno razlikovati jedna od druge u stupnju fluktuacije (varijacije) u vrijednosti karakteristike koja se proučava. Na primjer, u jednom sudu su izrečene kazne zatvora: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 godina, au drugom - 5, 5, 6, 6, 7, 7 godina. , 7 , 8, 8, 8 godina. U oba slučaja, aritmetička sredina je 6,7 godina. Međutim, ove se populacije značajno razlikuju jedna od druge u širenju pojedinačnih vrijednosti određene kazne zatvora u odnosu na prosječnu vrijednost.

A za prvi sud, gdje je ovaj raspon prilično velik, prosječna zatvorska kazna ne odražava cjelokupnu populaciju. Dakle, ako se pojedinačne vrijednosti neke karakteristike malo razlikuju jedna od druge, tada će aritmetička sredina biti prilično indikativna karakteristika svojstava date populacije. U suprotnom, aritmetička sredina će biti nepouzdana karakteristika ove populacije i njena upotreba u praksi će biti neefikasna. Stoga je potrebno uzeti u obzir varijacije u vrijednostima karakteristike koja se proučava.

Varijacija- to su razlike u vrijednostima bilo koje karakteristike među različitim jedinicama date populacije u istom periodu ili trenutku. Izraz „varijacija“ je latinskog porijekla – variatio, što znači razlika, promjena, fluktuacija. Nastaje kao rezultat činjenice da se pojedinačne vrijednosti neke karakteristike formiraju pod kombiniranim utjecajem različitih faktora (uvjeta), koji se u svakom pojedinačnom slučaju kombiniraju različito. Za mjerenje varijacije neke karakteristike koriste se različiti apsolutni i relativni indikatori.

Glavni pokazatelji varijacije uključuju sljedeće:

1) obim varijacije;

2) prosečno linearno odstupanje;

3) disperzija;

4) standardna devijacija;

5) koeficijent varijacije.

Pogledajmo ukratko svaki od njih.

Raspon varijacija R je najpristupačniji apsolutni indikator u smislu jednostavnosti izračunavanja, koji se definira kao razlika između najveće i najmanje vrijednosti karakteristike za jedinice date populacije:

Opseg varijacije (raspon fluktuacija) je važan pokazatelj varijabilnosti osobine, ali omogućava uočavanje samo ekstremnih odstupanja, što ograničava opseg njegove primjene. Da bi se preciznije okarakterisala varijacija osobine na osnovu njene varijabilnosti, koriste se drugi indikatori.

Prosječna linearna devijacija predstavlja aritmetičku sredinu apsolutnih vrijednosti odstupanja pojedinačnih vrijednosti karakteristike od prosjeka i određuje se po formulama:

1) Za negrupisani podaci

2) Za varijantne serije

Međutim, najčešće korištena mjera varijacije je disperzija . Karakterizira mjeru disperzije vrijednosti karakteristike koja se proučava u odnosu na njenu prosječnu vrijednost. Disperzija se definira kao prosjek kvadrata odstupanja.

Jednostavna varijansa za negrupirane podatke:

.

Ponderisana varijansa za seriju varijacija:

Komentar. U praksi je bolje koristiti sljedeće formule za izračunavanje varijanse:

Za jednostavnu varijaciju

.

Za ponderisanu varijansu

Standardna devijacija je kvadratni korijen varijanse:

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je manja standardna devijacija, to je populacija homogenija i aritmetička sredina bolje odražava cjelokupnu populaciju.

Gore diskutovane mjere raspršenja (opseg varijacije, disperzija, standardna devijacija) su apsolutni pokazatelji po kojima nije uvijek moguće suditi o stepenu varijabilnosti neke karakteristike. U nekim problemima potrebno je koristiti relativne indekse raspršenja, od kojih je jedan koeficijent varijacije.

Koeficijent varijacije– omjer standardne devijacije i aritmetičke sredine, izražen u postocima:

Koeficijent varijacije se koristi ne samo za komparativnu procjenu varijacije različitih karakteristika ili iste karakteristike u različitim populacijama, već i za karakterizaciju homogenosti populacije. Statistička populacija se smatra kvantitativno homogenom ako koeficijent varijacije ne prelazi 33% (za raspodjele bliske normalnoj).

Primjer. Dostupni su sljedeći podaci o rokovima zatvora za 50 osuđenika dostavljenih na izdržavanje kazne izrečene od strane suda u vaspitno-popravnom zavodu kaznenog sistema: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Konstruirajte seriju distribucija prema uslovima zatvora.

2. Pronađite srednju vrijednost, varijansu i standardnu ​​devijaciju.

3. Izračunajte koeficijent varijacije i donesite zaključak o homogenosti ili heterogenosti populacije koja se proučava.

Rješenje. Za konstruiranje diskretne serije distribucije potrebno je odrediti opcije i frekvencije. Opcija u ovom problemu je zatvorska kazna, a učestalost je broj pojedinačnih opcija. Nakon izračunavanja frekvencija, dobijamo sljedeće diskretne serije distribucije:

Nađimo srednju vrijednost i varijansu. Budući da su statistički podaci predstavljeni diskretnim nizom varijacija, za njihovo izračunavanje koristićemo formule za ponderisanu aritmetičku sredinu i disperziju. Dobijamo:

= = 4,1;

= 5,21.

Sada izračunavamo standardnu ​​devijaciju:

Pronalaženje koeficijenta varijacije:

Shodno tome, statistička populacija je kvantitativno heterogena.

Jednostavna aritmetička sredina

Prosječne vrijednosti

Prosječne vrijednosti se široko koriste u statistici.

prosječna vrijednost- ovo je opšti pokazatelj u kome se izražavaju efekti opštih uslova i obrazaca razvoja fenomena koji se proučava.

Statistički prosjeci se izračunavaju na osnovu masovnih podataka iz pravilno statistički organizovanog posmatranja (kontinuirano i selektivno). Međutim, statistički prosjek će biti objektivan i tipičan ako se izračuna iz masovnih podataka za kvalitativno homogenu populaciju (masovne pojave). Na primjer, ako izračunate prosječnu platu u akcionarskim društvima i državnim preduzećima i proširite rezultat na cijelu populaciju, onda je prosjek fiktivan, jer se računa za heterogenu populaciju, a takav prosjek gubi sve značenje.

Uz pomoć prosjeka izglađuju se razlike u vrijednosti neke karakteristike koje iz ovog ili onog razloga nastaju u pojedinim jedinicama posmatranja.

Na primjer, prosječan učinak pojedinačnog prodavca zavisi od mnogo razloga: kvalifikacije, dužina radnog staža, godine, oblik usluge, zdravlje itd. Prosječan učinak odražava opšte karakteristike cjelokupne populacije.

Prosječna vrijednost se mjeri u istim jedinicama kao i sam atribut.

Svaka prosječna vrijednost karakterizira populaciju koja se proučava prema bilo kojoj osobini. Da bi se dobila potpuna i sveobuhvatna slika populacije koja se proučava na osnovu niza bitnih karakteristika, potrebno je imati sistem prosječnih vrijednosti koji može opisati fenomen iz različitih uglova.

Postoje različite vrste prosjeka:

    aritmetička sredina;

    harmonična sredina;

    geometrijska sredina;

    srednji kvadrat;

    prosečan kubik.

Prosjeci svih gore navedenih tipova, pak, dijele se na jednostavne (neponderisane) i ponderisane.

Pogledajmo vrste prosjeka koji se koriste u statistici.

Prosta aritmetička sredina (neponderisana) jednaka je zbroju pojedinačnih vrijednosti atributa podijeljenom sa brojem ovih vrijednosti.

Pojedinačne vrijednosti karakteristike nazivaju se varijante i označavaju se sa x i (
); broj jedinica stanovništva je označen sa n, prosečna vrednost karakteristike je označena sa . Stoga je aritmetička prosta sredina jednaka:

ili

Primjer 1. Tabela 1

Podaci o proizvodnji proizvoda A radnika po smjeni

U ovom primjeru, varijabilni atribut je proizvodnja proizvoda po smjeni.

Numeričke vrijednosti atributa (16, 17, itd.) nazivaju se opcijama. Odredimo prosječan učinak radnika ove grupe:

PC.

Prosti aritmetički prosjek se koristi u slučajevima kada postoje odvojene vrijednosti neke karakteristike, tj. podaci nisu grupisani. Ako su podaci prikazani u obliku distributivnih serija ili grupa, onda se prosjek izračunava drugačije.

Ponderisan aritmetički prosjek

Aritmetički ponderisani prosjek jednak je zbiru proizvoda svake pojedinačne vrijednosti atributa (varijante) na odgovarajuću frekvenciju, podijeljen sa zbirom svih frekvencija.

Broj identičnih vrijednosti karakteristike u redovima distribucije naziva se frekvencija ili težina i označava se sa f i.

U skladu s tim, ponderirani aritmetički prosjek izgleda ovako:

ili

Iz formule je jasno da prosjek ne zavisi samo od vrijednosti atributa, već i od njihove frekvencije, tj. o sastavu agregata, o njegovoj strukturi.

Primjer 2. tabela 2

Podaci o platama radnika

Prema podacima serije diskretnih distribucija, jasno je da se iste karakteristične vrijednosti (varijante) ponavljaju više puta. Dakle, opcija x 1 se pojavljuje ukupno 2 puta, a opcija x 2 - 6 puta, itd.

Izračunajmo prosječnu platu jednog radnika:

Fond zarada za svaku grupu radnika jednak je umnošku opcija i učestalosti (
), a zbir ovih proizvoda daje ukupan fond zarada svih radnika (
).

Ako bi se izračunavanje izvršilo pomoću jednostavne formule aritmetičkog prosjeka, prosječna zarada bi bila jednaka 3.000 rubalja. (). Upoređujući dobijeni rezultat sa početnim podacima, očigledno je da bi prosečna plata trebalo da bude znatno veća (više od polovine radnika prima platu iznad 3.000 rubalja). Stoga će izračunavanje pomoću jednostavne aritmetičke sredine u takvim slučajevima biti pogrešno.

Kao rezultat obrade, statistički materijal se može prikazati ne samo u obliku diskretnih serija distribucije, već iu obliku intervalnih varijacionih serija sa zatvorenim ili otvorenim intervalima.

Razmotrimo izračunavanje aritmetičke sredine za takve serije.

Prosjek je:

Prosječna vrijednost

Prosječna vrijednost- numeričke karakteristike skupa brojeva ili funkcija; - određeni broj između najmanje i najveće njihove vrijednosti.

  • 1 Osnovne informacije
  • 2 Hijerarhija prosjeka u matematici
  • 3 U teoriji vjerovatnoće i statistici
  • 4 Vidi također
  • 5 Napomene

Osnovne informacije

Polazna tačka za razvoj teorije prosjeka bila je proučavanje proporcija Pitagorine škole. Istovremeno, nije napravljena stroga razlika između pojmova prosječne veličine i proporcije. Značajan podsticaj razvoju teorije proporcija sa aritmetičke tačke gledišta dali su grčki matematičari - Nikomah iz Gerasa (kraj 1. - početak 2. veka nove ere) i Papus iz Aleksandrije (3. vek nove ere). Prva faza u razvoju koncepta prosjeka je faza kada se prosjek počeo smatrati centralnim članom kontinuirane proporcije. Ali koncept prosjeka kao centralne vrijednosti progresije ne omogućava izvođenje koncepta prosjeka u odnosu na niz od n članova, bez obzira na redosljed kojim se oni slijede. U tu svrhu potrebno je pribjeći formalnoj generalizaciji prosjeka. Sljedeća faza je prijelaz sa kontinuiranih proporcija na progresije - aritmetičke, geometrijske i harmonijske.

U istoriji statistike, po prvi put, široka upotreba prosjeka povezana je s imenom engleskog naučnika W. Pettyja. W. Petty je bio jedan od prvih koji je pokušao prosječnoj vrijednosti dati statističko značenje, povezujući je sa ekonomskim kategorijama. Ali Petty nije opisao koncept prosječne veličine niti ga izolirao. A. Quetelet se smatra osnivačem teorije prosjeka. Bio je jedan od prvih koji je dosljedno razvijao teoriju prosjeka, pokušavajući da joj pruži matematičku osnovu. A. Quetelet je razlikovao dvije vrste prosjeka - stvarne prosjeke i aritmetičke prosjeke. Zapravo, prosjek predstavlja stvar, broj, koji stvarno postoji. Zapravo, proseci ili statistički proseci treba da budu izvedeni iz fenomena istog kvaliteta, identičnih po svom unutrašnjem značenju. Aritmetički prosjeci su brojevi koji daju najbližu moguću predstavu o mnogim brojevima, različitim, iako homogenim.

Svaki tip prosjeka može se pojaviti ili u obliku jednostavnog ili u obliku ponderiranog prosjeka. Ispravan izbor srednjeg oblika proizlazi iz materijalne prirode predmeta proučavanja. Jednostavne formule prosjeka se koriste ako se pojedinačne vrijednosti karakteristike koja se prosječuje ne ponavljaju. Kada se u praktičnim istraživanjima pojedinačne vrijednosti karakteristike koja se proučava pojavljuju nekoliko puta u jedinicama populacije koja se proučava, tada je učestalost ponavljanja pojedinačnih vrijednosti karakteristike prisutna u formulama za izračunavanje prosječnih snaga. U ovom slučaju, one se nazivaju ponderiranim prosječnim formulama.

Wikimedia Foundation. 2010.