Kako pronaći aritmetičku sredinu dužine i širine. Formula aritmetičke sredine

Kada počnu pričati o prosjeku, ljudi se najčešće sjete kako su završili školu i ušli u obrazovnu ustanovu. Zatim je izračunata prosječna ocjena na osnovu certifikata: sve ocjene (i dobre i ne tako dobre) su se zbrajale, a dobiveni iznos podijeljen je njihovim brojem. Tako se izračunava najjednostavniji tip prosjeka koji se naziva prostim aritmetičkim prosjekom. U praksi se u statistici koriste različite vrste prosjeka: aritmetički, harmonijski, geometrijski, kvadratni, strukturni prosjeki. Koristi se jedan ili drugi tip ovisno o prirodi podataka i svrsi studije.

prosječna vrijednost je najčešći statistički indikator, uz pomoć kojeg se daje opšta karakteristika skupa sličnih pojava prema jednoj od varijabilnih karakteristika. Pokazuje nivo karakteristike po jedinici stanovništva. Uz pomoć prosječnih vrijednosti upoređuju se različite populacije prema različitim karakteristikama i proučavaju obrasci razvoja pojava i procesa društvenog života.

U statistici se koriste dvije klase prosjeka: moć (analitički) i strukturni. Potonji se koriste za karakterizaciju strukture serije varijacija i o njima će se dalje raspravljati u poglavlju. 8.

Grupa prosječnih vrijednosti uključuje aritmetičke, harmonijske, geometrijske i kvadratne prosjeke. Pojedinačne formule za njihov proračun mogu se svesti na oblik koji je zajednički za sve prosječne snage, tj

gdje je m eksponent srednje vrijednosti: sa m = 1 dobijamo formulu za izračunavanje aritmetičke sredine, sa m = 0 - geometrijsku sredinu, m = -1 - harmonijsku sredinu, sa m = 2 - kvadratnu sredinu ;

x i - opcije (vrijednosti koje uzima atribut);

f i - frekvencije.

Glavni uslov pod kojim se proseci moći mogu koristiti u statističkoj analizi je homogenost populacije, koja ne bi trebalo da sadrži početne podatke koji se oštro razlikuju po svojoj kvantitativnoj vrednosti (u literaturi se nazivaju anomalnom opservacijom).

Pokažimo važnost ovog uslova na sljedećem primjeru.

Primjer 6.1. Izračunajmo prosječnu platu zaposlenih u malom preduzeću.

Tabela 6.1. Plate zaposlenih
br. Plata, rub. br. Plata, rub.
1 5 950 11 7 000
2 6 790 12 5 950
3 6 790 13 6 790
4 5 950 14 5 950
5 7 000 5 6 790
6 6 790 16 7 000
7 5 950 17 6 790
8 7 000 18 7 000
9 6 790 19 7 000
10 6 790 20 5 950

Da biste izračunali prosečnu platu, potrebno je zbrojiti zarade koje su obračunate svim zaposlenima u preduzeću (tj. pronaći fond zarada) i podeliti sa brojem zaposlenih:


Sada dodajmo našem ukupnom iznosu samo jednu osobu (direktor ovog preduzeća), ali sa platom od 50.000 rubalja. U ovom slučaju, izračunati prosjek će biti potpuno drugačiji:

Kao što vidimo, prelazi 7.000 rubalja itd. veća je od svih vrijednosti atributa sa izuzetkom jednog jedinog zapažanja.

Kako bi se osiguralo da se takvi slučajevi ne dešavaju u praksi i da prosjek ne izgubi smisao (u primjeru 6.1 više ne igra ulogu generalizirajuće karakteristike populacije kakva bi trebao biti), pri izračunavanju prosjeka, anomalan, oštro Izdvojena zapažanja treba isključiti iz analize i teme čine populaciju homogenom, ili podijeliti populaciju u homogene grupe i izračunati prosječne vrijednosti za svaku grupu i analizirati ne ukupni prosjek, već prosječne vrijednosti grupe.

6.1. Aritmetička sredina i njena svojstva

Aritmetička sredina se izračunava ili kao jednostavna ili kao ponderisana vrijednost.

Prilikom izračunavanja prosječne plaće prema podacima iz primjera tablice 6.1, sabrali smo sve vrijednosti atributa i podijelili s njihovim brojem. Zapisaćemo napredak naših proračuna u obliku jednostavne aritmetičke srednje formule

gdje je x i - opcije (pojedinačne vrijednosti karakteristike);

n je broj jedinica u agregatu.

Primjer 6.2. Hajde da sada grupišemo naše podatke iz tabele u primeru 6.1, itd. Hajde da konstruišemo diskretnu seriju varijacija distribucije radnika prema nivou nadnica. Rezultati grupisanja prikazani su u tabeli.

Napišimo izraz za izračunavanje nivoa prosječne plaće u kompaktnijem obliku:

U primjeru 6.2 primijenjena je formula ponderirane aritmetičke sredine

gdje su f i frekvencije koje pokazuju koliko puta se vrijednost atributa x i y javlja u jedinicama populacije.

Pogodno je izračunati aritmetički ponderisani prosek u tabeli, kao što je prikazano u nastavku (Tabela 6.3):

Tabela 6.3. Izračunavanje aritmetičke sredine u diskretnom nizu
Početni podaci Procijenjeni indikator
plata, rub. broj zaposlenih, ljudi platni fond, rub.
x i f i x i f i
5 950 6 35 760
6 790 8 54 320
7 000 6 42 000
Ukupno 20 132 080

Treba napomenuti da se jednostavna aritmetička sredina koristi u slučajevima kada podaci nisu grupisani ili grupirani, već su sve frekvencije jednake.

Često se rezultati posmatranja predstavljaju u obliku serije intervalne distribucije (vidi tabelu u primjeru 6.4). Zatim, pri izračunavanju prosjeka, sredine intervala se uzimaju kao x i. Ako su prvi i posljednji interval otvoreni (nemaju jednu od granica), onda su uvjetno "zatvoreni", uzimajući vrijednost susjednog intervala kao vrijednost ovog intervala, itd. prvi se zatvara na osnovu vrijednosti drugog, a posljednji - prema vrijednosti pretposljednjeg.

Primjer 6.3. Na osnovu rezultata anketnog uzorka jedne od grupa stanovništva izračunaćemo iznos prosječnog monetarnog dohotka po glavi stanovnika.

U gornjoj tabeli, sredina prvog intervala je 500. Zaista, vrijednost drugog intervala je 1000 (2000-1000); tada je donja granica prve 0 (1000-1000), a njena sredina je 500. Isto radimo sa zadnjim intervalom. Za sredinu uzimamo 25.000: vrijednost pretposljednjeg intervala je 10.000 (20.000-10.000), zatim je njegova gornja granica 30.000 (20.000 + 10.000), a srednja je, shodno tome, 25.000.

Tabela 6.4. Izračunavanje aritmetičke sredine u intervalnoj seriji
Prosječni novčani prihod po glavi stanovnika, rub. Mjesečno Ukupno stanovništvo, % f i Sredina intervala x i x i f i
Do 1.000 4,1 500 2 050
1 000-2 000 8,6 1 500 12 900
2 000-4 000 12,9 3 000 38 700
4 000-6 000 13,0 5 000 65 000
6 000-8 000 10,5 7 000 73 500
8 000-10 000 27,8 9 000 250 200
10 000-20 000 12,7 15 000 190 500
20.000 i više 10,4 25 000 260 000
Ukupno 100,0 - 892 850

Tada će prosječni mjesečni prihod po glavi stanovnika biti

U procesu izučavanja matematike, školarci se upoznaju sa pojmom aritmetičke sredine. U budućnosti, u statistici i nekim drugim naukama, studenti se suočavaju sa proračunom drugih šta oni mogu biti i po čemu se razlikuju jedni od drugih?

značenje i razlike

Tačni pokazatelji ne daju uvijek razumijevanje situacije. Da bi se procijenila određena situacija, ponekad je potrebno analizirati ogroman broj brojki. I tada prosjeci priskaču u pomoć. Oni nam omogućavaju da procijenimo situaciju u cjelini.

Od školskih dana mnogi odrasli pamte postojanje aritmetičke sredine. Vrlo je jednostavno izračunati - zbir niza od n članova podijeljen je sa n. Odnosno, ako trebate izračunati aritmetičku sredinu u nizu vrijednosti 27, 22, 34 i 37, tada morate riješiti izraz (27+22+34+37)/4, budući da su 4 vrijednosti se koriste u proračunima. U ovom slučaju, potrebna vrijednost će biti 30.

Geometrijska sredina se često proučava kao dio školskog predmeta. Izračunavanje ove vrijednosti zasniva se na izdvajanju n-tog korijena proizvoda od n članova. Ako uzmemo iste brojeve: 27, 22, 34 i 37, onda će rezultat izračuna biti 29,4.

Harmonska sredina obično nije predmet proučavanja u srednjim školama. Međutim, koristi se prilično često. Ova vrijednost je inverzna od aritmetičke sredine i izračunava se kao količnik n - broja vrijednosti i zbira 1/a 1 +1/a 2 +...+1/a n. Ako ponovo uzmemo isti za proračun, onda će harmonik biti 29,6.

Ponderisani prosek: karakteristike

Međutim, sve gore navedene vrijednosti se ne mogu svugdje koristiti. Na primjer, u statistici, kada se neki izračunavaju, "težina" svakog broja koji se koristi u proračunima igra važnu ulogu. Rezultati su indikativniji i tačniji jer uzimaju u obzir više informacija. Ova grupa veličina se općenito naziva “ponderisani prosjek”. Oni se ne uče u školi, pa ih vrijedi detaljnije pogledati.

Prije svega, vrijedi reći šta se podrazumijeva pod „težinom“ određene vrijednosti. To je najlakše objasniti konkretnim primjerom. U bolnici se dva puta dnevno mjeri tjelesna temperatura svakom pacijentu. Od 100 pacijenata na različitim odeljenjima bolnice, 44 će imati normalnu temperaturu - 36,6 stepeni. Još 30 će imati povećanu vrijednost - 37,2, 14 - 38, 7 - 38,5, 3 - 39, a preostala dva - 40. A ako uzmemo aritmetički prosjek, onda će ova vrijednost općenito za bolnicu biti veća od 38 stepeni! Ali gotovo polovina pacijenata ima apsolutno I ovdje bi bilo ispravnije koristiti ponderiranu prosječnu vrijednost, a “težina” svake vrijednosti će biti broj ljudi. U ovom slučaju, rezultat izračuna će biti 37,25 stepeni. Razlika je očigledna.

U slučaju izračunavanja ponderisanog prosjeka, „težina“ se može uzeti kao broj pošiljki, broj ljudi koji rade u datom danu, općenito, sve što se može izmjeriti i uticati na konačni rezultat.

Sorte

Ponderisani prosek je povezan sa aritmetičkom sredinom o kojoj se govori na početku članka. Međutim, prva vrijednost, kao što je već spomenuto, također uzima u obzir težinu svakog broja korištenog u proračunima. Pored toga, postoje i ponderisane geometrijske i harmonijske vrednosti.

Postoji još jedna zanimljiva varijacija koja se koristi u brojevnim serijama. Ovo je ponderisani pokretni prosek. Na osnovu toga se izračunavaju trendovi. Osim samih vrijednosti i njihove težine, tu se koristi i periodičnost. A prilikom izračunavanja prosječne vrijednosti u nekom trenutku, u obzir se uzimaju i vrijednosti ​​​​za prethodne vremenske periode.

Izračunavanje svih ovih vrijednosti nije tako teško, ali u praksi se obično koristi samo obični ponderirani prosjek.

Metode proračuna

U doba raširene kompjuterizacije, nema potrebe da se ponderisani prosjek izračunava ručno. Međutim, bilo bi korisno znati formulu izračuna kako biste mogli provjeriti i, ako je potrebno, prilagoditi dobivene rezultate.

Najlakši način je razmotriti izračun koristeći poseban primjer.

Potrebno je saznati kolika je prosječna plata u ovom preduzeću, uzimajući u obzir broj radnika koji primaju određenu platu.

Dakle, ponderisani prosjek se izračunava pomoću sljedeće formule:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Na primjer, izračun bi bio ovakav:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Očigledno, nema posebnih poteškoća u ručnom izračunavanju ponderisanog prosjeka. Formula za izračunavanje ove vrijednosti u jednoj od najpopularnijih aplikacija s formulama - Excelu - izgleda kao funkcija SUMPRODUCT (serija brojeva; niz pondera) / SUM (serija pondera).

Ovaj izraz ima druga značenja, pogledajte prosječno značenje.

Prosjek(u matematici i statistici) skupovi brojeva - zbir svih brojeva podijeljen njihovim brojem. To je jedna od najčešćih mjera centralne tendencije.

Predložili su ga (zajedno sa geometrijskom sredinom i harmonijskom sredinom) Pitagorejci.

Posebni slučajevi aritmetičke sredine su srednja vrijednost (opća populacija) i uzorkovana sredina (uzorak).

Uvod

Označimo skup podataka X = (x 1 , x 2 , …, x n), tada je srednja vrijednost uzorka obično označena horizontalnom crtom iznad varijable (x ¯ (\displaystyle (\bar (x))), izgovara se " x sa linijom").

Grčko slovo μ koristi se za označavanje aritmetičke sredine cjelokupne populacije. Za slučajnu varijablu za koju je određena srednja vrijednost, μ je prosek verovatnoće ili matematičko očekivanje slučajne varijable. Ako je set X je kolekcija slučajnih brojeva sa vjerovatnoćom srednje vrijednosti μ, tada za bilo koji uzorak x i iz ovog skupa μ = E( x i) je matematičko očekivanje ovog uzorka.

U praksi, razlika između μ i x ¯ (\displaystyle (\bar (x))) je u tome što je μ tipična varijabla jer možete vidjeti uzorak, a ne cijelu populaciju. Stoga, ako je uzorak predstavljen nasumično (u smislu teorije vjerovatnoće), tada se x ¯ (\displaystyle (\bar (x))) (ali ne μ) može tretirati kao slučajna varijabla koja ima distribuciju vjerovatnoće na uzorku ( distribucija vjerovatnoće srednje vrijednosti).

Obje ove količine se izračunavaju na isti način:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\suma _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Ako X je slučajna varijabla, zatim matematičko očekivanje X može se smatrati aritmetičkom sredinom vrijednosti u ponovljenim mjerenjima veličine X. Ovo je manifestacija zakona velikih brojeva. Stoga se srednja vrijednost uzorka koristi za procjenu nepoznate očekivane vrijednosti.

U osnovnoj algebri je dokazano da je srednja vrijednost n+ 1 broj iznad prosjeka n brojevi ako i samo ako je novi broj veći od starog prosjeka, manji ako i samo ako je novi broj manji od prosjeka i ne mijenja se ako i samo ako je novi broj jednak prosjeku. Više n, što je manja razlika između novog i starog prosjeka.

Imajte na umu da postoji nekoliko drugih dostupnih "prosjeka", uključujući srednju snagu, Kolmogorovljevu sredinu, harmonijsku sredinu, aritmetičko-geometrijsku sredinu i različite ponderisane prosjeke (npr. ponderirana aritmetička sredina, ponderirana geometrijska sredina, ponderirana harmonijska sredina).

Primjeri

  • Za tri broja, trebate ih sabrati i podijeliti sa 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Za četiri broja, trebate ih sabrati i podijeliti sa 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Ili jednostavnije 5+5=10, 10:2. Pošto smo sabirali 2 broja, što znači koliko brojeva sabiramo, dijelimo s tim brojem.

Kontinuirana slučajna varijabla

Za kontinuirano distribuiranu veličinu f (x) (\displaystyle f(x)), aritmetička sredina na intervalu [ a ; b ] (\displaystyle ) određuje se kroz određeni integral:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Neki problemi korištenja prosjeka

Nedostatak robusnosti

Glavni članak: Robusnost u statistici

Iako se aritmetičke sredine često koriste kao proseci ili centralne tendencije, ovaj koncept nije čvrsta statistika, što znači da je aritmetička sredina pod velikim uticajem "velikih odstupanja". Važno je napomenuti da za distribucije s velikim koeficijentom asimetrije, aritmetička sredina možda neće odgovarati konceptu „srednje vrijednosti“, a vrijednosti srednje vrijednosti iz robusne statistike (na primjer, medijan) mogu bolje opisati središnji sklonost.

Klasičan primjer je izračunavanje prosječnog prihoda. Aritmetička sredina se može pogrešno protumačiti kao medijana, što može dovesti do zaključka da ima više ljudi s većim primanjima nego što ih zapravo ima. “Prosječni” prihod se tumači tako da većina ljudi ima prihode oko ovog broja. Ovaj “prosječni” (u smislu aritmetičke sredine) prihod je veći od prihoda većine ljudi, budući da visok dohodak sa velikim odstupanjem od prosjeka čini aritmetičku sredinu jako iskrivljenom (nasuprot tome, prosječni prihod na medijani „opire se“ takvom iskošenju). Međutim, ovaj "prosječni" prihod ne govori ništa o broju ljudi blizu srednjeg prihoda (i ne govori ništa o broju ljudi blizu modalnog prihoda). Međutim, ako pojmove “prosjek” i “većina ljudi” shvatite olako, možete izvući pogrešan zaključak da većina ljudi ima prihode veće nego što jesu. Na primjer, izvještaj o "prosječnom" neto prihodu u Medini u Washingtonu, izračunatom kao aritmetički prosjek svih godišnjih neto prihoda stanovnika, dao bi iznenađujuće veliki broj zbog Billa Gatesa. Razmotrite uzorak (1, 2, 2, 2, 3, 9). Aritmetička sredina je 3,17, ali pet od šest vrijednosti je ispod ove sredine.

Složena kamata

Glavni članak: Povrat investicije

Ako su brojevi umnožiti, ali ne fold, trebate koristiti geometrijsku sredinu, a ne aritmetičku sredinu. Najčešće se ovaj incident dešava prilikom izračunavanja povrata ulaganja u finansije.

Na primjer, ako je dionica pala za 10% u prvoj godini i porasla za 30% u drugoj, onda je pogrešno izračunati „prosječan“ porast u te dvije godine kao aritmetičku sredinu (−10% + 30%) / 2 = 10%; tačan prosjek u ovom slučaju je dat složenom godišnjom stopom rasta, koja daje godišnju stopu rasta od samo oko 8,16653826392% ≈ 8,2%.

Razlog tome je što procenti svaki put imaju novu početnu tačku: 30% je 30% od broja manjeg od cijene na početku prve godine: ako je dionica počela na 30 dolara i pala za 10%, vrijedi 27 dolara na početku druge godine. Ako bi dionice porasle za 30%, na kraju druge godine vrijedile bi 35,1 dolara. Aritmetički prosjek ovog rasta je 10%, ali pošto je dionica porasla samo za 5,1 USD u 2 godine, prosječan rast od 8,2% daje konačni rezultat od 35,1 USD:

[30 USD (1 - 0,1) (1 + 0,3) = 30 USD (1 + 0,082) (1 + 0,082) = 35,1 USD]. Ako koristimo aritmetički prosjek od 10% na isti način, nećemo dobiti stvarnu vrijednost: [30 USD (1 + 0,1) (1 + 0,1) = 36,3 USD].

Složena kamata na kraju 2 godine: 90% * 130% = 117%, odnosno ukupno povećanje je 17%, a prosječna godišnja složena kamata je 117% ≈ 108,2% (\displaystyle (\sqrt (117\% ))\cca 108,2\%), odnosno prosječno godišnje povećanje od 8,2%.

Upute

Glavni članak: Statistika odredišta

Prilikom izračunavanja aritmetičke sredine neke varijable koja se ciklički mijenja (kao što je faza ili ugao), mora se obratiti posebna pažnja. Na primjer, prosjek od 1° i 359° bi bio 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Ovaj broj je netačan iz dva razloga.

  • Prvo, ugaone mere su definisane samo za opseg od 0° do 360° (ili od 0 do 2π kada se mere u radijanima). Dakle, isti par brojeva može se napisati kao (1° i -1°) ili kao (1° i 719°). Prosječne vrijednosti svakog para bit će različite: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ circ )).
  • Drugo, u ovom slučaju, vrijednost od 0° (ekvivalentno 360°) će biti geometrijski bolja prosječna vrijednost, pošto brojevi odstupaju manje od 0° nego od bilo koje druge vrijednosti (vrijednost 0° ima najmanju varijansu). uporedi:
    • broj 1° odstupa od 0° samo za 1°;
    • broj 1° odstupa od izračunatog prosjeka od 180° za 179°.

Prosječna vrijednost za cikličnu varijablu izračunatu korištenjem gornje formule bit će umjetno pomjerena u odnosu na stvarni prosjek prema sredini numeričkog raspona. Zbog toga se prosek izračunava na drugačiji način, naime, kao prosečna vrednost se bira broj sa najmanjom varijansom (centralna tačka). Također, umjesto oduzimanja, koristi se modularna udaljenost (tj. obodna udaljenost). Na primjer, modularna udaljenost između 1° i 359° je 2°, a ne 358° (na krugu između 359° i 360°==0° - jedan stepen, između 0° i 1° - također 1°, ukupno - 2°).

Vrste prosječnih vrijednosti i metode njihovog izračunavanja

U fazi statističke obrade mogu se postaviti različiti istraživački problemi za čije je rješavanje potrebno odabrati odgovarajući prosjek. U ovom slučaju potrebno je voditi se sljedećim pravilom: veličine koje predstavljaju brojnik i imenilac prosjeka moraju biti logički povezane jedna s drugom.

  • prosjeci snage;
  • strukturni proseci.

Hajde da predstavimo sledeće konvencije:

Količine za koje se izračunava prosjek;

Prosjek, gdje traka iznad pokazuje da se vrši usrednjavanje pojedinačnih vrijednosti;

Učestalost (ponovljivost pojedinačnih karakterističnih vrijednosti).

Različiti prosjeci su izvedeni iz opšte formule prosječne moći:

(5.1)

kada je k = 1 - aritmetička sredina; k = -1 - harmonijska sredina; k = 0 - geometrijska sredina; k = -2 - srednji kvadrat.

Prosječne vrijednosti mogu biti jednostavne ili ponderisane. Ponderisani proseci To su vrijednosti koje uzimaju u obzir da neke varijante vrijednosti atributa mogu imati različite brojeve, pa se stoga svaka opcija mora pomnožiti s ovim brojem. Drugim riječima, “skale” su brojevi agregatnih jedinica u različitim grupama, tj. Svaka opcija je "ponderisana" svojom frekvencijom. Frekvencija f se zove statistička težina ili Prosječna masa.

Aritmetička sredina- najčešći tip prosjeka. Koristi se kada se proračun vrši na negrupisanim statističkim podacima, gdje je potrebno dobiti prosječan termin. Aritmetička sredina je prosječna vrijednost neke karakteristike, po dobijanju koje ukupan volumen karakteristike u agregatu ostaje nepromijenjen.

Formula aritmetičke sredine ( jednostavno) ima oblik

gdje je n veličina populacije.

Na primjer, prosječna plata zaposlenih u preduzeću izračunava se kao aritmetički prosjek:

Odlučujući indikatori su plata svakog zaposlenog i broj zaposlenih u preduzeću. Prilikom izračunavanja prosjeka ukupan iznos zarada je ostao isti, ali ravnomjerno raspoređen na sve zaposlene. Na primjer, potrebno je izračunati prosječnu platu radnika u maloj kompaniji koja zapošljava 8 ljudi:

Prilikom izračunavanja prosječnih vrijednosti pojedinačne vrijednosti karakteristike koja se usrednjuje mogu se ponoviti, pa se prosječna vrijednost izračunava pomoću grupisanih podataka. U ovom slučaju govorimo o korištenju ponderisan aritmetički prosjek, koji ima oblik

(5.3)

Dakle, potrebno je izračunati prosječnu cijenu akcija akcionarskog društva na berzanskom trgovanju. Poznato je da su transakcije obavljene u roku od 5 dana (5 transakcija), a broj prodatih akcija po prodajnom kursu je raspoređen na sledeći način:

1 - 800 ak. - 1010 rub.

2 - 650 ak. - 990 rub.

3 - 700 ak. - 1015 rub.

4 - 550 ak. - 900 rub.

5 - 850 ak. - 1150 rub.

Početni omjer za određivanje prosječne cijene dionica je odnos ukupnog iznosa transakcija (TVA) i broja prodatih dionica (KPA):

OSS = 1010·800+990·650+1015·700+900·550+1150·850= 3,634,500;

KPA = 800+650+700+550+850=3550.

U ovom slučaju, prosječna cijena dionica bila je jednaka

Neophodno je poznavati svojstva aritmetičkog prosjeka, što je veoma važno kako za njegovu upotrebu tako i za izračunavanje. Možemo razlikovati tri glavna svojstva koja su najviše odredila raširenu upotrebu aritmetičkog prosjeka u statističkim i ekonomskim proračunima.

Svojstvo jedan (nula): zbir pozitivnih odstupanja pojedinačnih vrijednosti karakteristike od njene prosječne vrijednosti jednak je zbiru negativnih odstupanja. Ovo je vrlo važno svojstvo, jer pokazuje da će se sva odstupanja (i + i -) uzrokovana slučajnim razlozima međusobno poništavati.

dokaz:

Svojstvo dva (minimum): zbir kvadrata odstupanja pojedinačnih vrijednosti karakteristike od aritmetičke sredine je manji nego od bilo kojeg drugog broja (a), tj. postoji minimalni broj.

Dokaz.

Hajde da sastavimo zbir kvadrata odstupanja od varijable a:

(5.4)

Da bismo pronašli ekstremu ove funkcije, potrebno je njenu derivaciju u odnosu na a izjednačiti sa nulom:

Odavde dobijamo:

(5.5)

Posljedično, ekstremum sume kvadrata odstupanja se postiže na . Ovaj ekstrem je minimum, jer funkcija ne može imati maksimum.

Svojstvo tri: aritmetička sredina konstantne vrijednosti je jednaka ovoj konstanti: za a = const.

Pored ova tri najvažnija svojstva aritmetičke sredine, postoje i tzv svojstva dizajna, koji postepeno gube na značaju zbog upotrebe elektronske računarske tehnologije:

  • ako se pojedinačna vrijednost atributa svake jedinice pomnoži ili podijeli sa konstantnim brojem, tada će se aritmetička sredina povećati ili smanjiti za isti iznos;
  • aritmetička sredina se neće promijeniti ako se težina (učestalost) svake vrijednosti atributa podijeli sa konstantnim brojem;
  • ako se pojedinačne vrijednosti atributa svake jedinice smanjuju ili povećavaju za isti iznos, tada će se aritmetička sredina smanjiti ili povećati za isti iznos.

Harmonična sredina. Ovaj prosjek se naziva inverzni aritmetički prosjek jer se ova vrijednost koristi kada je k = -1.

Jednostavna harmonijska sredina koristi se kada su težine vrijednosti atributa iste. Njegova formula se može izvesti iz osnovne formule zamjenom k ​​= -1:

Na primjer, trebamo izračunati prosječnu brzinu dva automobila koji su prešli isti put, ali različitim brzinama: prvi pri brzini od 100 km/h, drugi pri 90 km/h. Koristeći metodu harmonijske sredine izračunavamo prosječnu brzinu:

U statističkoj praksi češće se koristi harmonijski ponderirani, čija formula ima oblik

Ova formula se koristi u slučajevima kada težine (ili zapremine fenomena) za svaki atribut nisu jednake. U početnom odnosu za izračunavanje prosjeka, brojilac je poznat, ali je imenilac nepoznat.

Na primjer, kada se izračunava prosječna cijena, moramo koristiti omjer iznosa prodaje i broja prodanih jedinica. Ne znamo broj prodanih jedinica (govorimo o različitim proizvodima), ali znamo kolike su prodajne količine tih različitih proizvoda. Recimo da trebate saznati prosječnu cijenu prodate robe:

Dobijamo

Geometrijska sredina. Najčešće, geometrijska sredina nalazi svoju primjenu u određivanju prosječnih stopa rasta (prosječnih koeficijenata rasta), kada se pojedinačne vrijednosti neke karakteristike prikazuju u obliku relativnih vrijednosti. Također se koristi ako je potrebno pronaći prosjek između minimalne i maksimalne vrijednosti karakteristike (na primjer, između 100 i 1000000). Postoje formule za jednostavnu i ponderisanu geometrijsku sredinu.

Za jednostavnu geometrijsku sredinu

Za ponderisanu geometrijsku sredinu

Srednja kvadratna vrijednost. Glavno područje njegove primjene je mjerenje varijacije karakteristike u agregatu (izračun standardne devijacije).

Jednostavna formula srednjeg kvadrata

Ponderirana formula srednjeg kvadrata

(5.11)

Kao rezultat toga, možemo reći da uspješno rješavanje problema statističkog istraživanja zavisi od pravilnog izbora vrste prosječne vrijednosti u svakom konkretnom slučaju. Odabir prosjeka uključuje sljedeći niz:

a) utvrđivanje opšteg indikatora stanovništva;

b) utvrđivanje matematičke veze veličina za dati opšti pokazatelj;

c) zamjenu pojedinačnih vrijednosti prosječnim vrijednostima;

d) izračunavanje prosjeka korištenjem odgovarajuće jednačine.

Prosjeci i varijacije

prosječna vrijednost- ovo je opšti pokazatelj koji karakteriše kvalitativno homogenu populaciju prema određenoj kvantitativnoj karakteristici. Na primjer, prosječna starost osoba osuđenih za krađu.

U pravosudnoj statistici prosječne vrijednosti se koriste za karakterizaciju:

Prosječno vrijeme za razmatranje predmeta ove kategorije;

Prosječna veličina potraživanja;

Prosječan broj optuženih po predmetu;

Prosječna šteta;

Prosječno opterećenje sudija itd.

Prosjek je uvijek imenovana vrijednost i ima istu dimenziju kao karakteristika pojedine jedinice populacije. Svaka prosječna vrijednost karakterizira populaciju koja se proučava prema bilo kojoj promjenjivoj karakteristici, stoga iza svake prosječne vrijednosti leži niz distribucije jedinica ove populacije prema osobini koja se proučava. Izbor vrste prosjeka određen je sadržajem indikatora i početnim podacima za izračunavanje prosječne vrijednosti.

Sve vrste prosjeka koji se koriste u statističkim istraživanjima podijeljeni su u dvije kategorije:

1) proseci snage;

2) strukturni proseci.

Prva kategorija prosjeka uključuje: aritmetička sredina, harmonijska sredina, geometrijska sredina I srednji kvadratni korijen . Druga kategorija je moda I medijana. Štaviše, svaki od navedenih tipova proseka snage može imati dva oblika: jednostavno I ponderisano . Jednostavan oblik prosjeka se koristi za dobivanje prosječne vrijednosti karakteristike koja se proučava kada se proračun vrši na negrupisanim statističkim podacima, ili kada se svaka opcija u zbiru javlja samo jednom. Ponderisani prosjeci su vrijednosti koje uzimaju u obzir da varijante vrijednosti atributa mogu imati različite brojeve, te se stoga svaka varijanta mora pomnožiti s odgovarajućom frekvencijom. Drugim riječima, svaka opcija je “ponderisana” svojom učestalošću. Učestalost se naziva statistička težina.

Jednostavna aritmetička sredina- najčešći tip prosjeka. Ona je jednaka zbroju pojedinačnih vrijednosti atributa podijeljenom s ukupnim brojem ovih vrijednosti:

,

Gdje x 1 ,x 2 , … ,x N su pojedinačne vrijednosti različite karakteristike (varijante), a N je broj jedinica u populaciji.

Ponderisan aritmetički prosjek koristi se u slučajevima kada su podaci predstavljeni u obliku distributivnih serija ili grupa. Izračunava se kao zbroj proizvoda opcija i njihovih odgovarajućih frekvencija, podijeljen sa zbirom frekvencija svih opcija:

Gdje x i- značenje i-te varijante karakteristike; f i– frekvencija i-th opcije.

Dakle, svaka vrijednost varijante je ponderisana svojom frekvencijom, zbog čega se frekvencije ponekad nazivaju statističkim ponderima.

Komentar. Kada govorimo o aritmetičkoj sredini bez navođenja njenog tipa, mislimo na jednostavnu aritmetičku sredinu.

Tabela 12.

Rješenje. Za izračunavanje koristimo formulu ponderiranog aritmetičkog prosjeka:

Dakle, u proseku postoje dva okrivljena po krivičnom predmetu.

Ako se izračunavanje prosječne vrijednosti vrši pomoću podataka grupiranih u obliku nizova intervalne distribucije, tada prvo morate odrediti srednje vrijednosti svakog intervala x"i, a zatim izračunati prosječnu vrijednost koristeći aritmetički ponderirani prosjek formule, u kojoj je x"i zamijenjen umjesto xi.

Primjer. Podaci o starosti kriminalaca osuđenih za krađu prikazani su u tabeli:

Tabela 13.

Odredite prosječnu starost kriminalaca osuđenih za krađu.

Rješenje. Da bi se odredila prosječna starost kriminalaca na osnovu niza intervalnih varijacija, potrebno je prvo pronaći srednje vrijednosti intervala. Pošto je data intervalna serija sa prvim i poslednjim otvorenim intervalom, vrednosti ovih intervala se uzimaju jednake vrednostima susednih zatvorenih intervala. U našem slučaju, vrijednosti prvog i posljednjeg intervala su jednake 10.

Sada pronalazimo prosječnu starost kriminalaca koristeći ponderiranu formulu aritmetičkog prosjeka:

Dakle, prosječna starost kriminalaca osuđenih za krađu je otprilike 27 godina.

Mean harmonic simple predstavlja recipročnu vrijednost aritmetičke sredine recipročnih vrijednosti karakteristike:

gdje je 1/ x i su inverzne vrijednosti opcija, a N je broj jedinica u populaciji.

Primjer. Radi utvrđivanja prosječnog godišnjeg opterećenja sudija okružnog suda prilikom razmatranja krivičnih predmeta, urađena je studija opterećenja 5 sudija ovog suda. Pokazalo se da je prosječno vrijeme provedeno na jednom krivičnom predmetu za svakog od ispitanih sudija jednako (u danima): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Nađite prosječne troškove na jednom krivični predmet i prosječno godišnje opterećenje sudija određenog okružnog suda prilikom razmatranja krivičnih predmeta.

Rješenje. Da bismo odredili prosječno vrijeme provedeno na jednom krivičnom predmetu, koristimo formulu harmoničnog prosjeka:

Da bismo pojednostavili proračune, u primjeru uzimamo broj dana u godini na 365, uključujući vikende (ovo ne utiče na metodologiju obračuna, a pri izračunavanju sličnog indikatora u praksi potrebno je zamijeniti broj radnih dana u određenoj godini umjesto 365 dana). Tada će prosječno godišnje opterećenje za sudije datog okružnog suda prilikom razmatranja krivičnih predmeta biti: 365 (dana) : 5,56 ≈ 65,6 (predmeti).

Ako bismo koristili jednostavnu formulu aritmetičkog prosjeka da odredimo prosječno vrijeme provedeno na jednom krivičnom predmetu, dobili bismo:

365 (dana): 5,64 ≈ 64,7 (slučajevi), tj. pokazalo se da je prosječno opterećenje sudija manje.

Provjerimo valjanost ovog pristupa. Za to ćemo koristiti podatke o vremenu provedenom na jednom krivičnom predmetu za svakog sudiju i izračunati broj krivičnih predmeta koje svaki od njih razmatra godišnje.

Dobijamo shodno tome:

365 (dani) : 6 ≈ 61 (slučajevi), 365 (dani) : 5,6 ≈ 65,2 (slučajevi), 365 (dani) : 6,3 ≈ 58 (slučajevi),

365 (dani) : 4,9 ≈ 74,5 (slučajevi), 365 (dani) : 5,4 ≈ 68 (slučajevi).

Sada izračunajmo prosječno godišnje opterećenje za sudije datog okružnog suda prilikom razmatranja krivičnih predmeta:

One. prosječno godišnje opterećenje je isto kao i kada se koristi harmonijski prosjek.

Stoga je korištenje aritmetičkog prosjeka u ovom slučaju nezakonito.

U slučajevima kada su poznate varijante karakteristike i njihove volumetrijske vrijednosti (proizvod varijanti i frekvencije), ali su same frekvencije nepoznate, koristi se ponderirana harmonijska prosječna formula:

,

Gdje x i su vrijednosti opcija atributa, a w i su volumetrijske vrijednosti opcija ( w i = x i f i).

Primjer. Podaci o cijeni jedinice iste vrste proizvoda koju proizvode različite ustanove kazneno-popravnog sistema, te o obimu njegove prodaje dati su u tabeli 14.

Tabela 14

Pronađite prosječnu prodajnu cijenu proizvoda.

Rješenje. Prilikom izračunavanja prosječne cijene moramo koristiti omjer iznosa prodaje i broja prodanih jedinica. Ne znamo broj prodatih jedinica, ali znamo količinu prodaje robe. Stoga, da bismo pronašli prosječnu cijenu prodane robe, koristit ćemo ponderiranu harmonijsku prosječnu formulu. Dobijamo

Ako ovdje koristite formulu aritmetičkog prosjeka, možete dobiti prosječnu cijenu koja će biti nerealna:

Geometrijska sredina izračunava se izdvajanjem korijena stepena N iz proizvoda svih vrijednosti varijanti atributa:

Gdje x 1 ,x 2 , … ,x N– pojedinačne vrijednosti različite karakteristike (varijante), i

N– broj jedinica u populaciji.

Ova vrsta prosjeka se koristi za izračunavanje prosječnih stopa rasta vremenskih serija.

Srednji kvadrat se koristi za izračunavanje standardne devijacije, koja je indikator varijacije, o čemu će biti riječi u nastavku.

Za utvrđivanje strukture stanovništva koriste se posebni prosječni pokazatelji, koji uključuju medijana I moda , ili takozvani strukturni proseci. Ako se aritmetička sredina izračunava na osnovu upotrebe svih varijanti vrijednosti atributa, tada medijan i mod karakteriziraju vrijednost varijante koja zauzima određenu prosječnu poziciju u rangiranoj (uređenoj) seriji. Jedinice statističke populacije mogu se poredati u rastućem ili opadajućem redosledu varijanti karakteristike koja se proučava.

medijana (ja)– ovo je vrijednost koja odgovara opciji koja se nalazi u sredini rangirane serije. Dakle, medijan je ona verzija rangiranog niza, na čijem obje strane u ovoj seriji treba biti jednak broj populacijskih jedinica.

Da biste pronašli medijan, prvo morate odrediti njegov serijski broj u rangiranoj seriji koristeći formulu:

gdje je N volumen serije (broj jedinica u populaciji).

Ako se niz sastoji od neparnog broja članova, tada je medijan jednak opciji sa brojem N Me. Ako se niz sastoji od parnog broja članova, tada se medijan definira kao aritmetička sredina dvije susjedne opcije koje se nalaze u sredini.

Primjer. Za rangiranu seriju 1, 2, 3, 3, 6, 7, 9, 9, 10. Obim serije je N = 9, što znači N Me = (9 + 1) / 2 = 5. Dakle, Me = 6, tj. peta opcija. Ako je red dat 1, 5, 7, 9, 11, 14, 15, 16, tj. niz sa parnim brojem članova (N = 8), tada je N Me = (8 + 1) / 2 = 4,5. To znači da je medijan jednak polovini zbira četvrte i pete opcije, tj. Ja = (9 + 11) / 2 = 10.

U seriji diskretnih varijacija, medijan je određen akumuliranim frekvencijama. Učestalosti opcije, počevši od prve, se zbrajaju sve dok se ne prekorači srednji broj. Vrijednost zadnjih zbrojenih opcija bit će medijana.

Primjer. Nađite medijan broja optuženih po krivičnom predmetu koristeći podatke u tabeli 12.

Rješenje. U ovom slučaju, volumen serije varijacija je N = 154, dakle, N Me = (154 + 1) / 2 = 77,5. Sumirajući frekvencije prve i druge opcije, dobijamo: 75 + 43 = 118, tj. premašili smo srednji broj. Dakle, ja = 2.

U nizu varijacija intervala, distribucija prvo ukazuje na interval u kojem će se nalaziti medijan. On je zvao medijana . Ovo je prvi interval čija akumulirana frekvencija prelazi polovinu volumena serije varijacije intervala. Tada se numerička vrijednost medijane određuje formulom:

Gdje x Me– donja granica srednjeg intervala; i – vrijednost srednjeg intervala; S Me-1– akumulirana frekvencija intervala koji prethodi medijani; f Me– frekvencija srednjeg intervala.

Primjer. Pronađite srednju starost prestupnika osuđenih za krađu na osnovu statistike predstavljene u tabeli 13.

Rješenje. Statistički podaci predstavljeni su nizom varijacije intervala, što znači da prvo određujemo srednji interval. Obim populacije je N = 162, dakle, srednji interval je interval 18-28, jer ovo je prvi interval čija akumulirana frekvencija (15 + 90 = 105) prelazi polovinu volumena (162: 2 = 81) serije varijacije intervala. Sada određujemo numeričku vrijednost medijane koristeći gornju formulu:

Tako je polovina osuđenih za krađu mlađa od 25 godina.

moda (pon.) Oni nazivaju vrijednost karakteristike koja se najčešće nalazi u jedinicama stanovništva. Moda se koristi za identifikaciju vrijednosti karakteristike koja je najrasprostranjenija. Za diskretnu seriju, način će biti opcija s najvećom frekvencijom. Na primjer, za diskretne serije prikazane u tabeli 3 Mo= 1, pošto ova vrijednost odgovara najvišoj frekvenciji - 75. Da biste odredili način intervalne serije, prvo odredite modalni interval (interval sa najvećom frekvencijom). Zatim se unutar ovog intervala pronađe vrijednost karakteristike, koja može biti mod.

Njegova vrijednost se nalazi pomoću formule:

Gdje x Mo– donja granica modalnog intervala; i – vrijednost modalnog intervala; f Mo– učestalost modalnog intervala; f Mo-1– učestalost intervala koji prethodi modalnom; f Mo+1– učestalost intervala koji slijedi nakon modalnog.

Primjer. Odredite godine starosti kriminalaca osuđenih za krađu, podaci o čemu su prikazani u tabeli 13.

Rješenje. Najviša frekvencija odgovara intervalu 18-28, stoga bi mod trebao biti u ovom intervalu. Njegova vrijednost je određena gornjom formulom:

Dakle, najveći broj kriminalaca osuđenih za krađe ima 24 godine.

Prosječna vrijednost daje opštu karakteristiku cjeline fenomena koji se proučava. Međutim, dvije populacije koje imaju iste prosječne vrijednosti mogu se značajno razlikovati jedna od druge u stupnju fluktuacije (varijacije) u vrijednosti karakteristike koja se proučava. Na primjer, u jednom sudu su izrečene kazne zatvora: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 godina, au drugom - 5, 5, 6, 6, 7, 7 godina. , 7 , 8, 8, 8 godina. U oba slučaja, aritmetička sredina je 6,7 godina. Međutim, ove se populacije značajno razlikuju jedna od druge u širenju pojedinačnih vrijednosti određene kazne zatvora u odnosu na prosječnu vrijednost.

A za prvi sud, gdje je ovaj raspon prilično velik, prosječna zatvorska kazna ne odražava cjelokupnu populaciju. Dakle, ako se pojedinačne vrijednosti neke karakteristike malo razlikuju jedna od druge, tada će aritmetička sredina biti prilično indikativna karakteristika svojstava date populacije. U suprotnom, aritmetička sredina će biti nepouzdana karakteristika ove populacije i njena upotreba u praksi će biti neefikasna. Stoga je potrebno uzeti u obzir varijacije u vrijednostima karakteristike koja se proučava.

Varijacija- to su razlike u vrijednostima bilo koje karakteristike među različitim jedinicama date populacije u istom periodu ili trenutku. Izraz „varijacija“ je latinskog porijekla – variatio, što znači razlika, promjena, fluktuacija. Nastaje kao rezultat činjenice da se pojedinačne vrijednosti neke karakteristike formiraju pod kombiniranim utjecajem različitih faktora (uvjeta), koji se u svakom pojedinačnom slučaju kombiniraju različito. Za mjerenje varijacije neke karakteristike koriste se različiti apsolutni i relativni indikatori.

Glavni pokazatelji varijacije uključuju sljedeće:

1) obim varijacije;

2) prosečno linearno odstupanje;

3) disperzija;

4) standardna devijacija;

5) koeficijent varijacije.

Pogledajmo ukratko svaki od njih.

Raspon varijacija R je najpristupačniji apsolutni indikator u smislu jednostavnosti izračunavanja, koji se definira kao razlika između najveće i najmanje vrijednosti karakteristike za jedinice date populacije:

Opseg varijacije (raspon fluktuacija) je važan pokazatelj varijabilnosti osobine, ali omogućava uočavanje samo ekstremnih odstupanja, što ograničava opseg njegove primjene. Da bi se preciznije okarakterisala varijacija osobine na osnovu njene varijabilnosti, koriste se drugi indikatori.

Prosječna linearna devijacija predstavlja aritmetičku sredinu apsolutnih vrijednosti odstupanja pojedinačnih vrijednosti karakteristike od prosjeka i određuje se po formulama:

1) Za negrupisani podaci

2) Za varijantne serije

Međutim, najčešće korištena mjera varijacije je disperzija . Karakterizira mjeru disperzije vrijednosti karakteristike koja se proučava u odnosu na njenu prosječnu vrijednost. Disperzija se definira kao prosjek kvadrata odstupanja.

Jednostavna varijansa za negrupirane podatke:

.

Ponderisana varijansa za seriju varijacija:

Komentar. U praksi je bolje koristiti sljedeće formule za izračunavanje varijanse:

Za jednostavnu varijaciju

.

Za ponderisanu varijansu

Standardna devijacija je kvadratni korijen varijanse:

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je manja standardna devijacija, to je populacija homogenija i aritmetička sredina bolje odražava cjelokupnu populaciju.

Gore diskutovane mjere raspršenja (opseg varijacije, disperzija, standardna devijacija) su apsolutni pokazatelji po kojima nije uvijek moguće suditi o stepenu varijabilnosti neke karakteristike. U nekim problemima potrebno je koristiti relativne indekse raspršenja, od kojih je jedan koeficijent varijacije.

Koeficijent varijacije– omjer standardne devijacije i aritmetičke sredine, izražen u postocima:

Koeficijent varijacije se koristi ne samo za komparativnu procjenu varijacije različitih karakteristika ili iste karakteristike u različitim populacijama, već i za karakterizaciju homogenosti populacije. Statistička populacija se smatra kvantitativno homogenom ako koeficijent varijacije ne prelazi 33% (za raspodjele bliske normalnoj).

Primjer. Dostupni su sljedeći podaci o rokovima zatvora za 50 osuđenika dostavljenih na izdržavanje kazne izrečene od strane suda u vaspitno-popravnom zavodu kaznenog sistema: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Konstruirajte seriju distribucija prema uslovima zatvora.

2. Pronađite srednju vrijednost, varijansu i standardnu ​​devijaciju.

3. Izračunajte koeficijent varijacije i donesite zaključak o homogenosti ili heterogenosti populacije koja se proučava.

Rješenje. Za konstruiranje diskretne serije distribucije potrebno je odrediti opcije i frekvencije. Opcija u ovom problemu je zatvorska kazna, a učestalost je broj pojedinačnih opcija. Nakon izračunavanja frekvencija, dobijamo sljedeće diskretne serije distribucije:

Nađimo srednju vrijednost i varijansu. Budući da su statistički podaci predstavljeni diskretnim nizom varijacija, za njihovo izračunavanje koristićemo formule za ponderisanu aritmetičku sredinu i disperziju. Dobijamo:

= = 4,1;

= 5,21.

Sada izračunavamo standardnu ​​devijaciju:

Pronalaženje koeficijenta varijacije:

Shodno tome, statistička populacija je kvantitativno heterogena.

Jednostavna aritmetička sredina

Prosječne vrijednosti

Prosječne vrijednosti se široko koriste u statistici.

prosječna vrijednost- ovo je opšti pokazatelj u kome se izražavaju efekti opštih uslova i obrazaca razvoja fenomena koji se proučava.

Statistički prosjeci se izračunavaju na osnovu masovnih podataka iz pravilno statistički organizovanog posmatranja (kontinuirano i selektivno). Međutim, statistički prosjek će biti objektivan i tipičan ako se izračuna iz masovnih podataka za kvalitativno homogenu populaciju (masovne pojave). Na primjer, ako izračunate prosječnu platu u akcionarskim društvima i državnim preduzećima i proširite rezultat na cijelu populaciju, onda je prosjek fiktivan, jer se računa za heterogenu populaciju, a takav prosjek gubi sve značenje.

Uz pomoć prosjeka izglađuju se razlike u vrijednosti neke karakteristike koje iz ovog ili onog razloga nastaju u pojedinim jedinicama posmatranja.

Na primjer, prosječan učinak pojedinačnog prodavca zavisi od mnogo razloga: kvalifikacije, dužina radnog staža, godine, oblik usluge, zdravlje itd. Prosječan učinak odražava opšte karakteristike cjelokupne populacije.

Prosječna vrijednost se mjeri u istim jedinicama kao i sam atribut.

Svaka prosječna vrijednost karakterizira populaciju koja se proučava prema bilo kojoj osobini. Da bi se dobila potpuna i sveobuhvatna slika populacije koja se proučava na osnovu niza bitnih karakteristika, potrebno je imati sistem prosječnih vrijednosti koji može opisati fenomen iz različitih uglova.

Postoje različite vrste prosjeka:

    aritmetička sredina;

    harmonična sredina;

    geometrijska sredina;

    srednji kvadrat;

    prosečan kubik.

Prosjeci svih gore navedenih tipova, pak, dijele se na jednostavne (neponderisane) i ponderisane.

Pogledajmo vrste prosjeka koji se koriste u statistici.

Prosta aritmetička sredina (neponderisana) jednaka je zbroju pojedinačnih vrijednosti atributa podijeljenom sa brojem ovih vrijednosti.

Pojedinačne vrijednosti karakteristike nazivaju se varijante i označavaju se sa x i (
); broj jedinica stanovništva je označen sa n, prosečna vrednost karakteristike je označena sa . Stoga je aritmetička prosta sredina jednaka:

ili

Primjer 1. Tabela 1

Podaci o proizvodnji proizvoda A radnika po smjeni

U ovom primjeru, varijabilni atribut je proizvodnja proizvoda po smjeni.

Numeričke vrijednosti atributa (16, 17, itd.) nazivaju se opcijama. Odredimo prosječan učinak radnika ove grupe:

PC.

Prosti aritmetički prosjek se koristi u slučajevima kada postoje odvojene vrijednosti neke karakteristike, tj. podaci nisu grupisani. Ako su podaci prikazani u obliku distributivnih serija ili grupa, onda se prosjek izračunava drugačije.

Ponderisan aritmetički prosjek

Aritmetički ponderisani prosjek jednak je zbiru proizvoda svake pojedinačne vrijednosti atributa (varijante) na odgovarajuću frekvenciju, podijeljen sa zbirom svih frekvencija.

Broj identičnih vrijednosti karakteristike u redovima distribucije naziva se frekvencija ili težina i označava se sa f i.

U skladu s tim, ponderirani aritmetički prosjek izgleda ovako:

ili

Iz formule je jasno da prosjek ne zavisi samo od vrijednosti atributa, već i od njihove frekvencije, tj. o sastavu agregata, o njegovoj strukturi.

Primjer 2. tabela 2

Podaci o platama radnika

Prema podacima serije diskretnih distribucija, jasno je da se iste karakteristične vrijednosti (varijante) ponavljaju više puta. Dakle, opcija x 1 se pojavljuje ukupno 2 puta, a opcija x 2 - 6 puta, itd.

Izračunajmo prosječnu platu jednog radnika:

Fond zarada za svaku grupu radnika jednak je umnošku opcija i učestalosti (
), a zbir ovih proizvoda daje ukupan fond zarada svih radnika (
).

Ako bi se izračunavanje izvršilo pomoću jednostavne formule aritmetičkog prosjeka, prosječna zarada bi bila jednaka 3.000 rubalja. (). Upoređujući dobijeni rezultat sa početnim podacima, očigledno je da bi prosečna plata trebalo da bude znatno veća (više od polovine radnika prima platu iznad 3.000 rubalja). Stoga će izračunavanje pomoću jednostavne aritmetičke sredine u takvim slučajevima biti pogrešno.

Kao rezultat obrade, statistički materijal se može prikazati ne samo u obliku diskretnih serija distribucije, već iu obliku intervalnih varijacionih serija sa zatvorenim ili otvorenim intervalima.

Razmotrimo izračunavanje aritmetičke sredine za takve serije.

Prosjek je:

Prosječna vrijednost

Prosječna vrijednost- numeričke karakteristike skupa brojeva ili funkcija; - određeni broj između najmanje i najveće njihove vrijednosti.

  • 1 Osnovne informacije
  • 2 Hijerarhija prosjeka u matematici
  • 3 U teoriji vjerovatnoće i statistici
  • 4 Vidi također
  • 5 Napomene

Osnovne informacije

Polazna tačka za razvoj teorije prosjeka bila je proučavanje proporcija Pitagorine škole. Istovremeno, nije napravljena stroga razlika između pojmova prosječne veličine i proporcije. Značajan podsticaj razvoju teorije proporcija sa aritmetičke tačke gledišta dali su grčki matematičari - Nikomah iz Gerasa (kraj 1. - početak 2. veka nove ere) i Papus iz Aleksandrije (3. vek nove ere). Prva faza u razvoju koncepta prosjeka je faza kada se prosjek počeo smatrati centralnim članom kontinuirane proporcije. Ali koncept prosjeka kao centralne vrijednosti progresije ne omogućava izvođenje koncepta prosjeka u odnosu na niz od n članova, bez obzira na redosljed kojim se oni slijede. U tu svrhu potrebno je pribjeći formalnoj generalizaciji prosjeka. Sljedeća faza je prijelaz sa kontinuiranih proporcija na progresije - aritmetičke, geometrijske i harmonijske.

U istoriji statistike, po prvi put, široka upotreba prosjeka povezana je s imenom engleskog naučnika W. Pettyja. W. Petty je bio jedan od prvih koji je pokušao prosječnoj vrijednosti dati statističko značenje, povezujući je sa ekonomskim kategorijama. Ali Petty nije opisao koncept prosječne veličine niti ga izolirao. A. Quetelet se smatra osnivačem teorije prosjeka. Bio je jedan od prvih koji je dosljedno razvijao teoriju prosjeka, pokušavajući da joj pruži matematičku osnovu. A. Quetelet je razlikovao dvije vrste prosjeka - stvarne prosjeke i aritmetičke prosjeke. Zapravo, prosjek predstavlja stvar, broj, koji stvarno postoji. Zapravo, proseci ili statistički proseci treba da budu izvedeni iz fenomena istog kvaliteta, identičnih po svom unutrašnjem značenju. Aritmetički prosjeci su brojevi koji daju najbližu moguću predstavu o mnogim brojevima, različitim, iako homogenim.

Svaki tip prosjeka može se pojaviti ili u obliku jednostavnog ili u obliku ponderiranog prosjeka. Ispravan izbor srednjeg oblika proizlazi iz materijalne prirode predmeta proučavanja. Jednostavne formule prosjeka se koriste ako se pojedinačne vrijednosti karakteristike koja se prosječuje ne ponavljaju. Kada se u praktičnim istraživanjima pojedinačne vrijednosti karakteristike koja se proučava pojavljuju nekoliko puta u jedinicama populacije koja se proučava, tada je učestalost ponavljanja pojedinačnih vrijednosti karakteristike prisutna u formulama za izračunavanje prosječnih snaga. U ovom slučaju, one se nazivaju ponderiranim prosječnim formulama.

Wikimedia Foundation. 2010.


Prosječna vrijednost je opšti pokazatelj koji karakteriše tipičan nivo pojave. Izražava vrijednost karakteristike po jedinici populacije.

Prosječna vrijednost je:

1) najtipičniju vrijednost atributa za populaciju;

2) obim atributa populacije, ravnomjerno raspoređen među jedinicama stanovništva.

Karakteristika za koju se izračunava prosječna vrijednost se u statistici naziva „prosječnom“.

Prosek uvek generalizuje kvantitativnu varijaciju osobine, tj. u prosječnim vrijednostima eliminiraju se individualne razlike između jedinica u populaciji zbog slučajnih okolnosti. Za razliku od prosjeka, apsolutna vrijednost koja karakterizira nivo karakteristike pojedine jedinice populacije ne dopušta da se uporede vrijednosti karakteristike među jedinicama koje pripadaju različitim populacijama. Dakle, ako treba da uporedite nivoe zarada radnika u dva preduzeća, onda ne možete porediti dva radnika različitih preduzeća po ovom osnovu. Naknada radnika odabranih za poređenje možda nije tipična za ova preduzeća. Ako uporedimo veličinu fondova zarada u preduzećima koja se razmatraju, broj zaposlenih se ne uzima u obzir i stoga je nemoguće utvrditi gde je nivo zarada veći. U konačnici se mogu porediti samo prosječni pokazatelji, tj. Koliko u svakom preduzeću u prosjeku zarađuje jedan zaposlenik? Dakle, postoji potreba da se izračuna prosječna vrijednost kao generalizirajuća karakteristika populacije.

Važno je napomenuti da tokom procesa usrednjavanja ukupna vrijednost nivoa atributa ili njegova konačna vrijednost (u slučaju izračunavanja prosječnih nivoa u dinamičkoj seriji) mora ostati nepromijenjena. Drugim riječima, prilikom izračunavanja prosječne vrijednosti, volumen proučavane karakteristike ne bi trebao biti iskrivljen, a izrazi koji se sastavljaju prilikom izračunavanja prosjeka moraju nužno imati smisla.

Izračunavanje prosjeka je jedna od uobičajenih tehnika generalizacije; prosječni indikator negira ono što je zajedničko (tipično) svim jedinicama populacije koja se proučava, dok istovremeno zanemaruje razlike pojedinačnih jedinica. U svakoj pojavi i njenom razvoju postoji kombinacija slučajnosti i nužnosti. Prilikom izračunavanja prosjeka, zbog djelovanja zakona velikih brojeva, slučajnost se poništava i balansira, pa je moguće apstrahirati od nebitnih obilježja pojave, od kvantitativnih vrijednosti karakteristike u svakom konkretnom slučaju . Sposobnost apstrahiranja od slučajnosti pojedinačnih vrijednosti i fluktuacija leži u naučnoj vrijednosti prosjeka kao generalizirajućih karakteristika agregata.

Da bi prosjek bio zaista reprezentativan, mora se izračunati uzimajući u obzir određene principe.

Zaustavimo se na nekim općim principima za korištenje prosjeka.

1. Prosjek se mora odrediti za populacije koje se sastoje od kvalitativno homogenih jedinica.

2. Prosjek se mora izračunati za populaciju koja se sastoji od dovoljno velikog broja jedinica.

3. Prosjek se mora izračunati za populaciju čije su jedinice u normalnom, prirodnom stanju.

4. Prosjek treba izračunati uzimajući u obzir ekonomski sadržaj indikatora koji se proučava.

5.2. Vrste prosjeka i metode za njihovo izračunavanje

Razmotrimo sada vrste prosječnih vrijednosti, karakteristike njihovog izračunavanja i područja primjene. Prosječne vrijednosti podijeljene su u dvije velike klase: prosječne snage, strukturne prosječne vrijednosti.

Srednje vrijednosti snage uključuju najpoznatije i najčešće korištene tipove, kao što su geometrijska sredina, aritmetička sredina i kvadratna sredina.

Mod i medijan se smatraju strukturnim prosjecima.

Hajde da se fokusiramo na proseke snage. Prosjeci snage, u zavisnosti od prezentacije izvornih podataka, mogu biti jednostavni ili ponderisani. Jednostavan prosek Izračunava se na osnovu negrupisanih podataka i ima sljedeći opći oblik:

,

gdje je X i varijanta (vrijednost) karakteristike koja se usrednjuje;

n – opcija broja.

Prosjećna težina izračunava se na osnovu grupisanih podataka i ima opšti izgled

,

gdje je X i varijanta (vrijednost) karakteristike koja se prosječuje ili srednja vrijednost intervala u kojem se varijanta mjeri;

m – indeks prosječnog stepena;

f i – frekvencija koja pokazuje koliko puta se pojavljuje i-e vrijednost prosječne karakteristike.

Ako izračunate sve vrste prosjeka za iste početne podatke, tada će se njihove vrijednosti pokazati različitim. Ovdje se primjenjuje pravilo većine prosjeka: kako eksponent m raste, raste i odgovarajuća prosječna vrijednost:

U statističkoj praksi, aritmetičke sredine i harmonijske ponderisane sredine se koriste češće od drugih vrsta ponderisanih prosjeka.

Vrste energetskih sredstava

Vrsta moći
prosjek

Indeks
stepen (m)

Formula za izračun

Jednostavno

Weighted

Harmonic

Geometrijski

Aritmetika

Kvadratno

Cubic

Harmonska sredina ima složeniju strukturu od aritmetičke sredine. Harmonička sredina se koristi za proračune kada se kao težine ne koriste jedinice populacije - nosioci karakteristike, već proizvod tih jedinica sa vrijednostima karakteristike (tj. m = Xf). Prosječnom harmonskom jednostavnom treba pribjeći u slučajevima određivanja npr. prosječne cijene rada, vremena, materijala po jedinici proizvodnje, po jednom dijelu za dva (tri, četiri, itd.) preduzeća, radnika koji se bave proizvodnjom. iste vrste proizvoda, istog dijela, proizvoda.

Glavni zahtjev za formulu za izračunavanje prosječne vrijednosti je da sve faze proračuna imaju stvarno smisleno opravdanje; rezultirajuća prosječna vrijednost treba zamijeniti pojedinačne vrijednosti atributa za svaki objekt bez narušavanja veze između pojedinačnih i zbirnih pokazatelja. Drugim riječima, prosječna vrijednost mora biti izračunata na način da kada se svaka pojedinačna vrijednost prosječnog indikatora zamijeni njegovom prosječnom vrijednošću, neki konačni zbirni pokazatelj, na ovaj ili onaj način povezan sa prosječnim indikatorom, ostane nepromijenjen. Ovaj zbroj se zove definisanje budući da priroda njegovog odnosa sa pojedinačnim vrijednostima određuje specifičnu formulu za izračunavanje prosječne vrijednosti. Pokažimo ovo pravilo na primjeru geometrijske sredine.

Formula geometrijske sredine

najčešće se koristi prilikom izračunavanja prosječne vrijednosti na osnovu individualne relativne dinamike.

Geometrijska sredina se koristi ako je dat niz lančane relativne dinamike, koji ukazuje na, na primjer, povećanje obima proizvodnje u odnosu na nivo prethodne godine: i 1, i 2, i 3,…, i n. Očigledno, obim proizvodnje u prošloj godini određen je njenim početnim nivoom (q 0) i naknadnim povećanjem tokom godina:

q n =q 0 × i 1 × i 2 ×…×i n .

Uzimajući q n kao određujući indikator i zamjenjujući pojedinačne vrijednosti indikatora dinamike prosječnim, dolazimo do relacije

Odavde



Posebna vrsta prosječnih vrijednosti - strukturni prosjeci - koristi se za proučavanje unutrašnje strukture distributivnog niza vrijednosti atributa, kao i za procjenu prosječne vrijednosti (vrste snage), ako je, prema dostupnim statističkim podacima, njena kalkulacija se ne može izvršiti (na primjer, ako u razmatranom primjeru ne postoje podaci i o obimu proizvodnje i o visini troškova po grupama preduzeća).

Indikatori se najčešće koriste kao strukturni prosjeci moda - najčešće ponavljana vrijednost atributa – i medijane - vrijednost karakteristike koja dijeli uređeni niz njegovih vrijednosti na dva jednaka dijela. Kao rezultat toga, za jednu polovinu jedinica u populaciji vrijednost atributa ne prelazi srednji nivo, a za drugu polovinu nije manja od njega.

Ako karakteristika koja se proučava ima diskretne vrijednosti, onda nema posebnih poteškoća u izračunavanju modusa i medijana. Ako se podaci o vrijednostima atributa X prezentiraju u obliku uređenih intervala njegove promjene (intervalne serije), izračunavanje moda i medijana postaje nešto složenije. Budući da vrijednost medijane dijeli cijelu populaciju na dva jednaka dijela, ona završava u jednom od intervala karakteristike X. Interpolacijom se vrijednost medijane nalazi u ovom srednjem intervalu:

,

gdje je X Me donja granica srednjeg intervala;

h Me – njegova vrijednost;

(Zbir m)/2 – polovina ukupnog broja posmatranja ili polovina volumena indikatora koji se koristi kao ponder u formulama za izračunavanje prosječne vrijednosti (u apsolutnom ili relativnom iznosu);

S Me-1 – zbir zapažanja (ili volumen atributa ponderiranja) akumuliranih prije početka srednjeg intervala;

m Me – broj zapažanja ili zapremina težinske karakteristike u srednjem intervalu (također u apsolutnom ili relativnom smislu).

Prilikom izračunavanja modalne vrijednosti karakteristike na temelju podataka intervalne serije, potrebno je obratiti pažnju na činjenicu da su intervali identični, jer pokazatelj ponovljivosti vrijednosti karakteristike X ovisi o tome intervalni niz sa jednakim intervalima, veličina moda se određuje kao

,

gdje je X Mo donja vrijednost modalnog intervala;

m Mo – broj zapažanja ili zapremina težinske karakteristike u modalnom intervalu (u apsolutnom ili relativnom smislu);

m Mo-1 – isto za interval koji prethodi modalnom;

m Mo+1 – isto za interval koji slijedi nakon modalnog;

h – vrijednost intervala promjene karakteristike u grupama.

ZADATAK 1

Za grupu industrijskih preduzeća za izvještajnu godinu dostupni su sljedeći podaci


preduzeća

Obim proizvoda, milion rubalja.

Prosječan broj zaposlenih, ljudi.

Dobit, hiljada rubalja

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

Za razmjenu proizvoda potrebno je grupirati preduzeća u sljedećim intervalima:

    do 200 miliona rubalja

    od 200 do 400 miliona rubalja.

  1. od 400 do 600 miliona rubalja.

    Za svaku grupu i za sve zajedno odrediti broj preduzeća, obim proizvodnje, prosječan broj zaposlenih, prosječan učinak po zaposlenom. Rezultate grupisanja predstaviti u obliku statističke tabele. Formulirajte zaključak.

    RJEŠENJE

    Grupisaćemo preduzeća po razmjeni proizvoda, izračunati broj preduzeća, obim proizvodnje i prosječan broj zaposlenih koristeći jednostavnu prosječnu formulu. Rezultati grupisanja i proračuna sumirani su u tabeli.

    Grupacije prema količini proizvoda


    preduzeća

    Obim proizvoda, milion rubalja.

    Prosječni godišnji trošak osnovnih sredstava, miliona rubalja.

    Srednji san

    sočan broj zaposlenih, ljudi.

    Dobit, hiljada rubalja

    Prosječan učinak po zaposlenom

    1 grupa

    do 200 miliona rubalja

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Prosječan nivo

    198,3

    24,9

    2. grupa

    od 200 do 400 miliona rubalja.

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Prosječan nivo

    282,3

    37,6

    1530

    64,0

    3 grupa

    od 400 do

    600 miliona

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Prosječan nivo

    512,9

    34,4

    1421

    120,9

    Ukupno ukupno

    5314,2

    419,4

    17131

    1113,4

    0,31

    U prosjeku

    379,6

    59,9

    1223,6

    79,5

    Zaključak. Tako je u posmatranoj populaciji najveći broj preduzeća po obimu proizvodnje spadao u treću grupu - sedam, odnosno polovina preduzeća. Prosečan godišnji trošak osnovnih sredstava je takođe u ovoj grupi, kao i veliki prosečan broj zaposlenih - 9974 lica su najmanje profitabilna preduzeća;

    ZADATAK 2

    Dostupni su sljedeći podaci o preduzećima kompanije

    Broj preduzeća uključenih u kompaniju

    I četvrtina

    II kvartal

    Proizvodnja proizvoda, hiljada rubalja.

    Čovjek-dana odrađenih od strane radnika

    Prosječan učinak po radniku dnevno, rub.

    59390,13

5.1. Koncept prosjeka

Prosječna vrijednost - Ovo je opšti indikator koji karakteriše tipičan nivo fenomena. Izražava vrijednost karakteristike po jedinici populacije.

Prosek uvek generalizuje kvantitativnu varijaciju osobine, tj. u prosječnim vrijednostima eliminiraju se individualne razlike između jedinica u populaciji zbog slučajnih okolnosti. Za razliku od prosjeka, apsolutna vrijednost koja karakterizira nivo karakteristike pojedine jedinice populacije ne dopušta da se uporede vrijednosti karakteristike među jedinicama koje pripadaju različitim populacijama. Dakle, ako treba da uporedite nivoe zarada radnika u dva preduzeća, onda ne možete porediti dva radnika različitih preduzeća po ovom osnovu. Naknada radnika odabranih za poređenje možda nije tipična za ova preduzeća. Ako uporedimo veličinu fondova zarada u preduzećima koja se razmatraju, broj zaposlenih se ne uzima u obzir i stoga je nemoguće utvrditi gde je nivo zarada veći. U konačnici se mogu porediti samo prosječni pokazatelji, tj. Koliko u svakom preduzeću u prosjeku zarađuje jedan zaposlenik? Dakle, postoji potreba da se izračuna prosječna vrijednost kao generalizirajuća karakteristika populacije.

Izračunavanje prosjeka je jedna od uobičajenih tehnika generalizacije; prosječni indikator negira ono što je zajedničko (tipično) za sve jedinice populacije koja se proučava, a istovremeno zanemaruje razlike pojedinačnih jedinica. U svakoj pojavi i njenom razvoju postoji kombinacija slučajnosti i nužnosti. Prilikom izračunavanja prosjeka, zbog djelovanja zakona velikih brojeva, slučajnost se poništava i balansira, pa je moguće apstrahirati od nebitnih obilježja pojave, od kvantitativnih vrijednosti karakteristike u svakom konkretnom slučaju . Sposobnost apstrahiranja od slučajnosti pojedinačnih vrijednosti i fluktuacija leži u naučnoj vrijednosti prosjeka kao generalizirajućih karakteristika agregata.

Da bi prosjek bio zaista reprezentativan, mora se izračunati uzimajući u obzir određene principe.

Zaustavimo se na nekim općim principima za korištenje prosjeka.
1. Prosjek se mora odrediti za populacije koje se sastoje od kvalitativno homogenih jedinica.
2. Prosjek se mora izračunati za populaciju koja se sastoji od dovoljno velikog broja jedinica.
3. Prosjek se mora izračunati za populaciju čije su jedinice u normalnom, prirodnom stanju.
4. Prosjek treba izračunati uzimajući u obzir ekonomski sadržaj indikatora koji se proučava.

5.2. Vrste prosjeka i metode za njihovo izračunavanje

Razmotrimo sada vrste prosječnih vrijednosti, karakteristike njihovog izračunavanja i područja primjene. Prosječne vrijednosti podijeljene su u dvije velike klase: prosječne snage, strukturne prosječne vrijednosti.

TO prosek snage To uključuje najpoznatije i najčešće korištene tipove, kao što su geometrijska sredina, aritmetička sredina i kvadratna sredina.

As strukturni proseci mod i medijan se razmatraju.

Hajde da se fokusiramo na proseke snage. Prosjeci snage, u zavisnosti od prezentacije izvornih podataka, mogu biti jednostavni ili ponderisani. Jednostavan prosek Izračunava se na osnovu negrupisanih podataka i ima sljedeći opći oblik:

gdje je X i varijanta (vrijednost) karakteristike koja se usrednjuje;

n – opcija broja.

Prosjećna težina izračunava se na osnovu grupisanih podataka i ima opšti izgled

,

gdje je X i varijanta (vrijednost) karakteristike koja se prosječuje ili srednja vrijednost intervala u kojem se varijanta mjeri;
m – indeks prosječnog stepena;
f i – frekvencija koja pokazuje koliko puta se pojavljuje i-e vrijednost prosječne karakteristike.

Navedimo kao primjer izračunavanje prosječne starosti učenika u grupi od 20 ljudi:


Prosječnu starost izračunavamo koristeći jednostavnu prosječnu formulu:

Grupirajmo izvorne podatke. Dobijamo sljedeću distributivnu seriju:

Kao rezultat grupisanja dobijamo novi indikator – učestalost, koji označava broj učenika starosti X godina. Stoga će se prosječna starost učenika u grupi izračunati pomoću ponderirane prosječne formule:

Opće formule za izračunavanje prosječnih snaga imaju eksponent (m). Ovisno o tome koju vrijednost ima, razlikuju se sljedeće vrste prosječnih vrijednosti:
harmonijska sredina ako je m = -1;
geometrijska sredina, ako je m –> 0;
aritmetička sredina ako je m = 1;
srednji kvadrat ako je m = 2;
prosječni kubik ako je m = 3.

Formule za prosječne snage su date u tabeli. 4.4.

Ako izračunate sve vrste prosjeka za iste početne podatke, tada će se njihove vrijednosti pokazati različitim. Ovdje se primjenjuje pravilo većine prosjeka: kako eksponent m raste, raste i odgovarajuća prosječna vrijednost:

U statističkoj praksi, aritmetičke sredine i harmonijske ponderisane sredine se koriste češće od drugih vrsta ponderisanih prosjeka.

Tabela 5.1

Vrste energetskih sredstava

Vrsta moći
prosjek
Indeks
stepen (m)
Formula za izračun
Jednostavno Weighted
Harmonic -1
Geometrijski 0
Aritmetika 1
Kvadratno 2
Cubic 3

Harmonska sredina ima složeniju strukturu od aritmetičke sredine. Harmonička sredina se koristi za proračune kada se kao težine ne koriste jedinice populacije - nosioci karakteristike, već proizvod tih jedinica sa vrijednostima karakteristike (tj. m = Xf). Prosječnom harmonskom jednostavnom treba pribjeći u slučajevima određivanja npr. prosječne cijene rada, vremena, materijala po jedinici proizvodnje, po jednom dijelu za dva (tri, četiri, itd.) preduzeća, radnika koji se bave proizvodnjom. iste vrste proizvoda, istog dijela, proizvoda.

Glavni zahtjev za formulu za izračunavanje prosječne vrijednosti je da sve faze proračuna imaju stvarno smisleno opravdanje; rezultirajuća prosječna vrijednost treba zamijeniti pojedinačne vrijednosti atributa za svaki objekt bez narušavanja veze između pojedinačnih i zbirnih pokazatelja. Drugim riječima, prosječna vrijednost mora biti izračunata na način da kada se svaka pojedinačna vrijednost prosječnog indikatora zamijeni njegovom prosječnom vrijednošću, neki konačni zbirni pokazatelj, na ovaj ili onaj način povezan sa prosječnom vrijednošću, ostane nepromijenjen. Ovaj zbroj se zove definisanje budući da priroda njegovog odnosa sa pojedinačnim vrijednostima određuje specifičnu formulu za izračunavanje prosječne vrijednosti. Pokažimo ovo pravilo na primjeru geometrijske sredine.

Formula geometrijske sredine

najčešće se koristi prilikom izračunavanja prosječne vrijednosti na osnovu individualne relativne dinamike.

Geometrijska sredina se koristi ako je dat niz lančane relativne dinamike, koji ukazuje na, na primjer, povećanje proizvodnje u odnosu na nivo prethodne godine: i 1, i 2, i 3,..., i n. Očigledno, obim proizvodnje u prošloj godini određen je njenim početnim nivoom (q 0) i naknadnim povećanjem tokom godina:

q n =q 0 × i 1 × i 2 ×...×i n .

Uzimajući q n kao određujući indikator i zamjenjujući pojedinačne vrijednosti indikatora dinamike prosječnim, dolazimo do relacije

Odavde

5.3. Strukturni proseci

Posebna vrsta prosječnih vrijednosti - strukturni prosjeci - koristi se za proučavanje unutrašnje strukture distributivnog niza vrijednosti atributa, kao i za procjenu prosječne vrijednosti (vrste snage), ako je, prema dostupnim statističkim podacima, njena kalkulacija se ne može izvršiti (na primjer, ako u razmatranom primjeru nije bilo podataka kako obim proizvodnje tako i iznos troškova po grupama preduzeća).

Indikatori se najčešće koriste kao strukturni prosjeci moda - najčešće ponavljana vrijednost atributa – i medijane - vrijednost karakteristike koja dijeli uređeni niz njegovih vrijednosti na dva jednaka dijela. Kao rezultat toga, za jednu polovinu jedinica u populaciji vrijednost atributa ne prelazi srednji nivo, a za drugu polovinu nije manja od njega.

Ako karakteristika koja se proučava ima diskretne vrijednosti, onda nema posebnih poteškoća u izračunavanju modusa i medijana. Ako se podaci o vrijednostima atributa X prezentiraju u obliku uređenih intervala njegove promjene (intervalne serije), izračunavanje moda i medijana postaje nešto složenije. Budući da vrijednost medijane dijeli cijelu populaciju na dva jednaka dijela, ona završava u jednom od intervala karakteristike X. Interpolacijom se vrijednost medijane nalazi u ovom srednjem intervalu:

,

gdje je X Me donja granica srednjeg intervala;
h Me – njegova vrijednost;
(Zbir m)/2 – polovina ukupnog broja posmatranja ili polovina obima indikatora koji se koristi kao ponder u formulama za izračunavanje prosečne vrednosti (u apsolutnom ili relativnom iznosu);
S Me-1 – zbir zapažanja (ili volumen atributa ponderiranja) akumuliranih prije početka srednjeg intervala;
m Me – broj zapažanja ili zapremina težinske karakteristike u srednjem intervalu (također u apsolutnom ili relativnom smislu).

U našem primjeru mogu se dobiti čak tri srednje vrijednosti - na osnovu broja preduzeća, obima proizvodnje i ukupnih troškova proizvodnje:

Dakle, u polovini preduzeća trošak po jedinici proizvodnje prelazi 125,19 hiljada rubalja, polovina ukupnog obima proizvoda proizvodi se sa troškom po proizvodu većim od 124,79 hiljada rubalja. a 50% ukupnih troškova formira se kada je cijena jednog proizvoda iznad 125,07 hiljada rubalja. Imajte na umu i da postoji određena tendencija ka povećanju troškova, budući da je Me 2 = 124,79 hiljada rubalja, a prosječni nivo je 123,15 hiljada rubalja.

Prilikom izračunavanja modalne vrijednosti karakteristike na osnovu podataka niza intervala, potrebno je obratiti pažnju na činjenicu da su intervali identični, jer pokazatelj ponovljivosti vrijednosti karakteristike X ovisi o tome intervalni niz sa jednakim intervalima, veličina moda se određuje kao

gdje je X Mo donja vrijednost modalnog intervala;
m Mo – broj zapažanja ili zapremina težinske karakteristike u modalnom intervalu (u apsolutnom ili relativnom smislu);
m Mo -1 – isto za interval koji prethodi modalnom;
m Mo+1 – isto za interval koji slijedi nakon modalnog;
h – vrijednost intervala promjene karakteristike u grupama.

Za naš primjer možemo izračunati tri modalne vrijednosti na osnovu karakteristika broja preduzeća, količine proizvoda i iznosa troškova. U sva tri slučaja modalni interval je isti, jer su za isti interval najveći broj preduzeća, obim proizvodnje i ukupni troškovi proizvodnje:

Dakle, najčešće postoje preduzeća sa nivoom troškova od 126,75 hiljada rubalja, najčešće se proizvode proizvodi sa nivoom troškova od 126,69 hiljada rubalja, a najčešće se troškovi proizvodnje objašnjavaju nivoom troškova od 123,73 hiljada rubalja.

5.4. Indikatori varijacije

Specifični uslovi u kojima se nalazi svaki od proučavanih objekata, kao i karakteristike sopstvenog razvoja (društveni, ekonomski i dr.) izraženi su odgovarajućim numeričkim nivoima statističkih pokazatelja. dakle, varijacija, one. neslaganje između nivoa istog indikatora u različitim objektima je objektivno po prirodi i pomaže da se shvati suština fenomena koji se proučava.

Postoji nekoliko metoda koje se koriste za mjerenje varijacija u statistici.

Najjednostavnije je izračunati indikator raspon varijacija H kao razlika između maksimalne (X max) i minimalne (X min) uočene vrijednosti karakteristike:

H=X max - X min.

Međutim, raspon varijacije pokazuje samo ekstremne vrijednosti osobine. Ovdje se ne uzima u obzir ponovljivost međuvrijednosti.

Strože karakteristike su indikatori varijabilnosti u odnosu na prosječni nivo atributa. Najjednostavniji indikator ove vrste je prosječno linearno odstupanje L kao aritmetička sredina apsolutnih odstupanja karakteristike od njenog prosječnog nivoa:

Kada su pojedinačne vrijednosti X ponovljive, koristite formulu ponderiranog aritmetičkog prosjeka:

(Podsjetite se da je algebarski zbir odstupanja od prosječnog nivoa nula.)

Indikator prosječne linearne devijacije se široko koristi u praksi. Uz njegovu pomoć, na primjer, analizira se sastav radnika, ritam proizvodnje, ujednačenost nabavke materijala i razvijaju se sistemi materijalnih poticaja. Ali, nažalost, ovaj pokazatelj komplikuje probabilističke proračune i komplikuje korištenje metoda matematičke statistike. Stoga je u statističkim naučnim istraživanjima indikator koji se najčešće koristi za mjerenje varijacije varijanse.

Varijanca karakteristike (s 2) se određuje na osnovu kvadratne srednje srednje snage:

.

Poziva se indikator s jednak standardna devijacija.

U općoj teoriji statistike, indikator disperzije je procjena istoimenog indikatora teorije vjerovatnoće i (kao zbir kvadrata odstupanja) procjena disperzije u matematičkoj statistici, što omogućava korištenje odredbi ovih teorijske discipline za analizu društveno-ekonomskih procesa.

Ako se varijacija procjenjuje na osnovu malog broja opservacija uzetih iz neograničene populacije, tada se prosječna vrijednost karakteristike određuje s nekom greškom. Pokazalo se da je izračunata vrijednost disperzije pomaknuta prema smanjenju. Da bi se dobila nepristrasna procjena, varijansa uzorka dobivena korištenjem prethodno datih formula mora se pomnožiti sa vrijednošću n / (n - 1). Kao rezultat toga, uz mali broj zapažanja (< 30) дисперсию признака рекомендуется вычислять по формуле

Obično, već za n > (15÷20), neslaganje između pristrasnih i nepristrasnih procjena postaje beznačajno. Iz istog razloga, pristranost se obično ne uzima u obzir u formuli za dodavanje varijansi.

Ako se iz opće populacije uzme više uzoraka i svaki put se odredi prosječna vrijednost neke karakteristike, onda nastaje problem procjene varijabilnosti prosjeka. Procijenite varijansu prosječna vrijednost moguće je na osnovu samo jednog posmatranja uzorka koristeći formulu

,

gdje je n veličina uzorka; s 2 – varijansa karakteristike izračunate iz podataka uzorka.

Magnituda se zove prosječna greška uzorkovanja i karakteristika je odstupanja prosječne vrijednosti uzorka atributa X od njegove prave prosječne vrijednosti. Indikator prosječne greške se koristi za procjenu pouzdanosti rezultata posmatranja uzorka.

Pokazatelji relativne disperzije. Za karakterizaciju mjere varijabilnosti karakteristike koja se proučava, indikatori varijabilnosti se izračunavaju u relativnim vrijednostima. Oni omogućavaju poređenje prirode disperzije u različitim distribucijama (različite jedinice posmatranja iste karakteristike u dvije populacije, s različitim prosječnim vrijednostima, kada se porede populacije različitih imena). Izračunavanje indikatora mjere relativne disperzije vrši se kao omjer indikatora apsolutne disperzije i aritmetičke sredine, pomnožen sa 100%.

1. Koeficijent oscilacije odražava relativnu fluktuaciju ekstremnih vrijednosti karakteristike oko prosjeka

.

2. Relativno linearno isključenje karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti

.

3. Koeficijent varijacije:

je najčešća mjera varijabilnosti koja se koristi za procjenu tipičnosti prosječnih vrijednosti.

U statistici se populacije sa koeficijentom varijacije većim od 30-35% smatraju heterogenim.

Ova metoda procjene varijacije također ima značajan nedostatak. Zaista, neka, na primjer, prvobitna populacija radnika sa prosječnim stažom od 15 godina, sa standardnom devijacijom od s = 10 godina, „ostari” za još 15 godina. Sada = 30 godina, a standardna devijacija je i dalje 10. Ranije heterogena populacija (10/15 × 100 = 66,7%), što se pokazalo kao prilično homogeno tokom vremena (10/30 × 100 = 33,3%).

Boyarsky A.Ya. Teorijske studije iz statistike: Sub. Scientific Trudov – M.: Statistika, 1974. str. 19–57.

Prethodno