Poslovna Statistika - Skripta

ELEKTROTEHNIKI ODJEL
Poslovna statistika

mr.sc. Bojan Kovai, predava 1

POSLOVNA
STATISTIKA
interna skripta

pripremio:
mr.sc. Bojan Kovai, predava


Poslovna statistika


SADRAJ

PREDGOVOR ....................................................................................................................5
0. REKLI SU O STATISTICI ...................................................................................8
1. UVOD U STATISTIKU .............................................................................................8
1.1. Pojam statistike ............................................................................................................................ 8
1.2. Opisna i inferencijalna statistika .................................................................................................. 8
1.3. Statistika analiza, statistiki skup i obiljeja elemenata statistikog skupa .............................. 9
1.3.1. Skale obiljeja ...................................................................................................................... 11
1.3.2. Vrste obiljeja ...................................................................................................................... 14
2. FAZE STATISTIKOGA ISTRAIVANJA ...................................................... 18
2.1. Odreivanje cilja i razrada plana istraivanja ............................................................................ 18
2.2. Organizirano prikupljanje statistikih podataka ........................................................................ 19
2.3. Grupiranje statistikih podataka ................................................................................................ 21
2.3.1. Grupiranje kvalitativnih podataka ....................................................................................... 21
2.3.2. Grupiranje kvantitativnih podataka .................................................................................... 23
2.3.3. Kumulativni nizovi frekvencija ............................................................................................. 25
2.3.4. Dijagram ''stablo list'' (stem leaf) .................................................................................. 30
2.4. Tablini prikaz statistikih podataka .......................................................................................... 32
2.5. Grafiki prikaz statistikih podataka .......................................................................................... 38
2.5.1. Povrinski grafikoni .............................................................................................................. 39
2.5.2. Histogram ............................................................................................................................ 47
2.5.3. Linijski grafikoni ................................................................................................................... 54
2.5.4. Ostale vrste grafikona ............................................................................................................. 59
3. OSNOVNE KARAKTERISTIKE NUMERIKIH NIZOVA ........................... 63
3.1. Srednje vrijednosti numerikih nizova ........................................................................................ 63
3.1.1. Aritmetika sredina ............................................................................................................. 64
3.1.2. Geometrijska sredina ........................................................................................................... 75


Poslovna statistika


3.1.3. Harmonijska sredina ............................................................................................................ 80
3.1.4. Kvantili ................................................................................................................................. 84
3.1.5. Mod ..................................................................................................................................... 92
3.2. Mjere rasprenja (disperzije) ...................................................................................................... 94
3.2.1. Raspon varijacije .................................................................................................................. 95
3.2.2. Interkvartil ........................................................................................................................... 97
3.2.3. Interpercentilni razmak ....................................................................................................... 98
3.2.4. Varijanca i standardna devijacija ........................................................................................ 99
3.2.5. Srednje apsolutno odstupanje ........................................................................................... 105
3.2.6. Koeficijent varijacije........................................................................................................... 108
3.2.7. Koeficijent kvartilne devijacije ........................................................................................... 111
3.3. Standardizirano obiljeje .......................................................................................................... 115
3.4. Vrste razdioba (distribucija) ..................................................................................................... 119
3.4.1. Mjere asimetrije ................................................................................................................ 120
3.4.2. Mjere zaobljenosti ............................................................................................................. 124
3.5. Programska potpora deskriptivnoj statistikoj analizi ............................................................. 126
4. KORELACIJSKA I REGRESIJSKA ANALIZA ............................................. 127
4.1. Korelacijska analiza .................................................................................................................. 128
4.1.1. Spearmanov koeficijent korelacije ranga .......................................................................... 139
4.2. Regresijska analiza ................................................................................................................... 146
4.2.1. Model jednostavne linearne regresije ............................................................................... 148
4.2.2. Analiza varijance modela jednostavne linearne regresije ................................................. 164
4.2.3. Mjere reprezentativnosti modela jednostavne linearne regresije ..................................... 166
4.2.3.1. Varijanca regresijskoga modela ............................................................................................... 166
4.2.3.2. Standardna devijacija regresijskoga modela ........................................................................... 167
4.2.3.3. Koeficijent varijacije regresijskoga modela .............................................................................. 167
4.2.3.4 Koeficijent determinacije .......................................................................................................... 168
4.3. Primjeri nelinearnih modela jednostavne regresije .................................................................. 172
4.3.1. Model jednostavne eksponencijalne regresije ................................................................... 172


Poslovna statistika


4.3.2. Model jednostavne logaritamske regresije ....................................................................... 181
4.3.3. Model jednostavne potencijske regresije (POWER) .......................................................... 186
4.4. Primjer modela viestruke (multiple) regresije: model viestruke linearne regresije ............... 194
5. INDIVIDUALNI BROJANI POKAZATELJI RAZVOJA VREMENSKO-
GA NIZA ......................................................................................................................... 199
5.1. Definicija i vrste vremenskih nizova.......................................................................................... 202
5.2. Pokazatelji pojedinanih apsolutnih promjena ........................................................................ 204
5.3. Modeli trenda .......................................................................................................................... 206
5.4. Osnovni brojani pokazatelji relativnih promjena .................................................................... 210
5.5. Individualni indeksi ................................................................................................................... 212
5.5.1. Verini (lanani) indeksi ..................................................................................................... 213
5.5.2. Indeksi na stalnoj bazi (bazni indeksi) ............................................................................... 218
5.5.3. Pretvorba indeksa .............................................................................................................. 224
5.6. Skupni indeksi ........................................................................................................................... 229
5.6.1. Skupni indeksi koliina ....................................................................................................... 230
5.6.1.1. Laspeyresov skupni indeks koliina .......................................................................................... 230
5.6.1.2. Paascheov skupni indeks koliina............................................................................................. 231
5.6.1.3. Fisherov skupni indeks koliina ................................................................................................ 233
5.6.2. Skupni indeksi cijena .......................................................................................................... 234
5.6.2.1. Laspeyresov skupni indeks cijena ............................................................................................. 235
5.6.2.2. Paascheov skupni indeks cijena .............................................................................................. 235
5.6.2.3. Fisherov skupni indeks cijena ................................................................................................... 237
5.6.3. Skupni indeksi vrijednosti .................................................................................................. 238
5.6.4. Neki posebni oblici skupnih indeksa i njihova primjena .................................................... 242
5.6.4.1. Izraunavanje realnih plaa na osnovu skupnih indeksa trokova ivota ................................ 242
5.6.4.2. Vrijednost u stalnim cijenama i indeks fizikoga obujma ........................................................ 248
6. LITERATURA .......................................................................................................... 260


Poslovna statistika


PREDGOVOR

Jedna od najprimjenjivanijih matematikih disciplina u gotovo svim podrujima ovjekova
djelovanja danas je nesumnjivo statistika. Bez te su discipline dananja znanost i cjelokupan
ljudski ivot praktiki nezamislivi. Prikupljanje podataka, njihova obrada i analiza, te
izvoenje zakljuaka na temelju tih postupaka provode se u tolikoj mjeri da su razvojem
moderne informatike tehnologije usporedno razvijeni i ''specijalizirani'' raunalni programi
namijenjeni potrebama statistike analize i statistike openito. S druge strane, zbog svojega
rairenoga podruja primjene, statistika je vrlo esto potpuno neopravdano i neutemeljeno bila
meta razliitih kritika koje su je nastojale obezvrijediti, prikazati njezina podruja i metode
kao ''neto zanimljivo samo statistiarima'', a statistiare kao neshvaene asocijalne udake
koji, umjesto druenja s tzv. normalnim ljudima i uivanja u svim ljepotama i arima
ovozemaljskoga ivota, radije odabiru uivanje u hrpama i tonama podataka, tablicama,
grafovima i slinim statistikim objektima.

Jo od samoga poetka svojega bavljenja statistikom u studentskim danima nastojao sam tu
matematiku disciplinu promatrati sa stajalita da je rije o disciplini nita manje vrijednoj i
nita manje vanoj od algebre, analize, geometrije i inih matematikih disciplina. Kasnije, kao
predava statistikih kolegija na razliitim visokim kolama, s vie ili manje uspjeha nastojao
sam pribliiti statistiku studentima i ukazati im na svu pogrenost uobiajenih zabluda o
statistici. Kao rezultat takvoga pristupa razvile su se sljedee temeljne postavke koje se
provlae kroz ova skripta:

1.) Statistika je sastavni dio matematike, unato injenicama da je znatan dio strunjaka
uporno pokuava ubrojiti u sastavnice ekonomske znanosti. Iako se statistika ponajvie
primjenjuje u ekonomiji, pa se na ekonomskim fakultetima zbog toga izuava kao posebno
podruje, temelji statistike i statistikoga naina miljenja su iskljuivo matematiki.

2.) Nitko ne moe zamijeniti istraivaa prigodom interpretacije rezultata statistike analize.
Raunala i ''specijalizirani'' raunalni programi mogu vrlo brzo i tono izraunati sve eljene
statistike pokazatelje, ali ne mogu dati njihovu univerzalnu interpretaciju jer ona ovisi o
svakom pojedinom razmatranom sluaju. Statistiar mora znati uz koje se temeljne
pretpostavke izraunavaju pojedine statistiki pokazatelji i provjeriti vrijede li te pretpostavke
u sluaju koji razmatra. Ukoliko ne vrijede, dobiveni statistiki pokazatelj bit e tono
izraunat, ali nee biti reprezentativan, tj. nee dovoljno dobro opisivati podatke iz kojih je
izraunat.

3.) Ne postoje univerzalni statistiki pokazatelji koji bi dovoljno reprezentativno opisivali
bilo koji statistiki niz podataka. Ova zabluda naroito se odnosi na aritmetiku sredinu
(popularni ''prosjek'') koju se, zbog jednostavnosti njezina izrauna, uporno nastoji ''progurati''


Poslovna statistika


kao univerzalni statistiki pokazatelj prikladan za opis bilo kojega statistikoga niza.
Pojednostavljivanje ovdje uzrokuje nereprezentativnost dobivenoga statistikoga pokazatelja,
to u svojim kritikama esto iskoritavaju protivnici statistike. Ispravan pristup ovoj
problematici je tipian pristup problemima matematikoga modeliranja: klasificirati
statistike probleme u tzv. klase dovoljno meusobno ''slinih'' problema koji se mogu rijeiti
uz iste polazne pretpostavke i istu, zadovoljavajuu reprezentativnost dobivenih rezultata.
Spomenuta klasifikacija nije nimalo jednostavna i predstavlja problem o kojemu se raspravlja
i dan-danas, ali takav je sluaj s apsolutnom veinom matematikih problema.
Stoga se na samom poetku pisanja ovih skripta pojavio sljedei problem: kako na dovoljno
jednostavan i razumljiv nain, ali uz uvaavanje svih gore navedenih postavki, napisati tekst
koji e istodobno biti i podloga za predavanja i nastavni materijal prema kojemu e studenti
moi pripremati ispit iz poslovne statistike? Navedeni je problem razlog to je ovaj tekst
nastajao tijekom mojih svakogodinjih predavanja statistike u gotovo svim godinama 21.
stoljea. Naime, odgovorno tvrdim da bilo koja skripta moe biti nastavni materijal prema
kojemu e studenti moi pripremati ispit ako i samo ako je skripta bila efektivno koritena u
nastavi tijekom najmanje 5 godina. U tom su smislu i svi studenti sluai statistikih
kolegija koje sam predavao koautori ovih skripta jer su mi njihova pitanja, konstruktivne
kritike i komentari pomogli uvidjeti na koje dijelove gradiva treba posebno obratiti pozornost
i dodatno ih pojasniti jer nisu sami po sebi dovoljno razumljivi.

Iako u nazivu skripta stoji Poslovna statistika, ova bi se skripta mogla zvati i Osnove
statistike. Gradivo koje je u njoj izloeno, naime, veina e statistiara proglasiti upravo
''osnovama osnovnih osnova'' statistike. No, upravo te ''osnove osnovnih osnova'' danas tvore
podruje koje se najee primjenjuje u razliitim poslovnim analizama i, kao takvo, sasvim
je primjereno studentima strunih studija. Stoga skripta mogu koristiti svi studenti strunih
studija ekonomije, ali i neekonomskih studija poput fizioterapije, upravnoga prava itd., te svi
koji u svojim poslovima primjenjuju ma koji dio izloenoga gradiva.

Konceptualno je skripta podijeljena u pet poglavlja. U prva dva poglavlja obraeni su osnovni
statistiki pojmovi definirani s matematikoga stajalita, te osnovne faze statistikoga
istraivanja. Posebna se pozornost posveuje statistikim tablicama i grafikonima, kao i
njihovim interpretacijama. U treem se poglavlju obrauju u praksi najee koritene srednje
vrijednosti i mjere rasprenosti (disperzije) uz poseban naglasak na reprezentativnost svake
pojedine srednje vrijednosti. etvrto je poglavlje posveeno osnovama korelacijske i
regresijske analize, pri emu se temeljne postavke i ideje uglavnom izlau na problemima u
kojima se razmatraju tono dvije varijable. U petom, posljednjem poglavlju izlau se osnove
analize vremenskih nizova i opisuju neke posebne vrste skupnih indeksa.

Kao dio osnovnoga teksta u svim je poglavljima naveden relativno velik broj detaljno
rijeenih primjera od kojih je vei dio rijeen ''klasino'' (bez koritenja bilo kojega od


Poslovna statistika


''specijaliziranih'' raunalnih programa), a manji dio uz koritenje MS Excela. Budui da je
rije o nastavnom materijalu namijenjenom za predavanja, tehnike rjeavanja statistikih
problema u MS Excelu ovdje se ne opisuju zasebno, a zainteresirani ih itatelj moe pronai u
literaturi [1]. Uz gotovo sve izraunate statistike pokazatelje navedena je njihova
interpretacija, a gdje god je to bilo primjereno, komentirana je i reprezentativnost konkretnoga
pokazatelja.

Ugodna mi je dunost da se na kraju ovoga predgovora iskreno zahvalim svima koji su na bilo
koji nain pomogli u nastajanju ovih skripta. To se ponajprije odnosi na ve spomenute
studente koji su svojim pitanjima, konstruktivnim kritikama i komentarima utjecali na zavrnu
verziju, odnosno kvalitetu skripta. U tom smislu unaprijed zahvaljujem i svima onima koji
budu proitali skripta i ukazali na neku nenamjerno napravljenu tiskarsku pogreku, te dali
konstruktivnu kritiku, primjedbu ili prijedlog za poboljanje osnovnoga teksta.

U Zagrebu, poetkom svibnja 2011.

Bojan Kovai


Poslovna statistika


0. REKLI SU O STATISTICI
1

''Statistika je poput bikinija: otkriva ono sugestivno, a skriva ono vitalno.'' (Aaron Levenstein)
''Kad bi netko stao jednom nogom u kipuu vodu, a drugom nogom u hladnjak, statistiar bi
rekao da se taj ovjek nalazi u prosjeno ugodnoj temperaturi.'' (Walter Heller)
''Postoje tri vrste lai: la, prokleta la i statistika.'' (Mark Twain)
''Statistika je bajka razuma.'' (Martin Kessel)
''Statistika je skup tonih podataka koji daje pogrean rezultat.'' (Anonimus)
''Statistika naa dika: togod hoe, ona slika.'' (Vladimir Bulatovi Vib)
''Ja jedem kupus, ti jede meso u prosjeku jedemo sarmu.'' (Anonimus)

1. UVOD U STATISTIKU

1.1. Pojam statistike

Statistika je znanstvena disciplina koja na organiziran nain pristupa prikupljanju, odabiru,
grupiranju, prezentaciji i analizi podataka, te interpretiranju rezultata provedene analize u
svrhu ostvaraja postavljenih istraivakih ciljeva. Da bi se ostvarili svi prethodno navedeni
zadaci i ciljevi, statistika je razvila svoje vlastite metode i tehnike. One se danas primjenjuju u
vrlo razliitim podrujima: ekonomiji, zdravstvu, kulturi, politici, sportu, obrazovanju,
znanosti itd.

1.2. Opisna i inferencijalna statistika

Kao zasebna znanstvena disciplina, statistika se grubo moe podijeliti na dva posebna dijela:
opisnu (deskriptivnu) i inferencijalnu statistiku. Potonji se esto smatra dijelom tzv.
matematike statistike.

Opisna (deskriptivna) statistika temelji se na konkretnim rezultatima dobivenima nekim
istraivanjima ili mjerenjima. U tim se istraivanjima skup svih promatranih objekata

1
Mnogobrojni slikovitiji komentari studenata koji su vie-manje uspjeno polagali statistike kolegije iz
udorednih razloga ovdje nisu navedeni.


Poslovna statistika


obuhvaa u cijelosti. Zadaa opisne statistike je "opisati'' dobivene rezultate, tj. srediti ih i
saeti tako da budu to pregledniji, razumljiviji i pogodniji za interpretaciju, daljnju analizu i
primjenu.

Inferencijalna statistika temelji se na djelominu obuhvatu skupa svih promatranih objekata.
Rezultati se dobivaju ispitivanjem odreenoga dijela (uzorka) promatranih objekata. Koristei
metodu "od pojedinanoga ka opemu" (tzv. induktivna metoda) izvode se zakljuci o
karakteristikama (obiljejima) svih promatranih objekata. Pri izvedbi takvih zakljuaka
postoji odreeni rizik pogreno izvedenih zakljuaka. Rizik i nesigurnost u primjeni rezultata
dobivenih istraivanjem na temelju uzorka procjenjuje se na temelju naela teorije
vjerojatnosti.
U ovom emo se kolegiju baviti opisnom statistikom jer se taj dio statistike praktino najvie
primijenjuje u razliitim poslovnim sustavima, procesima itd.

1.3. Statistika analiza, statistiki skup i obiljeja elemenata statistikog skupa

Statistika analiza bilo koje prirodne ili drutvene pojave ili procesa nuno se temelji na
statistikim informacijama, metodama i tehnikama.

Statistikom analizom dobiva se uvid u strukturu pojava ili procesa u vremenu i prostoru, te
uvid u njihovu meusobnu povezanost. Predmet statistike analize razliita su kvalitativna i
kvantitativna obiljeja promatranih pojava ili procesa vezanih za promatrani skup objekata.

Statistiki skup je osnovni pojam u statistici (kao, uostalom, i skup u matematici). Tvore ga
statistike jedinice ili elementi (osobe, poslovni subjekti, regije, drave, predmeti itd.) koji
imaju barem jedno zajedniko svojstvo (obiljeje ili varijabla
2
) koje od elementa do elementa
oituje statistiku promjenjivost. Ukupan broj elemenata statistikoga skupa naziva se opseg
statistikoga skupa.
3
Prema opsegu, statistike skupove (kao i sve druge skupove) dijelimo na
konane i beskonane, a prema vrsti elemenata na stvarne (realne) i zamiljene
4
(hipotetine).
Stvarni statistiki skupovi sastoje se od elemenata koji postoje u tekuem vremenu i prostoru,
a zamiljeni statistiki skupovi sastoje se od elemenata generiranima razliitim modelima

2
U opisnoj se statistici izraz varijabla obino poistovjeuje s izrazima obiljeje i svojstvo, dok se u
matematikoj statistici odnosi iskljuivo na numerika obiljeja.
3
U teoriji skupova taj se broj, inae, naziva kardinalni broj skupa, dok se termin opseg vie koristi u
geometrijskim razmatranjima.
4
Pritom izraz zamiljen ne znai stanje statistikoga skupa u kojemu svi njegovi elementi promiljaju npr. o
besmrtnosti komarca malariara, nego nepostojanje u realnom svijetu.


Poslovna statistika


procesa ili pokusa. Poslovna statistika se u pravilu bavi realnim konanim statistikim
skupovima.

Ve je istaknuto da statistiki skup tvore elementi koji imaju barem jedno zajedniko
svojstvo. Stoga za svaki element statistikoga skupa znamo odgovarajui podatak o tome
svojstvu. Skup svih takvih podataka naziva se osnovni skup ili populacija
5
. Poput
statistikoga, i osnovni skup moe biti konaan ili beskonaan, te stvaran ili zamiljen.

Bilo koji neprazan podskup
6
statistikoga skupa i osnovnoga skupa naziva se uzorak. Dakle,
pod terminom uzorak podrazumijevamo i neki dio elemenata statistikoga skupa i
odgovarajue podatke o tim elementima. U opisnoj se statistici nerijetko pojmovi
statistikoga skupa, osnovnoga skupa i uzorka poistovjeuju jer se statistika analiza provodi
na isti nain neovisno o kojem od tih triju tipova skupa je rije. Nasuprot tome, inferencijalna
statistika strogo razdvaja navedene pojmove jer provedba statistike analize ovisi o tome iz
kojega se od tih triju skupova uzimaju podaci koji se ele analizirati.

Statistiki skup nuno mora biti precizno definiran kako bi se na temelju njegove definicije
moglo jasno i jednoznano odrediti pripada li neki element tome skupu ili ne. Statistiki skup
mora biti definiran pojmovno, prostorno i vremenski. Pojmovna definicija utvruje pripadnost
bilo kojega objekta navedenom skupu, prostorna definicija utvruje prostor kojemu pripadaju
svi elementi statistikoga skupa, a vremenska definicija utvuje vremensko razdoblje ili
vremenski trenutak za koji su vezani svi elementi statistikoga skupa.

Primjer 1. Promatra se statistiki skup koji tvore svi studenti 1. godine strunoga studija
raunovodstva i financija Visoke kole za financijski menadment u pikovini na dan
01.03.2010. Definirajmo navedeni skup pojmovno, prostorno i vremenski:

pojmovna definicija: studenti 1. godine strunoga studija raunovodstva i financija
prostorna definicija: Visoka kola za financijski menadment u pikovini
7

vremenska definicija: 01.03.2010.

5
Izraz populacija obino se rabi iskljuivo u kontekstu vezanom za odreeni skup ivih bia (populacija ljudi,
udnovatih kljunaa, krokodila itd.).
6
Iz teorije skupova je poznato da je jedan od podskupova svakoga skupa tzv. prazan skup (skup koji nema niti
jednoga jedinoga elementa). Prazni skupovi (pa, prema tome, i prazni uzorci) koriste se iskljuivo u
matematikoj statistici.
7
Pri prostornom definiranju skupa obino se navodi i npr. naziv radne organizacije, visokoobrazovne ustanove
itd. iako bi moda prirodnije pripadali pojmovnoj definiciji. Takoer, iako u pravilu ne treba pretjerivati s
prostornim definiranjem, pa npr. rei: Visoka kola za financijski menadment u pikovini, drava: Republika
Hrvatska, kontinent: Europa, planet: Zemlja, galaksija: Miljena staza, nerijetko ipak treba istaknuti neke
dodatne prostorne pokazatelje (naroito ukoliko se npr. radi o radnicima na crno u gradu Ouagadougou).


Poslovna statistika


Taj skup je zamiljen i konaan, a njegov opseg iznosi 100 [studenata]
8
. Primjer osnovnoga
skupa vezanoga za promatrani statistiki skup jest skup svih zakljunih ocjena iz kolegija
Poslovna matematika, pri emu s 0 moemo oznaiti injenicu da student dosad nije uspio
poloiti navedeni kolegij. Stoga osnovni skup tvore ukupno 100 zakljunih ocjena
9
. Jedan od
uzoraka toga skupa je npr. Top 20, tj. skup svih studenata koji su navedeni kolegij uspjeli
poloiti sa zakljunom ocjenom izvrstan
10
.

1.3.1. Skale obiljeja

Kako je istaknuto, obiljeja (varijable) elemenata statistikog skupa su odgovarajua svojstva
po kojima usporeujemo te elemente. Svako obiljeje se javlja u vie pojavnih oblika
(modaliteta). Skup svih modaliteta nekoga obiljeja naziva se skala
11
. Tako je npr. skala
modaliteta obiljeja ''spol'' muki i enski, skala modaliteta obiljeja ''dan u tjednu''
ponedjeljak, utorak, srijeda, etvrtak, petak, subota i nedjelja, skala modaliteta ''mjesec u
godini'' sijeanj, veljaa, oujak, travanj, svibanj, lipanj, srpanj, kolovoz, rujan, listopad,
studeni i prosinac itd. Prilikom podjele elemenata statistikoga skupa prema barem jednom
obiljeju kad god je to mogue treba utvrditi skalu modaliteta. To se poglavito odnosi na
obiljeja iji se modaliteti ne iskazuju numerikim vrijednostima (tzv. kvalitativna obiljeja).

Skale obiljeja mogu se podijeliti sukladno odreenim metrikim svojstvima. Na temelju toga
razlikujemo nominalnu, redosljednu (ordinalnu ili rang), intervalnu i omjernu skalu.

Nominalna skala zadaje se u obliku skupa iji su elementi nenumerike vrijednosti: slovne
oznake, pridjevi, kategorije itd. Ti se elementi prigodom definiranja skale mogu navesti
proizvoljno odabranim redoslijedom. Nominalne skale dodatno se dijele na atributivne
(varijabilitet promatranoga obiljeja iskazuje se opisno) i prostorne (varijabilitet
promatranoga obiljeja iskazuje se zemljopisnim jedinicama). U nekim se sluajevima

8
Skup je zamiljen jer dotina visokoobrazovna ustanova (naalost) jo ne postoji.
9
Te ocjene, naravno, meusobno nisu u parovima razliite jer ih ima svega 5 razliitih: 0, 2, 3, 4 i 5. Koristei
npr. Dirichletovo naelo moe se pokazati da sigurno postoji barem 20 studenata koji imaju istu zakljunu
ocjenu iz Poslovne matematike.
10
Pritom odmah treba naglasiti da taj uzorak nije reprezentativan, tj. na temelju njega ne moemo izvui istinit
zakljuak o uspjehu svih studenata na ispitima iz Gospodarske matematike.
11
Unato upornom zagovaranju glazbeno nadarenih statistiara, sintagma ljestvica modaliteta (jo) nije ula u
svakodnevnu uporabu.


Poslovna statistika


nenumerike oznake zamjenjuju numerikima
12
, pri emu navedene numerike oznake slue
iskljuivo kao identifikatori, pa s njima nema smisla provoditi nikakve raunske operacije.
Npr. zamijenimo li nenumeriki modalitet muki numerikim modalitetom 0, a nenumeriki
modalitet enski modalitetom 1, onda nema smisla zapisati niti raunati npr. 0 + 1, 0 1 itd.
13

Istaknimo da nominalna skala ponajprije slui za razvrstavanje (kategorizaciju) elemenata
osnovnoga skupa u kategorije, a ukoliko je njihov broj vrlo velik, skala se utvruje dogovorno
i u takvim sluajevima govorimo o nomenklaturi. Tipini primjeri su razliite nomenklature
djelatnosti, industrijskih proizvoda, usluga itd.

Redosljedna (ordinalna, rang) skala elementima statistikoga skupa pridruuje slovne
oznake, simbole ili brojeve prema intenzitetu mjerenoga svojstva, pa se elementi potom
klasificiraju i ureuju sukladno stupnju promatranoga svojstva. Poredak modaliteta ovdje nije
proizvoljan: modalitete obino navodimo od onoga koji oznaava najmanji stupanj svojstva
do onoga koji oznaava najvei stupanj svojstva ili obrnuto. Tipini primjeri redosljedne skale
su skala ocjena (1, 2, 3, 4, 5), skala stupnjeva strune spreme, skala stupnjeva zadovoljstva
kvalitetom nastave iz kolegija ''Zabavljake vjetine'' itd. Iako ova skala ima bolja metrika
svojstva od nominalne, osnovni nedostatak joj je nemogunost preciznoga utvrivanja razlika
mjerenoga svojstva: npr. mi znamo da je ocjena 5 bolja od ocjene 2, ali ne moemo npr. rei
da je ocjena 5 za 3 bolja od ocjene 2.
14

Ukoliko elementima statistikoga skupa pridruujemo realne brojeve sukladno intenzitetu
promatranoga svojstva, dobit emo intervalnu skalu. Ona uvijek ima definiranu mjernu
jedinicu i dogovorno utvrenu nulu, pa ima bolja metrika svojstva od prethodnih dviju skala
jer omoguuje i razvrstavanje i rangiranje i brojano utvrivanje razlika mjerenoga svojstva.
Naime, s podacima dobivenima mjerenjem na intervalnoj su skali suvislo definirane operacije
zbrajanja i oduzimanja
15
, pa tako jednake razlike brojeva na skali govore o jednakoj razlici
mjerenih svojstava. Npr. ako je temperatura zraka na Zavianu -20C, u Zagrebu 0C, a u
Splitu 20C, onda se moe rei da je u Zagrebu za 20C toplije nego na Zavianu, a za 20C
hladnije nego u Splitu. Takoer, dogovorno utvrena nula znai da element statistikoga
skupa posjeduje odreeno svojstvo i da je modalitet toga svojstva jednak nuli. Konkretno,

12
Takva je ''zamjena'' zapravo bijekcija sa skale nenumerikih modaliteta u jednakobrojnu skalu numerikih
modaliteta: svaki nenumeriki modalitet zamjenjuje se tono jednim numerikim modalitetom i nikoja dva
nenumerika modaliteta nisu zamijenjena istim numerikim modalitetom.
13
ovinisti (i ovinistice?) bi vjerojatno vrlo rado definirali operaciju mnoenja, a feministice (i feministi?)
operaciju zbrajanja ovakvih brojeva sukladno uobiajenoj aritmetici.
14
Tj., opet ne moemo definirati operacije zbrajanja i oduzimanja. Ovo se pravilo praktino zanemaruje
prigodom raunanja prosjene ocjene, o emu e biti govora u posebnom poglavlju.
15
Mnoenje i dijeljenje se ne definiraju zbog problema tipa: ''Temperatura zraka u Zagrebu je 0C. Ako je na
Zavianu 20 puta hladnije nego u Zagrebu, kolika je temperatura zraka na Zavianu?''.


Poslovna statistika


injenica da je temperatura zraka u Zagrebu 0C znai da zrak u Zagrebu ima svoju
temperaturu i da je ta temperatura jednaka 0C.
16

Skala s najboljim metrikim svojstvima je tzv. omjerna skala. Ona se dobije tako da se
elementima statistikoga skupa pridrue realni brojevi sukladno intenzitetu mjerenoga
svojstva, a, osim definirane mjerne jedinice, ima i nulu koja oznaava nepostojanje svojstva.
Zbog toga se na takvoj skali mogu definirati sve etiri osnovne raunske operacije jer razlike i
omjeri vrijednosti imaju suvislo tumaenje. Npr. ako Blaenko na tekuem raunu ima
10.000,00 kn, a Draenko 100.000,00 kn, onda Draenko na svojem tekuem raunu ima 10
puta vie novaca, odnosno za 90.000,00 kn vie od Blaenka. Nadalje, ako Vlatka na svojem
deviznom raunu ima 0,00 , znai da je njezin devizni raun potpuno prazan, tj. da na njemu
(do daljnjega) nema novaca.

Poseban tip skale obiljeja je kronoloka skala. Ona obino sadri vremenska razdoblja
poredana kronoloki, tj. poevi od razdoblja koje je nastupilo najranije i zavravajui s
razdobljem koje je nastupilo najkasnije. Modaliteti kronoloke skale mogu se iskazivati
nazivima (npr. skala dana u tjednu, skala mjeseci u godini itd.) ili brojevima (npr. skala
minuta u pojedinom satu, skala sati u danu, skala datuma u pojedinom mjesecu, skala godina,
desetljea, stoljea itd.). Na tako formiranoj skali ima smisla definirati operacije zbrajanja i
oduzimanja, pri emu se u nekim sluajevima uobiajene operacije zbrajanja i oduzimanja
realnih brojeva zamijenjuju operacijama zbrajanja i oduzimanja modulo n
17
, pri emu je
obino n {7, 12, 24, 28, 29, 30, 31, 60}. Tipini primjeri kronolokih skala su: skala dana u
tjednu {ponedjeljak, utorak, srijeda, etvrtak, petak, subota, nedjelja}, skala godina u prvom
desetljeu ovoga tisuljea {2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010}
itd.

16
Matematiki nadareni statistiari odmah e se sjetiti da se na isti nain u matematici definiraju skupovi
povrine nula: to su skupovi koji imaju povrinu i ta povrina je jednaka 0. Tipian primjer takvoga skupa je
toka u bilo kojem euklidskom prostoru.
17
Zbrajanje modulo n (oznaka: +
n
) je binarna operacija definirana formulom: a +
n
b := (a + b) mod n = ostatak
pri dijeljenju zbroja a + b (dobivenoga uobiajenim zbrajanjem cijelih brojeva) brojem n. Npr. na skali sati u
danu je 17 +
24
8 = ostatak pri dijeljenju broja 17 + 8 s 24 = ostatak pri dijeljenju broja 25 s 12 = 1. Oduzimanje
modulo n (oznaka:
n
) je binarna operacija na skali modaliteta definirana opisno s: a
n
b = broj c takav da je b +
n

c = a. Npr. na skali sati u danu je 1
24
8 = 17 jer je, kako smo vidjeli, 17 +
24
8 = 1.


Poslovna statistika


1.3.2. Vrste obiljeja

Sukladno navedenoj podjeli skala, opa podjela obiljeja razlikuje kvalitativna, kvantitativna i
vremenska obiljeja.

Kvalitativna obiljeja su obiljeja kod kojih su svojstva elemenata statistikoga skupa
iskazana odreenim pridjevima ili atributima, kategorijama i sl. Ova obiljeja mogu biti
nominalna i redosljedna (obiljeja ranga).

Nominalna obiljeja vezana su uz nominalnu skalu izraavanja modaliteta promatranoga
obiljeja, a dodatno se dijele na atributivna i prostorna (geografska). Atributivna obiljeja su
obiljeja iji modaliteti iskazuju svojstva elemenata statistikoga skupa. Tipini primjeri
takvih obiljeja su: spol, boja kose, boja oiju, brano stanje, tip osobnoga automobila, vrsta
trgovakoga drutva, horoskopski znak, politika stranka itd. Atributivno obiljeje ija se
skala sastoji od tono dva modaliteta nazivamo alternativno obiljeje. Tipini primjeri
takvoga obiljeja su: spol (npr. na statistikomu skupu svih ljudi) sa skalom {muki, enski}
18
;
nain studiranja (npr. na statistikom skupu svih studenata Visoke kole za financijski
menadment u Bedekovini na dan 01.03.2008.) sa skalom {redovni, izvanredni} itd.

Primjer 2. Primjer alternativnoga statistikoga obiljeja:

Razdioba svih studenata Visoke kole za financijski menadment u pikovini koji su poloili
kolegij Poslovna matematika putem kolokvija u akademskoj godini 2007/2008. prema spolu

spol broj
studenata
struktura
[%]
muki 10 27.03
enski 27 72.97
ukupno 37 100.00
Izvor: osobna evidencija predmetnoga nastavnika, veljaa 2008.

Zadatak 1. a) Definirajte statistiki skup u gornjem primjeru pojmovno, prostorno i
vremenski, pa odredite njegov opseg.
b) Odredite osnovni skup i njegov opseg.

18
Novije socioloke analize u priznatim znanstvenim asopisima ''Glorija'', ''Tena'', ''Story'' itd. ozbiljno
ugroavaju ovu tradicionalistiko-konzervativnu podjelu svih ljudi prema spolu.


Poslovna statistika


Prostorno (geografsko) obiljeje je nominalno obiljeje iji modaliteti odraavaju vezu
elemenata statistikoga skupa s odreenim prostorom. Primjeri takvoga obiljeja su: mjesto
roenja, dravljanstvo, prebivalite, boravite, sjedite tvrtke, drava ili ekonomska unija
drava s kojom se vri odreena trgovinska razmjena itd.

Redosljedna obiljeja ili obiljeja ranga vezana su uz ordinalnu skalu iskazivanja modaliteta.
Tipini primjeri obiljeja ranga su ranije spomenuta ocjena, struna kvalifikacija, stupanj
akademskoga obrazovanja, stupanj zadovoljstva kvalitetom nastave itd.

Primjer 3. Primjer redosljednoga statistikoga obiljeja:

Razdioba svih studenata Visoke poslovne kole ''Mutimir kegro'' iz pikovine u akademskoj
godini 2006/07. prema stupnju zadovoljstva radom studentske referade
(stanje na dan 30.09.2007.)

stupanj zadovoljstva broj studenata struktura [%]
vrlo nezadovoljan 15 9.32
nezadovoljan 32 19.88
uglavnom nezadovoljan 21 13.04
ni zadovoljan ni nezadovoljan 38 23.60
uglavnom zadovoljan 27 16.77
zadovoljan 17 10.56
vrlo zadovoljan 11 6.83
ukupno: 161 100.00
Izvor: Studentski zbor VP ''Mutimir kegro''

Kvantitativna obiljeja su obiljeja kod kojih se svojstva elemenata statistikoga skupa
izraavaju brojevima, a vezana su uz intervalnu i omjernu skalu iskazivanja modaliteta.
Kvantitativna obiljeja esto se nazivaju i numerika obiljeja, a dodatno se dijele na
diskretna (diskontinuirana) i kontinuirana.

Diskretno (diskontinuirano) obiljeje je obiljeje ija je skala modaliteta konaan skup
(openito, realnih) brojeva takav da izmeu svakih dvaju modaliteta postoji razmak. Razmak
izmeu dvaju modaliteta je, zapravo, apsolutna vrijednost
19
njihove razlike. Tipini primjeri
obiljeja su broj soba u stanu, broj djece u obitelji, iznos ukupnih mjesenih primanja itd.

19
Podsjetnik za nematematiki nastrojene statistiare: apsolutna vrijednost bilo kojega realnoga broja x
definirana je formulom
, za 0;
| | =
, za 0.
x x
x
x x

<


Poslovna statistika


Pritom modalitet diskretnoga obiljeja ne mora biti nuno cjelobrojan. Postoje i
etveroipolsobni stanovi, iznos mjesenih primanja moe biti necjelobrojan, veliina obue
moe biti 48 i pol, ali neovisno o tome izmeu bilo kojih dvaju razliitih modaliteta uvijek
postoji spomenuti razmak.

Primjer 4. Primjer kvantitativnoga diskretnoga obiljeja:

Razdioba svih zaposlenika u tvrtki ''Brodolomac d.d.'' iz Mua prema broju djece
(stanje na dan 31.12.2007.)

broj djece broj zaposlenih struktura [%]
0 175 15.31
1 244 21.35
2 438 38.32
3 194 16.97
4 i vie 92 8.05
ukupno 1.143 100.00
Izvor: Sluba ljudskih potencijala tvrtke ''Brodolomac''

Kontinuirano obiljeje je obiljeje ija je skala modaliteta (teoretski) beskonaan skup. Ta je
skala najee poluotvoreni interval a, b]
20
ili konana unija takvih poluotvorenih intervala.
Praktino, to znai da modalitet obiljeja moe biti bilo koja vrijednost unutar nekoga od
intervala koji tvore omjernu skalu. Tipini primjeri ovoga obiljeja su visina, masa itd.

Primjer 5. Primjer kvantitativnoga kontinuiranoga obiljeja:

Razdioba svih uenika 4.b razreda gimnazije ''Ljilja Koki'' iz Kaine u k.god. 2007/2008.
prema visini (stanje na dan 01.03.2008.)

visina [cm] broj uenika struktura [%]
(160) 165 3 11.11
165 170 6 22.22
170 175 7 25.93
175 180 4 14.81
180 185 5 18.52
185 (195) 2 7.41
ukupno: 27 100.00
Izvor: osobna evidencija uitelja tjelesne i zdravstvene kulture Joe Kotrmelca

20
Podsjetnik za nematematiki nastrojene statistiare: a, b] je skup svih realnih brojeva koji su strogo vei od
realnoga broja a, a manji ili jednaki realnom broju b, tj. a, b] = {x R: a < x b}.


Poslovna statistika


Zadatak 2. a) Definirajte statistike skupove u Primjerima 3. 5. pojmovno, prostorno i
vremenski, pa odredite njihove opsege.
b) Odredite osnovne skupove u Primjerima 3. 5. i njihove opsege.
c) Odredite skale modaliteta obiljeja promatranih u Primjerima 3. 5.

Pri razlikovanju diskretna i kontinuirana obiljeja u nekim je sluajevima vrlo vano precizno
definirati promatrano kvantitativno obiljeje. Npr. "starost (ovjeka, drveta, zgrade)" je
kvantitativno kontinuirano obiljeje, no, ukoliko to obiljeje predefiniramo kao "navrene
godine starosti", ono postaje kvantitativno diskretno obiljeje (zato?).

Poseban tip obiljeja je vremensko obiljeje. To je obiljeje vezano uz kronoloku skalu
modaliteta, odnosno odgovarajui kronoloki ureaj. Sukladno njemu grupiramo elemente
osnovnoga skupa i dobivamo vremenski statistiki niz. Vremenski niz moe biti intervalan i
trenutaan ovisno o tome jesu li podaci iz osnovnoga skupa dobiveni neprekidnim praenjem
i kumuliranjem promatrane pojave u odabranom vremenskom intervalu ili pak odreivanjem
stanja pojave u odabranim vremenskim trenutcima.

Primjer 6. Primjer intervalnoga vremenskoga niza:

Razdioba ostvarenoga prometa u trgovini na malo u Kraljevini Dajdamda u razdoblju od
2002.-2006. prema godini

godina ostvareni promet
[000 000 USD]
2002. 9.45575824
2003. 11.79383472
2004. 18.51123944
2005. 25.55631827
2006. 30.10276687
Izvor: Statistiki ljetopis Kraljevine Dajdamda za 2007. godinu

Primjer 7. Primjer trenutanoga vremenskoga niza

Razdioba svih studenti koji su poloili ispit iz Poslovne statistike na Veleuilitu u Brlog
Gradu na ispitnim rokovima u razdoblju od 01.09.2007. do 01.03.2008. prema datumu
polaganja ispita

datum broj studenata
01.09.2007. 2
20.09.2007. 1
04.10.2007. 26
12.02.2008. 0
29.02.2008. 1
Izvor: Studentska sluba Veleuilita u Brlog Gradu


Poslovna statistika


2. FAZE STATISTIKOGA ISTRAIVANJA

Statistiko istraivanje openito moemo podijeliti na sljedee faze:

1. Odreivanje cilja i razrada plana istraivanja;
2. Organizirano prikupljanje statistikih podataka;
3. Grupiranje i sreivanje statistikih podataka;
4. Tablini i grafiki prikaz statistikih sreenih podataka;
5. Statistika analiza i interpretacija njezinih rezultata.

U ovom emo se kolegiju detaljno baviti fazama 3., 4. i 5., pa emo prve dvije faze ovdje
spomenuti samo okvirno.

2.1. Odreivanje cilja i razrada plana istraivanja

Iako se vrlo esto neopravdano zanemaruje, ova je faza zapravo jedna od najvanijih faza
cjelokupnoga statistikog istraivanja. Naime, prije negoli se krene na prikupljanje podataka,
svakako treba jasno i precizno definirati to se eli postii statistikim istraivanjem jer ve
dobro definiran cilj istraivanja moe nametnuti prirodan izbor pogodnih metoda za
prikupljanje podataka. Ukoliko cilj istraivanja i plan istraivanja nisu dovoljno precizno
definirani, mogue je uzalud prikupiti veliki broj podataka koje potom nije mogue dostatno
kvalitetno podvrgnuti statistikoj analizi i interpretaciji.

Druga velika prednost preciznoga definiranja cilja i plana istraivanja je to znatno
pojednostavljuje i skrauje cjelokupni postupak. Npr. pretpostavimo da elimo ispitati
zainteresiranost hrvatskih umirovljenika za aktivno sudjelovanje u teaju osnova rada na
osobnim raunalima. Iako npr. odlazak u Hrvatsku stranku umirovljenika i razgovor s
njezinim elnicima moe dati korisne podatke o cilju naega istraivanja, ta relativno jeftina i
kratkotrajna metoda nije dobra za postizanje eljenoga cilja
21
jer stav elnika stranke ne mora
odravati stav relativne veine hrvatskih umirovljenika. Teorijski najbolja metoda je postaviti
odgovarajue anketno pitanje svakom pojedinom umirovljeniku, ali ta je metoda npr. zbog

21
Navedena metoda, meutim, moe biti vrlo korisna za postavljanje hipoteze istraivanja. Hipoteza je temeljna
neprovjerena pretpostavka koju nastojimo potvrditi ili oboriti statistikim istraivanjem. U navedenom bi
primjeru (nakon obavljenih razgovora u HSU) postavljena hipoteza mogla glasiti: ''Veina hrvatskih
umirovljenika je zainteresirana za sudjelovanje u teajevima osnova rada na osobnim raunalima.''


Poslovna statistika


svoje dugotrajnosti
22
uzrokovane znatnim brojem hrvatskih umirovljenika praktiki potpuno
neprimjerena. Praktino najpogodnija metoda je izabrati dovoljno reprezentativan uzorak
23
i
(npr. telefonski) anketirati sve lanove toga uzorka. Metodama izbora uzoraka i procjenjivanja
njihove reprezentativnosti bavi se posebna statistika disciplina teorija uzoraka. Detalje ovdje
izostavljamo.

2.2. Organizirano prikupljanje statistikih podataka

Statistiki podaci obino se prikupljaju:

a) brojanjem (npr. iznos mjesene plae svakoga od djelatnika tvtke ''Drpcommerce'')
b) mjerenjem (npr. masa svake od natjecateljica za Miss Mlijene staze)
c) ocjenjivanjem (npr. stupanj zadovoljstva kvalitetom nastave iz Poslovne statistike);
d) evidentiranjem (npr. zakljune ocjene iz Poslovne statistike svih studenata Visoke
kole za financijski menadment u Bedekovini koji su poloili taj kolegij u proloj
akademskoj godini);
e) anketiranjem (intervjuiranjem) (npr. politika stranka za koju na predstojeim mjesnim
izborima namjerava glasovati svaki stanovnik Mua)

Rezultat organiziranoga prikupljanja statistikih podataka su tzv. ''sirovi'' (negrupirani,
neobraeni) podaci. Iz njih se najjasnije vidi koji je element osnovnoga skupa pridruen
svakom pojedinom elementu statistikoga skupa. Uoimo da obrnuta tvrdnja nije tona jer bez
grupiranja i sreivanja podataka openito ne moemo ''oitati'' kojim je sve elementima
statistikoga skupa pridruen svaki element osnovnoga skupa.

Najpoznatija, a moda i najprimjenjivanija metoda organiziranoga prikupljanja statistikih
podataka je anketiranje. Anketa predstavlja skup razliitih postupaka kojima se pobuuju,
prikupljaju i analiziraju izjave anonimnih ljudi
24
kako bi se dobili podaci o njihovu ponaanju,
stavu prema odreenom problemu, miljenju, interesima, preferencijama itd. Ti se podaci
dobivaju na temelju anketnih upitnika koji sadre promiljeno odabrana pitanja koja trebaju

22
Drugi prirodan razlog je cijena praktine provedbe takve metode koja nerijetko predstavlja ozbiljnu prepreku
za kvalitetnu provedbu statistikoga istraivanja.
23
Vrlo esta pogreka statistikih istraivanja upravo je ''megalomanija'' odgovarajuih planova istraivanja jer
se istraivanje planira obaviti na prevelikom uzorku.
24
Psiholoka istraivanja pokazuju da je uvjet anonimnosti sudionika ankete iznimno vaan jer ak moe utjecati
na iskrenost u davanju odgovora na anketna pitanja, a time i na realnost rezultata provedene ankete.


Poslovna statistika


biti jednostavna, jasna i nesugestivna. Ta se pitanja mogu postaviti pismeno i usmeno.
Usmeno postavljanje anketnih pitanja obino se naziva intervjuiranje
25
.

U nastavku navodimo primjer prvoga dobro strukturirane ankete za procjenu nastavnika i
kolegija koja se sukladno naelima Bolonjskoga procesa provodi na svim znanstveno-
nastavnim sastavnicama Sveuilita u Zagrebu. Jedini moebitni nedostatak navedene ankete
je pretpostavka da svaki pojedini anketirani student poznaje temeljni postotni raun od sto, to
u praksi ne mora biti sluaj.

25
Moderna praksa nerijetko pokazuje da se postavljanje pitanja (unaprijed) u pismenoj formi i prepisivanje
njihovih odgovora takoer naziva intervju, napose ukoliko je rije o medijski poznatim osobama (npr.
predsjednici drava, premijeri vlada itd.). Sa statistikoga je stanovita takvo izjednaavanje potpuno pogreno.


Poslovna statistika


2.3. Grupiranje statistikih podataka

Nakon to su prikupljanjem (i odgovarajuim unosom) dobiveni ''sirovi'' statistiki podatci,
vrlo esto ih treba ''srediti'' tako da budu to pregledniji i laki za daljnju statistiku analizu
26
.
U tu se svrhu koristi grupiranje statistikih podataka. Osnovna ideja grupiranja je podijeliti
statistiki skup na podskupove prema svim modalitetima koji tvore skalu obiljeja, tj. za svaki
pojedini modalitet utvrditi (prebrojati) kolikom broju elemenata statistikoga skupa je
pridruen dotini modalitet. Pritom treba potovati dva osnovna naela:

- iskljuivost: svaki element statistikoga skupa ne moe istodobno biti u barem dva
razliita podskupa;
- iscrpnost: svaki element statistikoga skupa mora biti obuhvaen grupiranjem
podataka.
27

2.3.1. Grupiranje kvalitativnih podataka

Kako je ve istaknuto, grupiranjem podataka za svaki pojedini modalitet utvrujemo kolikom
je broju elemenata statistikoga skupa pridruen taj modalitet. Dobiveni broj obino se naziva
apsolutna frekvencija (uestalost). Neformalno, apsolutna frekvencija nekoga modaliteta
jednaka je ukupnom broju pojavljivanja toga modaliteta u osnovnom skupu
28
. Budui da je
svakom elementu statistikoga skupa nuno pridruen tono jedan modalitet, zbroj apsolutnih
frekvencija svih modaliteta mora biti jednak opsegu statistikoga skupa
29
.

Relativna frekvencija modaliteta jednaka je koliniku odgovarajue apsolutne frekvencije
toga modaliteta i opsega statistikoga skupa. Takav se raun provodi jer elimo vidjeti
kolikom dijelu statistikoga skupa je pridruen odreeni modalitet. Iako je relativna

26
Izuzetak su sluajevi kad osnovni skup sadri relativno malo (obino 30) podataka.
27
Budui da je preslikavanje f koje svakom elementu statistikoga skupa S pridruuje tono jedan element skale
modaliteta M funkcija, za svaki modalitet y M ima smisla definirati skup f
(y) = {x S: f(x) = y}. Navedeni

skup se naziva praslika modaliteta y. Stoga strogo formalno moemo rei da je grupiranje podataka particija
statistikoga skupa na meusobno disjunktne praslike pojedinih modaliteta.
28
Strogo formalno, apsolutna frekvencija modaliteta y je ukupan broj elemenata skupa f
(y), gdje je f funkcija iz

Biljeke 28. Autori koji poistovjeuju pojmove statistiki skup i osnovni skup definiraju apsolutnu frekvenciju
kao ukupan broj pojavljivanja nekoga modaliteta u statistikom skupu. No, openito je bolje i preciznije u
definiciji rabiti pojam osnovnoga skupa.
29
Aritmetika kardinalnih brojeva iz teorije skupova osigurava da navedeno svojstvo ne ovisi o tipu statistikoga
skupa (konaan ili beskonaan). Dakle, neovisno o tome je li statistiki skup konaan ili beskonaan, zbroj
apsolutnih frekvencija svih modaliteta uvijek je jednak opsegu statistikoga skupa.


Poslovna statistika


frekvencija openito neki nenegativan realan broj iz segmenta [0, 1], radi praktinih ga je
potreba vrlo prikladno izraziti u proporcijama, postotcima ili promilima
30
.

Primjer 1. Promatramo statistiki skup iz Primjera 1. u odjeljku 1.3. Ukupno 20 studenata
(elemenata promatranoga skupa) iz kolegija Poslovna matematika ima zakljunu ocjenu
izvrstan. Stoga je apsolutna frekvencija modaliteta izvrstan u odgovarajuem osnovnom
skupu jednaka 20. Budui da je opseg promatranoga statistikoga skupa 100, relativna
frekvencija modaliteta izvrstan jednaka je

20
100
= 0.2 = 20%.

Tako moemo zakljuiti da iz kolegija Poslovna matematika 20% svih promatranih studenata
ima zakljunu ocjenu ''izvrstan''
31
.

Primjer 2. Istraivanjem potronje inozemnih putnika u Kraljevini Eldorado na uzorku od
ukupno 30 370 inozemnih putnika u razdoblju od lipnja do prosinca 2007. godine i
odgovarajuim grupiranjem podataka, izmeu ostalih, dobiveni su sljedei podaci:

vrsta prijelaza broj putnika struktura [%]
cestovni 25 924 85.36%
zrani 1 354 4.46%
eljezniki 2 075 6.83%
pomorski 1 017 3.35%
ukupno: 30 370 100.00%

Apsolutna frekvencija modaliteta cestovni je 25 924, to znai da je ukupno 25 924 anketirana
inozemna putnika anketirano na cestovnim graninim prijelazima. Odgovarajua relativna
frekvencija je 85.36%, to znai da je 85.36% svih anketiranih inozemnih putnika anketirano
na cestovnim graninim prijelazima. Za vjebu objasnite svaku od ostalih apsolutnih,
odnosno relativnih frekvencija.

30
Proporcija oznaava odreeni dio jedinine veliine, a to je zapravo decimalan broj izmeu 0 i 1. Kod
beskonanih se statistikih skupova relativne frekvencije modaliteta ne odreuju jer aritmetika beskonanih
kardinalnih brojeva ne definira pojam dijeljenja kardinalnih brojeva. Stoga su relativne frekvencije praktino
vezane iskljuivo za realne konane statistike skupove. Budui da se obino iskazuju u postotcima ili
promilima, za njihovo je raunanje potrebno poznavati postotni raun od sto, odnosno promilni raun od tisuu.
31
Strogo formalno govorei, interpretacija bi trebala glasiti: Ukupan broj studenata koji su dobili ocjenu
izvrstan iznosi 20% od ukupnoga broja svih studenata. Zbog svakodnevnoga govora mi emo dozvoljavati i
navedenu interpretaciju.


Poslovna statistika


2.3.2. Grupiranje kvantitativnih podataka

Ukoliko se podaci koje grupiramo odnose na kvantitativno statistiko obiljeje, njihovim
grupiranjem dobivamo poseban tip grupiranih statistikih podataka. Rije je o tzv. razdiobi
(distribuciji) frekvencija. U sluaju maloga broja modaliteta grupiranje ovakvih podataka
praktino se ne razlikuje od grupiranja kvalitativnih podataka. Meutim, u sluaju velikoga
broja modaliteta radi preglednosti ih je primjerenije grupirati u tzv. razrede. Definirajmo
ukratko osnovne pojmove.

Zatvoreni razred
32
je bilo koji poluzatvoreni podskup skupa realnih brojeva R oblika a, b], a
otvoreni razred je bilo koji otvoreni podskup skupa realnih brojeva R oblika a, + ili
, a
33
. Realan broj a nazivamo donja granica (zatvorenoga) razreda, a realan broj b
gornja granica (zatvorenoga) razreda. Realan broj h = b a naziva se irina (veliina)
razreda i taj je broj praktino uvijek strogo pozitivan (tj. strogo vei od nule). Istaknimo jo
da realan broj s =
1
2
(a + b) uobiajeno nazivamo razredna sredina
34
.

Primjer 3. Donja granica razreda 50, 100] jednaka je a = 50, dok je gornja granica jednaka
b = 100. irina razreda jednaka je h = b a = 100 50 = 50, a razredna sredina je broj
s =
1
2
(a + b) =
1
2
(50 + 100) = 75.

Ukupan broj (k) razreda u koje trebamo grupirati ukupno N razliitih modaliteta
kvantitativnoga obiljeja openito nije unaprijed odreen. U veini statistikih istraivanja i
izradama odgovarajuih raunalnih programa primijenjuje se tzv. Sturgesovo
35
pravilo:

k 1 + log
2
N( 1 + 3.321928091 log N( 1 + 1.442695 ln N(.
36

32
Radi potreba daljnje statistike analize, mi emo pod pojmom razred podrazumijevati zatvoreni razred, te
preutno pretpostavljati da za realne brojeve a i b vrijedi stroga nejednakost a < b.
33
Za matematiki nenastrojene statistiare: a, + je skup svih realnih brojeva koji su strogo vei od broja a:
a, + = {x R: x > a}. , a je skup svih realnih brojeva koji su strogo manji od broja a, tj.
, a= {x R: x < a}.
34
Kasnije emo vidjeti da je razredna sredina zapravo aritmetika sredina donje i gornje granice razreda.
35
Herbert Sturges, ameriki statistiar.
36
x( = najmanji cijeli broj vei ili jednak x. Npr. 3,14( = 4, 0,05( = 0 itd.


Poslovna statistika


Pojedine irine razreda takoer se ne zadaju unaprijed, nego openito ovise o tipu razdiobe
podataka
37
. Najjednostavniji i praktino najprimjenjeniji sluaj je grupiranje podataka u
razrede jednakih irina, pri emu preutno pretpostavljamo da je razdioba podataka barem
priblino simetrina. Tada izraunamo razliku najveega i najmanjega modaliteta, pa tu
razliku podijelimo ukupnim brojem razreda i tako dobijemo traenu irinu razreda. Ovaj se
sluaj naroito primijenjuje kod tzv. pravih razreda (objanjenje u nastavku teksta).

Ako razdioba podataka nije simetrina, primjereno je koristiti razrede manjih irina na
podruju u kojemu je ''gustoa'' podataka vea, a razrede veih irina na podruju s manjom
''gustoom'' podataka.

Primjer 4. Mjerenjem visina (i iskazivanjem podataka u centimetrima) svih uenika 5., 6., 7.
i 8. razreda Osnovne kole ''Milivoj Glavovi iz Brckovljana na dan 29.02.2008. dobiveno je
ukupno 506 podataka. Najmanji od njih je 151, najvei 193, a ukupan broj razliitih
modaliteta je 38. Prema Sturgesovu pravilu podaci se mogu grupirati u ukupno
k 1 + log
2
38( = 6.213( = 7 razreda. Visine uenika su obino priblino simetrino
rasporeene, pa je dobivene podatke primjereno grupirati u jednake razrede ija je irina
h =
193 151
6
= 7.

Uz grupiranje statistikih podataka esto se javlja tzv. problem nominalnih razreda. Naime,
grupiranjem modaliteta kvantitativnoga obiljeja u razrede dobivamo tono jedan od sljedeih
dvaju sluajeva:

1.) gornja granica svakoga pojedinoga razreda, osim posljednjega, jednaka je donjoj granici
neposredno sljedeega razreda;
2.) gornja granica svakoga pojedinoga razreda, osim posljednjega, nije jednaka donjoj granici
neposredno sljedeega razreda (tj. izmeu dvaju uzastopnih razreda postoji razmak).

Prvi sluaj praktino primijenjujemo uvijek kad analiziramo modalitete kvantitativnoga
kontinuiranoga obiljeja kojih teorijski moe biti beskonano mnogo. Granice tako dobivenih
razreda nazivamo prave granice i razredi s takvim granicama se najee koriste u statistici.

37
O tipovima razdiobe podataka bit e vie rijei kasnije u poglavlju o mjerama asimetrije. Ovdje istaknimo
jedino da noviji statistiki radovi predlau da se irine razreda, umjesto izvedeno iz Sturgesova pravila, raunaju
prema Freedman Diaconisovoj formuli:
3
2 IQ
h
n
= , gdje je IQ interkvartil osnovnoga skupa. O interkvartilu

emo neto vie rei kasnije u poglavlju o mjerama rasprenja.


Poslovna statistika


Drugi sluaj se obino primijenjuje pri analizi modaliteta kvantitativnoga diskretnoga
obiljeja kojih je obino konano mnogo. Zbog toga izmeu gornje granice jednoga razreda i
donje granice njemu neposredno sljedeega razreda postoji razmak (obino jednak 1). Takve
granice nazivaju se nominalne granice, a radi potreba daljnje statistike analize obino ih je
potrebno ''pretvoriti'' u prave. Najjednostavniji postupak pokazat emo na sljedeem primjeru.

Primjer 5. Pretpostavimo da smo grupiranjem podataka o iznosu mjesenih plaa svih
zaposlenika knjigovodstvenoga servisa ''Knjii kod mene'' iz Koara dobili sljedeu tablicu:

iznos mjesene plae [kn] broj zaposlenika
1600 1900 2
2000 2400 4
2500 2900 6
3000 3400 2
3500 8000 1

Sve navedene granice su oito nominalne granice. Razmaci izmeu dvaju uzastopnih razreda
su jednaki i iznose 100. Pretvaranje u prave granice radimo tako da svaku pojedinu donju
nominalnu granicu umanjimo za polovinu razmaka, a svaku pojedinu gornju nominalnu
granicu uveamo za polovicu razmaka. Budui da je polovina razmaka jednaka 50, dobivamo:

iznos mjesene plae [kn] broj zaposlenika
1550 1950 2
1950 2450 4
2450 2950 6
2950 3450 2
3450 8050 1

2.3.3. Kumulativni nizovi frekvencija

Ponekad je radi kvalitetnije statistike analize apsolutne i relativne frekvencije potrebno
grupirati u konane nizove. To se poglavito radi ukoliko analiziramo kvalitativno redosljedno
obiljeje iji su modaliteti iskazani numerikim vrijednostima (npr. ocjena na ispitu) ili bilo
koje kvantitativno obiljeje. U praksi se najvie koriste dva tipa takvih nizova: kumulativni niz
''manje od'' i kumulativni niz ''vee od''. Objasnit emo ih na sljedeem primjeru.


Poslovna statistika


Primjer 6. Na 1. godini strunoga studija smjehologije na Vioj uzaludnoj koli u pikovini
na dan 29.02.2008. bilo je ukupno 80 studenata. Svi oni su polagali pismeni ispit iz kolegija
''Zabavljake vjetine''. Rezultati pismenoga ispita dani su u sljedeoj tablici:

ocjena broj studenata
1 0
2 10
3 15
4 25
5 30
ukupno: 80

Za svaki pojedini modalitet definiramo kumulativnu apsolutnu frekvenciju ''manje od'' kao
ukupan broj elemenata osnovnoga skupa koji su ili strogo manji od dotinoga modaliteta ili
jednaki tom modalitetu. Tako je kumulativna apsolutna frekvencija ''manje od'' modaliteta 1
jednaka 0 jer niti jedan student nije ocijenjen ocjenom 1. Kumulativna apsolutna frekvencija
''manje od'' modaliteta 2 jednaka je 10 (nema studenata koji su dobili ocjenu strogo manju od
2, ali postoji 10 studenata koji su ocijenjeni ocjenom 2), kumulativna apsolutna frekvencija
''manje od'' modaliteta 3 jednaka je 25 (ukupno 10 studenata je ocijenjeno ocjenom strogo
manjom od 3, a 15 studenata je ocijenjeno ocjenom 3), kumulativna apsolutna frekvencija
''manje od'' modaliteta 4 jednaka je 50 (25 studenata je ocijenjeno ocjenom strogo manjom od
4, a jednako toliko ih je ocijenjeno ocjenom 4) i kumulativna apsolutna frekvencija ''manje
od'' modaliteta 5 jednaka je 80 (svi studenti su ocijenjeni ocjenom jednakom ili manjom od 5).

ocjena broj studenata kumulativna apsolutna
frekvencija ''manje od''
1 0 0
2 10 10
3 15 25
4 25 50
5 30 80
ukupno: 80

Dobivene kumulativne apsolutne frekvencije objanjavamo ovako: 10 studenata je na ispitu
ocijenjeno ocjenom 2 (niti jedna ocjena nije strogo manja od 2), 25 studenata je na ispitu
ocijenjeno ocjenom 2 ili ocjenom 3, 50 studenata je na ispitu ocijenjeno ocjenom 2, ocjenom 3
ili ocjenom 4, a 80 studenata je na ispitu ocijenjeno ocjenom 2, ocjenom 3, ocjenom 4 ili
ocjenom 5. Krae i matematikije, tu reenicu moemo izrei ovako: 10 studenata je na ispitu
ocijenjeno ocjenom najvie jednakom 2, 25 studenata je na ispitu ocijenjeno ocjenom najvie


Poslovna statistika


jednakom 3, 50 studenata je na ispitu ocijenjeno ocjenom najvie jednakom 4, a svi studenti
su na ispitu ocijenjeni ocjenom najvie jednakom 5.
38

Oznaimo li s f
x
apsolutnu frekvenciju, a s
x
c
<
kumulativnu apsolutnu frekvenciju ''manje od''
modaliteta x, nije teko vidjeti da vrijedi jednakost:

x y y x
y x y x
c f f f
<
<
= = +

koja nam omoguuje relativno brzo raunanje svake pojedine kumulativne apsolutne
frekvencije. Raunamo ih kreui se od najslabijega modaliteta prema najboljemu i za svaki
modalitet (osim prvoga, ija je kumulativna apsolutna frekvencija ''manje od'' jednaka
odgovarajuoj ''obinoj'' apsolutnoj frekvenciji) kumulativnu apsolutnu frekvenciju ''manje
od'' izraunamo tako da izraunatoj kumulativnoj apsolutnoj frekvenciji ''manje od''
prethodnoga modaliteta pribrojimo apsolutnu frekvenciju modaliteta iju kumulativnu
frekvenciju ''manje od'' elimo izraunati. Kao provjera ispravnosti izrauna moe nam
posluiti i injenica da kumulativna apsolutna frekvencija ''manje od'' najboljega (praktino,
posljednjega) modaliteta nuno mora biti jednaka opsegu statistikoga skupa.

Podijelimo li svaki lan dobivenoga niza kumulativnih apsolutnih frekvencija s opsegom
promatranoga statistikoga skupa, dobit emo kumulativni niz relativnih frekvencija ''manje
od''. U promatranom primjeru taj je niz:

kumulativna relativna
frekvencija ''manje od'' [%]
1 0 0 0
2 10 10 12,5
3 15 25 31,25
4 25 50 62,5
5 30 80 100
ukupno: 80

Dobiveni kumulativni niz interpretiramo na sljedei nain: Niti jedan student na ispitu nije
ocijenjen ocjenom 1. 12,5% studenata je na ispitu ocijenjeno ocjenom najvie jednakom 2,
31,25% studenata je na ispitu ocijenjeno ocjenom najvie jednakom 3, 62,5% studenata je na

38
Mini-teaj hrvatskoga jezika, lekcija 1: najvie jednak x je istoznanica izraza manji ili jednak x, odnosno
izraza jednak x ili strogo manji od x.


Poslovna statistika


ispitu ocijenjeno ocjenom najvie jednakom 4, a svi studenti su na ispitu ocijenjeni ocjenom
najvie jednakom 5.

Na potpuno analogan nain definiramo kumulativnu apsolutnu frekvenciju ''vee od'' svakoga
pojedinoga modaliteta To je ukupan broj elemenata osnovnoga skupa koji su ili strogo vei od
dotinoga modaliteta ili jednaki tom modalitetu. Tako je kumulativna apsolutna frekvencija
''vee od'' modaliteta 1 jednaka 80 (svi studenti su ocijenjeni ocjenom 1 ili strogo veom od
1). Kumulativna apsolutna frekvencija ''vee od'' modaliteta 2 takoer je jednaka 80 jer su svi
studenti ocijenjeni ocjenom 2 ili strogo veom od 2. Kumulativna apsolutna frekvencija ''vee
od'' modaliteta 3 jednaka je 70 (15 studenata je ocijenjeno ocjenom 3, 25 studenata ocjenom
4, a 30 studenata ocjenom 5), kumulativna apsolutna frekvencija ''vee od'' modaliteta 4
jednaka je 55 (25 studenata ocijenjeno je ocjenom 4, a 30 studenata ocjenom 5) i kumulativna
apsolutna frekvencija ''vee od'' modaliteta 5 jednaka 30 (30 studenata ocijenjeno je ocjenom
5, a niti jedan student nije ocijenjen ocjenom strogo veom od 5).

ocjena broj studenata kumulativna frekvencija ''vee od''
1 0 80
2 10 80
3 15 70
4 25 55
5 30 30
ukupno: 80

Dobivene apsolutne frekvencije objanjavamo ovako: Svi studenti su na ispitu ocijenjeni
ocjenom 2 ili veom od 2, 70 studenata je na ispitu ocijenjeno ocjenom 3 ili veom od 3, 55
studenata je na ispitu ocijenjeno ocjenom 4 ili veom od 4, a 30 studenata je na ispitu
ocijenjeno ocjenom 5. Krae i matematikije, tu reenicu moemo izrei ovako: Svi studenti
su na ispitu ocijenjeni ocjenom najmanje jednakom 2, 70 studenata je na ispitu ocijenjeno
ocjenom najmanje jednakom 3, 55 studenata je na ispitu ocijenjeno ocjenom najmanje
jednakom 4, a 30 studenata je na ispitu ocijenjeno ocjenom 5.
39

Kod izrauna pojedinih kumulativnih apsolutnih frekvencija ''vee od'' korisno je primijetiti
da kumulativna apsolutna frekvencija ''vee od'' najslabijega (praktino, prvoga) modaliteta
nuno mora biti jednaka opsegu statistikoga skupa i ta nam injenica moe biti svojevrsna
provjera ispravnosti provedenih izrauna.

39
Mini-teaj hrvatskoga jezika, lekcija 2: najmanje jednako x ili barem jednako x je istoznanica izraza vei ili
jednak x, odnosno izraza jednak x ili strogo vei od x.


Poslovna statistika


Oznaimo li s f
x
apsolutnu frekvenciju, a s
x
c
>
kumulativnu apsolutnu frekvenciju ''vee od''
modaliteta x, nije teko vidjeti da vrijedi jednakost:

x y y x
y x y x
c f f f
>
>
= = +

koja nam omoguuje relativno brzo raunanje svake pojedine kumulativne apsolutne
frekvencije ''vee od''. Raunamo ih kreui se od najboljega modaliteta prema najloijemu i
za svaki pojedini modalitet (osim najboljega ija je kumulativna apsolutna frekvencija ''vee
od'' jednaka odgovarajuoj ''obinoj'' apsolutnoj frekvenciji) kumulativnu apsolutnu
frekvenciju ''vee od'' izraunamo tako da izraunatoj kumulativnoj apsolutnoj frekvenciji
''vee od'' prethodnoga modaliteta pribrojimo apsolutnu frekvenciju modaliteta iju
kumulativnu frekvenciju ''vee od'' elimo izraunati.

Kao i u sluaju kumulativnih frekvencija ''manje od'', svaku od dobivenih kumulativnih
frekvencija ''vee od'' moemo podijeliti s opsegom statistikoga skupa. Tako se dobije
kumulativni niz relativnih frekvencija ''vee od''. U promatranom primjeru taj je niz:

frekvencija ''vee od''
kumulativna relativna
frekvencija ''vee od'' [%]
1 0 80 100
2 10 80 100
3 15 70 87.5
4 25 55 68.75
5 30 30 37.5
ukupno: 80

Dobivene kumulativne relativne frekvencije objanjavamo ovako: Svi studenti su na ispitu
ocijenjeni ocjenom najmanje jednakom 2, 87,5% studenata je na ispitu ocijenjeno ocjenom
najmanje jednakom 3, 68,75% studenata je na ispitu ocijenjeno ocjenom najmanje jednakom
4, a 37,5% studenata je na ispitu ocijenjeno ocjenom 5.


Poslovna statistika


2.3.4. Dijagram ''stablo list'' (stem leaf)

Jedan od naina saetoga prikaza kvantitativnih statistikih podataka, osobito koriten u
statistikim raunalnim programima, jest dijagram ''stablo list''
40
. Ovaj nain je osobito
prikladan ukoliko elimo vidjeti oblik i razdiobu podataka, a iz njega se vrlo lako mogu
izraunati medijan i mod
41
. Opiimo ukratko o emu se radi.

Osnovna ideja ovakvoga tipa grupiranja podataka jest zapisati svaki numeriki podatak u
obliku x.y, gdje je y bilo koja znamenka dekadskoga brojevnoga sustava, . decimalna toka, a
x ostatak numerikoga podatka. U ovakvom zapisu y nazivamo list, a x stablo. Ukoliko
numeriki podatak uope nema znamenaka iza decimalne toke ili ima barem dvije znamenke
iza decimalne toke, list e biti posljednja znamenka broja, a stablo sve ostale znamenke broja
poredane redoslijedom u kojemu se pojavljuju u zapisu broja. U takvim sluajevima obavezno
moramo dati odgovarajuu ''uputu za uporabu'', tj. kako iz zapisa x.y pravilno oitati polaznu
numeriku vrijednost. Ilustrirajmo to na primjerima.

Primjer 7. a) Stablo numerikoga podatka 2008.7 je broj 2008, a list broj 7. Ovdje nam ne
treba nikakva ''uputa za uporabu'' jer iz injenica da je 2008 stablo, 7 list i izloene ideje
grupiranja podataka odmah dobivamo originalni podatak: 2008.7.

b) Prirodan broj 2008 nema niti jedne znamenke iza decimalne toke. U tom sluaju list je
posljednja znamenka toga broja, tj. 8, a stablo sve ostale znamenke broja u redoslijedu u
kojemu se pojavljuju u samom broju, tj. 200. No, kad bismo iz ovakvoga zapisa htjeli dobiti
originalni podatak, slijedei osnovnu ideju dobili bismo broj 200.8, to je netono. Stoga
ovdje moramo dati ''uputu za uporabu'', odnosno rei kako iz podatka x.y dobiti originalni
podatak. Ta je uputa ovdje jednostavna: pomnoiti zapis x.y s 10.

c) Decimalan broj 20.08 ima dvije znamenke iza decimalne toke. I u ovome je sluaju list
znamenka 8, a stablo 200. Meutim, iz ovakvoga zapisa slijedi da je originalan podatak 200.8,
to je netono. Opet nedostaje ''uputa za uporabu'', a u ovom sluaju ona glasi: podijeliti zapis
x.y s 10.

40
Termini stablo (engl. tree) i list (engl. leaf) su dio osnovnih termina teorije grafova. Sukladno toj teoriji, ovaj
je dijagram zapravo unija stabala kojima su listovi znamenke jedinica prirodnih brojeva, a korijeni sve ostale
znamenke. Takoer, u duhu te teorije primjereniji prijevod naziva ovoga tipa dijagrama bio bi ''stabljika list''.
41
Medijan i mod su srednje vrijednosti ili mjere centralne tendencije o kojima e detaljnije biti govora u
posebnom poglavlju.


Poslovna statistika


Nakon to smo svaki element osnovnoga skupa jedinstveno zapisali na gore navedeni nain,
preostaje nam grupirati elemente osnovnoga skupa prema stablima: u istu grupu svrstat emo
sve elemente koji imaju isto stablo. Pritom emo stabla poredati prema uobiajenom ureaju u
skupu realnih brojeva, tj. od najmanjega do najveega. Pokaimo to na primjerima.

Primjer 8. Svi studenti Visoke kole za financijski menadment u pikovini koji su poloili
kolegij Poslovna matematika putem dvaju kolokvija ostvarili su sljedee brojeve bodova: 64,
67, 66, 95, 72, 90, 94, 95, 76, 86, 76, 55, 80, 58, 64, 68, 81, 72, 76, 87, 80, 93, 92, 63, 93, 99,
59, 78, 63, 72, 61, 69, 58, 82, 51, 70 i 90. Budui da je rije o dvoznamenkastim prirodnim
brojevima, prva znamenka svakoga od tih brojeva bit e stablo, a druga list. Tako dobivamo
sljedeu tablicu:

stablo list
5 1,5,8,8,9
6 1,3,3,4,4,6,7,8,9
7 0,2,2,2,6,6,6,8
8 0,0,1,2,6,7
9 0,0,2,3,3,4,5,5,9
uputa za uporabu: pomnoiti stablo.list s 10

Iz ovako navedene tablice se pomou ''upute za uporabu'' vrlo lako dobivaju polazni podaci.
Npr. u prvom retku tablice zapravo piu decimalni brojevi 5.1, 5.5, 5.8, 5.8 i 5.9. ''Uputa za
uporabu'' kae da se originalni podaci dobiju mnoenjem svakoga od tih brojeva s 10. Dakle,
originalni podaci su 51, 55, 58, 58 i 59. Na potpuno analogan nain se iz ostalih redaka tablice
dobiju ostali elementi osnovnoga skupa.

Primjer 9. Zakljune cijene dionica (u ) mobilnoga operatera ''Blablamobile d.d.'' na
bekoj burzi u 30 sluajno odabranih dana u razdoblju izmeu 31.12.2006. i 31.12.2007.
iznosile su: 8.7, 6.9, 11.5, 13.6, 6.8, 11.7, 7.3, 7.4, 14.5, 11.9, 8.2, 12.2, 14.9, 8.1, 12.0, 10.6,
13.2, 13.5, 11.8, 13.4, 13.6, 12.2, 7.2, 13.9, 12.5, 8.8, 9.8, 13.3, 9.9 i 7.0. U ovome e sluaju
stablo svakoga podatka biti znamenke ispred decimalne toke, a list znamenka iza decimalne
toke. Tako dobivamo sljedeu tablicu:

stablo list
6 8,9
7 0,2,3,4
8 1,2,7,8
9 8,9
10 6
11 5,7,8,9
12 0,2,2,5
13 2,3,4,5,6,6,9
14 5,9


Poslovna statistika


''Uputu za uporabu'' ovdje ne moramo navesti jer se originalni podaci dobivaju izravno bez
ikakvih dodatnih aritmetikih operacija. Npr. iz prvoga retka odmah dobivamo podatke 6.8 i
6.9, iz drugoga 7.0,7.2,7.3 i 7.4 itd.

Primjer 10. Zakljune cijene dionica (u kn) tvrtke ''Stara TV' na frkljevakoj burzi u veljai
2008. godine iznosile su: 59.52, 59.47, 59.51, 59.58, 59.57, 59.52, 59.49, 59.46, 59.43, 59.42,
59.39, 59.38, 59.37, 59.39, 59.4, 59.41, 59.43, 59.42, 59.44, 59.45, 59.48, 59.5, 59.53, 59.55,
59.58, 59.6, 59.62, 59.63 i 59.62. U ovome e sluaju list svakoga elementa osnovnoga skupa
biti znamenka na mjestu stotinki (druga znamenka iza decimalne toke), a stablo sve ostale
znamenke. Tako dobivamo sljedeu tablicu:

stablo list
593 7,8,9,9
594 0,1,2,2,3,3,4,5,6,7,8,9
595 0,1,2,2,3,5,7,8,8
596 0,2,2,3
uputa za uporabu: podijeliti stablo.list s 10

I ovdje pomou ''upute za uporabu'' vrlo lako dobivamo polazne podatke. Npr. u prvom retku
tablice zapravo piu decimalni brojevi 593.7, 593.8, 593.9 i 593.9. ''Uputa za uporabu'' kae
da odgovarajue originalne podatke dobivamo dijeljenjem svakoga od navedenih decimalnih
brojeva s 10, pa se tako dobiju podaci 59.37, 59.38, 59.39 i 59.39. Na potpuno analogan nain
se iz ostalih redaka dobiju ostali elementi osnovnoga skupa.

2.4. Tablini prikaz statistikih podataka

Tablini prikaz statistikih podataka je trea faza obrade ''sirovih'' statistikih podataka. Cilj te
faze jest na jasan, cjelovit i pregledan nain prezentirati rezultate prikupljanja i grupiranja
podataka. U ovoj emo toki ukratko spomenuti neke najvanije vrste tablica. Pritom
istaknimo da svaka statistika tablica nuno mora imati sljedee dijelove:

1.) naslov tablice;
2.) tekstualni dio tablice;
3.) numeriki dio tablice;
4.) izvor podataka.

Tono jedan statistiki niz nastao sreivanjem podataka prema modalitetima jednoga obiljeja
tabelarno se pregledno prikazuje jednostavnom tablicom. Vie statistikih nizova nastalih


Poslovna statistika


sreivanjem podataka prema modalitetima jednoga obiljeja pregledno prikazujemo skupnom
tablicom. Jednostavne i skupne tablice vrlo je jednostavno izraditi i u MS Wordu i MS
Excelu, ali se zbog potreba daljnje analize podataka preporuuje izraditi ih u MS Excelu.
Pogledajmo po jedan primjer svake od spomenutih vrsta tablica.

Primjer 1. Primjer jednostavne statistike tablice:

Razdioba svih zaposlenika tvrtke ''Lupeki d.o.o.'' iz Zlobina na dan 10.03.2008. prema spolu

spol broj zaposlenika
muki 7
enski 3
ukupno: 10
Izvor: sluba kadrovskih potencijala tvrtke ''Lupeki d.o.o.''

Primjer 2. Primjer skupne statistike tablice:

Razdioba registriranih cestovnih motornih i prikljunih vozila u Republici Hrvatskoj na dan
31.12.2007. prema vrsti vlasnika

vrsta vozila fizike osobe pravne osobe ukupno
autobusi 701 4 322 5 023
kombinirani automobili 6 316 4 592 10 908
mopedi 97 845 8 498 106 343
motocikli 52 104 4 191 56 295
osobna vozila 1 334 894 152 234 1 487 128
prikljuna vozila 19 792 15 118 34 910
vrsta vozila fizike osobe pravne osobe ukupno
radni strojevi 2 587 4 407 6 994
teretna i radna vozila 70 888 94 347 165 235
traktori 101 854 4 190 106 044
Izvor: mjeseno statistiko izvjee broj 1/2008 Dravnoga zavoda za statistiku Republike Hrvatske

Statistiki skup mogue je podijeliti i prema najmanje dvama razliitim obiljejima, pa se i
tako dobiveni podaci mogu grupirati i sreivati. Dobiveni rezultati pregledno se prikazuju
kombiniranom ili kontingencijskom tablicom. Ukupan broj obiljeja prema kojemu je
podijeljen skup naziva se dimenzija tablice, pa sukladno tome kombinirana tablica moe biti
dvodimenzionalna, trodimenzionalna, etverodimenzionalna itd. Svaka takva tablica uvijek se
sastoji od predstupca, zaglavlja, polja tablice, marginalnoga retka (retka ukupno) i
marginalnoga stupca (stupca ukupno). Ukoliko je statistiki skup podijeljen prema tono


Poslovna statistika


dvama obiljejima, odgovarajua kombinirana tablica je dvodimenzionalna, a njezin
marginalni redak i marginalni stupac sadre odgovarajue apsolutne ili relativne frekvencije
svakoga pojedinoga obiljeja. Pogledajmo dva primjera tablica s apsolutnim frekvencijama.

Primjer 3. Primjer dvodimenzionalne kombinirane statistike tablice:

Razdioba svih studenata 1. godine strunoga studija raunovodstva i financija Veleuilita u
pikovini na dan 10.03.2008. prema spolu i ruci kojom piu

desna lijeva ukupno:
muki 12 5 17
enski 17 6 23
ukupno: 29 11 40
izvor: studentska sluba Veleuilita u pikovini

Apsolutna frekvencija u retku i i stupcu j oznaava ukupan broj elemenata statistikoga skupa
koje istodobno imaju oblik obiljeja 1 naveden u retku i i oblik obiljeja 2 naveden u retku j.
Tako npr. apsolutna frekvencija 12 u presjeku drugoga retka i drugoga stupca znai da meu
svim promatranim studentima ima tono 12 studenata mukoga spola koji piu desnom rukom
(''denjaci''
42
), apsolutna frekvencija 6 u presjeku treega retka i treega stupca znai da meu
svim promatranim studentima ima tono 12 studentica koji piu lijevom rukom
(''ljevakinje''
43
) itd. Iz presjeka marginalnoga stupca i drugoga retka oitavamo da meu svim
promatranim studentima ima tono 17 studenata mukoga spola, a iz presjeka marginalnoga
retka i treega stupca oitavamo da meu svim promatranim studentima ima tono 11
studenata koji piu lijevom rukom. Za vjebu objasnite svaku od preostalih frekvencija
navedenih u tablici.

Primjer 4. Primjer etverodimenzionalne kombinirane statistike tablice:

Razdioba svih zaposlenika tvrtke ''Viktor Steaj'' iz Plomina na dan 31.12.2006. prema spolu,
stupnju strune spreme, navrenim godinama radnoga staa i iznosu prosjene mjesene plae

42
Uobiajeni izraz za mukarca koji pie desnom rukom. Taj izraz treba razlikovati od izraza desniar koji se
odnosi iskljuivo na politiku orijentaciju. Takoer, mukarac koji pie lijevom rukom nije niti ljeviar niti
lijevak, nego ljevak.
43
Uobiajeni izraz za enu koja pie lijevom rukom. Taj izraz treba razlikovati od izraza ljeviarka koji se
odnosi iskljuivo na politiku orijentaciju.


Poslovna statistika


3000-4999 5000-6999 7000-9000
ukupno
srednja via via visoka visoka
0-9 M 3 1 1 0 0 5
3 1 0 2 1 7
10-19 M 3 1 3 3 3 13
0 0 4 0 2 6
20-30 M 3 0 2 0 0 5
3 0 0 0 1 4
ukupno 15 3 10 5 7 40
izvor: sluba kadrovskih potencijala tvrtke ''Viktor Steaj''

Ovdje prva apsolutna frekvencija, tj. 3, znai da meu svim promatranim zaposlenicima
postoje tono 3 zaposlenika mukoga spola koji imaju srednju strunu spremu, najvie 9
godina radnoga staa i prosjenu mjesenu plau izmeu 3.000,00 kn i 5.000,00 (neemo
cjepidlaiti) kn. Posljednja apsolutna frekvencija, tj. 1, znai da meu svim promatranim
zaposlenicima postoji tono jedna zaposlenica (enskoga spola) koja ima visoku strunu
spremu, izmeu 20 i 30 godina radnoga staa, te prosjenu mjesenu plau izmeu 7.000,00 i
9.000,00 kn. Frekvencija 13 iz marginalnoga stupca znai da meu svim zaposlenicima koji
imaju izmeu 10 i 20 godina radnoga staa ima tono 13 zaposlenika mukoga spola, dok
frekvencija 10 iz marginalnoga retka znai da meu svim zaposlenicima ija je prosjena
mjesena plaa izmeu 5.000,00 kn i 7.000,00 (opet ne cjepidlaimo) kn ima tono 10
zaposlenika koji imaju viu strunu spremu itd. Iako te frekvencije nisu navedene, iz dobivene
kombinirane tablice vrlo lako moemo izraunati koliko je ena meu svim promatranim
zaposlenicima, koliko ukupno zaposlenika ima visoku strunu spremu i sl. Uinite to za
vjebu i objasnite znaenje svih preostalih apsolutnih frekvencija navedenih u tablici.

Kako je istaknuto, osim apsolutnih, kombinirana tablice moe sadravati i relativne
frekvencije. Ovdje emo izdvojiti i na primjerima ilustrirati tri tipa takvih tablica: tablica
''kutno 100'', tablica ''vodoravno 100'' i tablica ''okomito 100''.

Tablica ''kutno 100'' dobije se iz kombinirane tablice koja sadri apsolutne frekvencije tako da
se svaka apsolutna frekvencija podijeli s opsegom statistikoga skupa. Budui da je zbroj svih
apsolutnih frekvencija uvijek jednak opsegu statistikoga skupa, to zbroj svih relativnih
frekvencija mora biti jednak 1 (ili 100%, izrazimo li relativne frekvencije u postotcima). Taj
zbroj moemo izraunati na dva naina
44
:

44
Navedeni naini posljedica su svojstva komutativnosti i asocijativnosti zbrajanja realnih brojeva koja
zajedniki kau da zbroj proizvoljno (ali konano) mnogo realnih brojeva ne ovisi o poretku tih brojeva, te da
unutar toga zbroja moemo postaviti parove zagrada na koja god mjesta elimo, pa posebno izraunati zbroj
unutar svakoga pojedinoga para zagrada.


Poslovna statistika


1.) zbrajajui relativne frekvencije u svakom pojedinom retku, pa potom zbrojiti sve dobivene
zbrojeve;
2.) zbrajajui relativne frekvencije u svakom pojedinom stupcu, pa potom zbrojiti sve
dobivene zbrojeve.

Primjer 5. Primjer tablice ''kutno 100'':

Struktura svih umrlih nasilnom smru u Republici Hrvatskoj u 2005. godini prema spolu i
vrsti nasilne smrti

ene mukarci ukupno
nesretni sluaj 23.56% 43.40% 66.96%
samoubojstvo 7.75% 22.65% 30.40%
ubojstvo 0.87% 1.18% 2.05%
posljedice ratnih operacija 0.00% 0.17% 0.17%
nepoznata nasilna smrt 0.07% 0.35% 0.42%
ukupno 32.24% 67.76% 100,00%
Izvor: ''ene i mukarci u Hrvatskoj'', Dravni zavod za statistiku, 2007.

Iz ove tablice, primjerice, moemo oitati da su meu svim umrlima nasilnom smru u
Republici Hrvatskoj u 2005. godini njih 7.75% ene koje su izvrile samoubojstvo. Za vjebu
objasnite svaku od ostalih relativnih frekvencija.

Tablica ''vodoravno 100'' dobije se iz kombinirane tablice s apsolutnim frekvencijama tako da
svaki redak te tablice shvatimo kao tablini prikaz uzorka statistikoga skupa. Tada relativne
frekvencije raunamo tako da u svakom pojedinom retku svaku od apsolutnih frekvencija
podijelimo s opsegom odgovarajuega uzorka.

Primjer 6. Primjer tablice ''vodoravno 100'':

Struktura stanovnitva Republike Hrvatske (popis iz 2001. godine) prema spolu, razini
obrazovanja i navrenim godinama starosti


Poslovna statistika


osnovno ili
manje
srednje vie ili
visoko
ukupno:
15 - 24 ene 41.00% 56.50% 2.50% 100.00%
mukarci 42.20% 56.30% 1.50% 100.00%
25 - 34 ene 18.30% 61.90% 19.80% 100.00%
mukarci 17.70% 68.60% 13.70% 100.00%
35 - 44 ene 27.40% 55.10% 17.50% 100.00%
mukarci 20.10% 64.00% 15.90% 100.00%
45 - 54 ene 41.60% 42.40% 16.00% 100.00%
mukarci 25.30% 57.60% 17.10% 100.00%
55 - 64 ene 65.70% 24.10% 10.20% 100.00%
mukarci 37.30% 46.20% 16.50% 100.00%
65 - 74 ene 81.70% 13.60% 4.70% 100.00%
mukarci 52.50% 34.90% 12.60% 100.00%
75 - 84 ene 86.30% 10.90% 2.80% 100.00%
mukarci 61.40% 25.20% 13.40% 100.00%
85 + ene 88.60% 9.00% 2.40% 100.00%
mukarci 68.50% 22.70% 8.80% 100.00%
izvor: ''ene i mukarci u Hrvatskoj'', Dravni zavod za statistiku, 2007.

Uoimo da ovdje zapravo imamo 16 uzoraka: prvi uzorak tvore sve ene koje su navrile
izmeu 15 i 24 godine, drugi uzorak tvore svi mukarci koji su navrili izmeu 15 i 24 godine,
trei uzorak tvore sve ene koje su navrile izmeu 25 i 34 godine itd. Granice razreda u
ovom su primjeru nominalne, tj. rije je o segmentima [15, 24], [25, 34] itd.

Tako, primjerice, relativna frekvencija 27.40% u drugom stupcu znai da meu svim enama
koje su navrile izmeu 35 i 44 godine njih 27,4% ima osnovno obrazovanje ili manje, a
relativna frekvencija 1,50% u etvrtom stupcu znai da meu svim mukarcima koji su
navrili izmeu 15 i 24 godine njih 1,50% ima vie ili visoko obrazovanje. Za vjebu objasnite
svaku od ostalih relativnih frekvencija.

Tablica ''okomito 100'' dobije se iz kombinirane tablice s apsolutnim frekvencijama tako da
svaki stupac te tablice shvatimo kao tablini prikaz uzorka statistikoga skupa. Tada relativne
frekvencije raunamo tako da u svakom pojedinom stupcu svaku od apsolutnih frekvencija
podijelimo s opsegom odgovarajuega uzorka.

Primjer 7. Primjer tablice ''okomito 100'':

Struktura svih dravljana Republike Hrvatske koji su titulu doktor znanosti stekli 2005.
godine prema spolu i podruju znanosti iz kojega su obranili doktorsku disertaciju


Poslovna statistika


ene mukarci
prirodne znanosti 34.48% 10.90%
tehnike znanosti 8.62% 27.96%
biomedicina i zdravstvo 20.69% 24.64%
biotehnike znanosti 9.77% 9.48%
drutvene znanosti 12.64% 12.32%
humanistike znanosti 13.79% 14.69%
ukupno: 100.00% 100.00%
izvor: ''ene i mukarci u Republici Hrvatskoj'', Dravni zavod za statistiku, 2007.

Uoimo da ovdje zapravo imamo dva uzorka: prvi uzorak tvore sve ene koje su titulu dr.sc.
stekle 2005. godine, a drugi uzorak tvore svi mukarci koji su titulu dr.sc. stekli 2005. godine.
Tako, primjerice, relativna frekvencija 20,69% navedena u drugom stupcu znai da je meu
svim enama koje su titulu dr.sc. stekle 2005. godine njih 20.69% tu titulu steklo na podruju
biomedicine i zdravstva, a relativna frekvencija 10.90% navedena u treem stupcu znai da je
meu svim mukarcima koji su titulu dr.sc. stekli 2005. godine njih 10.9% tu titulu steklo na
podruju prirodnih znanosti. Za vjebu objasnite svaku od ostalih relativnih frekvencija.

2.5. Grafiki prikaz statistikih podataka

Grafiki prikaz statistikih podataka je jedan od najvanijih dijelova prezentacije rezultata
statistikoga istraivanja. Naime, kako je istaknuto u uvodu, statistika se, izmeu ostaloga,
bavi i organiziranim nainima prezentacije rezultata statistikoga istraivanja. Psihologija
ljudskoga ponaanja pokazuje da se u gotovo svim vrstama tiskovina, javnih medija (osim
radija), izlaganja na razliitim vrstama znanstvenih/strunih skupova, ali i izlaganja na svim
vrstama nastave u razliitim tipovima kola (osnovne, srednje, visoke, fakulteti, ) pozornost
sluatelja najprije i najveim dijelom usmjerava na grafike prikaze podataka. Stoga emo u
ovoj toki ukratko navesti osnovne i najee koritene statistike prikaze podataka
ilustrirajui ih na primjerima. Ipak, odmah istaknimo da tablice i grafiki prikazi pruaju
iskljuivo prve informacije o promatranoj pojavi, a ni u kojemu sluaju nisu (potpuno)
dovoljne za statistiku analizu i interpretaciju njezinih rezultata (5. faza statistikoga
istraivanja).

Grafike prikaze ili, krae, grafikone obino dijelimo u etiri osnovne skupine:
1.) povrinski grafikoni;
2.) linijski grafikoni;
3.) tokasti grafikoni;
4.) kartogrami


Poslovna statistika


Kako bi grafiki prikaz imao svoj potpuni smisao, osobito treba istaknuti da uz svaki grafikon
obavezno treba navesti odgovarajue oznake: naslov grafikona (najee: ''Razdioba'',
''Struktura'' itd.), nazive kategorija na koordinatnim osima (npr. godina, broj zaposlenika,
vrsta strune spreme itd.), legendu (dio grafikona koji dodatno pojanjava osobitosti
grafikona) itd. Bez spomenutih oznaka grafikon je nepotpun i ''neitljiv'', pa ni u kojemu
sluaju ne moe predstavljati dobar prikaz rezultata statistike analize.

Ukratko i uz odgovarajue primjere opisat emo najee predstavnike svake pojedine vrste
grafikona.

2.5.1. Povrinski grafikoni

Osnovna karakteristika ove vrste grafikona jest da se frekvencije podudaraju s povrinama
geometrijskih likova (pravokutnik, krug). Drugim rijeima, apsolutna (ili relativna)
frekvencija svakoga modaliteta jednaka je povrini tom modalitetu odgovarajuega
pravokutnika ili dijela kruga. Budui da je povrina pravokutnika jednaka umnoku njegove
duljine a i irine b, za irinu se najee uzima b = 1 jed., pa je u tom sluaju apsolutna
frekvencija identiki jednaka duljini pravokutnika. U sluaju strukturnoga kruga i prikaza
relativnih frekvencija povrina krunoga isjeka identiki je jednaka relativnoj frekvenciji
tom isjeku odgovarajuega modaliteta, a krug moe imati bilo koji polumjer (a ne nuno
polumjer r = 1 jed.). Krug kojega moemo zamiljati i kao kut od 360 dijelimo na krune
isjeke iji su sredinji kutovi 360 r
i
, gdje je r
i
relativna frekvencija i toga modaliteta
iskazana kao proporcija (tj. kao decimalan broj). Npr. relativnoj frekvenciji 33.3333%
odgovara sredinji kut 360 0,333333 = 120 itd.

Najei i praktino najvie koriteni tipovi povrinskih grafikona su razliite vrste stupaca
(jednostavni, poloeni, dvostruki, viestruki, strukturni), strukturni krug, Paretov dijagram i
histogram. O histogramu emo neto vie rei u posebnoj podtoki, a ovdje samo istaknimo
da se nabrojene vrste stupaca, te strukturni krug najee koriste za grafiki prikaz
kvalitativnih obiljeja.

Primjer 1. Primjer jednostavnih stupaca:


Poslovna statistika


Uoimo odmah da svi stupci imaju jednaku irinu i ta je irina jedinina (tj. b = 1 jed.). Stoga
je povrina svakoga pravokutnika identiki jednaka duljini pravokutnika, to znai da je i
apsolutna frekvencija svakoga od pet modaliteta identiki jednaka duljini pripadnoga
pravokutnika.
Iz zadanoga grafikona ne moemo oitati tone apsolutne frekvencije svakoga pojedinoga
modaliteta, ali moemo zakljuiti da je najvei broj promatranih studenata na ispitu ocijenjen
ocjenom 3, a najmanji broj promatranih studenata ocijenjen ocjenom 5.

Primjer 2. Primjer poloenih stupaca:


Poslovna statistika


Poloene stupce moemo shvatiti kao jednostavne stupce zarotirane za 90 ulijevo, pa potom
zrcaljene s obzirom na os modaliteta. (Na ovom naelu se konstruiraju poloeni stupci u MS
Excelu.) Oni imaju potpuno ista svojstva kao i jednostavni stupci, a koriste se najee kod
obiljeja s nomenklaturama.

Niti iz ovoga grafikona ne moemo ''oitati'' tonu apsolutnu frekvenciju svakoga pojedinoga
modaliteta (za dva modaliteta to moemo uiniti, ali za preostala tri ne), ali moemo zakljuiti
da je najvie promatranih studenata zavrilo ekonomsku kolu, a najmanje tehniku kolu.

Primjer 3. Primjer dvostrukih stupaca:

Uoimo da se ovdje zapravo radi o podjeli statistikoga skupa (svi dosadanji zastupnici u
Hrvatskom saboru) na 6 meusobno nedisjunktnih uzoraka (dio zastupnika je biran u barem
dva saziva Hrvatskoga sabora), pa je potom svaki od uzoraka podijeljen prema obiljeju spol.
U ovom je sluaju tuma (legenda) prikazana sa strane neizostavan dio grafikona jer bez nje
ne bismo mogli tono znati (ve samo prilino tono naslutiti) povrine kojih pravokutnika
oznaavaju apsolutne frekvencije modaliteta mukarci, a koji modaliteta ene.
45

Iz zadanoga grafikona, primjerice, moemo zakljuiti jedino da je u svim dosadanjim
sazivima Hrvatskoga sabora ukupan broj saborskih zastupnika bio znatno vei od ukupnoga

45
Strogo precizno, u legendi bi trebali pisati toni nazivi modaliteta obiljeja spol, tj. nazivi muki i enski. No,
ponekad se radi lake interpretacije grafikona ti modaliteti zamjenjuju imenicama mukarci i ene.


Poslovna statistika


broja saborskih zastupnica, ali ne moemo rei npr. za koliko posto vei, koliko puta vei itd.
Zbog toga su za daljnju analizu primjereniji strukturni stupci (vidjeti Primjer 6.)

Primjer 4. Primjer viestrukih stupaca:

Ovaj grafikon prikazuje podjelu istoga statistikoga skupa (svi zaposlenici tvrtke ''Ljubo
Jamio'' iz Mua na dan 10.03.2008.) prema trima razliitim obiljejima: stupnju strune
spreme, iznosu prosjene mjesene plae i navrenim godinama radnoga staa. Potonja dva
obiljeja su kvantitativna, te su grupirana u razrede s nominalnim granicama (neprikladno za
daljnju statistiku analizu, ali prikladno za grafiki prikaz). I ovdje je tuma sa strane nuan
kako bismo znali koja se boja odnosi na svaku kategoriju. Svi stupci imaju irinu jednaku 1,
pa je, kao i kod jednostavnih stupaca, duljina pravokutnika jednaka apsolutnoj frekvenciji.

Iz prikazanoga grafikona moemo izvui razne zakljuke, npr. da postoji 6 zaposlenika koji
imaju srednju strunu spremu, najvie 9 godina radnoga staa i prosjenu mjesenu plau
izmeu 3.000,00 i 4.999,00 kn, da od svih zaposlenika koji imaju visoku strunu spremu, te
izmeu 10 i 19 godina radnoga staa najvie njih ima plau izmeu 7.000,00 i 9.000,00 kn itd.
Za vjebu objasnite svaki prikazani stupac, te pokuajte izvui jo neke zakljuke iz ovoga
prikaza (npr. to sve moete rei o zaposlenicima koji imaju srednju strunu spremu, to o
zaposlenicima ija je plaa izmeu 5.000,00 i 6.999,00 kn itd.).

Primjer 5. Primjer strukturnoga kruga:


Poslovna statistika


Na ovom grafikonu povrina svakoga pojedinoga krunoga isjeka odgovara relativnoj
frekvenciji modaliteta kojega predstavlja taj isjeak. Kako je ve istaknuto, duljina polumjera
kruga moe biti bilo koji strogo pozitivan realan broj, a sredinji kutovi odgovarajuih
isjeaka dobiveni su mnoenjem broja 360 redom s brojevima 0.24, 0.16, 0.19, 0.13, 0.1 i
0.18, pa je tako povrina naranastoga krunoga isjeka jednaka 24% povrine cijeloga kruga,
povrina tamnoplavoga krunoga isjeka jednaka 16% povrine cijeloga kruga itd.
Napomenimo da neki programi (MS Excel) omoguuju dobivanje strukturnoga kruga na
osnovu jednostavne tablice s apsolutnim frekvencijama, pa se time izbjegava efektivno
raunanje relativnih frekvencija.

Iz navedenoga strukturnoga kruga moemo ''oitati'' da meu svim nastavnicima
Ekonomskoga fakulteta Sveuilita u Banovoj Jaruzi ima 16% mlaih asistenata, 24%
redovnih profesora itd. Za vjebu objasnite znaenje svake preostale relativne frekvencije.

Primjer 6. Primjer razdijeljenih stupaca (dobivenih iz odgovarajue tablice ''okomito 100''):


Poslovna statistika


irina svakoga stupca jednaka je 1 jed., a duljina 100 jed., pa je njegova povrina 100 kv. jed.
Ta je povrina jednostavnim raunom diobe podijeljena u omjeru relativnih frekvencija, pa se
za svaku pojedinu relativnu frekvenciju odreuje pripadni dio povrine pravokutnika. Pritom
poredak modaliteta nije bitan, tj. ako imamo ukupno n relativnih frekvencija, jedan
razdijeljeni stupac moemo ''nacrtati'' na n! = 1 2 n naina. Radi lake usporedbe, u
svakomu je razdijeljenom stupcu jednak redoslijed pojedinih modaliteta.


Poslovna statistika


Iz ovako prikazanih stupaca moemo izvui razne zakljuke, npr. da meu svim zaposlenim
enama u Republici Hrvatskoj u 2006. godini najvie (tonije, 55.9%) njih je sa srednjim
obrazovanjem, a najmanje (tonije, 21.8%) s osnovnim ili manjim obrazovanjem, da meu
svim nezaposlenim mukarcima u Republici Hrvatskoj u 2006. godini najvie (tonije, 62.7%)
njih je sa srednjim obrazovanjem, a najmanje (tonije, 6.4%) s viim ili visokim
obrazovanjem itd. Za vjebu, objasnite svaku pojedinu relativnu frekvenciju, pa iz
navedenoga grafikona pokuajte izvui jo neke zakljuke.

Primjer 7. Primjer poloenih razdijeljenih stupaca (dobivenih iz odgovarajue tablice
''vodoravno 100''):

Poloeni razdijeljeni stupci su vrlo prikladni za prikaz strukture statistikoga skupa pri podjeli
prema kvalitativnom obiljeju s nomenklaturom. Strogo formalno reeno, dobivaju se
rotiranjem ''obinih'' razdijeljenih stupaca za 90 ulijevo, pa zrcaljenjem s obzirom na os
modaliteta. irina svakoga pojedinoga pravokutnika jednaka je 1 jed., a duljina 100 jed., pa je
povrina svakoga pravokutnika 100 kv. jed., a dijelovi koji odgovaraju pojedinim relativnim
frekvencijama dobivaju se pomou dijeljenjem te povrine jednostavnim raunom diobe u
omjeru svih zadanih relativnih frekvencija.


Poslovna statistika


Ovakav se grafikon esto konstruira tako da se odabere jedan modalitet (u ovom je sluaju to
modalitet ene), te se njegove relativne frekvencije u svakoj pojedinoj kategoriji tablice
''vodoravno 100'' poredaju od najvee do najmanje. U tome se poretku slau i odgovarajui
stupci. Naravno, u sluajevima kad se u stupcima tablice ''vodoravno 100'' nalaze tono dva
modaliteta, takvo je slaganje stupaca ekvivalentno slaganju stupaca prema rastuem poretku
(od najmanje do najvee) relativnih frekvencija drugoga modaliteta. Odmah treba napomenuti
da se ovakva konstrukcija provodi iskljuivo radi lake mogunosti usporedbe relativnih
frekvencija istoga modaliteta u razliitim kategorijama, ali ni u kojemu sluaju ne predstavlja
pravilo prema kojemu treba slagati stupce.

Iz zadanoga grafikona mogu se izvui razni zakljuci, npr. da u privatnim kuanstvima sa
zaposlenim osobljem ima 14 puta vie zaposlenih ena nego mukaraca, meu svim
zaposlenicima u financijskom posredovanju njih 70% su ene itd. Za vjebu, objasnite
znaenje svake pojedine relativne frekvencije, te pokuajte izvui jo nekoliko zakljuaka iz
prikazanoga grafikona.

Primjer 8. Primjer Paretova
46
dijagrama:

46
Vilfredo Federico Damaso Pareto, francuski sociolog, ekonomist i filozof, porijeklom Talijan.


Poslovna statistika


Za crtanje Paretova dijagrama treba poredati apsolutne frekvencije modaliteta u silaznom
poretku, tj. od najvee do najmanje, te izraunati relativne frekvencije i formirati odgovarajui
kumulativni niz relativnih frekvencija. Formiranje toga niza potpuno je jednako formiranju
kumulativnoga niza ''manje od'', ali zbog kvalitativnoga obiljeja dan rijei ''manje od'' ovdje
treba izostaviti. Ovaj je dijagram svojevrsna ''kombinacija'' povrinskoga grafikona
(jednostavnih stupaca) i linijskoga grafikona (kojim se prikazuje kumulativni niz relativnih
frekvencija), a specifinost mu je to se na istom grafikonu primjenjuju dva tipa mjerila: prvo
mjerilo odnosi se na prikaz apsolutnih frekvencija jednostavnim stupcima, a drugo na prikaz
kumulativnih relativnih frekvencija. Istaknimo odmah da primjena dvaju ili vie tipova
mjerila na istom grafikonu u pravilu nije dozvoljena.

Iz Paretova je dijagrama vrlo lako odrediti mod
47
kvalitativnoga niza, odnosno modalitet koji
se najee pojavljuje u osnovnom skupu. To je jednostavno modalitet koji odgovara prvom
stupcu u Paretovu grafikonu, a lako je vidjeti i postoji li jo koji modalitet s istom apsolutnom
frekvencijom kao i prvi (prema naelima konstrukcije Paretova dijagrama, on se nuno mora
nalaziti neposredno iza prvoga modaliteta). U ovome je sluaju najei modalitet subota, pa
moemo zakljuiti da se najvie promatranih prometnih nesrea dogodilo subotom, te da se
najmanje promatranih prometnih nesrea dogodilo sredinom tjedna (tj. utorkom, srijedom ili
etvrtkom) Takoer, iz linijskoga grafikona kumulativnih relativnih frekvencija moemo
''oitati'' da se 30% svih promatranih prometnih nesrea dogodilo subotom, polovica svih
prometnih nesrea petkom ili subotom itd.

Istaknimo da se Paretov dijagram u MS Excelu vrlo lako moe dobiti primjenom procedure
Analiza podataka (Data Analysis), ali je nuan preduvjet za primjenu te procedure da
modaliteti obiljeja budu numeriki. Stoga, ukoliko je obiljeje kvalitativno, a modaliteti
iskazani rijeima, slovima itd., najprije treba provesti ''kodiranje'' modaliteta
48
(zamjenu rijei
brojevima), a nakon provedbe cijele procedure ''dekodirati'' brojeve, tj. vratiti originalne
modalitete.

2.5.2. Histogram

Histogram je posebna vrsta povrinskoga stupastoga grafikona koja se najee koristi za
prikaz modalitet kvantitativnih obiljeja grupiranih u razrede. Osnovna ideja konstruiranja
histograma je potpuno jednaka ideji izloenoj kod opisa stupastih grafikona navedenih u
toki 2.5.1.: apsolutne frekvencije modaliteta trebaju biti jednake povrini tom modalitetu

47
O modu e vie rijei biti u 3. poglavlju.
48
Usporediti s biljekom br. 13.


Poslovna statistika


odgovarajuega pravokutnika. Kod kvalitativnih i negrupiranih kvantitativnih obiljeja taj je
postupak bio relativno jednostavan: pretpostavili smo da su irine svih pravokutnika jednake 1
jed., pa je apsolutna frekvencija zbog toga bila jednaka duljini pravokutnika. No, kod
grupiranja kvantitativnih podataka u razrede cijela se pria malo komplicira. Radi
jednostavnosti, pretpostavit emo da histogramom elimo prikazati iskljuivo apsolutne
frekvencije jer za prikaz relativnih frekvencija obino koristimo strukturne stupce opisane u
prethodnoj toki.

Prvo emo opisati najlaki sluaj, a taj je kad su modaliteti kvantitativnoga obiljeja grupirani
u prave razrede jednakih irina. Oznaimo navedenu jednaku irinu s d. To znai da e irina
svakoga pravokutnika ija e povrina predstavljati apsolutnu frekvenciju razreda biti jednaka
d. Da bismo nacrtali pravokutnik, potreban nam je podatak o njegovoj duljini. Njegovu
duljinu a (za svaki pojedini razred) jednostavno dobijemo tako da apsolutnu frekvenciju
dotinoga razreda podijelimo brojem d. To ujedno znai da nam duljina pravokutnika a
openito vie nee biti jednaka apsolutnoj frekvenciji (osim u sluaju d = 1), nego d puta
manja od nje. Zbog toga budite oprezni: kod histograma duljina pravokutnika openito ne
mora biti jednaka apsolutnoj frekvenciji tom pravokutniku odgovarajuega razreda,
nego moe biti nekoliko puta vea ili manja od nje (ovisno o tome je li 0 < d < 1 ili d > 1).
Istaknimo da se duljina a izraunata na opisani nain naziva korigirana apsolutna frekvencija.
Primijetimo jo jednu vanu injenicu: budui da apsolutnu frekvenciju dijelimo strogo
pozitivnim realnim brojem, razred s najveom apsolutnom frekvencijom imat e najveu
korigiranu apsolutnu frekvenciju. Drugim rijeima, moemo usporeivati korigirane
apsolutne frekvencije pojedinih razreda (ali ne i ''oitavati'' apsolutne frekvencije) kako smo
to inili dosad s apsolutnim frekvencijama.

Malo sloeniji je sluaj kad su podaci grupirani u prave razrede razliitih irina. Tada za svaki
pojedini razred moramo izraunati odgovarajuu irinu i taj e strogo pozitivan realan broj
ujedno biti irina pripadnoga pravokutnika. Potom raunamo korigiranu apsolutnu frekvenciju
kao kolinik apsolutne frekvencije i upravo izraunate irine pravokutnika. Iako se naizgled
ini da je ovaj sluaj samo poopenje prethodnoga, to nije tako: naime, ovdje nema smisla
usporeivati korigirane apsolutne frekvencije jer pravokutnici nemaju jednaku irinu. Drugim
rijeima, ne vrijedi pravilo da najvea korigirana apsolutna frekvencija odgovara razredu koji
ima najveu apsolutnu frekvenciju. Stoga oprez: jedino to moemo napraviti jest
usporeivati povrine pravokutnika, a to ve zahtijeva tono ''oitanje'' duljina stranica
svakoga pravokutnika, to uz nedovoljno ''gusto'' mjerilo na koordinatnim osima ne mora biti
mogue izvesti.


Poslovna statistika


Najsloeniji je sluaj kad su podaci grupirani u nominalne razrede (to se openito dogaa
kod diskretnih obiljeja) ili ako je barem jedan od razreda otvoren. Da bismo dobili
histogram, nominalne razrede najprije moramo pretvoriti u prave
49
, definirati nedostajue
donje ili gornje granice, pa potom primijeniti postupak ili iz prvoga ili iz drugoga opisanoga
sluaja. Niti u ovom sluaju nema smisla usporeivati korigirane apsolutne frekvencije jer
pravokutnici openito ne moraju imati jednaku irinu.

U nastavku emo dati nekoliko primjera histograma dobivenih pomou MS Excela, te ukazati
na posebnosti izradbe histograma pomou ovoga programa.

Primjer 9. Primjer histograma (pravi razredi jednakih irina):

Pretpostavimo da smo brojeve bodova na 1. kolokviju iz kolegija Osnove raunovodstva
odranom 22.11.2007. koje su postigli studenti 1. godine strunoga studija raunovodstva i
financija Visoke kole za financijski menadment u Klokoevcu grupirali u sljedee razrede:

broj
bodova
broj
studenata
0-10 15
10-20 14
20-30 20
30-40 17
40-50 7

Odmah vidimo da svaki razred ima irinu 10, to znai da je rije o pravim razredima
jednakih irina. Izraunajmo korigirane apsolutne frekvencije podijelivi svaku pojedinu
apsolutnu frekvenciju s 10:
broj
bodova
korigirana
apsolutna
frekvencija
0-10 1,5
10-20 1,4
20-30 2
30-40 1,7
40-50 0,7

Tako histogram u ovom primjeru izgleda ovako:

49
Vidjeti Primjer 5. u toki 2.3.2.


Poslovna statistika


Uoimo odmah da natpis podataka na osi y nije Broj studenata (kao u sluaju jednostavnih
stupaca), nego Korigirana apsolutna frekvencija. Istaknimo jo jednom da je broj studenata,
odnosno apsolutna frekvencija pojedinoga razreda jednaka povrini tom razredu
odgovarajuega pravokutnika, pa nema nikakvoga smisla podatke na osi frekvencija nazvati
apsolutne frekvencije (to bi znailo da je 1.5 studenata na kolokviju ostvarilo najvie 10
bodova, to je besmisleno). Iako mjerilo na osi frekvencija nije dovoljno precizno za izraun
apsolutnih frekvencija svakoga pojedinoga razreda, ipak moemo zakljuiti da je najvie
studenata (njih ukupno 2 10 = 20) na kolokviju ostvarilo izmeu 20 i 30 bodova, a najmanje
studenata ostvarilo je izmeu 40 i 50 bodova, to se potpuno slae s podacima iz originalne
tablice.

Primjer 10. Primjer histograma (pravi razredi razliitih irina):

Pretpostavimo da smo brojeve bodova na 1. kolokviju iz kolegija Osnove informatike
odranom 03.12.2007. koje su postigli studenti 1. godine strunoga studija raunovodstva i
financija Visoke kole za financijski menadment u Klokoevcu grupirali u sljedee razrede:

broj bodova broj studenata
0-20 10
20-25 16
25-30 18
30-35 22
35-45 7


Poslovna statistika


Iako je rije o pravim razredima, oni nisu jednakih irina. irina prvoga razreda jednaka je 20,
irine triju srednjih razreda jednake su 5, dok je irina posljednjega razreda jednaka 10.
Raunamo korigirane apsolutne frekvencije:

broj
bodova
korigirana
apsolutna frekvencija
0-20 0.5
20-25 3.2
25-30 3.6
30-35 4.4
35-45 0.7

pa pripadni histogram izgleda ovako:

Uoimo odmah da usporedba korigiranih apsolutnih frekvencija ovdje navodi na pogrean
zakljuak da je najmanje studenata na kolokviju ostvarilo najvie 20 bodova. Zbog
nedovoljno preciznoga mjerila ovdje ne moemo tono oitati korigirane frekvencije, pa je
jedan od zakljuaka koji moemo izvesti na temelju ovoga grafikona npr. da je meu svim
studentima koji su na kolokviju postigli izmeu 20 i 35 bodova najvie onih koji su postigli
izmeu 30 i 35 bodova. (Usporeivali smo razrede istih irina za koje vrijedi pravilo da razred
s najveom apsolutnom frekvencijom ima najveu korigiranu frekvenciju.)

Primjer 11. Primjer histograma (pravi razredi razliitih irina):


Poslovna statistika


Iz sljedeega histograma

usporedbom korigiranih apsolutnih frekvencija zakljuujemo da je najvie promatranih
studenata na kolokviju ostvarilo izmeu 30 i 35 bodova, a najmanje studenata izmeu 50 i 80
bodova. injenino stanje, meutim, potpuno je drugaije jer je gornji histogram dobiven iz
sljedee tablice:

broj bodova broj studenata
0-20 24
20-30 11
30-35 9
35-50 16
50-80 30

Iako se ovdje prirodno namee zakljuak da je uvijek najbolje grupirati podatke u razrede
jednakih irina jer je tada usporedba najlaka, takav pristup openito nije uvijek primjeren, a
naroito ne u sluaju izrazito asimetrinih razdioba. Detalje ovdje izostavljamo.

Primjer 12. Primjer histograma (nepravi razredi razliitih irina):


Poslovna statistika


Zadana je razdioba rastavljenih brakova prema navrenim godinama ivota supruge u
Kraljevini Dajdamda 2006. godine:

navrene
godine ivota
do 23 24 32 33 - 39 40 - 44 45 - 49 50 - 59 60 i vie
broj brakova 107 374 475 456 372 212 182
izvor: Statistiki ljetopis Kraljevine Dajdamda za 2006. godinu

Odmah uoimo da su prvi i posljednji razred otvoreni, tj. prvi razred nema definiranu donju, a
posljednji razred gornju granicu. Procjena tih granica ovisi o svakom sluaju posebno. Ovdje
emo pretpostaviti da je donja granica prvoga razreda 16, a gornja granica posljednjega
razreda 80 godina. Tako dobivamo tablicu:

navrene
godine ivota
16 - 23 24 - 32 33 39 40 - 44 45 - 49 50 - 59 60 80
broj brakova 107 374 475 456 372 212 182

Razmaci izmeu donje granice svakoga razreda (osim prvoga) i gornje granice tom razredu
neposredno prethodnoga razreda su jednaki i iznose 1. Stoga nominalne granice pretvaramo u
prave tako da svaku donju granicu smanjimo za polovicu razmaka, tj. za 0.5, a svaku gornju
uveamo za polovicu razmaka (opet za 0.5). Tako dobivamo sljedeu tablicu:

godine ivota 15.5 23.5 23.5 32.5 32.5 39.5 39.5 44.5 44.5 49.5 49.5 59.5 59.5 80.5
broj brakova 107 374 475 456 372 212 182

Dalje postupamo kao i u prethodnom primjeru. Razredi nemaju jednake irine, pa je potrebno
izraunati korigirane apsolutne frekvencije za svaki pojedini razred. Dobivamo:

godine ivota 15.5 23.5 23.5 32.5 32.5 39.5 39.5 44.5 44.5 49.5 49.5 59.5 59.5 80.5
korigirana apsolutna
frekvencija
13.375 41.555556 67.85714 91.2 74.4 21.2 8.666666667

pa je odgovarajui histogram


Poslovna statistika


Primijetimo ponovno da razred s najveom/najmanjom apsolutnom frekvencijom nema
najveu/najmanju korigiranu apsolutnu frekvenciju, pa bismo samo na temelju grafikona
mogli donijeti pogrean zakljuak o najeoj dobi supruge. Za vjebu navedite najmanje
jedan toan zakljuak koji moemo izvesti na temelju gornjega grafikona.

2.5.3. Linijski grafikoni

Linijski grafikoni pripadaju u tipove grafikona naroito pogodne za grafiki prikaz
vremenskih nizova, poligona frekvencija i kumulante odreene razdiobe (najee prema
nekom kvantitativnom obiljeju), te za usporedbu najmanje dvaju nizova kvantitativnih
podataka. Po jednim primjerom ilustrirat emo svaku pojedinu podvrstu linijskih grafikona.

Primjer 13. Primjer linijskoga grafikona grafiki prikaz vremenskoga niza
50

50
Osnovama analize vremenskih nizova detaljnije emo se baviti kasnije.


Poslovna statistika


Srednji devizni teaj eura Hrvatske narodne banke u 2007. godini (stanje potkraj mjeseca)

Meusobno spojene su toke A = (sijeanj, 7.3734) i B = (veljaa, 7.345292), B = (veljaa,
7.345292) i C = (oujak, 7.382466) itd. Iz grafikona moemo zakljuiti da je najnii srednji
devizni teaj eura bio potkraj mjeseca rujna, a najvii potkraj mjeseca oujka, te da je tijekom
godine srednji devizni teaj pokazivao tendenciju rasta u razdobljima veljaa oujak, srpanj
kolovoz, rujan listopad i studeni prosinac, dok je u ostalim vremenskim razdobljima
teaj pokazivao tendenciju pada.

Primjer 14. Primjer linijskoga grafikona usporedba dvaju vremenskih nizova

Na sljedeem grafikonu prikazana je grafika usporedba srednjih deviznih teajeva dviju
inozemnih valuta (euro i ameriki dolar) Hrvatske narodne banke tijekom 2007. godine
(stanje potkraj razdoblja). Radi lake usporedbe vrijednosti za pojedini mjesec, odgovarajue
su toke spojene okomitom spojnicom. Iz grafikona zakljuujemo da je teaj amerikoga
dolara gotovo tijekom cijele godine pokazivao tendenciju pada i bio bitno nestabilniji od
teaja eura.
51

51
Nestabilnost teaja dolara u odnosu na teaj eura bila bi jo izraenija kad bi se mjerilo na okomitoj osi
sljedeega grafikona podudaralo s mjerilom na okomitoj osi gornjega grafikona.


Poslovna statistika


Poseban primjer linijskoga grafikona je poligon
52
frekvencija. Rije je o linijskom grafikonu
namijenjenu grafikom prikazu razdiobe razliitih vrsta frekvencija (dakle, rije je o linijskom
analogonu histograma). Ukoliko modaliteti kvantitativnoga obiljeja nisu grupirani u razrede,
poligon frekvencija dobiva se spajanjem toaka koje predstavljaju ureeni par modaliteta i
njegove apsolutne frekvencije. Ukoliko su ti modaliteti grupirani u razrede, poligon
frekvencija dobiva se tako da se, sukladno redoslijedu razreda na osi apscisa, spoje toke koje
predstavljaju ureeni par razredne sredine i apsolutne ili korigirane apsolutne frekvencije
dotinoga razreda. Oblik poligona frekvencija ukazuje na nain rasporeda podataka, a razlike
ordinata (tj. drugih koordinata) toaka o razlikama frekventiranosti oblika obiljeja.

Primjer 15. Primjer poligona frekvencija (kvantitativno obiljeje s negrupiranim
modalitetima)

52
Prema strogoj matematikoj definiciji, poligon frekvencija je zapravo otvorena poligonalna crta. Da bi se
dobio zatvoreni poligon, treba spojiti prvu i posljednju ucrtanu toku. Iako matematiki netoan, naziv poligon
(mnogokut) zadrao se kao dio uobiajenoga statistikoga nazivlja.


Poslovna statistika


Prikazani grafikon predstavlja svojevrstan linijski analogon jednostavnih (ili poloenih)
stupaca. Budui da ne moemo tono oitati apsolutnu frekvenciju svakoga modaliteta,
moemo zakljuiti npr. da najvie obitelji ima dvoje djece, a najmanje obitelji ima sedmero
djece. Razlike u frekventiranosti nisu odve znaajne jer krivulja nije zamjetno ''izboena''.

Primjer 16. Primjer poligona frekvencija (kvantitativno obiljeje s modalitetima grupiranim u
razrede s nominalnim granicama)


Poslovna statistika


Na gornjoj su slici prikazana dva poligona relativnih frekvencija koja predouju stope
aktivnosti pojedinih dobnih razreda, i to posebno za ene, a posebno za mukarce. Ovaj je
grafikon zapravo svojerstan linijski analogon strukturnih stupaca. Iz njega, primjerice,
moemo oitati da za oba spola nominalni razred [30, 34] ima najveu stopu aktivnosti (tj.
postotni udio radne snage u odnosu na radno sposobno stanovnitvo je najvei za promatrani
razred), a otvoreni razred [65, + najmanju stopu aktivnosti. Pokuajte navesti jo neke
zakljuke koji se mogu izvesti iz navedenoga grafikona.

Primjer 17. Primjer poligona frekvencija (kvantitativno obiljeje iji su modaliteti grupirani
u prave razrede)

Razredi u koje su grupirani iznosi prosjene mjesene plae su 1000, 2000], 2000, 3000],
3000, 4000] itd., a odgovarajue razredne sredine su 1500, 2500, 3500 itd. Da se (zajedno osi
apscisa) dobije zatvorena poligonalna crta, ''umjetno'' su dodani razredi 0, 1000] i 10000,
11000] ija je apsolutna frekvencija 0. Moemo zakljuiti da najvie zaposlenika promatrane
tvrtke ima plau izmeu 1.000,00 i 2.000,00 kn, a najmanje izmeu 9.000,00 i 10.000,00 kn.
Uoimo da bi najprimjereniji povrinski analogon prikazanoga linijskoga grafikona bio
Paretov dijagram (apsolutne frekvencije su poredane od najvee do najmanje) iako bi se
promatrana razdioba mogla prikazati i histogramom.

Kumulativni niz apsolutnih (ili relativnih) frekvencija ''manje od'' uobiajeno se grafiki
prikazuje linijskim grafikonom tzv. kumulantom. Praktino crtanje kumulante u pravokutnom
koordinatnom sustavu u ravnini ovisi o tipu obiljeja (diskretno ili kontinuirano), a mi emo
ga ilustrirati na razdiobi iz Primjera 16.


Poslovna statistika


Primjer 18. Primjer kumulante (kvantitativno obiljeje iji su modaliteti grupirani u prave
razrede)

Kumulanta se crta tako da se donjoj granici prvoga razreda (u naem je sluaju to 1000)
pridrui frekvencija 0 (na taj smo nain dobili toku (1000, 0)). Potom se svakoj od gornjih
granica razreda (to su 2000, 3000, 4000, , 10000) pridrui odgovarajua kumulativna
apsolutna frekvencija ''manje od'', te se sve tako dobivene toke spoje glatkom
53
krivuljom.
Napomenimo da se, iako teorijski ima smisla, kumulanta niza ''vee od'' u praksi vrlo rijetko
koristi, pa je iz tih razloga ovdje i ne navodimo.

2.5.4. Ostale vrste grafikona

Budui da emo se u ovom kolegiju susretati iskljuivo s povrinskim i linijskim grafikonima,
ostale vrste grafikona dajemo samo pregledno bez detaljnijih opisa i analiza.

Primjer 19. Primjer tokastoga grafikona dijagram toaka (razdioba statistikoga skupa
prema jednom obiljeju)

53
U matematici se pod pojmom glatka krivulja podrazumijeva graf bilo koje neprekidno diferencijabilne
funkcije. Grubo govorei, rije je o grafu koji ne sadri niti jedan ''iljak''. Primjer grafa koji sadri ''iljke'' je
bilo koji poligon frekvencija.


Poslovna statistika


Iznad svakoga pojedinoga modaliteta broj toaka oznaava odgovarajuu apsolutnu
frekvenciju. Ovdje prikazani dijagram toaka oznaava razdiobu rezultata ukupno 50
sluajnih pokusa
54
izbor jedne dekadske znamenke, a iz njega je lako oitati mod dobivenoga
statistikoga niza, tj. najeu znamenku koja se pojavila kao rezultat sluajnoga pokusa. U
promatranom sluaju imamo dvije takve znamenke: 7 i 9.
55

Primjer 20. Primjer tokastoga grafikona dijagram toaka (razdioba statistikoga skupa
prema trima obiljejima)

54
Sluajni pokus je jedan od osnovnih pojmova teorije vjerojatnosti, a time i matematike statistike.
55
Razdiobu u kojoj imamo tono dvije najee vrijednosti nazivamo bimodalna razdioba. Iako ovaj primjer to
ne daje naslutiti, zakon velikih brojeva (jedan od najznaajnijih pouaka teorije vjerojatnosti) tvrdi da e u
sluaju vrlo velikoga broja provedenih sluajnih pokusa (pod istim uvjetima) dobivene apsolutne frekvencije
znamenaka biti priblino jednake, tj. u dobivenom statistikom nizu svaka od znamenaka pojavit e se
(priblino) jednako esto.


Poslovna statistika


Na istom grafikonu prikazana je podjela svog radno aktivnog stanovnitva odreene regije
prema trima obiljejima: vrsta posla kojim se bave, prosjena plaa i prosjean broj tjednih
radnih sati. Uoimo da dva kvantitativna obiljeja nemaju istu mjernu jedinicu, no, ta se
injenica kod tokastih grafikona moe zanemariti (kod povrinskih i linijskih se ta injenica
ne smije zanemariti). Iz prikazanoga grafikona se moe zakljuiti da su menaderi najbolje
plaeni, ali i da najvie rade, dok su teaci najslabije plaeni za svoj rad unato veem broju
tjednih radnih sati. Takoer, moe se zakljuiti da je varijabilitet prosjenih plaa manji od
varijabiliteta prosjenih tjednih radnih sati, tj. promatrano stanovnitvo se vie razlikuje
prema tjednom radnom vremenu, nego prema prosjenim plaama.
56

Primjer 21. Primjer tokastoga grafikona dijagram rasipanja (dijagram rasprenja, oblak
rasprenja)

56
Navedena usporedba varijabiliteta obino se utvruje na temelju koeficijenata varijacije o kojima emo vie
rei u 4. poglavlju.


Poslovna statistika


O dijagramu rasipanja vie emo govoriti u poglavlju 4. Ovdje istaknimo samo da se ovakva
vrsta grafikona uobiajeno koristi prigodom utvrivanja korelacije dvaju kvantitativnih
obiljeja, tj. prigodom ispitivanja postoji li statistiki znaajna veza meu promatranim
kvantitativnim obiljejima (definiranih na istom statistikom skupu, odnosno uzorku toga
skupa). Toke se ne spajaju nikakvim krivuljama, nego se iz njihova poloaja i oblika
toastoga grafikona nastoje izvui zakljuci o jaini i smjeru veze meu promatranim
obiljejima. Ovdje se ve na prvi pogled zbog ''rasprenosti'' toaka po grafikonu moe
naslutiti da na promatranom uzorku ne postoji statistiki znaajna veza izmeu iznosa
mjesenoga deparca uenika i njihove tjelesne mase.

Primjer 22. Primjer dijagrama toaka struktura sadanjega saziva Hrvatskoga sabora

Primjer 23. Primjer kartograma
57
statistika karta

57
Najpoznatiji tipovi kartograma su piktogram i statistika karta, no, oni se koriste iskljuivo u zemljopisu za
grafiki prikaz nominalnih prostornih obiljeja, pa detalje ovdje izostavljamo.


Poslovna statistika


3. OSNOVNE KARAKTERISTIKE
NUMERIKIH NIZOVA

3.1. Srednje vrijednosti numerikih nizova

U praksi se vrlo esto javlja problem kvalitetnoga reprezentiranja velikih nizova podataka
kvalitativnih ili kvantitativnih obiljeja vezanih za relativno velike statistike skupove (npr.
cjelokupno stanovnitvo nekoga grada/upanije/drave). I dok je u sluaju kvalitativnih
obiljeja najbolji mogui rezultat tablini ili grafiki prikaz podataka, za kvantitativna se
obiljeja uvode posebni numeriki pokazatelji, i to su tzv. srednje vrijednosti.

Srednja vrijednost
58
je openito neka realna konstanta iji je cilj na to reprezentativniji nain
predoiti niz varijabilnih podataka numerikog niza. U pravilu je rije o vrijednosti oko koje
se ''gomila'' veina podataka numerikog niza, pa se zato naziva i mjera sredinje (centralne)
tendencije. to je vie podataka ''nagomilano'' oko pojedine srednje vrijednosti, njezina e
reprezentativnost biti bolja.

58
U svakodnevnom se ivotu pojam srednje vrijednosti vrlo esto pogreno zamjenjuje s pojmom prosjeka,
odnosno prosjene vrijednosti. Pod pojmom prosjek zapravo se podrazumijeva aritmetika sredina.


Poslovna statistika


Osnovne vrste srednjih vrijednosti su aritmetika sredina, geometrijska sredina, harmonijska
sredina, medijan i mod. Vrlo je vano istaknuti da je primjena svake pojedine vrste srednje
vrijednosti odreena karakterom (svojstvima) promatranoga kvantitativnoga obiljeja, pa ne
postoji ''univerzalna'' srednja vrijednost koja e dovoljno reprezentativno opisati bilo koji
numeriki niz podataka. U praksi se ovo pravilo esto vrlo neopravdano zanemaruje, pa se za
spomenutu ''univerzalnu'' srednju vrijednost, zbog relativno jednostavnoga naina izrauna,
uzima aritmetika sredina. Takav je pristup potpuno pogrean jer, kako emo vidjeti, postoje
brojni primjeri numerikih nizova takvi da aritmetika sredina nije dovoljno dobar
reprezentant svakoga od tih nizova.
59

U izraunu pojedine srednje vrijednosti mogu se pojaviti svi lanovi numerikoga niza ili
samo dio tih lanova. Sukladno tome, srednje vrijednosti dijelimo na potpune i poloajne
srednje vrijednosti.

U potpune srednje vrijednosti ubrajamo aritmetiku sredinu, geometrijsku sredinu i
harmonijsku sredinu. U izraunu tih vrijednosti koriste se svi elementi numerikoga niza. U
poloajne srednje vrijednosti ubrajamo medijan i mod. Njihova je vrijednost odreena
poloajem unutar numerikog niza, pa u njihovu izraunu ne sudjeluju svi elementi
numerikoga niza.

Zakljuno uvodno istaknimo da svaku od navedenih srednjih vrijednosti moemo raunati iz
negrupiranih (''sirovih'') i grupiranih podataka. Zajednika karakteristika svih takvih izrauna
jest da su vrijednosti dobivene izraunom iz grupiranih podataka nepreciznije od vrijednosti
dobivenih izraunom iz negrupiranih podataka, naroito ako su podaci grupirani u razrede
relativno velikih irina.

3.1.1. Aritmetika sredina

Aritmetika sredina (oznake: , X x , E(x)) je najrairenija i najee koritena srednja
vrijednost, a prilino je upitno proglaavati je i najvanijom srednjom vrijednou.
Definiramo li total kao zbroj svih elemenata konanoga
60
numerikoga niza, onda se
aritmetika sredina definira kao jednaki dio totala po jednom elementu niza. To praktino

59
Jedan tipian primjer takvoga niza je niz mjesenih plaa svih zaposlenika na (ne)odreeno vrijeme u naoj
zemlji.
60
Ovdje namjerno naglaavamo rije konaan jer se u matematici niz (u bilo kojem skupu S) definira kao
funkcija sa skupa prirodnih brojeva N u skup S. Sukladno tome, niz moe biti konaan (ako je prirodno podruje
definicije odgovarajue funkcije konaan podskup skupa N) i beskonaan (ako je prirodno podruje definicije
odgovarajue funkcije cijeli skup N). U deskriptivnoj se statistici promatraju iskljuivo konani nizovi, dok se
beskonani nizovi promatraju u matematikoj statistici.


Poslovna statistika


znai da se aritmetika sredina dobije tako da se total podijeli s ukupnim brojem elemenata
numerikoga niza.

Postoji nekoliko razliitih vrsta aritmetikih sredina. Najpoznatija i najrairenija je
jednostavna aritmetika sredina. Za njezino je izraunavanje potrebno zadati konaan niz
negrupiranih numerikih podataka x
1
, x
2
, , x
n
. Tada se jednostavna aritmetika sredina
rauna pomou formule:

1 2 i 1
...
n
i
n
x
x x x
X
n n
=
+ + +
= =
.

Primjer 1. Zadan je numeriki niz Smiljkovih mjesenih netoplaa (iskazanih u kn) u
proloj (2007.) godini:

1.810,25; 1.810,25; 1.810.25; 1.850,5; 1.850,5; 1.850,5; 1.862,4; 1.862,4; 1.862,4; 1.875,8;
1.875,8; 1.875,8

Izraunajmo Smiljkovu prosjenu mjesenu neto-plau u proloj godini:

1.810, 25 +1.810, 25 + 1.810.25 + 1.850, 5 + 1.850, 5 + 1.850, 5 + 1.862, 4 + 1.862, 4 + 1.862, 4
12
1.875, 8 + 1.875, 8 + 1.875, 8
1.849, 7375 1.849, 74
12
X = +
+ =

Dakle, Smiljkova prosjena mjesena netoplaa u proloj (2007.) godini iznosi priblino
1.849,74 kn. Uporabljujui ovakvu reenicu mi niz od ukupno 12 numerikih vrijednosti
zamjenjujemo jednom jedinom vrijednou: 1.849,74 kn. Stoga se prirodno postavlja pitanje
''uspjenosti'' takve zamjene, odnosno, preciznije, opisuje li dobivena vrijednost dovoljno
dobro niz podataka kojega zamjenjuje. Odgovor emo moi djelomino dati nakon
iskazivanja opih svojstava bilo koje aritmetike sredine, a potpuno nakon definiranja mjera
rasprenja (disperzije) u sljedeem poglavlju.

Ukoliko se aritmetika sredina rauna iz grupiranih podataka, govorimo o vaganoj ili
ponderiranoj aritmetikoj sredini. Pri izraunu vagane aritmetike sredine razlikujemo
sluajeve kad modaliteti kvantitativnoga obiljeja nisu grupirani u razrede i kad su modaliteti
kvantitativnoga obiljeja grupirani u razrede.
U prvom sluaju zapravo se radi o ''skrivenoj'' jednostavnoj aritmetikoj sredini jer grupiranje
podataka iskljuivo prema modalitetima nije nita drugo nego ''skraeni'' (tablini) zapis


Poslovna statistika


numerikoga niza. Formalno, ako su x
1
, x
2
, , x
k
meusobno razliiti modaliteti
kvantitativnoga obiljeja, a f
1
, f
2
, , f
k
njima odgovarajue apsolutne frekvencije, onda se
vagana aritmetika sredina rauna pomou izraza

1 1 2 2 1
1 2
1
...
...
k
i i
k k i
k
k
i
i
f x
f x f x f x
X
f f f
f
=
=
+ + +
= =
+ + +

esto se kae da u izrazima ovoga oblika apsolutne frekvencije imaju ulogu pondera ili teine
pojedinoga modaliteta, pa otuda i naziv odgovarajue aritmetike sredine.

Primjer 2. Zadana je razdioba svih studenata 1. godine studija smjehologije na Vioj
uzaludnoj koli u pikovini (akademska godina 2007/2008.) prema broju poloenih
jednosemestralnih kolegija:

broj poloenih jednosemestralnih kolegija broj studenata
0 7
1 12
2 17
3 25
4 21
5 18
ukupno: 100
izvor: studentska sluba Vie uzaludne kole u pikovini

Navedena tablica zapravo zamjenjuje niz od 100 numerikih podataka koji se sastoji od 7
nula, 12 jedinica, 17 dvojki, 25 trojki, 21 etvorke i 18 petica. Budui da nam je bitno lake
umjesto ukupno 99 operacija zbrajanja izvriti 6 operacija mnoenja i 4 operacije zbrajanja,
prosjean broj poloenih jednosemestralnih ispita raunamo kao vaganu aritmetiku sredinu:

6
1
6
1
7 0 12 1 17 2 25 3 21 4 18 5 295
2.95
100 100
i i
i
i
i
f x
X
f
=
=
+ + + + +
= = = =
.


Poslovna statistika


Dobiveni rezultat obino interpretiramo ovako: Prosjean broj poloenih jednosemestralnih
kolegija po jednom studentu priblino iznosi 3.
61
Ovdje treba pripaziti i na red rijei u
reenici: prilog prosjeno uvijek dolazi neposredno ispred veliine na koju se odnosi. Stoga je
pogreno rei: Svi promatrani studenti prosjeno su poloili 3 jednosemestralna kolegija ili
Prosjean promatrani student poloio je 3 jednosemestralna kolegija jer sintagma prosjeno
poloiti obino znai poloiti s ocjenom dobar(3), a sintagma prosjean student obino znai
student iji je prosjek ocjena priblino 3,00. Odmah primijetimo da je tono 3
jednosemestralna kolegija uistinu poloilo tono 25 studenata, a ne svih 100, pa je u ovakvim
sluajevima nuno izraunati dodatne pokazatelje reprezentativnosti aritmetike sredine.

Zadatak 1. a) Definirajte statistiki skup iz prethodnoga primjera pojmovno, prostorno i
vremenski, pa odredite njegov opseg i odgovarajui osnovni skup.

b) Prema kojemu je obiljeju podijeljen zadani statistiki skup? U koju grupu obiljeja
pripada i uz koju je skalu izraavanja modaliteta vezano to obiljeje? Objasnite svoje
odgovore.

Aritmetika sredina moe se raunati i ukoliko su, umjesto, apsolutnih zadane odgovarajue
(''obine'') relativne frekvencije. Radi jednostavnosti, pretpostavimo da su relativne
frekvencije iskazane u postotcima. Formalno, ako su x
1
, x
2
, , x
k
meusobno razliiti
modaliteti kvantitativnoga obiljeja, a p
1
, p
2
, , p
k
njima odgovarajue relativne frekvencije
iskazane u postotcima
62
, onda se vagana aritmetika sredina rauna pomou izraza

1 1 2 2
1
...
k
k k i i
i
X p x p x p x p x
=
= + + + =
.
63

Ilustrirajmo primjenu ove formule na sljedeem primjeru.

Primjer 3. Podaci o broju djece u svakoj obitelji iz mjesta Svinjarevci u veljai 2008. godine
obraeni su i grafiki prikazani strukturnim krugom.

61
Strogo formalna interpretacija, sukladno definiciji aritmetike sredine, glasi: Svaki od promatranih studenata
poloio je prosjeno 3 jednosemestralna kolegija. No, u interpretacijama se obino primjenjuje zamjena izraza
''svaki element nekoga skupa X ima svojstvo S'' izrazom ''svi elementi skupa X imaju svojstvo S''.
62
Relativne frekvencije p
1
, , p
k
ovdje su razlomci s nazivnikom 100, ali mogu biti iskazane i kao proporcije
(decimalni zapisi omjera apsolutne frekvencije modaliteta i totala).
63
itatelji upoznati s osnovama diskretne teorije vjerojatnosti odmah e uoiti da je navedeni izraz zapravo
definicija matematikoga oekivanja diskretne sluajne varijable koja poprima vrijednosti x
1
, x
2
, , x
n
.


Poslovna statistika


Na temelju navedenih podataka moemo izraunati prosjean broj djece po jednoj obitelji iz
promatranoga mjesta:

7
1
16 0 18 1 28 2 23 3 9 4 4 5 2 6 211
2.11
100 100 100
i i
i
p x
X
=
+ + + + + +
= = = =

Dobiveni rezultat moemo objasniti ovako: Prosjean broj djece po jednoj (promatranoj)
obitelji jednak je 2. Opet treba pripaziti i na red rijei u reenici jer je pogreno rei npr.
Prosjena (promatrana) obitelj ima dvoje djece (kako to esto ine u javnim medijima!).

Zadatak 2. a) Definirajte statistiki skup u prethodnom primjeru pojmovno, prostorno i
vremenski, pa odredite pripadni osnovni skup.

odgovore.

Spomenimo jo da vagana aritmetika sredina dobivena iz relativnih frekvencija teorijski
mora biti identiki jednaka jednostavnoj aritmetikoj sredini, ali da praktino dolazi do vie-
manje znaajnih odstupanja nastalih uslijed priblinih izrauna relativnih frekvencija. to je
priblini izraun relativnih frekvencija toniji, spomenuto odstupanje bit e manje, pa se u


Poslovna statistika


ovakvim sluajevima preporuuje izraunavati relativne frekvencije na najmanje 5 decimalnih
mjesta.

U sluajevima poput netom razmotrenih, dakle, jednostavna aritmetika sredina identiki
mora biti jednaka vaganoj aritmetikoj sredini. No, ukoliko podatke grupiramo u razrede,
dolazi do razlika koje, u pravilu, ovise o veliini (irini) pojedinih razreda, a ne o ukupnom
broju razreda. Objasnimo nastajanje tih razlika na konkretnom primjeru.

Primjer 4. Zadana je razdioba svih nezaposlenih dravljana Republike Ljenarije u veljai
2008. godine prema dobi

navrene godine starosti broj nezaposlenih [000]
15 24 25.2
25 49 75.8
50 64 19.2
65 0.6
izvor: mjeseno statistiko izvjee Dravnoga zavoda za statistiku Republike Ljenarije, oujak 2008.

Da bismo mogli izraunati aritmetiku sredinu i u ovom sluaju, zadane nominalne granice
razreda trebamo pretvoriti u prave, te procijeniti gornju granicu posljednjega (otvorenoga)
razreda. Procijenit emo da spomenuta gornja granica jednaka 70. U sluaju obiljeja
navrene godine starosti prave granice se dobiju izjednaavanjem gornje granice prethodnoga
razreda s donjom granicom tekuega razreda :

15 25 25.2
25 50 75.8
50 65 19.2
65 (70) 0.6

Prigodom raunanja aritmetike sredine iz podataka grupiranih u prave razrede, ulogu
ponder (tein) i dalje imaju apsolutne frekvencije, ali ''uloge'' modaliteta x
1
, x
2
, , x
k

preuzimaju razredne sredine. Tonije, za svaki pojedini razred trebamo izraunati njegovu
razredu sredinu, pa dobivenoj vrijednosti kao ponder pridruiti odgovarajujuu apsolutnu
frekvenciju. Upravo na ovom mjestu nastaju spomenute razlike izmeu jednostavne i vagane
aritmetike sredine: razliite podatke grupirane u isti razred zamjenjujemo istim podatkom, tj.
razrednom sredinom. Konkretno, razredna sredina prvoga razreda je

1
15 25
20
2
s
+
= = ,


Poslovna statistika


pa u daljnjem izraunu niz od 25 200 podataka iz prvoga razreda meu kojima sigurno ima
meusobno razliitih (jer inae grupiranje u razrede nema smisla) zamjenjujemo nizom od
25 200 meusobno jednakih podataka i svaki od tih novih podataka jednak je razrednoj
sredini prvoga razreda, tj. 20. Budui da takvu zamjenu ne provodimo kod izrauna
jednostavne aritmetike sredine, nego pri njezinu izraunu rabimo originalne podatke, vagana
aritmetika sredina izraunata iz podataka grupiranih u razrede je u pravilu loiji reprezentant
promatranoga statistikoga skupa od jednostavne aritmetike sredine.
64

Izraunom razrednih sredina dobivamo:

navrene godine starosti razredna sredina broj nezaposlenih [000]
15 25 20 25.2
25 50 37.5 75.8
50 65 57.5 19.2
65 (70) 67.5 0.6

pa je vagana aritmetika sredina izraunata iz podataka grupiranih u razrede
65
:

4
1
4
1
25.2 20 75.8 37.5 19.2 57.5 0.6 67.5 4491
37.177
25.2 75.8 19.2 0.6 120.8
i i
i
i
i
f s
X
f
=
=
+ + +
= = =
+ + +

Dobiveni rezultat moemo interpretirati ovako: Procijenjeni prosjek navrenih godina starosti
promatranih dravljana priblino je jednak 37 (pogreno je rei npr. Prosjean nezaposleni
dravljanin Republike Ljenarije ima navrenih 37 godina ili neku slinu ''mudroliju''). Ovdje
obavezno moramo navesti rije procijenjena jer smo navedeni rezultat dobili koristei
procjenu gornje granice posljednjega razreda, te zamijenivi originalne podatke razrednim
sredinama (u svakom od tih sluajeva smo napravili odreenu pogreku, pa ne moemo
govoriti o stvarnoj, nego iskljuivo o procijenjenoj aritmetikoj sredini).

64
Iznimka''koja potvruje pravilo'' su nizovi podataka s ekstremno velikim ili ekstremno malim vrijednostima.
Grupiranjem takvih nizova u razrede i zamjenom originalnih podataka razrednom sredinom mogue je znatno
smanjiti razliku izmeu pojedinih ekstremno velikih vrijednosti i ostalih vrijednosti skupa, a time i donekle
poboljati reprezentativnost aritmetike sredine.
65
Prigodom izrauna aritmetike sredine ''mjernu jedinicu'' apsolutnih frekvencija (000) moemo zanemariti, tj.
ne moramo raunati s tisuama. Razlog tome je to se ista jedinica pojavljuje i u brojniku i u nazivniku
odgovarajuega razlomka, pa prigodom dijeljenja dolazi do njezinoga kraenja.


Poslovna statistika


odgovore.
c) U koliko su razreda podijeljeni dobiveni podaci? Za svaki od njih odredite donju granicu,
gornju granicu i veliinu.

Za izraunavanje aritmetike sredine iz grupiranih podataka, umjesto apsolutnih, moemo
koristiti i relativne frekvencije. Radi jednostavnosti pretpostavit emo da su relativne
frekvencije ve iskazane u postotcima. U takvom sluaju razredne sredine imaju ulogu
modaliteta, a relativne frekvencije ulogu pondera (teina). Njihov je zbroj jednak 100, pa e
se u nazivniku odgovarajuega razlomka nai broj 100. Ilustrirajmo to primjerom.

Primjer 5. Zadana je struktura ena ovisnica o drogama lijeenih u zdravstvenim
ustanovama u Republici Hrvatskoj tijekom 2005. godine prema navrenim godinama starosti:

navrene godine starosti struktura [%]
14 0.5
15 19 12.1
20 24 27.0
25 29 25.8
30 34 14.4
35 39 18.0
40
2.2
ukupno: 100
izvor: ''ene i mukarci u Republici Hrvatskoj u 2007. godini, Dravni zavod za statistiku, 2008.

Procijenimo prosjenu navrenu dob svih promatranih ena. Kao donju granicu prvoga
razreda uzmimo 10, a kao gornju granicu posljednjega razreda uzmimo 60. Nominalne
granice pretvorimo u prave izjednaavanjem gornje granice prethodnoga razreda s donjom
granicom tekuega razreda:

navrene godine starosti struktura [%]
(10) 15 0.5
15 20 12.1
20 25 27.0
25 30 25.8
30 35 14.4
35 40 18.0
40 (60) 2.2
ukupno: 100


Poslovna statistika


Kako smo ve istakli, u ovakvim sluajevima razredne sredine shvaamo kao modalitete, a
relativne frekvencije (iskazane u postotcima) kao pondere (teine). Zbroj svih relativnih
frekvencija uvijek je jednak 100, pa prije izrauna procijenjene aritmetike sredine najprije
moramo izraunati odgovarajue razredne sredine (s
i
):

navrene godine starosti razredna sredina struktura [%]
(10) 15 12.5 0.5
15 20 17.5 12.1
20 25 22.5 27.0
25 30 27.5 25.8
30 35 32.5 14.4
35 40 37.5 18.0
40 (60) 50 2.2
ukupno: 100

Procijenjena aritmetika sredina izraunata iz grupiranih podataka je:

7
1
0.5 12.5 12.1 17.5 27 22.5 25.8 27.5 14.4 32.5 18 37.5 2.2 50
100 100
2788
27.88
100
i i
i
p s
X
=
+ + + + + +
= = =
= =

Dobiveni rezultat moemo interpretirati ovako: Procijenjena prosjena dob svih promatranih
ena je priblino jednaka 28 godina (pogreno je npr. rei: Prosjena ena ovisnica o
drogama ima navrenu dob od 28 godina i sl.).

Naposljetku, u praksi se esto javlja sluaj kad treba izraunati ''prosjek prosjeka'', tj.
aritmetiku sredinu aritmetikih sredina. U takvim sluajevima treba poznavati apsolutne ili
relativne frekvencije odgovarajuih modaliteta
66
. Ulogu pondera (teina) u ovom sluaju
imaju zadane aritmetike sredine. Pokaimo to na primjeru:

Primjer 6. Zadani su podaci o ukupnom broju zaposlenih u Republici Hrvatskoj u podruju
financijskoga posredovanja na dan 31.3.2006. i njihovim prosjenim mjesenim neto
plaama u razdoblju od 01.01.2006. do 31.3.2006.

66
Zadavanje navedenih vrijednosti je nuan uvjet za izraun prosjene vrijednosti svih podataka. Bez
poznavanja navedenih vrijednosti izraun aritmetike sredine aritmetikih sredina je praktiki besmislen.


Poslovna statistika


vrsta djelatnosti broj zaposlenih prosjena mjesena
neto plaa [kn]
financijsko posredovanje
osim osiguranja i mirovinskih
fondova

25 310

6.616,00
osiguranje i mirovinski fondovi
osim obveznoga osiguranja
6 077 6.505,00
pomone djelatnosti u
financijskom posredovanju
1 763 4.444,00
ukupno: 33 150
izvor: Statistiki ljetopis Republike Hrvatske za 2006. godinu, Dravni zavod za statistiku, Zagreb, 2007.

Procijenimo prosjenu mjesenu netoplau svih promatranih zaposlenika u navedenom
razdoblju. Trebamo, dakle, izraunati aritmetiku sredinu aritmetikih sredina netoplaa.
Brojevi zaposlenih su apsolutne frekvencije i one imaju uobiajenu ulogu pondera (teine),
dok iznosi prosjenih netoplaa imaju ulogu modaliteta. Stoga je aritmetika sredina
aritmetikih sredina netoplaa jednaka

3
1
3
1
25310 6.616, 00 6077 6.505, 00 1763 4.444, 00 214.816.617, 00
6.480,14
25310 6077 1763 33150
i i
i
i
i
f x
X
f
=
=
+ +
= = =
+ +

Prema tome, procijenjena prosjena mjesena neto plaa svih promatranih zaposlenika u
navedenom razdoblju iznosi 6.480,14 kn. Rije procijenjena ovdje navodimo zato jer ne
znamo metodologiju izrauna zadanih prosjenih mjesenih netoplaa: mogue je da su one
izraunate iz originalnih podataka, ali je isto tako mogue da su izraunate i iz podataka
grupiranih u razrede. Stoga je u interpretaciji primjereno koristiti rije procijenjena neovisno
o tome to je mogue da je dobivena vrijednost ujedno i stvarna prosjena mjesena neto-
plaa promatranih zaposlenika.

odgovore.

Primjer 7. (problem kolskih ocjena) Kako smo ve ranije istakli, kolske ocjene su primjer
kvalitativnoga redosljednoga obiljeja i vezane su uz redosljednu skalu izraavanja
modaliteta, pa se nad njima ne mogu provoditi osnovne raunske operacije. No, u praksi se u


Poslovna statistika


brojnim sluajevima odreuje prosjena ocjena ili prosjek ocjena (kao zbroj svih ocjena
podijeljen s njihovim ukupnim brojem) iako ta veliina, prema dosad iskazanoj statistikoj
teoriji, uope nema smisla. U emu se zapravo sastoji ovaj prividni paradoks?
Prigodom odreivanja (pogreno: raunanja!) prosjene ocjene
67
mi zapravo kodiramo svaku
pojedinu ocjenu, tj. svakoj ocjeni bijektivno pridruujemo tono jedan prirodan broj: ocjeni
''nedovoljan'' pridruujemo prirodan broj 1, ocjeni ''dovoljan'' prirodan broj 2, ocjeni ''dobar''
prirodan broj 3, ocjeni ''vrlo dobar'' prirodan broj 4 i ocjeni ''izvrstan'' prirodan broj 5. Na taj
nain kvalitativni niz ocjena bijektivno preslikavamo u numeriki niz prirodnih brojeva, pa
budui da je na skupu prirodnih brojeva definirana operacija zbrajanja moemo raunati
aritmetiku sredinu dobivenoga numerikoga niza i zaokruiti je na najblii prirodan broj.
Jedno od osnovnih svojstava aritmetike sredine
68
je da se ona nalazi izmeu najmanje i
najvee vrijednosti u numerikom nizu, a to u ovom sluaju znai da je rije o jednom od
prirodnih brojeva izmeu 1 i 5. Dekodiranjem dobivenoga prirodnoga broja, tj. ''oitavanjem''
kojoj je ocjeni pridruen taj prirodan broj, dobivamo spomenutu prosjenu ocjenu.

Opisani postupak kodiranja i dekodiranja je vrlo est u statistici, a primjenjuje se u
sluajevima kad je niz kvalitativnih podataka potrebno (dovoljno reprezentativno) opisati
tono jednim podatkom. Alternativni naini opisivanja takvih podataka u sluaju redosljednih
obiljeja mogu biti i odreivanje moda ili medijana
69
.
Na kraju ove toke navodimo osnovna svojstva aritmetike sredine koja uvelike mogu
koristiti pri gruboj procjeni
70
je li izraunata aritmetika sredina dobar reprezentant
numerikoga niza.

Svojstvo 1. Svaka razdioba u kojoj su vrijednosti obiljeja pridruene elementima skupa na
temelju intervalne ili omjerne skale ima aritmetiku sredinu.
Svojstvo 2. (potpunost) Pri izraunu aritmetike sredine niza numerikih podataka
obuhvaene su sve vrijednosti numerikoga niza.
Svojstvo 3. (jedinstvenost) Svaki numeriki niz ima tono jednu aritmetiku sredinu.
Svojstvo 4. Aritmetika sredina moe posluiti za usporedbu dvaju ili vie numerikih nizova
nastalih grupiranjem prema istom kvantitativnom obiljeju.
Svojstvo 5. Aritmetika sredina se uvijek nalazi izmeu najmanje (x
min
) i najvee (x
max
)
vrijednosti numerikoga niza, tj. vrijede nejednakosti:

67
Napomenimo da se prosjena ocjena praktino ne rauna ukoliko je barem jedan element odgovarajuega
kvalitativnoga niza jednak ''nedovoljan''. To osobito znaju uenici koji mue muku s ''ispravljanjem ocjena''.
68
Vidjeti svojstvo 5. na sljedeoj stranici.
69
Navedeni se naini u kolstvu ipak ne primjenjuju unato injenici da bi cjelokupna uenika populacija
nesumnjivo zduno podrala da zakljuna ocjena iz nekoga predmeta bude mod niza pozitivnih ocjena pojedinih
podruja iz dotinoga predmeta.
70
Statistike pokazatelje ''finijih'' procjena reprezentativnosti aritmetike sredine navodimo u sljedeem
poglavlju.


Poslovna statistika


x
min
X x
max
.

Svojstvo 6. Aritmetika je sredina jedina srednja vrijednost takva da je zbroj odstupanja svih
elemenata numerikoga niza od nje uvijek jednak nuli.
71
Tonije, vrijede sljedee jednakosti:

1
( ) 0
n
i
i
x X
=
=

1
( ) 0
n
i i
i
f x X
=
=

Svojstvo 7. (svojstvo minimuma zbroja kvadrata) Neka je x
1
, x
2
, , x
k
zadani numeriki niz
podataka. Tada realna funkcija f(x) =
2
1
( )
n
i
i
x x
=
poprima minimalnu vrijednost za x = X ,

tj. navedeni zbroj kvadrata poprima minimalnu vrijednost
72
kad je vrijednost varijable x
jednaka aritmetikoj sredini elemenata zadanoga niza.
Svojstvo 8. Aritmetika sredina nije dobar reprezentant numerikoga niza ukoliko u
numerikom nizu postoje ekstremno male ili velike vrijednosti promatranoga kvantitativnoga
obiljeja. (Ovo se svojstvo vrlo neopravdano zanemaruje pri izraunu prosjene (mjesene,
godinje) plae svih registriranih djelatnika neke zemlje.)
Svojstvo 9. Aritmetika sredina izraunata na temelju razdiobe frekvencija u kojoj su
modaliteti obiljeja predstavljeni razredima uvijek sadri pogreku budui da izraunata
razredna sredina, koritena za izraun vagane aritmetike sredine, predstavlja samo priblinu
zamjenu stvarne razredne sredine
73
nekoga razreda.
Svojstvo 10. Problem reprezentativnosti aritmetike sredine dodatno je izraen u sluaju kada
razdioba frekvencija sadri barem jedan otvoren razred, a osobito kada nije mogue
objektivno procijeniti nepoznate granice otvorenih razreda.

3.1.2. Geometrijska sredina

Neka je x
1
, x
2
, , x
n
konaan numeriki niz takav da za svaki i = 1, 2, , n vrijedi x
i
> 0.
Geometrijska sredina (oznaka: G) je srednja vrijednost koja se dobije kao n-ti korijen iz

71
Iz samoga iskaza svojstva vidljivo je da se ono ne odnosi na aritmetiku sredinu izraunatu iz podataka
grupiranih u razrede, nego iskljuivo na jednostavnu aritmetiku sredinu ili aritmetiku sredinu izraunatu iz
podataka grupiranih prema modalitetima (za koju smo ve utvrdili da je zapravo identiki jednaka jednostavnoj
aritmetikoj sredini).
72
Dijeljenjem navedene minimalne vrijednosti ukupnim brojem elemenata numerikoga niza dobiva se
varijanca niza i ona se esto neprecizno objanjava kao prosjeno kvadratno odstupanje od aritmetike sredine.
O varijanci emo vie rei u sljedeem poglavlju.
73
Stvarna razredna sredina je aritmetika sredina svih numerikih podataka koji pripadaju dotinom razredu.


Poslovna statistika


umnoka svih lanova niza. Ukoliko je barem jedan lan numerikoga niza najvie jednak
nuli, geometrijska se sredina takvoga niza ne definira.

Za negrupirane podatke geometrijsku sredinu raunamo prema formuli:

1 2
.....
n
n
G x x x = .

Primjer 1. Geometrijska sredina niza 1, 2, 3, 4, 5 jednaka je

5
1 2 3 4 5 G = 2.605171085.

Pretpostavimo sada da su podaci grupirani, tj. da imamo ukupno n razliitih modaliteta x
1
, x
2
,
, x
n
. Za svaki i = 1, 2, , n oznaimo s f
i
apsolutnu frekvenciju modaliteta x
i
. Tada je
vagana (ponderirana) geometrijska sredina izraunata iz grupiranih podataka dana izrazom

1 2 1
1
1 2
1
.....
n
n
i
i
n i i
i
n f
f
f f f f
n i
i
G x x x x
=
=
=

= =

.

Primjer 2. Zadana je razdioba studenata 1. godine strunoga studija raunovodstva i financija
na Veleuilitu u Pikorevcima dana 20.3.2008. prema broju lanova domainstva u kojemu
ive.

broj lanova domainstva broj studenata
2 25
3 20
4 30
5 15
6 10
ukupno: 100

Geometrijska sredina zadane razdiobe jednaka je

100 25 20 30 15 10
2 3 4 5 6 G = 3.419482401.

U promatranim primjerima osnovni je problem bio to dobiveni rezultat nismo mogli
uobiajeno interpretirati. Drugim rijeima, mogli smo rei da je prosjena vrijednost svih
lanova niza u Primjeru 1. priblino jednaka 2.6, a prosjean broj lanova domainstva po
jednom studentu iz Primjera 2. priblino jednak 3, ali te bismo interpretacije uobiajeno


Poslovna statistika


shvaali kao interpretacije aritmetike sredine zbog ve istaknutoga uobiajenoga
poistovjeivanja pojma prosjek s aritmetikom sredinom. Stoga se namee pitanje u kojim
situacijama geometrijsku sredinu moemo tono interpretirati kao prosjenu vrijednost neke
pojave. Tipina takva situacija je raunanje prosjene promjene cijena u nekom promatranom
razdoblju
74
. Tonije, promatramo sljedei opi problem:

Problem: Neka se pojava (npr. cijena, mjesena plaa, broj stanovnika) tijekom razdoblja od
ukupno n vremenskih jedinica promijenila ukupno m puta. Oznaimo te promjene s p
1
, p
2
, ,
p
m
i pretpostavimo da su iskazane u postotcima. Odredimo prosjenu promjenu p promatrane
pojave u jednoj vremenskoj jedinici.

Odgovor: Neka je C
0
poetna vrijednost pojave, a C
n
njezina vrijednost na kraju razdoblja od
n vremenskih jedinica. Koristei formulu za sukcesivnu promjenu osnovne svote
75
dobivamo
da istodobno moraju vrijediti sljedee jednakosti:

0
1 2
0
1
100
1 1 ... 1
100 100 100
n
n
m
n
p
C C
p p p
C C
| |
= +
|
\
| | | | | |
= + + +
| | |
\ \ \

Lijeve strane tih jednakosti su jednake, pa takve moraju biti i desne strane. Njihovim
izjednaavanjem i sreivanjem dobivenoga izraza dobiva se

1 2
100 1 1 ... 1 1
100 100 100
m
n
p p p
p
(
| | | | | |
= + + +
(
| | |
\ \ \
(

.

U sluaju kad je ukupan broj promjena (m) jednak ukupnom broju razdoblja (n) gornju
jednakost moemo zapisati u obliku

1 2
(100 ) (100 ) ... (100 ) 100
n
n
p p p p = + + + ,

pa je u takvim sluajevima prosjena promjena pojave u jedinici vremena jednaka razlici
geometrijske sredine niza 100 + p
1
, 100 + p
2
, , 100 + p
n
i broja 100.
76

74
Takva situacija pripada u analizu vremenskih nizova, o emu emo vie rei u posebnom poglavlju.
75
Preporuuje se ponoviti gradivo postotnoga rauna od sto iz kolegija Gospodarska matematika.


Poslovna statistika


Ilustrirajmo netom provedeno razmatranje na primjerima.

Primjer 3. Cijena loivoga ulja se u minula dva mjeseca mijenjala tono etiri puta: najprije
je poveana za 0.5%, potom je poveana za daljnjih 0.7%, pa je sniena za 0.2% i naposljetku
poveana za jo 1.5%. Odredimo prosjenu mjesenu promjenu cijene loivoga ulja.
Jedinino vremensko razdoblje je 1 mjesec, pa je ukupan broj jedininih razdoblja n = 2, a
ukupan broj promjena cijena m = 4. Te promjene iznose redom p
1
= +0.5, p
2
= +0.7, p
3
= 0.2
i p
4
= +1.5. (Predznak + oznaava da je rije o poveanju cijene, a predznak oznaava da je
rije o snienju cijene.) Traena prosjena promjena jednaka je

1 2 3 4
100 1 1 1 1 1
100 100 100 100
0.5 0.7 0.2 1.5
= 100 1 1 1 1 1
100 100 100 100
1.250239
p p p p
p
(
| | | | | | | |
= + + + + =
(
| | | |
\ \ \ \
(

(
| | | | | | | |
+ + + +
(
| | | |
\ \ \ \
(

Uoimo da je, zbog relativno male razlike izmeu navedenih numerikih vrijednosti,
navedena prosjena promjena priblino jednaka

1 2 3 4 1
0.5 0.7 ( 0.2) 1.5
1.25
2 2
m
i
i
p
p p p p
p
n
=
+ + + + + +
= = =
77
,

ali ne i aritmetikoj sredini svih etiriju promjena koja iznosi

0.5 0.7 ( 0.2) 1.5
4
a
p
+ + +
= = 0.625.

No, u sluajevima kad izmeu numerikih vrijednosti promjena postoje vee razlike, razlika
izmeu aritmetike i geometrijske sredine je bitno izraenija, kako pokazuje sljedei primjer.

76
Brojevi 100 + p
1
, , 100 + p
n
u praksi se nazivaju verini (lanani) indeksi. O njima emo neto vie rei u
toki 5.5.1.
77
Navedeni priblini izraz, naravno, nije aritmetika sredina promatranih promjena jer zbroj svih lanova
numerikoga niza ne dijelimo ukupnim brojem tih lanova.


Poslovna statistika


Primjer 4. Cijena etvornoga metra (''kvadrata'') zemljita u Lokvama u protekle je dvije
godine najprije udvostruena, a potom poveana za jo 20%. Odredimo prosjenu godinju
promjenu cijene etvornoga metra toga zemljita. Iz navedenih podataka vidimo da su
numerike vrijednosti promjena p
1
= +100 i p
2
= +20. Ukoliko bismo traenu prosjenu
godinju promjenu raunali kao jednostavnu aritmetiku sredinu (to je i formalno ispravno
jer imamo dvije promjene u dvije godine), dobili bismo:

100 20
60
2
a
p
+
= = ,

pa bismo zakljuili da se promatrana cijena poveavala za prosjeno 60% godinje. No,
izraunom pomou navedene formule za prosjenu promjenu dobivamo:

(100 100) (100 20) 100 54.91933 p = + + ,

pa zakljuujemo da se promatrana cijena poveavala za prosjeno (priblino) 55% godinje.
Provjerimo dobivena razmatranja uzimajui da je poetna cijena etvornoga metra zemljita
100,00 . Tada je cijena nakon prvoga poveanja 200,00 , a nakon drugoga 240,00 .
Ukoliko cijenu od 100,00 poveavamo dva puta po 60%, dobit emo najprije 160,00 , a
potom 256,00 , to je za 16 (ili 6.67%) vie od stvarne krajnje cijene zemljita. No, ukoliko
cijenu od 100,00 poveavamo dva puta po 54.91933% dobit emo najprije 154,92 , a
potom cijenu od 240,00 , to je i stvarna krajnja cijena.
Netom provedena razmatranja u praksi treba provoditi vrlo oprezno jer je njihov temeljni
nedostatak injenica da prigodom izrauna prosjene promjene zapravo uzimaju u obzir
jedino poetnu i konanu vrijednost pojave, ali ne i njezine meuvrijednosti, to ponekad
moe dovesti do potpuno pogrenih zakljuaka. Pogledajmo to na primjeru.

Primjer 5. Cijena automobila ''Ficho'' u protekle se dvije godine mijenjala dva puta: najprije
je udvostruena, a potom ''prepolovljena'' (sniena za 50%). Poetna cijena je tada oito
jednaka krajnjoj, pa uvrtavanjem p
1
= +100, p
2
= 50 u formulu za prosjenu promjenu
cijene dobivamo da je ta promjena jednaka

(100 100) (100 50) 100 p = + = 0,

otkuda slijedi da se u prosjeku cijena automobila godinje nije mijenjala (pogreno je rei:
prosjena cijena automobila se godinje nije mijenjala!). Taj zakljuak, meutim, oito
nedovoljno reprezentativno opisuje navedeno kretanje cijena automobila jer smo u
promatrane dvije godine imali ukupno dvije razliite promjene: jedno poveanje i jedno
snienje. Aritmetika sredina je jo loiji pokazatelj:


Poslovna statistika


100 ( 50)
25
2
a
p
+
= = ,

pa bismo zakljuili da se cijena automobila prosjeno poveavala za 25% godinje, to je u
suprotnosti s tonom injenicom da je poetna cijena automobila jednaka njegovoj krajnjoj
cijeni. Stoga sve vrste sredina treba primjenjivati oprezno i uz dodatne statistike analize, a
nikako ''ablonski'' i prema nekom automatizmu.

3.1.3. Harmonijska sredina

Neka je x
1
, x
2
, , x
n
konaan numeriki niz podataka takav da za svaki i = 1, 2, , n vrijedi
nejednakost x
i
> 0. Harmonijska sredina (oznaka: H) navedenoga numerikoga niza definira
se kao reciprona vrijednost aritmetike sredine recipronih vrijednosti svih elemenata
niza.
78
. Za numerike nizove kojima je barem jedan lan najvie jednak nuli harmonijska
sredina se ne definira.

Sukladno navedenoj definiciji, harmonijska sredina negrupiranih numerikih podataka rauna
se iz izraza:

1 2 1
1 1 1 1
...
n
n i i
n n
H
x x x x
=
= =
+ + +
.

Primjer 1. Odredimo harmonijsku sredinu niza 2, 3, 6. Ona je jednaka

3
3
1 1 1
2 3 6
H = =
+ +
.

Pretpostavimo sada da su podaci grupirani, tj. da imamo ukupno n razliitih modaliteta x
1
, x
2
,
, x
n
. Za svaki i = 1, 2, , n oznaimo s f
i
apsolutnu frekvenciju modaliteta x
i
. Tada je
vagana (ponderirana) harmonijska sredina izraunata iz grupiranih podataka dana izrazom

78
Iako se od itanja naglas ove definicije moe zapetljati jezik, navedena je definicija uistinu jedina potpuno
ispravna definicija harmonijske sredine.


Poslovna statistika


1 2 1
1 2
1 1 2
...
...
n
i
n i
n
n i
i n i
f
f f f
H
f f f f
x x x x
=
=
+ + +
= =
+ + +
.

Primjer 2. Odredimo harmonijsku sredinu za razdiobu iz Primjera 2. u toki 3.1.2.:

broj lanova domainstva broj studenata
2 25
3 20
4 30
5 15
6 10
ukupno: 100

Ona je jednaka

5
1
5
1
100 150
3.19149
25 20 30 15 10
47
2 3 4 5 6
i
i
i
i i
f
H
f
x
=
=
= = =
+ + + +
.

Kao ni u sluaju geometrijske sredine, ni ovdje interpretacije Prosjena vrijednost svih
lanova niza 2, 3, 6 jednaka je 3 i Prosjean broj lanova domainstva po jednom studentu
priblino je jednak 3 ne zvue kao prirodne interpretacije harmonijske sredine.
79
Zbog toga
hamonijsku sredinu koristimo prigodom rjeavanja problema u kojima se pojavljuju obrnuto
razmjerne veliine. U nastavku dajemo dva primjera takvih problema.

Primjer 1. etiri radnika rade istovrstan posao, ali razliitim brzinama. U etiri sata prvi je
radnik izradio 48 komada proizvoda, drugi 80 komada, trei 96 komada, a etvrti 120
komada. Odredimo prosjeno vrijeme izrade jednoga proizvoda za sve radnike zajedno, te
prosjean broj izraenih proizvoda po jednoj osmosatnoj radnoj smjeni.

79
Prilikom itanja ovih dviju interpretacija, ali bez naznake o kojoj se srednjoj vrijednosti radi, svaki
nestatistiki nastrojen homo sapiens odmah bi pomislio da je rije o interpretaciji aritmetike sredine.


Poslovna statistika


Za izradu jednoga proizvoda prvi radnik utroi t
1
=
4 1
48 12
= sati, drugi t
2
=
4 1
80 20
= sati, trei
t
3
=
4 1
96 24
= sati, a etvrti t
4
=
4 1
120 30
= sati. Mi traimo vrijeme t za koje e etvorica
radnika proizvesti ukupno 4 proizvoda. Za navedeno vrijeme t prvi e radnik proizvesti
ukupno
1
12
t
proizvoda, drugi
1
20
t
proizvoda, trei
1
24
t
proizvoda, a etvrti
1
30
t
proizvoda, pa
e sva etvorica u vremenu t proizvesti ukupno
1
12
t
+
1
20
t
+
1
24
t
+
1
30
t
=
t
1 1 1 1
1 1 1 1
12 20 24 30
| |
|
+ + +
|
|
\
proizvoda. Taj broj treba biti jednak 4, pa dobivamo jednadbu

t
1 1 1 1
1 1 1 1
12 20 24 30
| |
|
+ + +
|
|
\
= 4

iz koje je

4
1 1 1 1
1 1 1 1
12 20 24 30
t =
+ + +
.

Prema definiciji harmonijske sredine, odavde izravno slijedi da je traeno prosjeno vrijeme
izrade jednoga proizvoda za sva etiri radnika zajedno jednako harmonijskoj sredini niza t
1
,
t
2
, t
3
, t
4,
tj. niza
1 1 1 1
, , ,
12 20 24 30
:

1
4 4 4 2
1 1 1 1 1 12 20 24 30 86 43
1 1 1 1
12 20 24 30
n
i i
n
H
t
=
= = = = =
+ + +
+ + +
radna sata.


Poslovna statistika


Provjerimo dobiveni rezultat. Za
2
43
sata prvi e radnik proizvesti prosjeno
2
24
43
1
43
12
=
proizvoda, drugi prosjeno
2
40
43
1
43
20
= proizvoda, trei prosjeno
2
48
43
1
43
24
= proizvoda, a etvrti
prosjeno
2
60
43
1
43
30
= proizvoda. Stoga e sva etvorica radnika za
2
43
sata proizvesti prosjeno
24 40 48 60 172
4
43 43 43 43 43
+ + + = = proizvoda. Odatle izravno slijedi da e za 8 radnih sati
promatrana etvorica radnika proizvesti prosjeno
8
2
43
= 172 proizvoda.

Primjer 2. U donjoj su tablici navedeni podaci o prosjenoj prodajnoj cijeni udbenika iz
Poslovne statistike autora Statha Isticka tijekom 2007. godine, te strukturi vrijednosti prodaje
u trima prodajnim podrujima

prodajno
podruje
prosjena prodajna cijena
[kn]
struktura vrijednosti
prodaje [%]
sjever 290,00 25
sredinja regija 300,00 35
jug 295,00 40

Odredimo prosjenu prodajnu cijenu za sva tri prodajna podruja zajedno. Podsjetimo se,
vrijednost prodaje jednaka je umnoku ukupnoga broja prodanih proizvoda i cijene jednoga
proizvoda, dok je prosjena prodajna cijena jednaka koliniku vrijednosti prodaje i ukupnoga
broja prodanih proizvoda. Budui da su postoci vrijednosti prodaje upravno razmjerni
vrijednostima prodaje svakoga pojedinoga podruja, traenu prosjenu prodajnu cijenu
izraunat emo kao vaganu harmonijsku sredinu shvaajui prosjene prodajne cijene kao
modalitete, a strukture vrijednosti prodaje kao pondere (teine):


Poslovna statistika


3
1
3
1
25 35 40
295, 45
25 35 40
290 300 295
i
i
i
i i
p
H
p
x
=
=
+ +
= =
+ +
kn.

Zakljuno istaknimo da meu trima sredinama numerikoga niza vrijedi poznata A G H
nejednakost, tj. ako su A, G i H redom aritmetika, geometrijska i harmonijska sredina istoga
numerikoga niza, onda vrijedi nejednakost

H G A.

Znakovi jednakosti vrijede ako i samo ako je odgovarajui numeriki niz konstantan, tj. ako
je a
k
= c, za neki strogo pozitivan realan broj c 0, + i za svaki k = 1, 2, , n.

3.1.4. Kvantili

Neka je x
1
, x
2
, , x
m
niz modaliteta kvantitativnoga ili kvalitativnoga redosljednoga obiljeja.
Svaki takav niz moemo urediti tako da podatke ili poredamo po veliini (od najmanjega do
najveega ili obrnuto) ako je rije o modalitetima kvantitativnoga obiljeja ili poredamo
prema stupnjevima intenziteta mjerenoga svojstva ako je rije o modalitetima kvalitativnoga
redosljednoga obiljeja. Na taj nain dobivamo ureeni niz podataka.

Primjer 1. a) Niz kvantitativnih modaliteta 10, 7, 14, 5, 20, 8 moemo zapisati kao ureeni
niz 5, 7, 8, 10, 14, 20 ili kao ureeni niz 20, 14, 10, 8, 7, 5.
b) Niz kvalitativnih redosljednih modaliteta SSS, VSS, VS, VSS, SSS, VS, VS, VSS,
SSS moemo zapisati kao ureeni niz SSS, SSS, SSS, VS, VS, VS, VSS. VSS, VSS ili
kao ureeni niz VSS, VSS, VSS, VS, VS, VS, SSS, SSS, SSS.

U daljnjem, radi odreenosti, pretpostavljamo da je konaan niz kvantitativnih, odnosno
kvalitativnih redosljednih modaliteta ureen uzlazno, tj. od najmanjega (najloijega) prema
najveemu (najboljemu), te promatramo iskljuivo tako ureene konane nizove. Problem
koji emo razmatrati jest:

Problem 1: Zadani ureeni konaan niz podijeliti na jednakobrojne dijelove zadravajui
pritom svojstvo ureenosti niza. Formalnije i preciznije, ureeni skup S = (x
1
, x
2
, , x
m
)
podijeliti na n ureenih podskupova S
1
, S
2
, , S
n
tako da vrijede sljedea svojstva:


Poslovna statistika


1.) card(S
1
) = card(S
2
) = = card(S
n
), tj. svi podskupovi S
1
, S
2
, , S
n
imaju jednako mnogo
elemenata;

2.) za svaki i = 2, , n svaki element skupova S
1
, S
i

1
nije vei od svakoga elementa
skupa S
i
ili, ekvivalentno, za svaki x
1
1
i
k
k
S
i svaki y S
i
vrijedi nejednakost x y;
3.) svaka dva uzastopna lana niza S
1
, S
2
, , S
n
imaju najvie jedan zajedniki element, dok
nesusjedni lanovi niza nemaju niti jedan zajedniki element;
4.)
1
n
i
i
S
=
= S
1
S
2
S
n
= S, tj. unija
80
svih ureenih podskupova treba biti jednaka
polaznom ureenom skupu.

Odmah primijetimo da u postavci navedenoga problema nema uobiajenoga zahtjeva da
skupovi na koje dijelimo polazni ureeni skup nemaju niti jedan zajedniki element, tj. da su
meusobno disjunktni. Taj zahtjev je namjerno izostavljen jer dozvoljavamo mogunost da se
isti lan niza pojavi u dva uzastopna podskupa. Formalno se ne navodi niti bilo kakva veza
izmeu brojeva m i n, no, moe se pokazati da iz uvjeta 1.), 3.) i 4.) slijedi nejednakost n m.
Ona se intuitivno moe objasniti kao injenica da ureeni skup od m elemenata moemo
podijeliti na najvie m dijelova tako da svi dijelovi imaju jednako mnogo elemenata.

Primjer 2. Sukladno gore navedenim uvjetima, podijelimo ureeni niz 1, 2, 3, 4 na dva
jednakobrojna dijela. Traimo dva ureena podskupa S
1
i S
2
ureenoga skupa S = (1, 2, 3, 4)
takva da svaki element skupa S
1
nije vei od svakoga elementa skupa S
2
, da skupovi S
1
i S
2

imaju najvie jedan zajedniki element, te da njihova unija daje skup S. Lako se vidi da je
jedina mogunost takve podjele S
1
= (1, 2) i S
2
= (3, 4).

Primjer 3. Sukladno uvjetima problema, ureeni niz iz Primjera 1. podijelimo na tri
jednakobrojna dijela. Sada traimo tri ureena podskupa S
1
, S
2
i S
3
takva da svaki element
skupa S
1
nije vei od svakoga elementa skupa S
2
i svaki element skupa S
2
nije vei od svakoga
elementa skupa S
3
, te da unija svih triju ureenih skupova daje skup S. Nije teko vidjeti da je
jedina mogunost takve podjele S
1
= (1, 2), S
2
= (2, 3) i S
3
= (3, 4). Uoimo da skupovi S
1
i S
2

imaju zajedniki element 2, skupovi S
2
i S
3
zajedniki element 3, dok skupovi S
1
i S
3
nemaju
zajednikih elemenata.

80
Navedenu uniju dobijemo tako da svaki od podskupova najprije shvatimo kao ''obian'' skup, napravimo
uobiajenu operaciju unije skupova uz dozvoljeno ponavljanje elemenata, a potom uredimo dobiveni skup.


Poslovna statistika


Primjer 4. Sukladno uvjetima problema, ureeni niz 1, 2, 3 podijelimo na dva jednakobrojna
dijela. U ovom se sluaju dobiva S
1
= (1, 2) i S
2
= (2, 3). Uoimo da skupovi S
1
i S
2
imaju
zajedniki element 2.

Netom razmatrani problem poopuje se u matematikoj statistici, i to prigodom prouavanja
svojstava kumulativne funkcije distribucije sluajne varijable
81
. Ondje se Problem 1. svodi na
to da se za zadanu sluajnu varijablu X i zadani realan broj p 0, 1 odredi vrijednost x
takva da je vjerojatnost da je vrijednost sluajne varijable X strogo manja od x jednaka
najvie p, a vjerojatnost da je vrijednost sluajne varijable X strogo vea od x jednaka najvie
1 p. Moe se pokazati da traena vrijednost x uistinu postoji i da je jedinstvena, te se ona
naziva pkvantil. Kvantili su vrlo znaajni i u deskriptivnoj statistici, ali njihov osnovni
nedostatak je nemogunost tone interpretacije: deskriptivna statistika ''ne poznaje'' termin
sluajna varijabla, pa se gornja, tona definicija p kvantila mora preinaiti, ime se gubi na
preciznosti (i istinitosti) interpretacije. Priblini deskriptivni ''ekvivalent'' p kvantila je tzv.
(per)centil i njega opisujemo u nastavku.

Percentili ili centili su poloajne vrijednosti koje ureeni niz dijele na ukupno 100
jednakobrojnih dijelova. Ima ih ukupno 100 1 = 99 i oznaavaju se s P
1
, P
2
, P
3
, , P
98
, P
99
.
Priblina formula za izraun k toga percentila P
k
za ureeni niz x
1
, x
2
, , x
m
dana je s:

P
k
= x
c + 1
+ d (x
c + 2
x
c + 1
), za k = 1, 2, , 98, 99,

gdje je c cijeli, a d decimalni dio broja
100
k
(m 1).
82
(Priblina i matematiki neprecizna!)
Interpretacija k toga percentila P
k
obino je jedna od sljedeih interpretacija:

prvih k% lanova niza ima vrijednost manju ili jednaku P
k
,
(100 k)% lanova niza ima vrijednost veu ili jednaku P
k
.

Nerijetko se (opet priblino tono i matematiki neprecizno) kae i da k ti percentil P
k

odvaja k% najmanjih lanova niza, odnosno (100 k)% najveih lanova niza.

81
U matematikoj je statistici sluajna varijabla bilo koja realna funkcija ije je podruje definicije odreeni
vjerojatnosni prostor. Ovdje je spominjemo iskljuivo u kontekstu definiranja kvantila.
82
Upravo navedenu formulu koristi MS Excel prigodom izrauna vrijednosti pojedinih percentila.


Poslovna statistika


Primjer 5. Prikupljanjem podataka o navrenim godinama radnoga staa za ukupno 60
zaposlenika tvrtke ''Mukali commerce d.o.o'' iz Klokoevca i odgovarajuim izraunom
dobivena je vrijednost

P
5
= 7.25

Dobivenu vrijednost moemo interpretirati na jedan od sljedeih dvaju naina:

5% promatranih zaposlenika ima najvie 7.25 godina navrenoga radnoga staa;
95% promatranih zaposlenika ima barem 7.25 godina navrenoga radnoga staa.

Budui da znamo ukupan broj zaposlenih (60), navedene interpretacije zapravo znae da:

- priblino 3 zaposlenika promatrane tvrtke imaju najvie 7 godina navrenoga radnoga
staa;
- priblino 57 zaposlenika ima barem 8 godina navrenoga radnoga staa.

Odmah istaknimo da ovdje prilog ''priblino'' ne znai da npr. tono 3.14 zaposlenika ima
najvie 7 godina navrenoga staa (pa smo taj broj zaokruili na najblii cijeli broj). Greka je
bitno vea: mogue je da tono 2 zaposlenika ili tono 4 zaposlenika promatrane tvrtke imaju
najvie 7 godina navrenoga radnoga staa. Zbog toga je u ovakvim interpretacijama bolje
izbjegavati navoenje konkretnih apsolutnih frekvencija.

Primjer 6. Prikupljanjem podataka o visinama (iskazanima kao cijeli broj cm) za ukupno 30
uenika 8.a razreda Osnovne kole ''tefica niclek'' iz Careva Sela i odgovarajuim
izraunom dobivena je vrijednost

P
30
= 170.66

Dobivenu vrijednost moemo interpretirati na jedan od sljedeih dvaju naina:
30% promatranih uenika visoko je najvie 170.66 cm;
70% promatranih zaposlenika visoko je barem 170.66 cm.

U ovom je sluaju obiljeje ''visina'' kvantitativno diskretno obiljeje (jer zanemarujemo
milimetre, mikrometre itd.), pa navedene interpretacije moemo preformulirati ovako:

30% promatranih uenika visoko je najvie 170 cm;
70% promatranih zaposlenika visoko je barem 171 cm.


Poslovna statistika


Kao i u Primjeru 5., budui da znamo ukupan broj uenika, navedene interpretacije zapravo
znae da je priblino 9 promatranih uenika visoko najvie 170 cm, dok visina svakoga od
preostalih 21 uenika iznosi barem 171 cm. Meutim, mogue je i da tono 10 promatranih
uenika bude visoko najvie 170 cm, pa je opet primjerenije izostaviti interpretaciju s
apsolutnim frekvencijama.

U praksi se vrlo esto koriste dvije posebne vrste percentila: decili i kvartili. Decili su
vrijednosti koje ureeni niz modaliteta dijele na 10 jednakobrojnih dijelova. Ima ih ukupno
10 1 = 9 i oznaavaju se s D
1
, D
2
, , D
9
. Nije teko vidjeti da za svaki i = 1, 2, , 8, 9
vrijedi jednakost

D
i
= P
10 i

koja, zapravo, tvrdi da je i ti decil identiki jednak (10 i) tom percentilu. Ovo vrlo
korisno svojstvo omoguuje da se interpretacija svakoga decila poistovjeti s interpretacijom
njemu odgovarajuega percentila.

Primjer 7. Prikupljanjem podataka o ostvarenom uspjehu (1 nedovoljan, 2 dovoljan, , 5
izvrstan) svih studenata 1. godine strunoga studija raunovodstva i financija Veleuilita u
pikovini akademske godine 2006/2007. koji su kolegij Poslovna statistika polagali putem
dvaju kolokvija i odgovarajuim izraunom dobivena je vrijednost

D
4
= 1.25

Rije je o 4. decilu, a toj vrijednosti odgovara 10 4 = 40. percentil. Stoga dobivenu
vrijednost moemo teorijski interpretirati na jedan od sljedeih dvaju naina:

40% promatranih studenata dobilo je ocjenu najvie 1.25;
60% promatranih studenata dobilo je ocjenu barem 1.25.

Budui da da dobivanje ocjene 1 znai da kolokviji nisu poloeni, navedene interpretacije
moemo preformulirati u sljedee:

40% promatranih studenata nije poloilo kolegij Poslovna statistika putem kolokvija;
60% promatranih studenata je poloilo kolegij Poslovna statistika putem kolokvija.

Primjer 8. Prikupljanjem podataka o stupnju strune spreme (uz uobiajeno rangiranje
stupnjeva strunih sprema) za svakoga zaposlenika tvrtke ''Pijetlovi d.o.o.'' i odgovarajuim
izraunom dobivena je vrijednost


Poslovna statistika


D
8
= VS.

Rije je o 8. decilu, a toj vrijednosti odgovara 10 8 = 80. percentil. Stoga dobivenu
vrijednost moemo teorijski interpretirati na jedan od sljedeih dvaju naina:

80% promatranih zaposlenika ima viu strunu spremu ili strunu spremu manju od
vie strune spreme;
20% promatranih zaposlenika ima viu strunu spremu ili strunu spremu veu od vie
strune spreme.

Budui da je jedino visoka struna sprema vea od vie strune spreme, drugu interpretaciju
moemo pojednostavniti ovako: 20% promatranih zaposlenika ima viu ili visoku strunu
spremu. U ovom je sluaju ta interpretacija jednostavnija i razumljivija od prve.

Uoimo da se u Primjerima 3. i 4. radilo o odreivanju percentila za niz modaliteta
kvalitativnoga redosljednoga obiljeja.

Jo jedna od spomenutih posebnih vrsta percentila su kvartili. Kvartili su poloajne
vrijednosti koje ureeni numeriki niz dijele na ukupno 4 jednakobrojna dijela. Ima ih ukupno
4 1 = 3, a imaju svoja posebna imena i oznake:

prvi ili donji kvartil (oznaka: Q
1
);
drugi kvartil ili medijan (oznake: Q
2
, M
e
);
trei ili gornji kvartil (oznaka: Q
3
)

Nije teko vidjeti da za svaki i = 1, 2, 3 vrijedi jednakost

Q
i
= P
25 i

koja, zapravo, tvrdi da je i ti kvartil identiki jednak (25 i) tom percentilu. Ovo vrlo
korisno svojstvo omoguuje da se interpretacija svakoga kvartila poistovjeti s interpretacijom
njemu odgovarajuega percentila. Istaknimo da se u sluajevima u kojima, zbog postojanja
ekstremno malih ili ekstremno velikih vrijednosti, aritmetika sredina nije reprezentativan
pokazatelj statistikoga niza kao ''zamjenski'' pokazatelji rabe upravo kvartili, a poglavito
medijan.

Primjer 9. Zadan je ureeni niz prosjenih mjesenih plaa (iskazanima u kn) svih stalno
zaposlenih djelatnika poduzea "Schwindltrade d.o.o." iz uplje Lipe u razdoblju od
01.01.2007. 31.12.2007.:


Poslovna statistika


1.852,95; 1.884,76; 2.248,62; 2.417,25; 2.646,27; 2.718,12; 2.947,83; 3.085,45; 3.090,31;
50.000,64; 60.000,75

Odgovarajuim izraunima se dobiva:

prvi ili donji kvartil: Q
1
= 2.332,935;
medijan: Q
2
= 2.718,12;
trei ili gornji kvartil: Q
3
= 3.087,88;
jednostavna aritmetika sredina: X = 12.081,18 (kn)

Te vrijednosti moemo redom interpretirati na sljedei nain:

25% promatranih djelatnika ima prosjenu mjesenu plau manju od 2.332,94 kn;
50% promatranih djelatnika ima prosjenu mjesenu plau najvie 2.718,12 kn;
25% promatranih djelatnika ima prosjenu mjesenu plau veu od 3.087,88 kn;
Prosjena mjesena plaa svakoga djelatnika navedene tvrtke iznosi 12.081,18 kn.

Iz zadanoga ureenoga niza lako moemo vidjeti da tono 6 promatranih djelatnika ima
prosjenu mjesenu plau najvie 2.718,12 kn, dok 6 promatranih djelatnika ima prosjenu
mjesenu plau barem 2.718,12 kn. (1 djelatnik pripada objema kategorijama.) To znai da je
iznos 2.718,12 tono rjeenje Problema 1. za navedeni niz plaa jer uistinu dijeli niz na dva
jednakobrojna dijela:

(1.852,95; 1.884,76; 2.248,62; 2.417,25; 2.646,27; 2.718,12) i (2.718,12; 2.947,83; 3.085,45;
3.090,31; 50.000,64; 60.000,75).

I sva tri kvartila su tono rjeenje Problema 1. za navedeni niz plaa jer uistinu dijele niz na
etiri jednakobrojna dijela:

(1.852,95; 1.884,76; 2.248,62), (2.417,25; 2.646,27; 2.718,12), (2.718,12; 2.947,83; 3.085,45)
i (3.090,31; 50.000,64; 60.000,75).

Zbog postojanja ekstremno velikih vrijednosti (50.000,64 i 60.000,75) u navedenom nizu
plaa, oito je da su u ovom sluaju sva tri kvartila bitno reprezentativnije vrijednosti od
aritmetike sredine. Stoga je u statistikoj analizi takvih nizova, kad god je to mogue,
primjerenije odrediti barem jedan kvartil (poeljno: sva tri), negoli aritmetiku sredinu.

Svi percentili, pa posebno i sva tri kvartila, mogu se odreivati iz negrupiranih i grupiranih
podataka. Odreivanje pomou grupiranih podataka zasniva se deskriptivnom analogonu


Poslovna statistika


funkcije distribucije, a to je kumulativni niz ''manje od'' kojega smo ve upoznali. Na primjeru
emo pokazati kako se iz grupiranih podataka odreuje medijan.

Moe se dogoditi da kod parnoga broja elemenata niza prvi sredinji element pripada jednoj, a
drugi sredinji element drugoj frekvenciji kumulativnoga niza. U tom sluaju medijan
predstavlja aritmetiku sredinu dviju njima odgovarajuih vrijednosti diskretnoga obiljeja.

Primjer 10. Zadana je razdioba svih studenata 1. godine studija smjehologije na Vioj
uzaludnoj koli u pikovini (akademska godina 2007/2008.) prema broju poloenih
jednosemestralnih kolegija
83
:

broj poloenih jednosemestralnih kolegija broj studenata
0 7
1 12
2 17
3 25
4 21
5 18
ukupno: 100
izvor: studentska sluba Vie uzaludne kole u pikovini

Odredimo medijan ovako grupiranoga niza podataka i objasnimo dobiveni rezultat. Na ranije
opisani nain formiramo kumulativni niz apsolutnih frekvencija ''manje od'':

broj poloenih jednosemestralnih
kolegija (x
i
)
broj studenata
(f
i
)
kumulativni niz apsolutnih
frekvencija "manje od"
0 7 7
1 12 19
2 17 36
3 25 61
4 21 82
5 18 100
ukupno: 100
Promatrani statistiki niz je ve ureen uzlazno. On ima ukupno 100 lanova. Stoga se
njegovi sredinji lanovi nalaze na mjestima
100
2
i
100
2
+ 1, tj. na 50. i 51. mjestu. Iz stupca u

83
Usporediti s Primjer 2., toka 3.1.1. Aritmetika sredina.


Poslovna statistika


kojemu su navedene kumulativne frekvencije ''oitavamo'' da su na mjestima 37., 38., 39., ,
49., 50., 51., 52., , 59., 60. i 61. ureenoga niza napisane ''trojke''. Prema tome, x
50
= x
51
=
= 3, pa je medijan jednak 3, to bi znailo da je 50% studenata poloilo najvie 3 ispita, a
50% studenata poloilo je najmanje 3 ispita. Ta je interpretacija potpuno tona: na prvih 50
mjesta imamo najprije 7 nula, pa 12 jedinica, pa 17 dvojki i 14 trojki, dok na preostalih 50
mjesta imamo 11 trojki, 21 etvorku i 18 petica.

Na slian se nain iz grupiranih podataka odreuju i preostala dva kvartila. Detalje, kao i
nain odreivanja kvartila iz podataka grupiranih u razrede ovdje izostavljamo.

Na kraju ove toke dajemo pregled najvanijih svojstava medijana kao svojevrsnoj poloajnoj
alternativi aritmetike sredine:

Svojstvo 1. (jedinstvenost medijana) U svakoj razdiobi prema kvantitativnomu ili
kvalitativnom redosljednom obiljeju postoji tono jedan medijan.
Svojstvo 2. Medijan se nalazi izmeu najmanje i najvee vrijednosti obiljeja u razdiobi.
Svojstvo 3. Na vrijednost medijana ne utjeu ekstremne vrijednosti obiljeja u razdiobi.
Svojstvo 4. Medijan se bez tekoa moe odrediti i u razdiobama kod kojih se pojavljuju
otvoreni razredi (osim ako je razred kojem pripada medijan otvoren).
Svojstvo 5. Medijan je srednja vrijednost osobito primjerena za opis izrazito asimetrinih
razdioba.

3.1.5. Mod

Pri analizi statistikih nizova vrlo esto se najprije odreuje najei modalitet koji se
pojavljuje u nizu (tj. modalitet s najveom apsolutnom ili relativnom frekvencijom). Takav
modalitet naziva se mod, oznaava s M
o
i pripada u poloajne srednje vijednosti. Ve iz same
definicije moda oito je da se on moe odrediti neovisno o tipu obiljeja, tj. mod je jedina
srednja vrijednost koja se moe odrediti i za kvalitativna i za kvantitativna obiljeja. Dakako,
nuan uvjet za postojanje moda jest pojavljivanje barem dva jednaka modaliteta u
statistikom nizu.

Oprez: Klasina pogreka prigodom interpretacije modova jest interpretiranje najvee
apsolutne ili relativne frekvencije kao moda pripadnoga osnovnoga skupa. To nije tono:
mod je iskljuivo najei modalitet statistikoga obiljeja, a odreuje se pomou najvee
apsolutne ili relativne frekvencije (za negrupirana obiljeja ili obiljeja grupirana prema
modalitetima).


Poslovna statistika


Primjer 1. Promatramo skup svih automobila parkiranih u Ratkajevu prolazu 01.04.2008. u
16:30 sati i dijelimo njegove elemente prema obiljeju marka automobila. Analizom
dobivenoga osnovnoga skupa utvrdili smo da je mod promatranoga obiljeja BMW. Prema
tome, meu svim promatranim automobilima ima najvie automobila marke BMW. Iako je
takva interpretacija potpuno tona, ona ne mora dobro opisivati pripadni osnovni skup. Npr.
ako promatrani statistiki skup tvore 2 BMW-a, 1 ''Mercedes'', 1 ''koda Octavia'', 1 ''Opel
Corsa'', 1 ''Grand Cherokee'', 1 ''Yugo'' i 1 ''Fio'', onda opis ''Meu promatranim
automobilima ima najvie automobila marke BMW'' oito nedovoljno dobro opisuje
''arolikost'' skupa promatranih automobila. No, ako promatrani statistiki skup tvore 6 BMW-
a i dvije ''Opel Corse'', onda navedena interpretacija prilino dobro opisuje taj skup.

Primjer 2. Neto-plae (iskazane u kn) svih djelatnika knjigovodstvenoga servisa ''Knjii kod
mene'' iz Koara isplaene u sijenju ove godine tvore niz 1.800,00; 1.800,00; 1.800,00;
1.800,64; 1.800,64; 1.820,25; 1820,25; 30.000,75. Mod promatranoga niza je 1.800,00, to
znai da je najea plaa promatranih djelatnika 1.800,00 kn. Ta vrijednost dobro opisuje
pripadni osnovni skup jer plae 7 od ukupno 8 djelatnika odstupaju od moda za najvie
1,125%.

Primjer 3. Netoplae (iskazane u kn) svih djelatnica knjigovodstvenoga servisa ''. & J.
d.o.o. iz Grudnjaka isplaene u veljai ove godine tvore niz 1.800,00; 1.800,00; 4.928,50;
5.103,75; 5.224,47; 7.842,86; 7.915,92; 10.165,78 i 10.201,54. I u ovome je sluaju mod
promatranoga niza jednak 1.800,00 (interpretacija je ista kao i u Primjeru 2.), no, u ovom
sluaju on loe opisuje pripadni osnovni skup jer plae 7 od ukupno 9 djelatnika odstupaju od
moda za barem 173,806%.

Jedno od osnovnih svojstava moda je da ne mora nuno biti jedinstven. Naime, moe se
dogoditi da barem dva modaliteta imaju jednake apsolutne frekvencije, a da su apsolutne
frekvencije svih ostalih modaliteta strogo manje od njih. Stoga razlikujemo unimodalne
razdiobe (razdiobe koja imaju tono jedan mod), bimodalne razdiobe (razdiobe koja imaju
tono dva moda) i multimodalne razdiobe (razdiobe koje imaju barem tri moda).

Primjer 4. a) Ureeni niz 1, 2, 2, 3, 3, 4, 5 ima tono dva moda: 2 i 3. Stoga je taj niz
bimodalan.
b) Ureeni niz 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5 ima tono tri moda: 1, 2 i 3. Stoga je taj niz
multimodalan.
Uoimo da modovi dobro opisuju oba navedena niza jer je u svakom od njih vie od polovice
elemenata niza jednako nekomu od modova.

Kao i sve ostale srednje vrijednosti, i modovi se mogu odreivati iz negrupiranih i grupiranih
podataka, ali i iz grafikih prikaza razdioba, poglavito Paretova grafikona koji kao prvu


Poslovna statistika


kategoriju na osi Ox navodi upravo modalnu vrijednost. Iako se ova vrijednost vjerojatno
odreuje najjednostavnije od svih srednjih vrijednosti, treba istaknuti da su sluajevi u kojima
mod dobro opisuje pripadni osnovni skup relativno rijetki. Takoer, jedan od ozbiljnijih
nedostataka veine raunalnih statistikih potpora (npr. MS Excel) je nemogunost ''ispisa''
svih modova pojedine razdiobe. Ukoliko uope postoji mogunost odreivanja moda
primjenom neke funkcije, njezina izlazna vrijednost je prvi mod po veliini, tj. najmanji ili
najvei mod, pa time zapravo gubimo mogunost utvrivanja je li neki statistiki niz
unimodalan, bimodalan ili multimodalan.

Sve navedeno samo potvruje da problem opisa osnovnoga skupa ili statistikoga niza
pomou bilo koje od potpunih ili poloajnih vrijednosti nije nimalo trivijalan i da obavezno
zahtijeva dodatnu statistiku analizu reprezentativnosti odreenih vrijednosti. O nekim
pokazateljima reprezentativnosti govorimo u sljedeoj toki.

3.2. Mjere rasprenja (disperzije)

Izraun neke od potpunih ili poloajnih srednjih vrijednosti predstavlja tek jedan korak u
statistikoj analizi nekoga obiljeja. Sljedei je korak analiza reprezentativnosti izraunate
srednje vrijednosti, odnosno, pojednostavljeno reeno, odreivanje pokazatelja koliko
izraunata srednja vrijednost dobro opisuje elemente osnovnoga skupa. Ti pokazatelji gotovo
su jednako vani kao i izraunate srednje vrijednosti. Ilustrirajmo to na primjeru.

Primjer 1. Tvrtka ''Super Silva d.o.o.'' iz Duhova zapoljava ukupno 10 stalno zaposlenih
djelatnika. Troje djelatnika ima prosjenu mjesenu netoplau 7.800,00 kn, etvero
prosjenu mjesenu neto-plau 8.000,00 kn, a troje prosjenu mjesenu netoplau 8.200,00
kn. Stoga prosjena mjesena netoplaa po zaposleniku u toj tvrtki iznosi 8.000,00 kn.
Tvrtka ''Super Silvio d.o.o.'' iz Duhia takoer zapoljava ukupno 10 stalno zaposlenih
djelatnika. 9 djelatnika ima prosjenu mjesenu netoplau 3.000,00 kn, a jedan djelatnik
prosjenu mjesenu netoplau 53.000,00 kn. Prosjena mjesena netoplaa po zaposleniku
u promatranoj tvrtki takoer iznosi 8.000,00 kn.
Iskljuivo na temelju izraunatih prosjenih mjesenih netoplaa, tj. bez poznavanja
originalnih podataka o prosjenim mjesenim netoplaama namee se zakljuak da meu
promatranim tvrtkama nema razlika u modalitetima obiljeja ''prosjena mjesena plaa'', to
je oito netono.

Kako bi se moglo to bolje opisati stupanj varijabilnosti statistikih podataka, definiraju se
odgovarajui statistiki pokazatelji pod zajednikim imenom mjere rasprenja (stupnja
varijabilnosti; disperzije). Mjere rasprenja openito mogu biti apsolutne i relativne.


Poslovna statistika


Apsolutne mjere rasprenja su raspon varijacije, interkvartil, interpercentilni razmak, srednje
apsolutno odstupanje i varijanca (odnosno, iz nje izvedena standardna devijacija).
Zajedniko obiljeje svih navedenih mjera jest iskazivanje u jedinicama mjere obiljeja
statistikog skupa (kn, , kg, cm itd.)

Relativne mjere rasprenja obino se izraavaju u postocima, a dvije najee su koeficijent
kvartilne devijacije i koeficijent varijacije.

Odmah napomenimo da izbor mjere rasprenja u pravilu ovisi o mjernim svojstvima
statistikih varijabli, tj. ne postoji ''univerzalna'' mjera rasprenja koja bi se mogla primijeniti
u svim sluajevima. Ukoliko je promatrano obiljeje kvantitativno, primjereno je izraunati i
interpretirati sve navedene mjere. Ukoliko je promatrano obiljeje kvalitativno redosljedno, za
analizu rasprenja mogu se koristiti raspon varijacije, interkvartil i koeficijent kvartilne
devijacije. Grubu sliku (''prvi dojam'') o rasprenosti podataka u osnovnom skupu zorno moe
predoiti i odgovarajui grafikon, a rije je o dijagramu rasipanja ili dijagramu rasprenja
spomenutom u 2. poglavlju.

Navedene mjere rasprenja, dakle, shvaamo kao svojevrsne mjere reprezentativnosti srednjih
vrijednosti. Manja mjera rasprenja znai bolju reprezentativnost srednje vrijednosti i
obrnuto
84
. Pomou mjera rasprenja usporeuju se razlike u varijablitetu barem dviju
razdioba, pri emu vrijede sljedea praktina pravila:

Pravilo 1. Ukoliko se radi o razdiobama prema istim obiljejima (s istom skalom modaliteta),
za usporedbu varijabiliteta koriste se apsolutne mjere rasprenja.

Pravilo 2. Ako se radi o razdiobama razliitih obiljeja ili istih obiljeja s razliitim skalama
modaliteta, za usporedbu varijabliteta koriste se relativne mjere rasprenja.

U nastavku se podrobnije opisuje svaka pojedina mjera rasprenja.

3.2.1. Raspon varijacije

Raspon varijacije (oznaka: R) je najjednostavnija mjera rasprenja definirana kao razlika
izmeu najvee (M) i najmanje (m) vrijednosti kvantitativnoga (ili, eventualno, kvalitativnoga
redosljednoga) obiljeja. Dakle,

84
Grubo moemo rei da su te dvije veliine obrnuto razmjerne, premda to matematiki nije tono.


Poslovna statistika


R = M m.

Najmanja mogua vrijednost raspona varijacije jednaka je nuli i nastupa u sluajevima kad je
odgovarajui niz vrijednosti kvantitativnoga obiljeja konstantan. Najvea vrijednost raspona
varijacije ne moe se openito odrediti.

Primjer 2. Navrene godine radnoga staa svih 10 zaposlenika tvrtke ''Super Silva d.o.o.''
tvore niz: 20, 12, 7, 29, 32, 10, 18, 16, 8, 17. Najvea vrijednost u tome nizu je M = 32, a
najmanja m = 7. Stoga je raspon varijacije vrijednosti promatranoga obiljeja

R = M m = 32 7 = 25 (godina).

Primjer 3. Prosjene mjesene netoplae (iskazane u kn) u razdoblju od 01.01.2008. do
31.03.2008. svih 6 zaposlenika knjigovodstvenoga servisa ''Knjii kod mene'' iz Koara na dan
01.04.2008. tvore niz 2.528,42; 2.527,75; 25.000,64; 2.584,12; 2.598,02; 2.576,25. Najvea
vrijednost u tome nizu je M = 25.000,64, a najmanja m = 2.527,75. Stoga je raspon varijacije
promatranoga obiljeja

R = M m = 25.000,64 2.527,75 = 22.472,89 (kn).

Primjer 4. Zadana je razdioba svih nezaposlenih dravljana Republike Ljenarije u veljai
2008. godine prema navrenim godinama starosti:

15 24 25,2
25 49 75,8
50 64 19,2
65 0,6
izvor: Mjeseno statistiko izvjee Dravnoga zavoda za statistiku Republike Ljenarije, oujak 2008.

Da bismo mogli odrediti raspon varijacije ovoga obiljeja, za najmanju vrijednost (m)
uzimamo donju granicu prvoga razreda, a za najveu (M) gornju granicu posljednjega
razreda. Uoimo da je posljednji razred otvoren, pa njegovu gornju granicu moramo
procijeniti sami. Uzmemo li da je procijenjena gornja granica posljednjega razreda 70, slijedi
da je M = 70 i m = 15, pa je procijenjeni raspon varijacije promatranoga obiljeja

R = M m = 70 15 = 55 (godina).

Osnovna prednost raspona varijacije u praktinoj primjeni je jednostavnost njegova izrauna,
odnosno interpretacije. Njegov osnovni nedostatak je koritenje tono dvaju elemenata


Poslovna statistika


osnovnoga skupa (u sluaju negrupiranih podataka) ili razdiobe (u sluaju grupiranih
podataka) u njegovu izraunu. Stoga ga, kao reprezentativnu mjeru rasprenja, ima smisla
primijeniti u sluajevima kad promatrani niz podataka ne sadri ekstremno velike ili
ekstremno male vrijednosti jer je u suprotnim sluajevima vrlo nepouzdan (npr. u Primjeru 3.
bi se moglo pogreno zakljuiti da promatrane prosjene mjesene plae jako variraju jer
odgovarajui niz sadri ekstremno veliku vrijednost 25.000,64). Jo openitije govorei,
raspon varijacije moe se iskoristiti za ''grubi'' opis osnovnoga skupa ili statistikoga niza, ali
nije dovoljno precizna mjera za daljnju detaljnu analizu tih objekata.

3.2.2. Interkvartil

Interkvartil (oznaka: I
q
) je apsolutna mjera rasprenja definirana kao raspon varijacije
sredinjih 50% elemenata ureenoga niza (kvantitativnih ili kvalitativnih redosljednih)
statistikih podataka. Ekvivalentno reeno, interkvartil je, zapravo, jednak razlici treega
(gornjega) i prvoga (donjega) kvartila:

I
q
= Q
3
Q
1
.

Primjer 5. Prvi (donji) kvartil niza navrenih godina radnoga staa iz Primjera 2. jednak je
Q
1
= 10.5 (godina), a trei (gornji) kvartil istoga niza Q
3
= 19.5. Odatle slijedi da je
interkvartil jednak

I
q
= Q
3
Q
1
= 19,5 10,5 = 9 (godina).

Dakle, raspon varijacije sredinjih 50% navrenih godina radnoga staa iznosi 9 godina. Iz
dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima manje od 10,5 godina
radnoga staa, 25% promatranih zaposlenika ima vie od 19,5 godina radnoga staa, a
navrene godine radnoga staa preostalih 50% promatranih zaposlenika su u rasponu od 9
godina.

Primjer 6. Prvi (donji) kvartil niza prosjenih mjesenih netoplaa iz Primjera 3. jednak je
Q
1
= 2.540,38 (kn), a trei (gornji) kvartil istoga niza Q
3
= 2.594,55 (kn). Odatle slijedi da je
interkvartil jednak

I
q
= Q
3
Q
1
= 2.594,55 2.540,38 = 54,17 (kn).

Dakle, raspon varijacije sredinjih 50% prosjenih mjesenih netoplaa iznosi 54,17 kn. Iz
dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima prosjenu mjesenu neto


Poslovna statistika


plau manju od 2.540,38 kn, 25% promatranih zaposlenika ima prosjenu mjesenu neto
plau veu od 2.594,55 kn, a preostalih 50% promatranih zaposlenika ima prosjenu mjesenu
netoplau u rasponu od 54,17 kn.
Osnovna prednost interkvartila u odnosu na raspon varijacije je zanemarivanje ekstremno
malih ili ekstremno velikih vrijednosti u statistikom nizu, ime se dobiva toniji opis veine
elemenata niza. No, kao i za raspon varijacije, za izraun interkvartila koriste se tono dvije
poloajne vrijednosti u statistikom nizu, pa u izraunu interkvartila ne sudjeluju svi elementi
niza. Zbog toga se ta mjera rasprenja smatra nepotpunom.

3.2.3. Interpercentilni razmak

Interkvartil je poseban sluaj tzv. interpercentila. Za bilo koja dva prirodna broja k, l N
takva da vrijedi nejednakost 0 < k l < 100 interpercentil je razlika l toga i k toga
percentila:

l k
P P
I

= P
l
P
k
.

Prema definiciji percentila vrijedi ekvivalencija

(k l ) (P
k
P
l
),

pa je bilo koji interpercentil uvijek nenegativan realan broj. Obino se interpretira kao raspon
varijacije sredinjih
85
(l k)% elemenata ureenoga statistikoga niza. Posebno, za k = 25 i
l = 75 dobivamo interkvartil, a ako su oba broja k i l djeljiva s 10, dobivamo tzv. interdecilni
razmak (razlika bilo kojih dvaju decila). Praktino se brojevi k i l obino biraju tako da vrijedi
jednakost

k + l = 100

jer se na taj nain ''odvaja'' jednak postotak ''najloijih'' i ''najboljih'' elemenata niza.

85
Izraz sredinjih posljedica je injenice da percentili P
k
i P
l
, zanemarujui ostalih 97 percentila, dijele ureeni
statistiki niz na 3, openito nejednaka, dijela: prvi (''donji'') dio tvori k% podataka manji ili jednak P
k
, drugi
(''sredinji'') dio tvore podaci smjeteni izmeu P
k
i P
l
, a trei (''gornji'') dio tvori (100 l)% podataka veih ili
jednakih P
l
.


Poslovna statistika


Primjer 7. U tvrtki ''Kamen Steaj d.d.'' iz Brckovljana 10% svih zaposlenika ima prosjenu
mjesenu netoplau manju od 1.900,00 kn, dok drugih 10% svih zaposlenika ima prosjenu
mjesenu netoplau veu od 2.200,00 kn. Iz interpretacije navedenih vrijednosti slijedi:

P
10
= 1.900,00 i P
90
= 2.200,00,

pa je odgovarajui interpercentilni razmak

90 10
P P
I

= P
90
P
10
= 2.200,00 1.900,00 = 300,00 (kn).

Dakle, raspon varijacije sredinjih 90% 10% = 80% prosjenih mjesenih netoplaa iznosi
300,00 kn. Primijetimo da je taj raspon ujedno i razlika 9. i 1. decila.

Primjer 8. U zatitarskoj tvrtki ''Orlovi d.o.o'' iz Donje Vrbe 15% svih zaposlenika nije vie
od 185 cm, a 15% svih zaposlenika nije nie od 197 cm. Iz interpretacije navedenih percentila
slijedi
P
15
= 185 i P
85
= 197,

pa je odgovarajui interpercentilni razmak

85 15
P P
I

= P
85
P
15
= 197 185 = 12 (cm).

Dakle, raspon varijacije sredinjih 85% 15% = 70% visina iznosi 12 cm.

Osnovna prednost interpercentila u odnosu na raspon varijacije je zanemarivanje obino
jednakoga postotka ekstremno malih i ekstremno velikih vrijednosti u statistikom nizu, ime
se dobiva toniji opis veine elemenata niza. No, kao i za raspon varijacije, za izraun
interpercentila koriste se tono dvije poloajne vrijednosti u statistikom nizu, pa u njegovu
izraunu ne sudjeluju svi elementi niza. Zbog toga se ta mjera rasprenja smatra nepotpunom.

3.2.4. Varijanca i standardna devijacija

Varijanca i iz nje izvedena standardna devijacija obino se svrstava u red najvanijih
pokazatelja varijabiliteta ili rasprenosti modaliteta kvantitativnih obiljeja. Osnovni razlog je
injenica da da je zbroj odstupanja svih vrijednosti kvantitativnoga obiljeja od njihove
aritmetike sredine uvijek jednak nuli, pa taj pokazatelj ne moemo koristiti za opis
varijabiliteta statistikoga niza. Drugi je razlog tome to u izraunu varijance, a samim tim i


Poslovna statistika


standardne devijacije, koristimo sve elemente statistikoga niza, pa je moemo kategorizirati
kao potpunu mjerom rasprenja. Drugim rijeima, varijanca i standardna devijacija mogu se
raunati i iz ''sirovih'' (negrupiranih ili neureenih) i iz grupiranih podataka.

Varijanca (oznaka:
2
(grko slovo itajte: sigma)) se definira kao aritmetika sredina
kvadrata odstupanja vrijednosti kvantitativnoga obiljeja od aritmetike sredine svih
vrijednosti. Nerijetko se varijanca matematiki netono, ali intuitivno prihvatljivije
definira kao prosjeno kvadratno odstupanje vrijednosti kvantitativnoga obiljeja od
aritmetike sredine tih vrijednosti. Sukladno takvoj definiciji, formule za izraun varijance su:

a) za niz negrupiranih podataka x
1
, x
2
, , x
n
ija je aritmetika sredina x :

( )
2
2
1
n
i
i
x x
n
ili, ekvivalentno,
2
2
2
1
n
i
i
x
x
n
=
=
,

b) za podatke ija je aritmetika sredina x grupirane prema tono k razliitih modaliteta tako
da za svaki i = 1, 2, , k modalitet x
i
ima apsolutnu ili relativnu frekvenciju f
i
:

( )
2
2 1
1
k
i i
i
k
i
i
f x x
f
=
=

=
ili, ekvivalentno,
2
2
2 1
1
k
i i
i
k
i
i
f x
x
f
=
=

c) za podatke grupirane u tono k razreda takvih da je za svaki i = 1, 2, , k x
i
razredna
sredina, f
i
odgovarajua apsolutna ili relativna frekvencija, a x aritmetika sredina svih
podataka:

( )
2
2 1
1
k
i i
i
k
i
i
f x x
f
=
=

=
ili, ekvivalentno,
2
2
2 1
1
k
i i
i
k
i
i
f x
x
f
=
=
.

Primijetimo da je varijanca jednaka nuli ako i samo ako je pripadni statistiki niz konstantan,
tj. ako postoji realan broj c R takav da za svaki k = 1, 2, , n vrijedi x
k
= c. U tom je


Poslovna statistika


sluaju i aritmetika sredina jednaka broju c. No, to promatrani niz sadri vie meusobno
razliitih lanova, tj. to je vei stupanj varijabilnosti niza, to su vea i odstupanja pojedinih
modaliteta kvantitativnoga obiljeja od njihove aritmetike sredine. Stoga moemo zakljuiti
da je varijanca upravno razmjerna stupnju rasprenja statistikoga niza.

Budui je varijanca ''kvadratna'' mjera rasprenja, relativno teko ju je interpretirati. Pomou
drugoga korijena iz varijance dolazimo do praktino najprimjenjenije potpune mjere
rasprenja: standardne devijacije. Standardna devijacija (oznaka: ) je, po definiciji, drugi
korijen iz varijance. Takva formalna definicija obino se zamjenjuje matematiki netonom,
ali intuitivno prihvatljivijom definicijom prema kojoj je standardna devijacija prosjeno
odstupanje vrijednosti kvantitativnoga obiljeja od aritmetike sredine tih vrijednosti ili, jo
krae i jo nepreciznije, prosjeno odstupanje od prosjeka. Istaknimo da je ''mjerna jedinica''
za standardnu devijaciju jednaka ''mjernoj jedinici'' odgovarajuega kvantitativnoga obiljeja
(kn, , kg, cm itd.).

Radi potpunosti, navodimo formule za izraun standardne devijacije:

a) za negrupirane podatke:

( )
2
1
n
i
i
x x
n
ili
2
2
1
n
i
i
x
x
n
=
=

b) za podatke grupirane prema modalitetima ili u razrede:

( )
2
1
1
k
i i
i
k
i
i
f x x
f
=
=

=
ili
2
2 1
1
k
i i
i
k
i
i
f x
x
f
=
=

Primjer 9. Odredimo varijancu i standardnu devijaciju niza navrenih godina radnoga staa iz
Primjera 2. Aritmetika sredina vrijednosti toga obiljeja jednaka je:

20 12 7 29 32 10 18 16 8 17
16.9
10
x
+ + + + + + + + +
= = (godina),


Poslovna statistika


pa je varijanca tih podataka:

10
2
2
2 1
2 2 2 2 2 2 2 2 2 2
2 2
2
10
20 12 7 29 32 10 18 16 8 17
16.9
10
63.49
i
i
x
x
=
= =
+ + + + + + + + +
=
=

Odavde slijedi da je standardna devijacija jednaka

2
63.49 = = =7.968 8 godina.

Moemo, dakle, rei da je prosjeno odstupanje pojedinanih navrenih godina radnoga
staa od njihove aritmetike sredine priblino 8 godina.

Primjer 10. Promatramo statistiki skup svih stanova u onim stambenim zgradama
(novogradnja i dogradnja) koje su 2006. godine dobile graevinsku dozvolu u Republici
Hrvatskoj. Promatrani skup dijelimo prema broju soba u stanu:

broj soba
(x
i
)
broj stanova
(f
i
)
1 3 256
2 7 428
3 7 244
4 4 414
5 1 794
6 997
7 266
8 118
ukupno: 25 517
izvor: Statistiki ljetopis Republike Hrvatske za 2006. godinu,
Dravni zavod za statistiku, 2007.

Odredimo prosjean broj soba po jednom stanu, te varijancu i standardnu devijaciju broja
soba. Prosjean broj soba po jednom stanu je vagana aritmetika sredina promatrane razdiobe:


Poslovna statistika


8
1
8
1
3256 1 7428 2 7244 3 4414 4 1794 5 997 6 266 7 118 8
25517
2.949
i i
i
i
i
f x
x
f
x
=
=
+ + + + + + +
= =
=

Dakle, prosjean broj soba po jednom stanu iznosi priblino 3. Varijanca broja soba jednaka
je:

8
2
2
2 1
8
1
2 2 2 2
2
2 2 2 2
2
2
3256 1 7428 2 7244 3 4414 4
25517
1794 5 997 6 266 7 118 8
2.949328
25517
1.887192
i i
i
i
i
f x
x
f
=
=
=
+ + +
= +
+ + +
+
=

otkuda slijedi da je odgovarajua standardna devijacija broja soba

2
1.887192 1.373751 = = = .

Dakle, moemo rei da prosjeno odstupanje pojedinanih brojeva soba od njihove
aritmetike sredine iznosi priblino 1,374.

Primjer 11. U donjoj je tablici prikazana razdioba svih poinitelja kaznenih djela u Republici
Hrvatskoj osuenih na bezuvjetni zatvor u 2006. godini prema trajanju zatvorske kazne:


Poslovna statistika


trajanje kazne
[godina]
broj
poinitelja
0 1 2 535
1 2 658
2 3 232
3 5 164
5 10 102
10 15 29
15 11
20 3
20 40 8
ukupno: 3 742
Dravni zavod za statistiku, 2007.

Odredimo prosjeno trajanje kazne po jednom poinitelju, te varijancu i standardnu devijaciju
trajanja kazni. U tablici imamo ukupno 7 pravih razreda i dva modaliteta koja nisu grupirana
u razrede. Za svaki pojedini razred raunamo razrednu sredinu, a potom i vaganu aritmetiku
sredinu:

trajanje kazne
[godina]
broj
poinitelja
(f
i
)
razredna
sredina
(x
i
)
f
i
x
i
f
i

2
i
x
0 1 2 535 0.5 1267.5 633.75
1 2 658 1.5 987 1480.5
2 3 232 2.5 580 1.450
3 5 164 4 656 2.624
5 10 102 7.5 765 5737.5
10 15 29 12.5 362.5 4531.25
15 11 15 165 2.475
20 3 20 60 1.200
20 40 8 30 240 7.200
ukupno: 3 742 5083 27.332

Vagana aritmetika sredina jednaka je:


Poslovna statistika


9
1
9
1
5083
1.358365
3742
i i
i
i
i
f x
x
f
=
=
= = =
,

pa prosjeno trajanje kazne po jednom poinitelju iznosi priblino 1.358365 godina, odnosno
1 godinu 4 mjeseca i 9 dana. Varijanca trajanja kazni iznosi:

9
2
2
2 2 1
9
1
27332
1.358365 5.458961
3742
i i
i
i
i
f x
x
f
=
=
= = =
,

otkuda slijedi da je standardna devijacija trajanja kazni

2
5.458961 2.336442 = = = godina,

tj. prosjeno odstupanje pojedinanih trajanja kazni od njihove aritmetike sredine iznosi
priblino 2.336442 godina, odnosno 2 godine 4 mjeseca i 1 dan. Primijetimo da u
promatranom primjeru neto vie od 85% svih podataka pripada prvim dvama razredima, dok
svi ostali razredi obuhvaaju neto manje od 15% svih podataka. Na temelju aritmetike
sredine i standardne devijacije ne moemo zakljuiti npr. da postoji razred 20 40 kojemu
pripada 8 elemenata osnovnoga skupa, pa statistika analiza promatranoga obiljeja mora
obuhvatiti i izraun dodatnih pokazatelja (npr. koeficijent varijacije o kojemu govorimo u
podtoki 3.2.6.).

3.2.5. Srednje apsolutno odstupanje

Ve je istaknuto da je zbroj svih odstupanja pojedinih vrijednosti kvantitativnoga obiljeja od
aritmetike sredine jednak nuli. No, uzmemo li apsolutnu vrijednost svakoga odstupanja
(izraunamo odstupanje i zanemarimo njegov predznak), dobit emo nenegativne realne
brojeve. Njihov je zbroj biti jednak nuli ako i samo ako je niz vrijednosti kvantitativnoga
obiljeja konstantan, a to openito ne vrijedi (kvantitativna obiljeja imaju najmanje dva
razliita modaliteta). Stoga ima smisla definirati srednje apsolutno odstupanje (oznaka:
x
MAD , pri emu kratica: MAD od engleskih rijei Mean Absolute Deviation) kao prosjeno
apsolutno odstupanje od aritmetike sredine.
x
MAD se izraunava prema sljedeim
formulama:


Poslovna statistika


a) za niz negrupiranih modaliteta kvantitativnoga obiljeja x
1
, x
2
, , x
n
ija je aritmetika
sredina x :

1 2
1
...
n
n k
x
k
x x x x x x x x
MAD
n n
=
+ + +
= =
;

b) za podatke ija je aritmetika sredina x grupirane prema tono k razliitih modaliteta tako
da za svaki i = 1, 2, , k modalitet x
i
ima apsolutnu ili relativnu frekvenciju f
i
:

1 1 2 2
1
1 2
1
...
...
n
k k
n n
k
n x
n
k
k
f x x
f x x f x x f x x
MAD
f f f
f
=
=

+ + +
= =
+ + +
;

c) za podatke grupirane u tono k razreda takvih da je za svaki i = 1, 2, , k x
i
razredna
sredina, f
i
odgovarajua apsolutna ili relativna frekvencija, a x aritmetika sredina svih
podataka:

1 1 2 2
1
1 2
1
...
...
n
k k
n n
k
n x
n
k
k
f x x
f x x f x x f x x
MAD
f f f
f
=
=

+ + +
= =
+ + +
.

Primjer 12. Odredimo srednje apsolutno odstupanje od aritmetike sredine za niz navrenih
godina radnoga staa iz Primjera 2. U Primjeru 9. izraunali smo da je aritmetika sredina
toga niza x = 16.9 (godina), pa je srednje apsolutno odstupanje od aritmetike sredine:

10
1
20 16.9 12 16.9 7 16.9 29 16.9 32 16.9 10 16.9
10 10
18 16.9 16 16.9 8 16.9 17 16.9
+
10
3.1 4.9 9.9 12.1 15.1 6.9 1.1 0.9 8.9 0.1
10
k
x
k
x
x x
MAD
MAD
=
+ + + + +
= = +
+ + +
+ + + + + + + + +
=


Poslovna statistika


3.1 4.9 9.9 12.1 15.1 6.9 1.1 0.9 8.9 0.1
6.3
10
x
MAD
+ + + + + + + + +
= =

Dakle, prosjeno apsolutno odstupanje od aritmetike sredine iznosi 6.3 godina. Dobivena
vrijednost je strogo manja od standardne devijacije istoga niza ( 8 godina).

Primjer 13. Odredimo srednje apsolutno odstupanje za vrijednosti obiljeja iz Primjera 11:

trajanje kazne
[godina]
broj
poinitelja
razredna
sredina
(x
i
)
0 1 2 535 0.5
1 2 658 1.5
2 3 232 2.5
3 5 164 4
5 10 102 7.5
10 15 29 12.5
15 11 15
20 3 20
20 40 8 30
ukupno: 3 742

U tom smo primjeru izraunali vaganu aritmetiku sredinu:

x = 1.358365 (godina),

pa je traeno srednje apsolutno odstupanje

9
1
9
1
2535 0.5 1.358365 658 1.5 1.358365 232 2.5 1.358365
3742
164 4 1.358365 102 7.5 1.358365 29 12.5 1.358365
3742
k k
k
x
k
k
x
f x x
MAD
f
MAD
=
=

=
+ +
= +
+ + +
+


Poslovna statistika


11 15 1.358365 3 20 1.358365 8 30 1.358365
3742
1.163
x
MAD
+ +
+
=

Dakle, prosjeno apsolutno odstupanje od aritmetike sredine iznosi priblino 1.63 godina.

Istaknimo da se prosjeno apsolutno odstupanje moe raunati i u odnosu na medijan, pri
emu su odgovarajue formule potpuno analogne navedenima (aritmetika sredina se
zamijeni medijanom, a sve ostale veliine ostaju nepromijenjene). Moe se pokazati i da je
prosjeno apsolutno odstupanje od aritmetike sredine ili medijana uvijek manje ili jednako
standardnoj devijaciji.

Zakljuno istaknimo da dio novijih radova iz statistike preporuuje primjenu srednjih
apsolutnih odstupanja (od aritmetike sredine ili medijana) umjesto ''tradicionalne'' standardne
devijacije jer je praksa pokazala da pogreke u mjerenju, neidealizirani uvjeti provedbe
sluajnih pokusa ili opaanja openito itd. imaju manji utjecaj na prosjeno apsolutno
odstupanje, nego na standardnu devijaciju. Drugim rijeima, sve se vie zagovara da se u
statistikoj analizi realnih procesa (koji se odvijaju u realnim, a ne idealnim uvjetima)
primjenjuje prosjeno apsolutno odstupanje, tim vie to se utvrdilo da primjena takvoga
odstupanja na razliite vrste razdioba daje priblino jednake ili ak bolje rezultate od
standardne devijacije.

3.2.6. Koeficijent varijacije

Ve smo istakli da je standardna devijacija potpuna mjera rasprenja iskazana u jedinicama
promatranoga kvantitativnoga obiljeja. Kao takva, standardna devijacija nije prikladna za
usporedbu varijabiliteta najmanje dvaju razliitih tipova kvantitativnih obiljeja prema
kojima se moe podijeliti isti statistiki skup. Promatramo li npr. skup svih natjecatelja u
izboru za ovogodinjeg Mistera Svrzigaa i podijelimo li sve njegove elemente prema
obiljejima masa i visina, onda na temelju standardne devijacije ne moemo rei razlikuju li
se promatrani natjecatelji vie prema masi ili prema visini. U takvim se sluajevima obavezno
primjenjuju relativne mjere rasprenja jer one ne ovise o ''mjernim jedinicama'' promatranih
obiljeja. Dvije najee primjenjivane mjere su koeficijent varijacije i koeficijent kvartilne
devijacije, a koriste se ponajprije za usporedbu varijabiliteta dvaju razdioba.

Koeficijent varijacije (oznaka: V) definira se kao omjer standardne devijacije i aritmetike
sredine iskazan u postotcima. Slobodno govorei, moemo rei da je koeficijent varijacije


Poslovna statistika


zapravo prosjeno odstupanje vrijednosti kvantitativnoga obiljeja od aritmetike sredine
iskazano u postotcima. Sukladno netom navedenoj definiciji, koeficijent varijacije neovisno o
tome jesu li podaci grupirani ili nisu raunamo prema formuli:

100 V
x
= .

Istaknimo da se koeficijent varijacije primijenjuje gotovo iskljuivo u statistikoj analizi
kvantitativnih obiljeja vezanih za ordinalnu skalu (zbog dogovorno definirane nule nije
primjenjiv u obiljejima vezanima za intervalnu skalu). Njegovi osnovni nedostaci su loa
reprezentativnost u sluaju ekstremnih vrijednosti ili otvorenih razreda, te osjetljivost na male
promjene aritmetike sredine u sluajevima kad je aritmetika sredina vrlo blizu nuli.

Iako ne postoji opi kriterij procjene varijabiliteta prema vrijednostima koeficijenta varijacije,
jedan od najee primjenjivanih je kriterij naveden u sljedeoj tablici. Naglasimo i injenicu
da je najmanja mogua vrijednost koeficijenta varijacije jednaka nuli (i postie se iskljuivo
za konstantne nizove podataka), dok najvea vrijednosti openito nije odreena. Praktine
primjene pokazuju da koeficijent varijacije relativno rijetko prelazi 100%.

V [%] varijabilitet
0 10 vrlo slab
10 - 30 relativno slab
30 - 50 umjeren
50 - 70 relativno jak
70 vrlo jak

Primjer 16. Za svih 11 nogometaa prve postave NK ''Akumulator'' iz Babine Grede na dan
01.04.2008. prikupljeni su podaci o masi i prosjenim mjesenim netoplaama. Podaci su
prikazani u donjoj tablici.


Poslovna statistika


redni br.
nogometaa
masa
[kg]
prosjena mjesena
netoplaa []
1 79 1.190,00
2 89 1.195,00
3 82 1.196,00
4 78 1.185,00
5 91 1.183,00
6 84 1.198,00
7 83 1.197,00
8 86 1.191,00
9 90 1.189,00
10 78 1.300,00
11 81 1.400,00

Utvrdimo razlikuju li se promatrani nogometai vie prema masi ili prema prosjenim
mjesenim neto-plaama. U nizu masa i nizu prosjenih mjesenih netoplaa nema
ekstremno velikih vrijednosti, niti vrijednosti blizu nule, pa koeficijent varijacije obaju
obiljeja raunamo koristei formule za jednostavnu aritmetiku sredinu i standardnu
devijaciju za negrupirani niz podataka. Dobiva se:

obiljeje aritmetika
sredina
standardna
devijacija
koeficijent
varijacije
masa 83.72727 (kg) 4.51444 (kg) 5.391839%
prosjena netoplaa 1.220,36 () 64,88 () 5.316734%

Budui da je koeficijent varijacije masa strogo vei od koeficijenta varijacije prosjenih neto
plaa, zakljuujemo da se promatrani nogometai vie razlikuju prema masama. Uoimo da su
varijabiliteti obaju promatranih obiljeja vrlo slabi, pa praktino moemo zakljuiti da nema
zamjetnih razlika izmeu varijabiliteta promatranih obiljeja.

Primjer 17. Utvrdimo varijabilitet navrenih godina starosti svih nezaposlenih osoba u
Republici Ljenariji u veljai 2008. godine (Primjer 4. u podtoki 3.1.1.):

15 25 25.2
25 50 75.8
50 65 19.2
65 (70) 0.6

U navedenom smo primjeru izraunali:


Poslovna statistika


37.177 x godina,

pa je standardna devijacija raunata iz podataka grupiranih u razrede

= 11.48167 godina,

to znai da je koeficijent varijacije promatranoga obiljeja

11.48167
100 100
37.17715
V
x
= = = 30.88%.

U ovome je sluaju, dakle, varijabilitet ''na granici'' relativno slaboga i umjerenoga, a budui
da je aritmetika sredina raunata iz grupiranih podataka nepreciznija od aritmetike sredine
raunate iz negrupiranih podataka i (obino) manja od nje, moemo zakljuiti da je
varijabilitet vrijednosti promatranoga obiljeja umjeren.

3.2.7. Koeficijent kvartilne devijacije

Kako je ve istaknuto, koeficijent varijacije je lo pokazatelj varijabiliteta vrijednosti
promatranoga obiljeja ukoliko promatrani niz vrijednosti obiljeja sadri ekstremno male ili
ekstremno velike vrijednosti. U takvim se sluajevima rasprenost vrijednosti obiljeja obino
iskazuje interkvartilom (kao apsolutnom mjerom rasprenja), odnosno koeficijentom kvartilne
devijacije kao pripadnom relativnom mjerom rasprenja.

Koeficijent kvartilne devijacije (oznaka: V
q
) je, prema definiciji, omjer interkvartila i zbroja
prvoga i treega kvartila:

3 1
3 1 3 1
q
q
I
Q Q
V
Q Q Q Q
= =
+ +

V
q
se interpretira kao intenzitet varijabiliteta sredinje polovice (sredinjih 50%) elemenata
ureenoga statistikoga niza, a moe poprimiti tono sve vrijednosti iz segmenta [0, 1]. to je
varijablitet sredinje polovice niza manji, vrijednost V
q
je blia 0, a to je varijablitet sredinje
polovice vei, vrijednost V
q
je blia 1. Iako ne postoji opi kritetij za utvrivanje varijabiliteta
sredinje polovice vrijednosti kvantitativnoga obiljeja na temelju koeficijenta kvartilne
devijacije, jedan od najee primijenjenih kriterija naveden je u tablici.


Poslovna statistika


V
q
varijabilitet
0.0 - 0.1 vrlo slab
0.1 - 0.2 relativno slab
0.2 - 0.3 umjeren
0.3 - 0.5 relativno jak
0.5 1.0 vrlo jak

Izraun koeficijenta kvartilne devijacije iz obiju vrsta podataka pokazat emo na sljedeim
primjerima.

Primjer 18. Odredimo varijabilitet sredinjih 50% prosjenih mjesenih plaa (iskazanima u
kn) svih stalno zaposlenih djelatnika poduzea "Schwindltrade d.o.o." iz uplje Lipe u
razdoblju od 01.01.2007. 31.12.2007. navedenih u Primjeru 9. U ovom sluaju statistiki niz
sadri dvije ekstremno velike vrijednosti (50.000,64 i 60.000,75), pa je za dobivanje slike o
varijabilitetu primjereno uporabiti koeficijent kvartilne devijacije.

U Primjeru 9. izraunali smo:

prvi ili donji kvartil: Q
1
= 2.332,935;
trei ili gornji kvartil: Q
3
= 3.087,88;

Stoga je koeficijent kvartilne devijacije promatranoga niza jednak

3 1
3 1
3.087, 88 2.332, 935
0.13927
3.087,88 2.332, 935
q
Q Q
V
Q Q

= = =
+ +
.

Dakle, varijabilitet sredinjih 50% prosjenih mjesenih plaa je relativno slab.

Primjer 19. Zadana je razdioba svih honorarnih nastavnika Visoke kole za financijski
menadment u pikovini u zimskom semestru akademske godine 2007/2008. prema
prosjenom mjesenom netohonoraru za sve odrane oblike nastave:

prosjean mjeseni
netohonorar ()
broj
nastavnika
100,00 5
200,00 8
400,00 21
500,00 12
600,00 6
ukupno: 52


Poslovna statistika


Odredimo koeficijent kvartilne devijacije i objasnimo njegovo znaenje
86
. U ovom sluaju
prvi i trei kvartil odreujemo iz grupiranih podataka, pri emu smo podatke ve zapisali u
obliku ureenoga niza. Ukupan broj podataka jednak je n = 52 i djeljiv je s 4, pa je priblina
pozicija prvoga kvartila jednaka

k
1
=
1 52 1
13.25
4 4
n + +
= = .

Vrijednost prvoga kvartila iz grupiranih podataka odreuje se iz izraza:

Q
1
= 13. vrijednost u nizu +
1
4
(14. vrijednost u nizu 13. vrijednost u nizu) =
= 200,00 +
1
4
(400,00 200,00) = 250,00.

Analogno, priblina pozicija treega kvartila jednaka je

k
2
=
3 3
( 1) (52 1) 39.75
4 4
n + = + = ,

pa je vrijednost treega kvartila:

Q
3
= 39. vrijednost u nizu +
3
4
(40. vrijednost u nizu 39. vrijednost u nizu) =
= 500,00 +
3
4
(500,00 500,00) = 500,00.

Tako je koeficijent kvartilne devijacije jednak

3 1
3 1
500, 00 250, 00
0.33333
500, 00 250, 00
q
Q Q
V
Q Q

= = =
+ +

i zakljuujemo da je varijabilitet sredinjih 50% prosjenih mjesenih netohonorara
relativno jak.

86
U ovome se primjeru iskljuivo radi ilustracije raunanja koeficijenta kvartilne devijacije iz podataka
grupiranih prema modalitetima koriste relacije za izraun kvartila koje se mogu nai u knjizi I. oia
''Primijenjena statistika''.


Poslovna statistika


Primjer 20. Zadana je razdioba svih djelatnika Sveleuilita u Gaelezima na dan 22.3.2008.
prema iznosu primljene ''uskrsnice'':

iznos ''uskrsnice''
()
broj
djelatnika
351,00 500,00 48
501,00 650,00 189
651,00 800,00 88
801,00 950,00 47
951,00 1.100,00 28
ukupno: 400

Odredimo koeficijent kvartilne devijacije i objasnimo dobiveni rezultat.
87
Neprave razrede
najprije pretvorimo u prave i izraunajmo pripadne kumulativne apsolutne frekvencije ''manje
od''. Dobivamo:

iznos ''uskrsnice''
()
broj
djelatnika
kumulativna apsolutna
350,50 500,50 48 48
500,50 650,50 189 237
650,50 800,50 88 325
800,50 950,50 47 372
950,50 1.100,50 28 400
ukupno: 400

etvrtina ukupnoga broja djelatnika jednaka je 100, a 100. element ureenoga niza nalazi se u
razredu 500,50 650,50. Donja granica toga razreda je g
1
= 500,50, odgovarajua apsolutna
frekvencija f
1
= 189, kumulativna apsolutna frekvencija ''manje od'' prethodnoga razreda
jednaka je m
1
= 48, a irina uoenoga razreda je h
1
= 650,50 500,50 = 150. Stoga je prvi
kvartil jednak

Q
1
= g
1
+
1
1
4
n
m
f
h
1
= 500,50 +
400
48
4
150, 00
189
541,77.

87
U ovome se primjeru iskljuivo radi ilustracije raunanja koeficijenta kvartilne devijacije iz podataka
grupiranih u razrede koriste relacije za izraun kvartila koje se mogu nai u knjizi I. oia ''Primijenjena
statistika''.


Poslovna statistika


Nadalje, tri etvrtine ukupnoga broja djelatnika jednake su 300, a 300. element niza nalazi se
u rauzredu 650,50 800,50. Donja granica toga razreda je g
3
= 650,50, odgovarajua
apsolutna frekvencija f
3
= 88, kumulativna apsolutna frekvencija ''manje od'' prethodnoga
razreda jednaka je m
2
= 237, a irina uoenoga razreda je h
3
= 850,50 650,50 = 15,00. Stoga
je trei kvartil jednak

Q
3
= g
3
+
2
3
3
4
n m
f

h
3
= 650,50 +
3
400 237
4
150, 00
88

757,89.

Stoga je koeficijent kvartilne devijacije jednak

3 1
3 1
757,89 541, 77
0.1663
757,89 541, 77
q
Q Q
V
Q Q

= = =
+ +
,

pa zakljuujemo da je varijabilitet sredinjih 50% iznosa ''uskrsnica'' relativno slab.

3.3. Standardizirano obiljeje

U praksi se vrlo esto postavljaju problemi usporedbe razliitih nizova vrijednosti
kvantitativnih obiljeja iskazanima u istim mjernicm jedinicama, ali s razliitim stupnjem
varijabilnosti, problemi usporedbe raznorodnih numerikih nizova, problemi usporedbe
relativnoga poloaja barem dvaju podataka u istom numerikom nizu itd. Tipini primjeri
takvih problema su:

Problem 1. Prosjena godinja netoplaa zaposlenika s visokom strunom spremom u nekoj
tvrtki iznosi 62.000,00 kn uz standardnu devijaciju od 7.100,00 kn. Moe li se rei da je
djelatnik koji ima visoku strunu spremu i ukupnu godinju netoplau 40.000,00 kn
diskriminiran?

Problem 2. Prosjean broj bodova na pismenom ispitu iz Gospodarske matematike odranom
25.02.2008. iznosi 55 uz standardnu devijaciju od 8 bodova. Prosjean broj bodova na
pismenom ispitu iz Osnova raunovodstva odranom 21.02.2008. iznosi 65 uz standardnu
devijaciju 12 bodova. iro je na pismenom ispitu iz Gospodarske matematike ostvario 62
boda, a na pismenom ispitu iz Osnova raunovodstva 75 boda. Na kojemu je ispitu iro
ostvario bolji uspjeh?


Poslovna statistika


Ovakvi problemi rjeavaju se izraunom vrijednosti tzv. standardiziranoga obiljeja (oznaka:
z). Rije je o linearnoj transformaciji vrijednosti kvantitativnoga obiljeja definiranoj
formulom:

z =
1 x x x
x

= ,

gdje je uobiajeno x aritmetika sredina, a standardna devijacija vrijednosti varijable x.
Moe se pokazati da je aritmetika sredina svakoga standardiziranoga obiljeja jednaka nuli, a
odgovarajua standardna devijacija jednaka 1. Kako bi se mogli donijeti zakljuci o
rasprenosti elemenata polaznoga osnovnoga skupa, koristi se sljedee

Pravilo 1. (ebievljevo
88
pravilo) Neka je X niz vrijednosti kvantitativnoga obiljeja ija je
aritmetika sredina x , a standardna devijacija . Tada se za svaki prirodan broj k > 1 u
segmentu [ x k , x + k ] nalazi najmanje 100
2
1
1
k
| |
|
\
% lanova niza X.

Posljedice: U segmentu [ x 2 , x + 2 ] nalazi se najmanje 75% podataka, a u
segmentu [ x 3 , x + 3 ] nalazi se najmanje 89% podataka bilo kojega niza numerikih
podataka.

Pokaimo na nekoliko primjera primjenu standardiziranoga obiljeja i ebievljeva pravila.

Primjer 1. Rijeimo Problem 1. Izraunajmo vrijednost standardizirana obiljeja za
x = 40.000,00, x = 62.000,00 i = 7.100,00:

z =
40.000, 00 62.000, 00
3.0986
7.100, 00
x x

= = ,

pa zakljuujemo da ukupna godinja plaa od 40.000,00 kn odstupa od prosjene godinje
netoplae nanie za vie od tri standardne devijacije. Prema ebievljevu pravilu, najmanje
89% elemenata niza odstupa od prosjene vrijednosti niza za najvie tri standardne devijacije.
To znai da najvie 100% 89% = 11% elemenata niza odstupa od prosjeka za vie od tri

88
Pafnutij Lavovi ebiev (1821. 1894.), ruski matematiar.


Poslovna statistika


standardne devijacije. Promatrani se djelatnik nalazi upravo u tih 11% elemenata, pa se moe
rei da je diskriminiran.

Primjer 2. Rijeimo Problem 2. Prosudba uspjeha na ispitima mora se temeljiti iskljuivo na
standardiziranom obiljeju jer je ono neovisno o mjernim jedinicama, a eliminira i problem
razliitih raspona varijacije.
Za prvi je pismeni ispit x
1
= 55 i
1
= 8, pa je vrijednost standardizirana obiljeja irina
uspjeha na tom ispitu

z
1
=
1
1
1
62 55
0.875
8
x x

= = .

Za drugi je pismeni ispit x
2
= 65 i
2
= 12, pa je vrijednost standardizirana obiljeja irina
uspjeha na tom ispitu

z
2
=
2
2
2
75 65
0.83333
12
x x

= = .

Budui da je vrijednost standardizirana obiljeja za prvi pismeni ispit strogo vea od
vrijednosti standardizirana obiljeja za drugi pismeni ispit, zakljuujemo da je na pismenom
ispitu iz Gospodarske matematike iro postigao neto bolji uspjeh (odstupanje navie iznosi
87,5% standardne devijacije).

Primjer 3. Teaj dionica (u kn) portfolia zabiljeen na Frkljevakoj burzi u razdoblju od
01.03.2008. do 25.03.2008. bio je sljedei:

126 128 133 128 123 130 122 125 129 133 127 126 130
129 133 123 122 121 126 134 128 126 128 135 135

Dva trgovca dionicama procjenjuju teaj dionice u vremenu predvienom za prodaju. Prvi
trgovac procjenjuje da e cijena biti 140 kn, a drugi da e cijena biti 139 kn. Pretpostavimo da
je kretanje teaja dionice ''normalno''. Odredimo koji se trgovac izlae veem riziku donoenja
pogrene poslovne odluke o prodaji dionice. Najprije treba izraunati aritmetiku sredinu
(prosjeni teaj dionice) i standardnu devijaciju iz negrupiranih podataka. Dobiva se:

x = 128,00 kn, = 4,08 kn.


Poslovna statistika


Izraunajmo vrijednost standardiziranoga obiljeja za svaku pojedinu procjenu i odrediti koja
od njih vie odstupa od prosjeka:

z
1
=
1
140 128
2.94
4, 08
x x

= = ,
z
2
=
1
139 128
2.697
4, 08
x x

= = .

Prema tome, prvi trgovac se izlae veem riziku donoenja pogrene poslovne odluke o
prodaji dionice.

Primjer 4. 20 strunjaka iz podruja managementa i gospodarstva procjenjivalo je godinju
stopu inflacije u Republici Nikoristiji za 2007. godinu:

3,52 3,73 4,05 4,12 4,25 3,85 3,68 3,74 4,19 4,42 4,28 4,36 4,09
3,92 3,67 4,26 4,35 3,59 3,97 4,32

Primjenom ebievljeva pravila za k = 2 odredimo prognostiki interval stope inflacije.
Jednostavna aritmetika sredina procjenjenih vrijednosti godinje stope inflacije iznosi 4.018,
a odgovarajua standardna devijacija 0.280546. Prema tome, traeni prognostiki interval
stope inflacije je [4.018 2 0.280546, 4.018 + 2 0.280546] = [3.457, 4.579].

Primjer 5. (problem skaliranja) Prijamnom ispitu za upis na Ekonomski fakultet Sveuilita
u Banovoj Jaruzi pristupilo je ukupno 2000 kandidata. Prosjean broj bodova iz matematike
iznosio je 150 sa standardnom devijacijom 30 bodova. Povjerenstvo za provedbu
razredbenoga ispita odluilo je skalirati rezultate tako da im aritmetika sredina bude 100, a
standardna devijacija 12. Odredimo broj bodova (na novoj skali) kandidata koji je na ispitu
osvojio tono 130 bodova.
Da bismo preraunali rezultate ispita u skladu s izmijenjenim parametrima, najprije emo
odrediti relativan poloaj postignutoga rezultata od 130 bodova u prvotnom numerikom nizu.
Taj se poloaj svodi na izraun vrijednosti standardiziranoga obiljeja za x = 130, 1 x = 150 i
1
= 30, pa se dobije:

z
1
=
1
1
1
130 150
0.66666
30
x x

= = .


Poslovna statistika


Dakle, rezultat kandidata odstupa od prvotnoga prosjeka za 0.66666 prvotnih standardnih
devijacija nanie. Stoga i novi broj bodova mora odstupati od predefiniranoga prosjeka za
0.66666 predefiniranih standardnih devijacija nanie, pa je

x
2
= 2 x + z
1

2
= 100 + (0.66666) 12 = 92.

Prema tome, kandidat e na novoj skali imati ukupno 92 boda.

3.4. Vrste razdioba (distribucija)

Razdiobe statistikih skupova prema kvantitativnim obiljejima grupiramo prema tome kako
su vrijednosti obiljeja elemenata toga skupa rasporeene oko najvanije srednje vrijednosti:
aritmetike sredine. U skladu s tim razlikujemo tri osnovne vrste razdioba statistikoga skupa:

Ako su vrijednosti obiljeja elemenata statistikoga skupa ravnomjerno rasporeene oko
aritmetike sredine, govorimo o simetrinoj razdiobi (distribuciji). Kod simetrine razdiobe
sve tri srednje vrijednosti su jednake ( X = M
e
= M
o
).

Ako skup vrijednosti obiljeja elemenata statistikoga skupa sadri barem jednu ekstremno
veliku vrijednost, govorimo o pozitivno asimetrinoj razdiobi (distribuciji). Kod pozitivno
asimetrine razdiobe vrijede nejednakosti: X > M
e
> M
o
.

Ako skup vrijednosti obiljeja elemenata statistikoga skupa sadri barem jednu ekstremno
malu vrijednost, govorimo o negativno asimetrinoj razdiobi (distribuciji). Kod negativno
asimetrine razdiobe vrijede nejednakosti: X < M
e
< M
o
.

Gornje definicije zgodno je popratiti i grafiki:


Poslovna statistika


3.4.1. Mjere asimetrije

Pri opisu razdiobe vrijednosti obiljeja elemenata odreenoga statistikoga skupa, osim
srednjih vrijednosti i mjera rasprenja, koristimo i mjere asimetrije. Tim mjerama nastoji se
jednim numerikim pokazateljem opisati nain rasporeda kvantitativnih podataka prema
aritmetikoj sredini ili nekoj drugoj srednjoj vrijednosti. U praksi se najee koriste tri mjere
asimetrije:

1.) Pearsonova
89
mjera asimetrije (oznaka: S
k
) je mjera asimetrije definirana kao omjer
aritmetike sredine x i medijana M
e,
odnosno moda M
o
, izraen u jedinicama standardne
devijacije :

3 ( )
;
e o
k k
x M x M
S S

= =

Ova je mjera zapravo standardizirano odstupanje medijana ili moda od aritmetike sredine.
Razlika aritmetike sredine i medijana, odnosno moda podijeljena je sa standardnom
devijacijom radi uklanjanja utjecaja mjernih jedinica kvantitativnoga obiljeja na vrijednost
pokazatelja.

Koeficijent S
k
90
moe poprimiti tono sve vrijednosti iz segmenta [3, 3]. Za simetrinu
razdiobu njegova je vrijednost S
k
= 0, za pozitivno asimetrinu S
k
> 0, a za negativno

89
Karl Pearson (1857. 1936.), britanski statistiar, jedan od najzaslunijih za razvoj statistike kao zasebne
znanstvene discipline.
90
Oznaka S
k
potjee od engleske rijei skewness koja znai nagnutost.


Poslovna statistika


asimetrinu S
k
< 0. to je apsolutna vrijednost od S
k
blia 3, asimetrinost je izraenija. Ovaj
koeficijent u pravilu se rauna za razdiobe prema kvantitativnim kontinuiranim varijablama.

2.) Bowleyeva
91
mjera asimetrije (oznaka: S
kQ
) rauna se iz meusobnoga odnosa svih triju
kvartila: prvoga (Q
1
), treega (Q
3
) i medijana (M
e
). Na temelju toga odnosa odreuje se
asimetrinost sredinje polovice (sredinjih 50%) elemenata ureenoga statistikoga niza.
Raunamo je prema formuli:

1 3
3 1
2
e
kQ
Q Q M
S
Q Q
+
=
.

Koeficijent S
kq
poprima tono sve vrijednosti iz segmenta [-1, 1]. Za simetrinu razdiobu je
S
kQ
= 0, za pozitivno asimetrinu S
kQ
> 0, a za negativno asimetrinu S
kQ
< 0. to je apsolutna
vrijednost koeficijenta S
kQ
blia 1, asimetrinost je izraenija.

3.) Koeficijent asimetrije (oznaka:
3
) je potpuna i najee koritena mjera asimetrije
definirana formulom:

3
1
3
( )
n
k
x x
n

gdje je n ukupan broj elemenata statistikoga niza (odnosno podataka u odgovarajuem
osnovnom skupu), x aritmetika sredina tih podataka, a njihova standardna devijacija.

Koeficijent
3
poprima tono sve vrijednosti iz segmenta [-2, 2]. Za simetrinu razdiobu
vrijednost toga koeficijenta je
3
= 0, za pozitivno asimetrinu
3
> 0, a za negativno
asimetrinu
3
< 0. to je apsolutna vrijednost koeficijenta
3
blia 2, asimetrinost je
izraenija.

Valjda istaknuti da koeficijent asimetrije kao potpuna mjera asimetrije uvijek prua
najvjerniju sliku o asimetriji, dok s ostalim dvama mjerama to nije sluaj. Sve tri mjere obino
se (ali ne i uvijek) podudaraju jedino u predznaku, a njihova izravna usporedba nije mogua
jer se odgovarajui izrauni temelje na razliitim principima.

91
Arthur Lyon Bowley (1869. 1957.), engleski ekonomist i statistiar, zasluan za razvoj teorije uzoraka.


Poslovna statistika


Primjer 1. Radi provjere deklarirane mase paketia bombona ''Kiki'' izabran je uzorak od
ukupno 25 razliitih paketia. Mjerenjem mase (iskazane u gramima) dobiveni su sljedei
rezultati:

101 103 98 99 100 102 96 102 101 105 93 98 98
94 96 101 102 97 97 100 93 104 102 91 104

Odredimo vrijednost svih triju pokazatelja asimetrije, objasnimo njihova znaenja i prikaimo
dobivenu razdiobu linijskim grafikonom. Prikaemo li dobivene podatke tablino, dobivamo:

masa
(g)
broj
paketia
91 1
93 2
94 1
96 2
97 2
98 3
99 1
100 2
101 3
102 4
103 1
104 2
105 1
ukupno: 25

Odgovarajuim izraunima lagano se dobiva:

- aritmetika sredina: x = 99.08 (grama);
- medijan: M
e
= 100 (grama);
- mod: M
o
= 102 (grama);
- 1. ili donji kvartil: Q
1
= 97 (grama);
- 3. ili gornji kvartil: Q
3
= 102 (grama);
- standardna devijacija: = 3.69778312 (grama).

Za vjebu objasnite svaku od neposredno izraunatih vrijednosti. Prema tome, traene
vrijednosti mjera asimetrije su:


Poslovna statistika


- Pearsonova mjera asimetrije (odstupanje medijana): S
k
= -0.746393153;
- Pearsonova mjera asimetrije (odstupanje moda): S
k
= -0.789662321;
- Bowleyeva mjera asimetrije: S
kQ
= 0.2;
- koeficijent asimetrije:
3
= -0.471860569.

Pearsonove mjere asimetrije upuuju na zakljuak da je promatrana razdioba srednje
negativno asimetrina (prevladavaju vrijednosti vee od aritmetike sredine), Bowleyeva
mjera asimetrije upuuje na zakljuak da je razdioba sredinjih 50% paketia blago negativno
asimetrina, dok koeficijent asimetrije upuuje na zakljuak da je promatrana razdioba
srednje negativno asimetrina. To se vidi i iz dobivene tablice jer postoji ukupno 13
vrijednosti strogo veih od aritmetike sredine i 12 vrijednosti manjih od nje. Odgovarajui
prikaz linijskim grafikonom dan je na sljedeoj slici.

Primjer 2. Prema podacima Hrvatske elektroprivrede za 2006. godinu
92
, prosjena godinja
potronja elektrine energije po potroau iznosi 2422.168207 kWh uz standardnu devijaciju
2383.869183 kWh. Pritom 25% svih potroaa godinje potroi najvie 683.319 kWh,
polovica svih potroaa najvie 1766.895 kWh, a 25% svih potroaa barem 3370.143 kWh.
Odredimo vrijednosti odgovarajuih relativnih mjera rasprenja i mjera asimetrije, te
objasnimo dobivene rezultate. Iz zadanih podataka slijedi:

92
Podaci su preuzeti iz Statistikoga ljetopisa Republike Hrvatske za 2006. godinu.


Poslovna statistika


- aritmetika sredina: x = 2422.168207 (kWh);
- medijan: M
e
= 1766.895 (kWh);
- 1. ili donji kvartil: Q
1
= 683.319 (kWh);
- 3. ili gornji kvartil: Q
3
= 3370.143 (kWh);
- standardna devijacija: = 2383.869183 (kWh);

pa su traene vrijednosti:

- koeficijent varijacije: V = 98.4188124%, to znai da je stupanj rasprenja
(varijabilitet) godinje potronje elektrine energije vrlo jak;
- koeficijent kvartilne devijacije: V
q
= 66.2846722%, to znai da je stupanj rasprenja
(varijablitet) sredinjih 50% potroaa elektrine energije vrlo jak;
- Pearsonova mjera asimetrije (odstupanje medijana): S
k
= 0.824634017, to znai da je
promatrana razdioba potroaa prema godinjoj potronji elektrine energije srednje
pozitivno asimetrina;
- Bowleyeva mjera asimetrije: S
kQ
= 0.193414976, to znai da je razdioba sredinjih
50% potroaa blago pozitivno asimetrina;
Koeficijent asimetrije ne moemo izraunati na temelju zadanih podataka. Spomenimo tek da
iz originalnih podataka navedenih u referenciranoj literaturi slijedi
3
= 2.133, to znai da je
razdioba potroaa prema godinjoj potronji elektrine energije vrlo pozitivno asimetrina,
tj. vrlo izraeno prevladavaju manje vrijednosti potronje elektrine energije.

3.4.2. Mjere zaobljenosti

Veina pojava u prirodi, raznim gospodarskim i tehnikim procesima i sl. rasporeena je u
skladu s tzv. normalnom razdiobom. Ova se razdioba vrlo precizno definira u matematikoj
statistici i za to je potreban neto sloeniji aparat teorije vjerojatnosti. Ovdje emo samo
napomenuti da je rije o potpuno simetrinoj unimodalnoj razdiobi takvoj da se otprilike svi
podaci (tonije, 99.73% njih) promatranoga obiljeja nalaze u rasponu [ x 3 , x + 3 ],
gdje je x aritmetika sredina, a standardna devijacija razdiobe. Ova je injenica nerijetko
vrlo korisna prigodom procjenjivanja je li neka razdioba (priblino) normalna ili nije.

S obzirom na veliki znaaj normalne razdiobe u statistici, definirane su posebne mjere kojima
se pojedine razdiobe usporeuju s normalnom. To su tzv. mjere zaobljenosti i ima ih tono


Poslovna statistika


dvije: koeficijent zaobljenosti (kurtosis
93
) i eksces
94
. Koeficijent zaobljenosti (kurtosis)
(oznaka:
4
) je mjera zaobljenosti modalnoga vrha neke razdiobe, dok je eksces (oznaka: )
jednak razlici koeficijenta zaobljenosti i broja 3:

=
4
3.

Od navedene dvije mjere jednostavnija je eksces jer eksces normalne razdiobe iznosi 0, pa je
na temelju te injenice lako izvriti usporedbu. Prema predznaku ekscesa razlikujemo tri vrste
razdioba:

platikurtine iji je eksces strogo manji od nule, tj. < 0;
mezokurtine iji je eksces jednak nuli, tj. = 0;
leptikurtine iji je eksces strogo vei od nule, tj. > 0.

Slobodnije govorei, moemo rei da su platikurtine razdiobe ''plosnatije'', a leptikurtine
''iljastije'' u odnosu na normalnu razdiobu. Usporedba nekih znaajnijih vrsta razdioba s
normalnom razdiobom (krivulja nacrtana crnom bojom) navedena je na donjoj slici.

93
Rije kurtosis na grkom znai izboenost.
94
Rije eksces na latinskom znai prekoraenje ili pretjeranost.


Poslovna statistika


3.5. Programska potpora deskriptivnoj statistikoj analizi

Danas je u uporabi vie razliitih raunalnih programa namijenjenih statistikim analizama.
Najpoznatiji od njih su SAS, SPSS i STATISTICA. U MS EXCEL-u potpunu statistiku analizu
vrijednosti kvantitativnoga obiljeja elemenata statistikoga skupa moemo dobiti rabei alat
Descriptive Statistics smjetenu u izborniku Alati (Tools), opcija: Analiza podataka (Data
Analysis). Taj je alat dio Analysis ToolPak alata za analizu, a stvara statistiki izvjetaj za
podatke u ulaznom rasponu i daje podatke o tendenciji gomilanja podataka oko aritmetike
sredine i njihovoj promjenljivosti (varijabilitetu). Jedini potrebni ulazni podatak jest raspon
elija u kojima su smjeteni negrupirani numeriki podaci. Tzv. izlazni izvjetaj (Summary
Statistics) obavljene statistike analize sadri, izmeu ostalih, i podatke o aritmetikoj sredini,
medijanu, modu, standardnoj devijaciji, varijanci, koeficijentu asimetrije, najmanjoj i najveoj
vrijednosti, opsegu i ukupnom zbroju svih lanova promatranoga numerikoga niza. Primjer
takvog izvjetaja prikazan je u donjoj tablici.

Ocjene iz matematike

Mean 3.46666667
Standard Error 0.21298823
Median 3
Mode 2
Standard Deviation 1.16658456
Sample Variance 1.36091954
Kurtosis -1.4568278
Skewness 0.08605128
Range 3
Minimum 2
Maximum 5
Sum 104
Count 30


Poslovna statistika


4. KORELACIJSKA I REGRESIJSKA ANALIZA

U prethodnim smo se poglavljima bavili tzv. jednodimenzionalnom analizom
odreenih pojava. Pri tome nismo vodili rauna o uzrocima i posljedicama tih pojava,
odnosno o meusobnoj povezanosti dviju ili vie pojava. U ovom emo poglavlju obratiti
pozornost upravo na takve sluajeve. Pri tome emo (radi analogije s matematikom) termin
obiljeja (koji se obino rabi u kvalitativnim sluajevima) zamijeniti ekvivalentnim nazivom
varijabla (jer emo promatrati kvantitativna obiljeja).

Veza izmeu dviju varijabli openito moe biti funkcijska (deterministika) ili
statistika (sluajna, stohastika). U sluaju funkcijske povezanosti svakoj vrijednosti jedne
varijable odgovara tono odreena i jedinstvena vrijednost druge varijable, dok u sluaju
statistike povezanosti odreenoj vrijednosti jedne varijable mogu odgovarati barem dvije
vrijednosti druge varijable.

Primjer 1. Akcijska cijena jednoga automobila marke ''Ficho'' je 50.000,00 . Neka nam n
oznaava broj kupljenih automobila, a C
n
ukupan iznos koji treba izdvojiti za kupnju tih
automobila. Tada je veza izmeu varijabli n i C
n
funkcijska i moe se opisati analitikim
izrazom (zatvorenom formulom):

C
n
= 50.000,00 n.

To znai da e svaki kupac koji kupi tono n automobila za njih morati izdvojiti tono
50.000,00 n . I u sluaju uvoenja dodatnih varijabli (npr. dodatni popust na gotovinsko
plaanje) veza e i dalje ostati funkcijska.

Primjer 2. ''itluka banka'' odobrava stambene kredite uz 5.99% sloenih dekurzivnih
godinjih kamata na 30 godina uz otplatu jednakim godinjim postnumerando anuitetima.
Neka je C
0
iznos zajma koji se odobrava zajmoprimcu, a C
n
ukupan iznos koji u tih 30 godina
zajmoprimac treba vratiti banci. Tada je veza izmeu varijabli C
0
i C
n
funkcijska i moe se
opisati analitikim izrazom (zatvorenom formulom):

C
n
= 2.17713578 C
0
.

To znai da svaki zajmoprimac koji dobije zajam u iznosu od C
0
kn banci treba vratiti ukupno
2.17713578 C
0
kn.


Poslovna statistika


Pojave koje istrauje statistika obino nisu tako ''vrsto'' povezane kao varijable u prethodnim
primjerima. Tada govorimo o statistikoj ili stohastikoj vezi meu varijablama.

Primjer 3. Ekonomskim je analizama utvreno da postoji veza izmeu izdvajanja za
marketing nekoga prehrambenoga proizvoda i ukupne vrijednosti prodanih komada toga
proizvoda. No, ne moe se rei da npr. sve patete za iju je promidbu utroeno 100.000,00
kn imaju jednake ukupne vrijednosti prodanih komada.

Primjer 4. Ekonomskim je analizama utvreno da postoji veza izmeu ukupnih prosjenih
mjesenih primanja i prosjenih mjesenih izdvajanja za prehranu. No, ne moe se rei da
npr. svi ljudi koji mjeseno zarauju prosjeno 3.000,00 imaju jednaka prosjena mjesena
izdvajanja za prehranu.

Korelacijska analiza primjenom posebnih metoda i tehnika ispituje stupanj povezanosti
izmeu barem dviju varijabli. Ukoliko se utvrdi odreeni stupanj povezanosti izmeu dviju
varijabli, regresijskom analizom razvija se odgovarajui analitiki izraz ili algebarski model
te veze kako bi se moglo prognozirati oekivanu vrijednost jedne varijable za unaprijed
zadanu vrijednost druge varijable.

4.1. Korelacijska analiza

Korelacijska analiza povezanosti dviju varijabli obino se provodi u tri koraka:

1.) konstrukcija odgovarajuega grafikog prikaza odnosa meu varijablama (tzv. dijagram
rasipanja, dijagram rasprenja ili oblak rasprenja);
2.) odreivanje brojanoga pokazatelja jakosti i smjera veze meu varijablama (koeficijent
korelacije);
3.) odreivanje brojanoga pokazatelja statistike znaajnosti koeficijenta korelacije (tzv. p
vrijednost).

Ukoliko se utvruje povezanost najmanje triju varijabli, prvi korak se vrlo esto izostavlja jer
je prostorne analogone dijagrama rasipanja vrlo teko nacrtati ak i uz pomo suvremenih
raunalnih programa. Stoga se dijagram rasipanja obino crta iskljuivo kod utvrivanja
povezanosti tono dviju varijabli.

Govorimo li o odnosu izmeu dviju varijabli, obino razlikujemo nezavisnu varijablu (X) i
zavisnu varijablu (Y). Kako sugeriraju sami nazivi, nezavisna varijabla (X) je ''varijabla koja
utjee'' na drugu varijablu, a mogue utjecaje na nju samu zanemarujemo, dok je zavisna


Poslovna statistika


varijabla (Y) ''varijabla na koju se utjee'', tj. varijabla ije vrijednosti zavise o vrijednostima
nezavisne varijable X. U praksi, meutim, nije uvijek tono odreeno koja varijabla je
nezavisna, a koja zavisna. Npr. promatramo li varijable ocjena iz matematike i ocjena iz
statistike, onda ocjena iz statistike moe zavisiti o ocjeni iz matematike (dobar matematiar
obino je i dobar statistiar), ali i ocjena iz matematike moe zavisiti i o ocjeni iz statistike
(ako netko na ispitu iz statistike dobije 5, to ga moe motivirati da sjedne i naui matematiku
barem za 4). U takvim sluajevima, dakle, ne moemo potpuno precizno utvrditi koja
varijabla je zavisna, a koja nezavisna. No, u sluajevima kada imamo varijable poput iznos
mjesene plae i iznos mjesenoga izdvajanja za prehranu jasno je da iznos mjesenoga
izdvajanja za prehranu ovisi o iznosu primljene mjesene plae, a da iznos primljene
mjesene plae ne ovisi o iznosu mjesenoga izdvajanja za prehranu (osim ako je posao
djelatnika usko vezan za prehranu, kao to je npr. degustator).

Kako je ve istaknuto, kad god je to mogue, odnos izmeu zavisne i nezavisne varijable
najprije je zgodno predoiti grafiki. U tu se svrhu rabi ve spomenuti dijagram rasipanja.
Taj se dijagram konstruira tako da da toke s odgovarajuim vrijednostima varijabli X i Y
nanesemo u pravokutni koordinatni sustav u ravnini. Iz oblika dijagrama rasipanja moe se
priblino procijeniti postoji li uope veza izmeu dviju varijabli i, ako postoji, kojega je
oblika (pravocrtna (pravolinijska) ili krivocrtna (krivolinijska)).

Primjer 1. Primjeri potpune linearne (pravocrtne) veze izmeu dviju varijabli:


Poslovna statistika


Primjer 2. Primjeri potpune nelinearne (krivocrtne) veze izmeu dviju varijabli:


Poslovna statistika


Primjer 3. Primjer postojanja statistike veze izmeu dviju varijabli:

Primjer 4. Primjer sluajne (statistiki beznaajne) veze izmeu dviju varijabli:


Poslovna statistika


Ukoliko se nakon konstrukcije dijagrama rasipanja utvri postojanje veze meu promatranim
varijablama, prelazi se na izraun odgovarajuega numerikoga pokazatelja jakosti i smjera
utvrene veze. Pritom odreivanje smjera veze znai utvrivanje uzrokuje li poveanje
vrijednosti jedne varijable poveanje ili smanjenje vrijednosti druge varijable. Ako poveanje
vrijednosti jedne varijable uzrokuje poveanje vrijednosti druge varijable, kaemo da je veza
meu varijablama pozitivna. Uzrokuje li, pak, poveanje vrijednosti jedne varijable smanjenje
vrijednosti druge varijable, kaemo da je veza negativna. Treba napomenuti da je teorijski
veza meu varijablama pozitivna (negativna) i ako smanjenje vrijednosti jedne varijable
uzrokuje smanjenje (poveanje) vrijednosti druge varijable, ali se taj kriterij praktino ne
koristi jer su vrijednosti na svakoj od osi u dijagramu rasipanja poredane uzlazno (od
najmanje do najvee), pa je praktinije promatrati poveanje bilo koje vrijednosti umjesto
njezina smanjenja.

Najjednostavniji sluaj analitikoga opisivanja veze meu dvjema varijablama jest ukoliko iz
dijagrama rasipanja utvrdimo da je ta veza linearna. U takvim se sluajevima rauna tzv.
Pearsonov
95
koeficijent jednostavne linearne korelacije (oznaka: r). Uz pretpostavku da
imamo ukupno n ureenih parova (x
i
, y
i
) vrijednosti varijabli X i Y, koeficijent r raunamo
prema formuli:

95
Karl Pearson (1857. 1936.), britanski statistiar, jedan od najzaslunijih za razvoj statistike kao zasebne
znanstvene discipline.


Poslovna statistika


1 1 1
2 2
2 2
1 1 1 1
1
1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
x y x y
n
r
x x y y
n n
= = =
= = = =

=
| | | |

| |
\ \

Moe se pokazati da koeficijent r moe poprimiti sve vrijednosti iz segmenta [1, 1], pa je,
dakle, njegova najmanja vrijednost jednaka 1, a najvea 1. Korelacijska analiza zasebno
interpretira predznak Pearsonova koeficijenta jednostavne linearne korelacije, a zasebno
njegovu apsolutnu vrijednost.

Pozitivan koeficijent jednostavne linearne korelacije (onaj koji je strogo vei od 0, odnosno
onaj kojemu je predznak +) ukazuje da poveanje vrijednosti jedne varijable uzrokuje
poveanje vrijednosti druge varijable, ali i obrnuto: smanjenje vrijednosti jedne varijable
uzrokuje smanjenje vrijednosti druge varijable. Grubo bismo mogli rei da su promatrane
varijable upravno razmjerne, no, to ne bi bilo matematiki korektno: upravna razmjernost
vrijednosti varijabli znai da ako se, za neki k 0, +, vrijednost jedne varijable povea
(smanji) za k%, onda se i vrijednost druge varijable povea (smanji) za k%. Kod linearne
ovisnosti, meutim, to openito nije tono: ako se vrijednost jedne varijable povea (smanji)
za k%, vrijednost druge varijable e se svakako poveati (smanjiti), ali ne nuno za k% (nego
najee za strogo manje od k%).

Negativan koeficijent jednostavne linearne korelacije ukazuje da poveanje vrijednosti jedne
varijable uzrokuje smanjenje vrijednosti druge varijable, ali i obrnuto: smanjenje vrijednosti
jedne varijable uzrokuje poveanje vrijednosti druge varijable. Kao i u sluaju pozitivnoga
koeficijenta, grubo bismo mogli rei da su promatrane varijable obrnuto razmjerne, no, to ne
bi bilo matematiki korektno: obrnuta razmjernost vrijednosti varijabli znai da ako se, za
neki k R, vrijednost jedne varijable povea (smanji) za k%, onda se vrijednost druge
varijable smanji (povea) za k%. Kod linearne ovisnosti, meutim, to openito nije tono: ako
se vrijednost jedne varijable povea (smanji) za k%, vrijednost druge varijable e se smanjiti
(poveati), ali ne nuno za k% (nego najee za strogo vie od k%).

Apsolutna vrijednost koeficijenta korelacije (oznaka:r) ukazuje na jakost linearne veze
meu varijablama. to jerblie nuli, veza je slabija, a to je blie jedinici, veza je jaa.
Jedan od moguih kriterija jakosti veze naveden je u donjoj tablici.


Poslovna statistika


koeficijent korelacije jakost veze meu varijablama
1 potpuna
0.80 r < 1 jaka
0.50 r < 0.8 srednje jaka
0.20 r < 0.5 slaba
0.0 < r < 0.2 neznatna
0 potpuna odsutnost

Ovdje odmah treba istaknuti najeu pogreku koja se javlja prigodom uporabe Pearsonova
koeficijenta jednostavne linearne korelacije. Naime, u sluajevima kad je |r| 0, esto se
pogreno zakljuuje da nema nikakve statistike veze meu promatranim varijablama. Veza
meu varijablama moe biti i eksponencijalna, logaritamska, potencijska, polinomna (takva
da je stupanj odgovarajuega polinoma najmanje 2) itd., a ne samo linearna. Zbog toga
prigodom interpretacije ovoga koeficijenta uvijek treba imati na umu da on opisuje iskljuivo
smjer i jakost linearne veze meu varijablama.

Posljednji korak korelacijske analize je procjenjivanje statistike znaajnosti izraunatoga
koeficijenta korelacije. Grubo govorei, takvom procjenom elimo utvrditi je li promjena
vrijednosti zavisne varijable doista uzrokovana utjecajem, odnosno promjenom vrijednosti
nezavisne varijable ili je do promjene vrijednosti zavisne varijable dolo sluajno stjecajem
drugih okolnosti (pod djelovanjem tzv. nekontroliranih uvjeta ili initelja). U tu svrhu s p
oznaavamo vjerojatnost da je do promjene zavisne varijable dolo sluajno stjecajem drugih
okolnosti i taj broj nazivamo p vrijednost. Broj p je neki element segmenta [0, 1] i za njega
odreujemo gornju granicu do koje emo smatrati da je do promjene vrijednosti zavisne
varijable dolo sluajno. Obino se razlikuju dva kriterija:

- blai kriterij: smatramo da je do promjene vrijednosti zavisne varijable dolo sluajno
ako i samo ako je p 0.05 i tada kaemo da smo procjenu izvrili uz razinu
pouzdanosti od 95%;
- stroi kriterij: smatramo da je do promjene vrijednosti zavisne varijable dolo sluajno
ako i samo ako je p 0.01 i tada kaemo da smo procjenu izvrili uz razinu
pouzdanosti od 99%.

Ekvivalentno, prema blaem kriteriju smatramo da je promjena vrijednosti zavisne varijable
doista uzrokovana promjenom vrijednosti nezavisne varijable, tj. da je veza promatranih
varijabli statistiki znaajna ako i samo ako je p < 0.05. U sluaju stroega kriterija
odgovarajui uvjet je p < 0.01.


Poslovna statistika


Budui da emo raditi uglavnom s ''malim'' uzorcima (koji imaju najvie 30 elemenata), p
vrijednost koja odgovara Pearsonovu koeficijentu jednostavne linearne korelacije raunat
emo koristei tzv. Studentovu t razdiobu
96
ili, kako se esto naziva, ''razdiobu malih
uzoraka'' jer se u sluaju ''velikih uzoraka (koji imaju npr. 300 elemenata) praktiki podudara
s normalnom razdiobom. Jedan od modificiranih algoritama za izraun p vrijednosti
Pearsonova koeficijenta jednostavne linearne korelacije na temelju Studentove t razdiobe u
MS Excelu moe se formulirati ovako:

Korak 1. Izraunati Pearsonov koeficijent jednostavne linearne korelacije (r).
Korak 2. Izraunati vrijednost broja d := N 2, gdje je N opseg uzorka (tj. ukupan broj
elemenata u uzorku). Vrijednost d obino se naziva broj stupnjeva slobode
97
.
Korak 3. Izraunati pripadnu t vrijednost prema formuli

2
1
d
t r
r
=
.

Korak 4. Izraunati p vrijednost kao vrijednost Studentove t razdiobe s parametrima |t|, d i
2. (Broj 2 treba upisati jer kod korelacije uvijek promatramo dvosmjerne veze, tj. ne treba
unaprijed zadati koja varijabla je zavisna, a koja nezavisna. Ukoliko se to ipak uini, govori se
o jednosmjernoj vezi.) U MS Excelu ta se vrijednost dobiva primjenom funkcije TDIST.
Korak 5. Usporediti p vrijednost ili s 0.01 (stroi kriterij) ili s 0.05 (blai kriterij). Pearsonov
koeficijent jednostavne linearne korelacije je statistiki znaajan ako i samo ako je p < 0.01
(ili p < 0.05).

Pokaimo primjenu navedenih postupaka na primjerima.

Primjer 5. (preuzeto iz The World Almanac and The Book of Fact, 1975.) Ispituje se odnos
izmeu visine i mase ena u dobi od 30 do 40 godina. Odabrano je ukupno 15 uzoraka ena
navedene dobi i dobiveni su sljedei podaci:

96
Studentovu t-razdiobu je 1908. prvi otkrio engleski statistiar William Sealy Gosset (1876. 1937.), suradnik
Karla Pearsona. On je tada radio za pivovaru Guiness koja je zahtijevala od njega da svoje radove objavljuje
pod pseudonimom, pa je Gosset objavio lanak o novoj razdiobi u Pearsonovu asopisu ''Biometrics'' pod
pseudonimom Student. Taj se pseudonim i danas koristi u nazivu razdiobe.
97
Grubo govorei, broj stupnjeva slobode moe se definirati kao ukupan broj meusobno razliitih ''slobodnih''
(nezavisnih) parametara ije vrijednosti treba zadati kako bi se potpuno odredila vrijednost neke veliine.


Poslovna statistika


uzorak prosjena visina
[m]
prosjena masa
[kg]
1 1.47 52.21
2 1.5 53.12
3 1.52 54.48
4 1.55 55.84
5 1.57 57.2
6 1.60 58.57
7 1.63 59.93
8 1.65 61.29
9 1.68 63.11
10 1.7 64.47
11 1.73 66.28
12 1.75 68.1
13 1.78 69.92
uzorak prosjena visina
[m]
prosjena masa
[kg]
14 1.8 72.19
15 1.83 74.46
ukupno:

24.76 931.17

Odredimo Pearsonov koeficijent jednostavne linearne korelacije i procijenimo njegovu
statistiku znaajnost uz razinu pouzdanosti od 95%. Radi odreenosti, neka nezavisna
varijabla (X) bude varijabla prosjena visina, a zavisna varijabla (Y) varijabla prosjena
masa.
98
Izraunajmo najprije sve potrebne pomone numerike podatke:

98
Suprotna bi pretpostavka (ovisnost visine o masi) bila daleko vie motivirajua npr. za lijeenje od anoreksije i
bulimije.


Poslovna statistika


uzorak
prosjena
visina [m]
(X)
prosjena
masa [kg]
(Y)
x
i
y
i

x
i
2
y
i
2

1 1.47 52.21 76.7487 2.1609 2725.8841
2 1.5 53.12 79.68 2.25 2821.7344
3 1.52 54.48 82.8096 2.3104 2968.0704
4 1.55 55.84 86.552 2.4025 3118.1056
5 1.57 57.2 89.804 2.4649 3271.84
6 1.6 58.57 93.712 2.56 3430.4449
7 1.63 59.93 97.6859 2.6569 3591.6049
8 1.65 61.29 101.1285 2.7225 3756.4641
9 1.68 63.11 106.0248 2.8224 3982.8721
10 1.7 64.47 109.599 2.89 4156.3809
11 1.73 66.28 114.6644 2.9929 4393.0384
12 1.75 68.1 119.175 3.0625 4637.61
13 1.78 69.92 124.4576 3.1684 4888.8064
14 1.8 72.19 129.942 3.24 5211.3961
15 1.83 74.46 136.2618 3.3489 5544.2916
ukupno: 24.76 931.17 1548.245 41.053 58498.5439

Stoga je traeni Pearsonov koeficijent jednostavne linearne korelacije:

15 15 15
1 1 1
2 2
15 15 15 15
2 2
1 1 1 1
2 2
1
15
,
1 1
15 15
1
1548.245 24.76 931.17
15
1 1
41.053 24.76 58498.5439 931.17
15 15
i i i i
i i i
i i i i
i i i i
x y x y
r
x x y y
r
= = =
= = = =

=
| | | |

| |
\ \

=

r = 0,994583794

Prije interpretacije dobivenoga koeficijenta procijenimo njegovu statistiku znaajnost.
Izraunajmo najprije pripadnu t vrijednost:


Poslovna statistika


2
15 2
0.994583794 34.5016057
1 0.994583794
d
t r
r
= =
.

Pripadnu p vrijednost izraunamo koristei MS Excel. Dobivamo:

p = TDIST(34.5016057;152;2) 3.60352E-14 = 0.00000000000000360352.

Oito je p < 0,05, pa postoji statistiki znaajna linearna veza izmeu prosjene visine i
prosjene mase na promatranim uzorcima ena. Iz vrijednosti Pearsonova koeficijenta
jednostavne linearne korelacije zakljuujemo da je ta veza pozitivna i jaka, tj. da e poveanje
prosjene visine vrlo vjerojatno uzrokovati i poveanje prosjene mase (i obrnuto).

Primjer 6. U sljedeoj je tablici navedeno ukupno 10 parova vrijednosti nezavisne varijable X
i zavisne varijable Y.

I x
i
y
i
1 10 0.666654428469398
2 11,8 0.666664817791255
3 16 0.666666644193195
4 20 0.666666666329664
5 30 0.666666666666657
6 50 0.666666666666667
7 70 0.666666666666667
8 90 0.666666666666667
9 120 0.666666666666667
10 600 0.666666666666667

Odgovarajuim se izraunom dobiva da je vrijednost Pearsonova koeficijenta jednostavne
linearne korelacije

r = 0.208423,

pripadna t vrijednost
t 0.602745504,

a toj vrijednosti odgovarajua p vrijednost


Poslovna statistika


p 0.563369789.

Uz razinu pouzdanosti od 95%, moe se zakljuiti da ne postoji statistiki znaajna linearna
korelacija promatranih varijabli. No, zakljuak da ne postoji bilo kakva korelacija
promatranih varijabli potpuno je pogrean: veza promatranih varijabli, naime, zapravo je
potpuna, tj. funkcijska i dana je analitikim izrazom:

y =
1.05
1
1.5
x
e

+
(primjer tzv. logistike funkcije).

Ovaj primjer jo jednom ukazuje na injenicu da se u primjeni Pearsonova koeficijenta
jednostavne linearne korelacije uporno mora naglaavati rije linearne jer se radi o
pokazatelju iskljuivo linearne, a ne bilo kakve veze izmeu promatranih varijabli.

4.1.1. Spearmanov
99
koeficijent korelacije ranga

Pearsonov se koeficijent jednostavne linearne korelacije u pravilu primjenjuje za utvrivanje
stupnja linearne povezanosti izmeu numerikih varijabli ije jedinice odgovaraju intervalnoj
ili omjernoj skali. No, ukoliko imamo dvije varijable od kojih je barem jedna redosljedna
(varijabla ranga), ne moramo zahtijevati da odreivanje stupnja linearne povezanosti, niti da
vrijednosti varijable (modaliteti) pripadaju intervalnoj ili omjernoj skali. U takvim
sluajevima za odreivanje stupnja linearne veze obino se koristi Spearmanov koeficijent
korelacije ranga (oznaka: r
s
)

Spearmanov koeficijent korelacije ranga pripada u tzv. neparametarske mjere korelacije jer
njegovo izraunavanje ovisi o poretku vrijednosti modaliteta promatranih varijabli, a ne
izravno o samim vrijednostima varijabli. Pritom se ne pretpostavlja da vrijednosti varijable
pripadaju nekoj od uobiajenih razdioba (npr. normalnoj razdiobi), a ve smo istakli da se ne
zahtijeva utvrivanje linearne veze i pripadnost modaliteta intervalnoj ili omjernoj skali.
Napomenimo da se obino ne rauna za pojave u bilo kakvom monotonom (rastuem ili
padajuem) odnosu.

Dakle, pretpostavljamo da modaliteti pripadaju ordinalnoj skali. Sukladno tome, modalitete
moemo rangirati, odnosno poredati od najslabijega prema najboljemu (uzlazno) ili od

99
Charles Edward Spearman (1863. 1945.), engleski statistiar i psiholog, jedan od zaetnika ideje faktorske
analize varijance.


Poslovna statistika


najboljega prema najslabijemu (silazno). Dogovorno emo modalitete rangirati silazno od
najboljega prema najslabijemu tako da najbolji modalitet uvijek ima rang 1. Rang pojedinoga
modaliteta zapravo moemo shvatiti kao broj poloaja (mjesta, pozicije) toga modaliteta u
''rang-listi''.

Oprez: Dogovorno modalitete rangiramo silazno, tj. najbolji modalitet uvijek dobiva rang 1.
No, ovisno o promatranom obiljeju, poveanje ranga ne mora nuno znaiti smanjenje
odgovarajue vrijednosti modaliteta. Npr. rangiramo li neki uzorak studenata prema
trenutnom prosjeku ocjena, onda e student s najboljim prosjekom imati rang 1. Poveanje
ranga (s 1 na 2) u ovom sluaju znai uobiajeno smanjenje vrijednosti modaliteta. No,
rangiramo li isti uzorak studenata prema broju izostanaka s redovne nastave, onda e student s
najmanjim brojem izostanaka imati najbolji rang, tj. u ovome sluaju poveanje ranga povlai
poveanje vrijednosti modaliteta. Ovo obavezno treba imati na umu prigodom interpretacije
Spearmanova koeficijenta korelacije ranga.

Pri ovakvom rangiranju se prirodno pojavljuje problem odreivanja ranga barem dvaju
jednakih modaliteta. U takvim sluajevima govorimo o tzv. vezanim rangovima. Npr. u nizu
ocjena 5, 4, 2, 2, 2 imamo 3 jednaka modaliteta (2), pa treba odrediti rang svakoga od njih.
Budui da su modaliteti meusobno jednaki, nema razloga preferirati bilo kojega od njih, pa
se utvruje tzv. zajedniki rang kao aritmetika sredina trenutnih pozicija istih modaliteta.
Konkretno, vrijednost 5 ima rang 1 (najbolja ocjena), vrijednost 4 ima rang 2, a tri iste
vrijednosti 2 imaju zajedniki rang
3 4 5
4
3
+ +
= jer se u trenutnom nizu nalaze na 3., 4. i 5.
mjestu.

Unato ovakvom nainu ''eliminiranja'' vezanih rangova, treba istaknuti da se u sluajevima
pojave nezanemarivoga broja vezanih rangova (u odnosu na ukupan broj parova vrijednosti
varijabli), umjesto Spearmanova, preporuuje raunanje Pearsonova koeficijenta jednostavne
linearne korelacije. Pritom kao vrijednosti nezavisne, odnosno zavisne varijable treba uzeti
izraunate rangove modaliteta.

Nakon rangiranja modaliteta, Spearmanov koeficijent r
s
rauna se prema formuli :

2
1
3
6
1
n
i
i
s
d
r
n n
=

gdje su:

n ukupan broj elemenata niza vrijednosti varijable X (ili varijable Y)


Poslovna statistika


d
i
= r(x
i
) r(y
i
) = razlika rangova odgovarajuega para vrijednosti varijable X i varijable Y ,
za svaki i = 1, 2, , n.

Navedimo neka korisna svojstva vezana uz Spearmanov koeficijent korelacije ranga:

Svojstvo 1. Zbroj svih razlika rangova jednak je 0.
Svojstvo 2. Ako su u svakom paru rangovi jednaki, njihove su razlike jednake nuli. U tom je
sluaju vrijednost Spearmanova koeficijenta korelacije ranga jednaka r
s
= 1 i tada govorimo o
potpunoj (savrenoj) pozitivnoj korelaciji ranga.
Svojstvo 3. Ako je redoslijed rangova jedne varijable suprotan redoslijedu rangova druge
varijable, vrijednost Spearmanova koeficijenta korelacije ranga jednaka je r
s
= 1 i tada
govorimo o potpunoj (savrenoj) negativnoj korelaciji ranga.
Svojstvo 4. Kao kriterij jakosti veze meu varijablama ranga koristi se kriterij naveden kod
Pearsonova koeficijenta jednostavne linearne korelacije.

Primjer 1. Na sluajno odabranom uzorku od 10 ljudi ispituje se veza kvocijenta inteligencije
i ukupnoga tjednoga vremena provedenoga u gledanju TV programa. Pritom se, kao radna
pretpostavka, uzima da je poeljno to manje vremena tjedno provoditi pred televizijskim
prijamnikom. Dobiveni podaci prikazani su u donjoj tablici.

kolinik
inteligencije
(IQ)
vrijeme
provedeno u
gledanju TV
[sati/tjedan]
106 7
86 0
100 27
101 50
99 28
103 29
97 20
113 12
112 6
110 17

Ispitajmo vezu promatranih varijabli pomou Spearmanova koeficijenta korelacije ranga.
Najprije rangirajmo modalitete. Kod varijable IQ logino je da osoba (iz promatranoga
uzorka) s najveim kolinikom inteligencije ima rang 1, a osoba s najmanjim koeficijentom


Poslovna statistika


inteligencije rang 10. Ovdje, dakle, poveanje ranga znai smanjenje vrijednosti varijable,
odnosno smanjenje kolinika inteligencije. Kod varijable vrijeme provedeno u gledanju TV
osobi koja tjedno najmanje vremena provede u gledanju televizijskih programa, u skladu s
polaznom temeljnom pretpostavkom, dodijelit emo rang 1, a osobi koja tjedno najvie
vremena provede u gledanju televizijskih programa rang 10. Tako dobivamo sljedeu tablicu:

kolinik
inteligencije
(IQ)
(x
i
)
vrijeme
provedeno u
gledanju TV
[sati/tjedan]
(y
i
)

r(x
i
)

r(y
i
)

d
i

2
i
d
106 7 4 3 1 1
86 0 10 1 9 81
100 27 7 7 0 0
101 50 6 10 -4 16
99 28 8 8 0 0
103 29 5 9 -4 16
97 20 9 6 3 9
113 12 1 4 -3 9
112 6 2 2 0 0
110 17 3 5 -2 4
ukupno: 0 136

Prema tome, Spearmanov koeficijent korelacije ranga jednak je:

10
2
1
3
6
6 136
1 1
10 10 990
i
i
s
d
r
=
= =
0.175757576.

Dakle, na temelju promatranoga uzorka moe se zakljuiti da postoji neznatna pozitivna
korelacija kolinika inteligencije i vremena provedenim u gledanju televizijskih programa.
Napomenimo da se moe pokazati da je pripadna p vrijednost strogo vea od 0.05, tj. da
izraunati Spearmanov koeficijent korelacije ranga nije statistiki znaajan pokazatelj.

Primjer 2. U donjoj su tablici navedeni ukupni bodovi na pismenim ispitima iz Gospodarske
matematike, odnosno Poslovne statistike za svakoga od 8 sluajno izabranih studenata


Poslovna statistika


strunoga studija raunovodstva i financija Veleuilita u Frkljevcima u akademskoj godini
2006/2007.

bodovi na ispitu iz
gospodarske matematike
bodovi na ispitu iz
poslovne statistike
45 50
20 10
50 50
0 20
100 90
50 50
30 40
80 100

Odredimo Spearmanov koeficijent korelacije ranga i objasnimo njegovo znaenje. U ovom se
zadatku radi o sluaju gdje nije potpuno jasno koja je varijabla zavisna, a koja nezavisna. No,
kako ispitujemo iskljuivo stupanj veze meu promatranim varijablama, ta injenica nije
bitna. Stoga emo pretpostaviti da su bodovi na ispitu iz Gospodarske matematike nezavisna,
a bodovi na ispitu iz Poslovne statistike zavisna varijabla. Navedene su varijable oito
redosljedne, tj. student koji je na ispitu iz Gospodarske matematike postigao 100 bodova bolji
je od studenta koji je na istom ispitu postigao 50 bodova itd. U oba sluaja modalitete
obiljeja poredat emo silazno jer student s najveim brojem bodova treba ima najvei rang.
Tako dobivamo sljedeu tablicu:

bodovi na ispitu iz Gospodarske matematike
(x
i
)
bodovi na ispitu iz Poslovne statistike
(y
i
)
r(x
i
) r(y
i
) d
i
d
i
2
45 50 5 4 1 1
20 10 7 8 -1 1
50 50 3.5 4 -0.5 0.25
0 20 8 7 1 1
100 90 1 2 -1 1
50 50 3.5 4 -0.5 0.25
30 40 6 6 0 0
80 100 2 1 1 1
ukupno: 0 5.50

Uoimo da u vrijednostima varijable X imamo dvije meusobno jednake (50) koje dijele 3. i
4. mjesto. Stoga je njihov zajedniki rang jednak
2
4 3 +
= 3.5. Analogno, u varijabli Y imamo


Poslovna statistika


3 takve vrijednosti (ponovno 50) koje dijele 3., 4. i 5. mjesto. Stoga je njihov zajedniki rang
jednak =
+ +
3
5 4 3
4. Tako je traeni Spearmanov koeficijent korelacije ranga jednak:

93 . 0
8 8
50 . 5 6
1
3

=
s
r

Zakljuujemo da postoji jaka pozitivna korelacija izmeu bodova na ispitu iz matematike i
bodova na ispitu iz statistike. Iz dobivena koeficijenta zakljuujemo da poveanje ranga broja
bodova iz Gospodarske matematike vrlo vjerojatno uzrokuje poveanje ranga broja bodova iz
Poslovne statistike. To znai da e student koji ostvari visoki rezultat u jednom ispitu vrlo
vjerojatno postii visoki rezultat i u drugom, i obrnuto. Moe se pokazati da je pripadna p
vrijednost strogo manja od 0,01, pa je dobiveni koeficijent statistiki znaajan.

Primjer 3. Mujaci smeokriloga brzana (Fregata maginificens) imaju crvenu grlenu vreicu
koju u doba svadbenoga plesa
100
nadimaju kao svadbeno ruho (vidjeti sliku) i pomou nje
proizvode poseban zvuk kojim privlae enke. Prouavajui opisano ponaanje, grupa
ornitologa utvrdila je da enke odabiru mujake upravo na temelju veliine njihove grlene
vreice, pa je provedeno dodatno istraivanje postoji li statistiki znaajna korelacija izmeu
obujma grlene vreice i frekvencije zvuka kojim mujaci privlae enke. U donjoj su tablici
navedeni prikupljeni podaci.

100
Svadbeni ples u biologiji je skupni naziv za sva ponaanja koja predstavljaju uvod u parenje ivotinja.


Poslovna statistika


mujak smeokriloga brzana

Korelacija promatranih varijabli utvrena je na temelju Spearmanova koeficijenta korelacije
ranga: mujak s najveim obujmom grlene vreice ima rang 1, a mujak s najmanjim
obujmom rang 18, pri emu mujaci s obujmom grlene vreice 5090 cm
3
imaju rang 6.5. Za
varijablu frekvencija zvuka primijenjen je suprotan kriterij: mujak s najdubljom frekvencijom
zvuka ima rang 1, a mujak s najviom frekvencijom rang 18. Izraunom Spearmanova
koeficijenta korelacije ranga dobiva se:

r
s
= 0.763158.

Dakle, postoji srednje jaka pozitivna korelacija izmeu obujma grlene vreice smeokriloga
brzana i frekvencije zvuka kojim vabi enke. To znai da poveanje ranga obujma grlene
resice vjerojatno uzrokuje poveanje ranga frekvencije zvuka, odnosno da e mujak s veim
obujmom grlene vreice vrlo vjerojatno imati dublju frekvenciju zvuka kojim privlai enke.
Napomenimo da je na temelju odgovarajuega statistikoga pokazatelja utvreno da je
dobiveni rezultat statistiki znaajan, tj. zakljuak izveden iz promatranoga uzorka od 18
mujaka moe se primijeniti i na cjelokupnu populaciju smeokriloga brzana, te da se
ovisnost frekvencije zvuka (zavisne varijable Y) o obujmu grlene vreice (nezavisnoj varijabli
X) moe relativno dobro opisati tzv. regresijskom jednadbom:
obujam
grlene vreice
[cm
3
]
frekvencija
zvuka
[Hz]
1760 529
2040 566
2440 473
2550 461
2730 465
2740 532
3010 484
3080 527
3370 488
3740 485
4910 478
5090 434
5090 468
5380 449
5850 425
6730 389
6990 421
7960 416


Poslovna statistika


Y = 563.95 e
0,0005 X
.

Zadatak za vjebu: Unesite podatke iz gornje tablice u radni list MS Excela, pa provjerite
valjanost izrauna Spearmanova koeficijenta korelacije ranga. Oprez: Rangove mujaka s
obujmom grlene vreice 5090 cm
3
morate upisati sami.

4.2. Regresijska analiza

Korelacijska je analiza vrlo esto tek prvi korak u utvrivanju meusobne ovisnosti dviju ili
vie promatranih varijabli. Ukoliko se pomou odgovarajuih statistikih pokazatelja utvrdi
da postoji statistiki znaajna veza meu promatranim varijablama, sljedei korak u
istraivanju te veze je tzv. regresijska
101
analiza.

Regresijsku su analizu u statistici prvi koristili matematiari Legendre
102
i Gauss koji su
poetkom 19. stoljea objavili radove o metodi najmanjih kvadrata. Meutim, sm pojam
regresijska analiza u statistiku je uveo Sir Francis Galton
103
. On je 1886. u Glasniku
antropolokoga instituta u Londonu objavio rad u kojemu je promatrao ovisnost visine djece
o prosjenoj visini njihovih roditelja. U tom je istraivanju doao do zanimljiva zakljuka:
ukoliko je prosjena visina obaju roditelja vea od medijana ureenoga niza svih prosjenih
visina roditelja, visina njihova djeteta e oekivano biti manja od prosjene visine obaju
roditelja (i obrnuto: ukoliko je prosjena visina obaju roditelja manja od medijana, visina
njihova djeteta oekivano e biti vea od prosjene visine od prosjene visine obaju roditelja).
Ovakvu je pojavu Galton nazivao efekt nazadovanja ili regresijski efekt. Zaslugom Karla
Pearsona, koji je poopio Galtonova razmatranja na ope statistike modele, rije regresija u
statistici je dobila dananje znaenje iako, praktino, s tim znaenjem nema gotovo nikakvih
dodirnih toaka.
Regresijska analiza ili, krae, regresija openito obuhvaa primjenu razliitih metoda
ispitivanja ovisnosti zavisne varijable (Y) o barem jednoj nezavisnoj varijabli (X). Temeljni je
cilj provedbe takvih metoda vezu izmeu promatranih varijabli izraziti ili opisati
odgovarajuim analitikim izrazom (regresijskim modelom). Takav izraz omoguuje ne samo

101
Rije regresija potjee od latinske rijei regressio = povratak, uzmak, odstupanje, nazadovanje. Objanjenje
uporabe ovoga naziva u statistici slijedi u daljnjem tekstu.
102
Adrien-Marie Legendre (1752. 1833.), francuski matematiar, bavio se matematikom analizom, teorijom
brojeva i algebrom. Jedan od Mjeseevih kratera dobio je ime po njemu.
103
Francis Galton (1822. 1911.), engleski znanstvenik, neak Charlesa Darwina, zaetnik moderne korelacijske
i statistike analize, mentor Karla Pearsona i Charlesa Edwarda Spearmana.


Poslovna statistika


objanjavanje ovisnosti promatranih pojava, nego i procjenjivanje vrijednosti zavisne
varijable Y za odreene vrijednosti barem jedne nezavisne varijable X.

Ovisno o broju zavisnih i nezavisnih varijabli koje se pojavljuju u odgovarajuem modelu,
regresija openito moe biti:

1.) jednostavna (u modelu se pojavljuje tono jedna zavisna i tono jedna nezavisna
varijabla);
2.) viestruka ili multipla (u modelu se pojavljuju tono jedna zavisna i barem dvije nezavisne
varijable).

U ovom emo se kolegiju baviti modelima jednostavne regresije, a od primjera modela
viestruke regresije kratko emo spomenuti samo najjednostavniji i najprimjenjivaniji model
viestruke linearne regresije.

Opi oblik modela jednostavne regresije jest:

Y = f(X) + e ili Y =
^
Y + e.

U ovakvom modelu varijabla e je tzv. stohastika (sluajna) varijabla koja, slobodno
govorei, ''mjeri'' stupanj nesustavnih utjecaja na zavisnu varijablu Y. To je potpuno u skladu s
ranijom podjelom veza mou varijablama na funkcijske i statistike: kod funkcijskih su veza
vrijednosti varijable u jednake nuli, dok su kod statistikih veza one razliite od nule. Opisna
statistika kojom se bavimo u ovom kolegiju ne bavi se posebnom analizom stohastike
varijable e, nego je smatra iskljuivo odstupanjima od funkcijskoga dijela regresijskoga
modela
104
.

O emu se, zapravo, radi? Kad istraujemo ovisnosti pojedinih varijabli, statistikim
istraivanjem dobivamo odreene podatke o vrijednostima tih varijabli. Npr. elimo li utvrditi
kako mjeseno izdvajanje za odjeu zaposlenika tvrtke ''Drpislavi d.o.o.'' iz Babine Grede
ovisi o njihovim mjesenim primanjima, statistikim istraivanjem (npr. anketiranjem)
dobivamo podatke o mjesenim primanjima i izdvajanja za odjeu svakoga od zaposlenika.
Te podatke sredimo i pregledno prikaemo tablino, kako smo to nauili u 2. poglavlju.
Oznaimo li s X nezavisnu varijablu mjesena primanja, a s Y zavisnu varijablu izdvajanja za
odjeu, cilj nam je odrediti funkciju koja e svakoj vrijednosti varijable X pridruiti
statistikim istraivanjima dobivenu vrijednost varijable Y. Najee takva funkcija ne postoji
jer je veza meu varijablama stohastika. Stoga elimo nai funkciju f(X) koja e to tonije

104
Otuda dolazi i oznaka e: engl. error = greka.


Poslovna statistika


vrijednostima varijable X pridruivati vrijednosti varijable Y. U svakom takvom pridruivanju
nuno e se javiti odreena greka (tzv. rezidualno
105
odstupanje). Iako bi teorijski bilo
najbolje da svako pojedino rezidualno odstupanje bude to manje, to praktino nije mogue:
minimiziranje odstupanja nastaloga jednim pridruivanjem u pravilu uzrokuje poveanje
odstupanja nastaloga drugim pridruivanjem. Moe se pokazati da je prosjena vrijednost svih
rezidualnih odstupanja jednaka nuli, to znai da kao i kod uvoenja pojma standardne
devijacije (vidjeti poglavlje 3.) nije mogue minimizirati prosjeno rezidualno odstupanje.
Stoga je potrebno analizirati i minimizirati varijancu svih rezidualnih odstupanja (koja je
uvijek strogo vea od nule). Takvo razmatranje dovodi do definiranja pojmova varijanca
regresije i standardna devijacija regresije o kojima emo neto vie rei u toki 4.2.3.

Prema tome, dva su osnovna cilja koja se ele postii stvaranjem regresijskoga modela:

1) odrediti tip realne funkcije (linearna, kvadratna, eksponencijalna, logaritamska, )
koja najbolje opisuje vezu izmeu promatranih varijabli;
2) procijeniti osnovne parametre te funkcije tako da zbroj kvadrata svih rezidualnih
odstupanja bude to manji.

U nastavku emo dati kratak opis nekoliko takvih regresijskih modela.

4.2.1. Model jednostavne linearne regresije

Ukoliko iz dijagrama rasipanja uvidimo da ravnomjerno poveanje vrijednosti nezavisne
varijable X uzrokuje priblino ravnomjerno poveanje (ili smanjenje) zavisne varijable Y,
regresijski model koji najbolje opisuje promatranu vezu varijabli X i Y jest model jednostavne
linearne regresije.

Opi oblik toga modela je:
Y = aX + b + e,

gdje su a, b R parametri modela, a e, kako je istaknuto u uvodu, stohastika (sluajna)
varijabla. Cilj nam je odrediti parametre a i b tako da varijanca svih rezidualnih odstupanja
bude minimalna. Budui da je graf svake linearne funkcije pravac, to praktino znai da
traimo jednadbu pravca koji e najbolje aproksimirati skup toaka dobiven konstrukcijom
dijagrama rasipanja.

105
Lat. residuum = ostatak; razlika


Poslovna statistika


Svakim statistikim istraivanjem dobivamo ukupno n razliitih ureenih parova vrijednosti
varijable X i vrijednosti varijable Y, tj. dobivamo ureene parove (x
1
, y
1
), (x
2
, y
2
), (x
n
, y
n
).
Za svaki od tih parova vrijedi jednakost:

y
i
= a x
i
+ b + e
i
, i = 1, 2, , n,

pri emu je e
i
rezidualno odstupanje, odnosno ''promaaj'' koji inimo zamijenimo li
statistikim istraivanjem dobivenu vrijednost y
i
raunski dobivenom vrijednou a x
i
+ b.
106

Time, zapravo, dobivamo sustav od n linearnih jednadbi s n + 2 nepoznanice: a, b, e
1
, e
2
, ,
e
n
. Taj sustav ima beskonano mnogo realnih rjeenja, ali tono jedno od njih zadovoljava
uvjet da varijanca svih rezidualnih odstupanja bude minimalna. Takvo se rjeenje odreuje
tzv. metodom najmanjih kvadrata.

Osnovna ideja metode najmanjih kvadrata je postii da zbroj kvadrata odstupanja empirijskih
vrijednosti zavisne varijable y
i
od oekivanih vrijednosti (oznaka:
i
) te varijable bude
minimalan. Budui da se pri izvodu parametara koristi tzv. diferencijalni raun, u detalje
cijeloga postupka neemo nulaziti, nego emo samo navesti rezultat:

1
2
2
1
,
n
i i
i
n
i
i
x y n x y
a b y a x
x n x
=
=

= =

,

pri emu su x i y redom aritmetika sredina empirijskih vrijednosti varijable x, odnosno
varijable y. Tako smo, dakle, dobili model jednostavne linearne regresije:

y
= a x + b.

(Oznaka y
sugerira da je rije o vrijednosti koja se izraunava na temelju jednadbe

regresijskoga modela, a ne o vrijednosti dobivenoj statistikim istraivanjem.) Navedimo
ukratko nazive i znaenje dobivenih parametara.

106
Vrijednosti dobivene statistikim istraivanjem u nastavku emo zvati originalne ili empirijske vrijednosti, a
vrijednosti dobivene raunski (pomou regresijskoga modela) zvat emo oekivane, procijenjene ili regresijske
vrijednosti.


Poslovna statistika


Vrijednost b naziva se naziva se konstantni lan
107
. Njegova teorijska interpretacija je
sljedea: b je oekivana vrijednost zavisne varijable y kada je vrijednost nezavisne varijable x
jednaka nuli. To se lako vidi uvrtavanjem x = 0 u jednadbu y
= a x + b. Ovaj parametar
nema veliko praktino znaenje jer nerijetko nema praktinoga smisla (npr. u modelima koji
promaraju ovisnost izdvajanja za prehranu o ukupnim mjesenim primanjima jer je u takvim
sluajevima praktino besmisleno procjenjivati iznos izdvajanja za prehranu osobe bez
ikakvih ukupnih mjesenih primanja).

Vrijednost a naziva se regresijski koeficijent i to je ujedno najvaniji parametar dobivenoga
modela. Njegova teorijska interepretacija je sljedea: vrijednost a je oekivana prosjena
promjena zavisne varijable y kada se nezavisna varijabla x povea za jednu jedinicu mjere.
Strogo pozitivna vrijednost regresijskoga koeficijenta upuuje na to da jedinini porast
vrijednosti nezavisne varijable X uzrokuje porast vrijednosti zavisne varijable Y (ili, kako se
matematiki netono esto istie, da su varijable X i Y upravno razmjerne), a strogo negativna
vrijednost regresijskoga koeficijenta upuuje na to da jedinini porast vrijednosti nezavisne
varijable X uzrokuje smanjenje vrijednosti zavisne varijable Y (ili, kako se matematiki
netono esto istie, da su varijable X i Y obrnuto razmjerne).

Znaenje regresijskoga koeficijenta nije iskljuivo u promjeni vrijednosti nezavisne varijable
za jednu jedinicu mjere, nego je ono puno vee. Naime, vrijede sljedea svojstva:

Svojstvo 1. Ukoliko se vrijednost nezavisne varijable X promijeni (povea ili smanji) za k
jedinica mjere, oekivana apsolutna prosjena promjena vrijednosti zavisne varijable Y iznosi
k a (jedinica mjere).

Dokaz: Neka je x
1
poetna vrijednost nezavisne varijable X. Tada je pripadna oekivana
vrijednost zavisne varijable Y jednaka

1
y
= a x
1
+ b.

Ukoliko se vrijednost x
1
promijeni za k jedinica mjere, nova vrijednost varijable X je:

x
2
= x
1
+ k,

107
U osnovnoj i srednjoj koli tu vrijednost nerijetko (neprecizno!) nazivaju odsjeak na osi y.


Poslovna statistika


pri emu za k > 0 imamo poveanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje
vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je

2
y
= a x
2
+ b = a (x
1
+ k) + b = a x
1
+ b + a k =
1
y
+ a k,

a odatle slijedi:

2
y

1
y
= a k.

Dakle, apsolutna prosjena promjena vrijednosti zavisne varijable Y jednaka je a k, to je i
trebalo pokazati.

Svojstvo 2. (esta zabluda) Ukoliko se vrijednost nezavisne varijable x promijeni (povea ili
smanji) za k%, oekivana relativna prosjena promjena vrijednosti zavisne varijable y iznosi
k% ako i samo ako je b = 0. Drugim rijeima, promatrane varijable su upravno ili obrnuto
razmjerne ako i samo ako je b = 0.

Dokaz: Neka je x
1
poetna vrijednost zavisne varijable X. Tada je pripadna oekivana
vrijednost zavisne varijable Y jednaka

1
y
= a x
1
+ b.

1
promijeni za k%, pri emu je k realan broj takav da je k 0 (za k = 0
poetna vrijednost varijable X se ne mijenja), nova vrijednost varijable X je:

x
2
= x
1
+
100
k
x
1
= (1 +
100
k
) x
1
,

pri emu za k > 0 imamo poveanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje
vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je:

2
y
= a x
2
+ b = a (1 +
100
k
) x
1
+ b = a x
1
+ b + a
100
k
x
1
=
1
y
+ a
100
k
x
1
.

Stoga je pripadna relativna prosjena promjena vrijednosti zavisne varijable Y jednaka:


Poslovna statistika


1 1 1 1 1
2 1
1
1 1 1
100 100 100
k k k
y a x y a x a x
y y
a x b
y y y

+
= = =
+
,

Ta e vrijednost biti jednaka k% ako i samo ako vrijedi jednakost:

2 1
1
100
y y k
y

= ,

odnosno jednakost

1
1
100
100
k
a x
k
a x b

=
+
.

Prema definiciji jednakosti dvaju razlomaka, gornja je jednakost ekvivalentna jednakosti

1 1
100 ( )
100
k
a x a x b k = + ,

tj. jednakosti

a k x
1
= a x
1
k + b k,
a odavde je
b k = 0.

Prema pretpostavci je k 0, pa dijeljenjem s k dobivamo

b = 0,

to je i trebalo pokazati.

Radi potpunosti, spomenimo da se grafiki prikaz bilo kojega modela jednostavne regresije
naziva regresijska krivulja. Regresijske krivulje mogu biti pravci, grafovi eksponencijalne i
logaritamske funkcije, grafovi ope potencije itd. Grafiki prikaz modela jednostavne linearne
regresije uvijek je pravac (jer je grafiki prikaz bilo koje linearne funkcije pravac), i taj se


Poslovna statistika


pravac naziva regresijski pravac. Njegova jednadba u pravokutnom koordinatnom sustavu u
ravnini podudara se s jednadbom regresijskoga modela, tj. ona glasi: y
= a x + b.

Primjer 1. Menadment tvornice prehrambenih proizvoda ''Mljac-mljac d.d.'' iz Zveaja
razmatra vezu izmeu opsega proizvodnje okolade ''Fantazija'' i ukupne zarade dobivene
prodajom te okolade u proteklih 8 mjeseci. Dobiveni podaci prikazani su u donjoj tablici.

proizvodnja okolade
[000 kom.]
ukupna dobit
[000 kn]
20 220
25 280
32 520
28 500
40 1250
35 1000
36 980
30 600

Prikaimo dobivene podatke dijagramom rasipanja, izraunajmo Pearsonov koeficijent
jednostavne linearne korelacije i procijenimo njegovu statistiku znaajnost na razini
pouzdanosti od 95%. Potom procijenimo parametre modela jednostavne linearne regresije koji
najbolje opisuje ovisnost ukupne dobiti o koliini proizvedene okolade, te, na temelju njega,
ukupnu dobit ukoliko se proizvede 30 000 komada okolade i ukupnu proizvodnju okolade u
mjesecu u kojemu je ostvarena dobit od 800.000,00 kn.

Budui da emo u drugom dijelu zadatka promatrati ovisnost ukupne dobiti o koliini
proizvedene okolade, koliina proizvedene okolade bit e nam nezavisna varijabla X, a
ukupna zarada dobivena prodajom okolade zavisna varijabla Y (za korelacijsku je analizu to
nebitno). Odgovarajui dijagram rasipanja je:


Poslovna statistika


Izraunima analognima onima iz toke 4.1 dobiva se vrijednost Pearsonova koeficijenta
jednostavne linearne korelacije:

r = 0.952039274,

a tom koeficijentu pripadna p vrijednost jednaka je

p = 0.000265976 < 0.05.

Dakle, dobiveni koeficijent je statistiki znaajan, tj. postoji statistiki znaajna linearna veza
izmeu proizvodnje okolade i ukupne dobiti. Iz vrijednosti Pearsonova koeficijenta
jednostavne linearne korelacije moe se zakljuiti da je ta veza pozitivna i jaka, tj. da e
poveanje proizvodnje okolade vrlo vjerojatno uzrokovati poveanje ukupne dobiti.

Regresijski pravac i njegova jednadba, koja je ujedno i jednadba odgovarajuega modela
jednostavne linearne regresije, prikazani su na donjoj slici.


Poslovna statistika


Osnovni parametri dobivenoga regresijskog modela jednostavne linearne regresije su:

a = 54.60276339,
b = 1010.284974

(Definiciju i znaenje parametra R
2
navodimo u toki 4.2.3.) Znaenje tih parametara je
sljedee:

a = 54.60276339 Ukoliko se proizvodnja povea za 1000 okolada, oekivano prosjeno
poveanje ukupne dobiti iznosi 54.602,76 kn. (Oprez s mjernim jedinicama!)
b = 1010.284974 Ukoliko tvornica ne proizvede niti jednu okoladu, procjenjuje (ili
oekuje) se gubitak u iznosu od 1.010.284,97 kn. (Opet pripazite na mjerne jedinice!)

Teoretski gledano, na temelju dobivenoga regresijskoga koeficijenta a moemo procijeniti
prosjenu promjenu ukupne dobiti u sluaju bilo koje promjene vrijednosti proizvodnje. No,
zbog pouzdanosti regresijskoga modela vrijednost navedene promjene ne bi trebala biti strogo
vea od raspona varijacije uzorka nezavisne varijable X jer se procjenjivanjem vrijednosti
izvan segmenta odreenoga najmanjom i najveom vrijednosti nezavisne varijable X znaajno
gubi na pouzdanosti procjene.

Npr. ukoliko se mjesena proizvodnja povea za 100 okolada, oekivano prosjeno
poveanje ukupne dobiti iznosit e 5.460,27 kn. Smanji li se mjesena proizvodnja (npr. zbog
remonta strojeva) za 200 okolada, oekivano prosjeno smanjenje ukupne dobiti iznosit e


Poslovna statistika


10.920,55 kn. Openito, povea (smanji) li se proizvodnja za k okolada mjeseno, oekivano
prosjeno poveanje (smanjenje) ukupne dobiti iznosit e k a = 54,60276 k kn.
Preostaje nam procijeniti ukupnu dobit ukoliko se mjeseno proizvede 30000 komada
okolade. U tu emo svrhu u dobivenu jednadbu modela jednostavne linearne regresije
uvrstiti x = 30, pa emo dobiti:

y
= 54.60276339 30 1010.284974 = 627.797927

Dakle, oekivana ukupna dobit iznosi 627.797,93 kn.

Dobiveni regresijski model, naravno, moemo iskoristiti i u obrnutom sluaju, tj. za
procjenjivanje vrijednosti nezavisne varijable x u sluajevima u kojima nam je zadana
vrijednost zavisne varijable y. Izrazimo li x iz jednadbe modela jednostavne linearne
regresije, dobivamo:

1 b
x y
a a
= .

Ovdje oznaka x
sugerira da vrijednost varijable x procjenjujemo, a oznaka y da je vrijednost

varijable y unaprijed poznata. U konkretnom sluaju, u navedenu jednakost uvrstimo
a = 54.60276339, y = 800 i b = 1010.284974, pa dobivamo da je traena procijenjena
mjesena proizvodnja

1 1010.284974
800 33.1537245
54.60276339 54.60276339
x
= + .

Dakle, procijenjena proizvodnja u mjesecu u kojemu je ostvarena dobit od 800.000,00 kn
priblino iznosi 33154 komada okolade. (Oprez s interpretacijom: vrijednosti varijable
proizvodnja su nuno prirodni brojevi ili nula, pa ne moemo rei npr. da procijenjena
proizvodnja iznosi 33153.7 komada okolade. Slino vrijedi i za vrijednosti varijable y koje
ima smisla raunati na najvie 5 decimalnih mjesta jer 6. decimala oznaava tisuiti dio kune
koji u praksi ne postoji.)

Napomenimo da se u sluaju modela jednostavne linearne regresije p vrijednost koja
odgovara nezavisnoj varijabli X i ukazuje na njezinu statistiku znaajnost podudara s p
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije. U ovom sluaju to znai
da je nezavisna varijabla X statistiki znaajna, tj. da postoji statistiki znaajan utjecaj
proizvodnje okolade na ukupnu dobit. Ovaj pokazatelj ujedno je i pokazatelj statistike


Poslovna statistika


znaajnosti cijeloga dobivenoga modela jednostavne linearne regresije, tj. dobiveni je model
takoer statistiki znaajan.

Primjer 2. U sljedeoj su tablici navedeni podaci o prosjenom broju zaposlenih tijekom
2007. godine i ukupnom godinjem prometu za svaku od ukupno 12 prodavaonica tvrtke
''Zumkon d.o.o.'' iz Kukae.

prosjean broj zaposlenih ukupan godinji promet
[000 ]
22 250
31 300
90 920
82 850
43 400
65 680
59 630
16 180
61 670
46 420
35 350
50 460

Odnos ukupnoga godinjega prometa i prosjenoga broja zaposlenih prikaimo grafiki
odgovarajuim dijagramom (uz kojega navedimo sve potrebne oznake), pa odredimo
Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu
statistiku znaajnost na razini pouzdanosti od 95%.
Potom procijenimo jednadbu i parametre modela jednostavne linearne regresije koji najbolje
opisuje ovisnost ukupnoga godinjega prometa o prosjenom broju zaposlenih, te utvrdimo
njihovu statistiku znaajnost na razini pouzdanosti od 95%.
Procijenimo i ukupan godinji promet prodavaonice koja je u 2007. godini imala prosjeno 40
zaposlenih, prosjean broj zaposlenih u prodavaonici koja je u 2007. godini ostvarila promet u
iznosu od pola milijuna eura, te promjenu ukupnoga godinjega prometa ukoliko se prosjean
broj zaposlenih u jednoj prodavaonici smanji za 5.
Zbog drugoga dijela zadatka, prosjean broj zaposlenih u jednoj prodavaonici bit e nam
nezavisna varijabla X, a ukupan godinji promet zavisna varijabla Y. Odgovarajui grafiki
prikaz je dijagram rasprenja prikazan na donjoj slici.


Poslovna statistika


Izraunima analognima onima iz toke 4.1. dobiva se vrijednost Pearsonova koeficijenta

r = 0.991128384,

a tom koeficijentu odgovarajua p vrijednost iznosi

p = 4.26414E-10 = 0.0000000000426414 < 0.05.

Prema tome, dobiveni koeficijent statistiki je znaajan, tj. postoji statistiki znaajna
linearna veza izmeu prosjenoga broja zaposlenih i ukupnoga godinjega prometa. Iz
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zakljuujemo da je ta veza
pozitivna i jaka, tj. da e poveanje prosjenoga broja zaposlenih vrlo vjerojatno uzrokovati i
poveanje ukupnoga godinjega prometa.

Koristei gornji dijagram, moemo odrediti jednadbu modela jednostavne linearne regresije
koji najbolje opisuje promatranu ovisnost, te osnovne parametre toga modela. Zajedno s
odgovarajuim regresijskim pravcem, ti su podaci navedeni na sljedeoj slici.


Poslovna statistika


Iz dobivene jednadbe modela jednostavne linearne regresije slijedi da su osnovni parametri
dobivenoga regresijskog modela:

a = 10.4023396,
b = 10.95031313

Njihova znaenja su:

a = 10.4023396 Ukoliko se prosjean broj zaposlenih povea za 1, oekivano prosjeno
poveanje ukupnoga godinjega prometa iznosi 10.402,34 . Odavde izravno slijedi da
ukoliko se prosjean broj zaposlenih smanji za 5, oekivano prosjeno smanjenje ukupnoga
godinjega prometa iznosi 5 10.402,34 = 52.011,70 . Openito, ukoliko se prosjean broj
zaposlenih povea (smanji) za k, oekivano prosjeno poveanje (smanjenje) ukupnoga
godinjega prometa iznosi k a 1.000,00 = k 10.4023396 1.000,00 = 10.402,3396 k .

b = 10.95031313 U ovom sluaju vrijednost x = 0 znai da u prodavaonici tijekom cijele
godine nije radio niti jedan zaposlenik. Takva prodavaonica prirodno nije ostvarila nikakav
ukupni godinji promet. Stoga konstantni lan u ovom sluaju nema svojega znaenja (ranije


Poslovna statistika


je istaknuto da se u praksi nerijetko javljaju ovakvi sluajevi i da je zbog toga regresijski
koeficijent najvaniji parametar dobivenoga modela).

Analogno kao i u prethodnom primjeru, oekivani ukupan godinji promet prodavaonice u
kojoj je prosjean godinji broj zaposlenih jednak 40 dobijemo tako da u jednadbu
regresijskoga modela uvrstimo x = 40. Dobiva se:

y
= 10.4023396 40 10.95031313 = 405.1432707

Dakle, traeni oekivani promet iznosi 405.143,27 . S druge strane, prosjean godinji broj
zaposlenih u prodavaonici iji je ukupan godinji promet iznosio pola milijuna eura procijenit
emo tako da u jednadbu

1 b
x y
a a
=

uvrstimo a = 10.4023396, y = 500 i b = 10.95031313. Dobivamo:

1 10.95031313
500 49.118788
10.4023396 10.4023396
x
= + .

Dakle, traeni procijenjeni prosjean broj zaposlenih priblino iznosi 49. (Opet oprez s
interpretacijom: brojimo ljude, pa dobiveni rezultat nuno mora biti prirodan broj ili nula.)

Iz p vrijednosti izraunate za Pearsonov koeficijent jednostavne linearne korelacije slijedi
da su varijabla X i dobiveni model jednostavne linearne regresije statistiki znaajni. Drugim
rijeima, postoji statistiki znaajan utjecaj prosjenoga broja zaposlenih na ukupan godinji
promet u promatranim prodavaonicama.

Primjer 3. Za 10 odabranih pokrajina Kraljevine Bubumbuj utvreni su narodni dohodak po
stanovniku (per capita) i stopa mortalileta dojenadi u 2007. godini. Dobiveni su podaci
prikazani u sljedeoj tablici.

narodni dohodak po stanovniku
[000 USD]
stopa mortaliteta dojenadi
[]
3,99 12
3,5 13
3,1 15
2,82 17
2 18
1,8 18
1,73 19


Poslovna statistika


narodni dohodak po stanovniku
[000 USD]
stopa mortaliteta dojenadi
[]
1,56 24
1 29
0,5 35

Odnos stope mortaliteta dojenadi i narodnoga dohotka po stanovniku prikaimo grafiki
odgovarajuim dijagramom (uz kojega navedimo sve potrebne oznake), pa odredimo
Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu
statistiku znaajnost uz razinu pouzdanosti od 95%.
Potom procijenimo jednadbu i parametre modela jednostavne linearne regresije koji najbolje
opisuje ovisnost stope mortaliteta dojenadi o narodnom dohotku po stanovniku, te statistiku
znaajnost regresijskih varijabli i dobivenoga modela jednostavne linearne regresije uz razinu
pouzdanosti od 95%.
Procijenimo i stopu mortaliteta dojenadi pokrajine iji je narodni dohodak po stanovniku u
2007. godini bio 2.500,00 USD, narodni dohodak po stanovniku u pokrajini koja je u 2007.
godini zabiljeila stopu mortaliteta dojenadi 20, te promjenu stope mortaliteta dojenadi
ukoliko se narodni dohodak po stanovniku smanji za 800 USD.

Ponovo radi drugoga dijela zadatka, stopa mortaliteta dojenadi bit e zavisna varijabla Y, a
narodni dohodak po stanovniku nezavisna varijabla X. Odgovarajui grafiki prikaz odnosa
promatranih varijabli je dijagram rasipanja prikazan na sljedeoj slici.


Poslovna statistika


Izraunima analognima onima iz toke 4.1. dobiva se vrijednost Pearsonova koeficijenta

r = -0.913291451,

a tom koeficijentu pripadna p vrijednost iznosi

p = 0.000222487 < 0.05,

pa zakljuujemo da je dobiveni koeficijent statistiki znaajan, tj. da postoji statistiki
znaajna linearna veza izmeu narodnoga dohotka i stope mortaliteta dojenadi. Iz
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zakljuujemo da je ta veza
negativna i jaka, tj. da e poveanje narodnoga dohotka vrlo vjerojatno uzrokovati smanjenje
stope mortaliteta dojenadi.

Parametri modela jednostavne linearne regresije, kao i odgovarajui regresijski pravac
prikazani su na donjoj slici.

U ovome je sluaju, dakle,

a = 5.953418082;
b = 33.09751978.

Interpretacije tih parametara su:


Poslovna statistika


a = 5.953418082 Ukoliko se narodni dohodak po stanovniku povea za 1.000,00 USD,
oekivano prosjeno smanjenje stope mortaliteta dojenadi iznosi priblino 6. Odatle
izravno slijedi da ukoliko se narodni dohodak po stanovniku smanji za 800 USD, oekivano
prosjeno poveanje stope mortaliteta dojenadi iznosi priblino 0.8 5.953418082
4.762734465, tj. priblino 4.76. Openito, ukoliko se narodni dohodak po stanovniku
povea (smanji) za k USD, oekivano prosjeno smanjenje (poveanje) stope mortaliteta
dojenadi iznosi k |a|
1
1000
= k 5.953418082
1
1000
= 0.005953418082 k .
b = 33.098 I u ovom sluaju konstantni lan nema znaenja jer je praktiki nemogue da
cjelokupni narodni dohodak po stanovniku (varijabla X) iznosi 0,00 USD.

Preostaje procijeniti stopu mortaliteta dojenadi pokrajine iji je narodni dohodak po
stanovniku u 2007. godini bio 2.500,00 USD, te narodni dohodak po stanovniku u pokrajini
koja je u 2007. godini zabiljeila stopu mortaliteta dojenadi 20. U prvom sluaju u
dobivenu jednadbu modela jednostavne linearne regresije uvrstimo x = 2.5, pa dobijemo:

y
= 5.953418082 2.5 + 33.09751978 = 18.21397458.

Dakle, traena procijenjena stopa mortaliteta iznosi priblino 18,214. U drugom sluaju, u
jednadbu

1 b
x y
a a
=

uvrstimo a = 5.953418082, y = 20 i b = 33.098, pa dobivamo:

1 33.09751978
20 2.2
5.953418082 5.953418082
x
= +

Dakle, traeni procijenjeni narodni dohodak po stanovniku iznosi priblino 2.200,00 USD.

Zakljuno istaknimo da iz p vrijednosti izraunate za Pearsonov koeficijent jednostavne
linearne korelacije slijedi da su i regresorska varijabla X i dobiveni model jednostavne
linearne regresije statistiki znaajni, tj. da postoji statistiki znaajan utjecaj narodnoga
dohotka po stanovniku na stopu mortaliteta dojenadi.


Poslovna statistika


4.2.2. Analiza varijance modela jednostavne linearne regresije

Nakon to smo odredili jednadbu modela jednostavne linearne regresije namee se pitanje
''kvalitete'' dobivenoga modela. Zapravo, promatramo u kojoj mjeri vrijednosti zavisne
varijable procijenjene dobivenim modelom odgovaraju empirijskim vrijednostima, tj. s
kolikom tonou moemo procijeniti vrijednost zavisne varijable za odreenu vrijednost
nezavisne varijable. Procjena reprezentativnosti modela temelji se na ve spomenutoj analizi
varijance rezidualnih odstupanja empirijskih vrijednosti (y
i
) zavisne varijable od procijenjenih
vrijednosti (
i
) te varijable. Tu je analizu grafiki zgodno prikazati donjom slikom.

Prigodom ocjenjivanja reprezentativnosti modela jednostavne linearne regresije koristi se tzv.
jednadba analize varijance toga modela. Ona predstavlja temelj deskriptivne i inferencijalne
statistike analize reprezentativnosti regresijskoga modela, a glasi:

2 2 2
1 1 1
( ) ( ) ( )
n n n
i i i
i i i
y y y y y y

= = =
= +

,

odnosno, u razvijenom obliku,

2 2
2 2
1 1 1 1 1 1
n n n n n n
i i i i i i i i
i i i i i i
y n y a y b x y n y y a y b x y
= = = = = =
| | | |
= + +
| |
\ \

Ova jednadba je posljedica sljedeega netrivijalnoga svojstva modela jednostavne linearne
regresije:

Svojstvo 1. Neka su (x
i
, y
i
) empirijski dobivene vrijednosti nezavisne varijable X, odnosno
zavisne varijable Y, za svaki i = 1, 2, , n. Nadalje, neka su
i
y
procijenjene vrijednosti
dobivene uvrtavanjem vrijednosti x
i
u jednadbu modela jednostavne linearne regresije koji


Poslovna statistika


najbolje opisuje ovisnost varijable Y o varijabli X, i to za svaki i = 1, 2, , n. Tada je
aritmetika sredina svih procijenjenih vrijednosti jednaka aritmetikoj sredini svih
empirijskih vrijednosti, tj. vrijedi jednakost:

1 1
n n
i i
i i
y y y
= =
= =

.

Objasnimo poblie svaki pojedini lan u gornjoj jednadbi:

ST :=
2
1
( )
n
i
i
y y
=
=
2
2
1
n
i
i
y n y
=

ukupan zbroj kvadrata odstupanja svih empirijskih

vrijednosti zavisne varijable Y od aritmetike sredine tih vrijednosti
108
;

SP =
2
1
( )
n
i
y y
=
2
1 1
n n
i i i
i i
a y b x y n y
= =
+

ovaj se lan naziva protumaeni dio
ukupnoga zbroja kvadrata odstupanja, a zapravo je rije o ukupnom zbroju kvadrata
odstupanja svih procijenjenih vrijednosti zavisne varijable Y od aritmetike sredine tih
vrijednosti
109
(zbog iskazanoga svojstva 1., ta aritmetika sredina jednaka je onoj koja se
pojavljuje u lanu ST);

SR =
2
1
( )
n
i
i
y y
=
2
1 1 1
n n n
i i i i
i i i
y a y b x y
= = =

ovaj se lan naziva neprotumaeni dio
ukupnoga zbroja kvadrata odstupanja ili zbroj kvadrata rezidualnih odstupanja, a zapravo je
rije o zbroju kvadrata odstupanja procijenjenih vrijednosti od odgovarajuih empirijskih
vrijednosti. Slobodno govorei, ovaj lan ''mjeri'' ukupnu pogreku svih n procjenjivanja.

Budui da je prvi lan jednak zbroju preostalih dvaju, praktino se obino raunaju samo
protumaeni i neprotumaeni dio ukupnoga zbroja kvadrata odstupanja. Koristei dobivene
rezultate raunaju se tzv. mjere reprezentativnosti o kojima se govori u sljedeoj toki.

108
Podijeli li se navedeni lan ukupnim brojem parova podataka (n), dobiva se varijanca empirijskih vrijednosti
varijable Y.
109
Podijeli li se navedeni lan ukupnim brojem parova (n), dobiva se varijanca procijenjenih vrijednosti varijable
Y.


Poslovna statistika


4.2.3. Mjere reprezentativnosti modela jednostavne linearne regresije

Za ocjenu reprezentativnosti nekoga regresijskoga modela rabe se pokazatelji analogni
pokazateljima reprezentativnosti aritmetike sredine u deskriptivnoj analizi. Te pokazatelje
nazivamo mjere reprezentativnosti regresijskoga modela, a dijelimo ih na apsolutne i
relativne.

U apsolutne mjere reprezentativnosti ubrajamo varijancu regresijskoga modela i iz nje
izvedenu standardnu devijaciju regresijskoga modela. U raunanju ovih vrijednosti koriste se
svi empirijski i svi procijenjeni podaci.

U relativne mjere reprezentativnosti ubrajamo koeficijent varijacije regresijskoga modela i
koeficijent determinacije regresijskoga modela. Za usporedbu reprezentativnosti dvaju
razliitih regresijskih modela najee se rabe upravo relativne mjere reprezentativnosti.

U nastavku ukratko opisujemo svaku od navedenih mjera reprezentativnosti.

4.2.3.1. Varijanca regresijskoga modela

Osnova za mjerenje reprezentativnosti regresijskoga modela je rasprenje (disperzija) oko
regresijskoga pravca koja se oituje na rezidualnim odstupanjima. to su odstupanja
empirijskih vrijednosti zavisne varijable Y od odgovarajuih procijenjenih vrijednosti manja,
reprezentativnost regresijskoga modela je bolja. Ve smo istaknuli da je aritmetika sredina
svih rezidualnih odstupanja uvijek jednaka nuli, pa se pri analizi rasprenja polazi od analize
kvadrata rezidualnih odstupanja, odnosno od analize njihove varijance. S tim u vezi definira
se pojam varijance regresijskoga modela.

Varijanca regresijskoga modela (oznaka:
2
y
) je apsolutna mjera reprezentativnosti

regresijskoga modela. Ona se rauna kao aritmetika sredina kvadrata svih rezidualnih
odstupanja, pa je, sukladno oznakama iz toke 4.2.2., jednaka

2 2
1 1 1
1
2 2
n n n
i i i i
y
i i i
SR
y a y b x y
n n
= = =
| |
= =
|

\

Istaknimo da se u inferencijalnoj statistici procjena ovoga pokazatelj rauna kao omjer
veliine SR i broja (n 2) koji, kako smo ve vidjeli, oznaava ukupan broj stupnjeva


Poslovna statistika


slobode. Takav nain izrauna primijenjuju gotovo svi statistiki raunalni programi, pa je u
takvim sluajevima nuno naglasiti da je rije o procjeni varijance regresije osnovnoga
skupa.

4.2.3.2. Standardna devijacija regresijskoga modela

Standardna devijacija regresijskoga modela (oznaka:
y
) je apsolutna mjera
reprezentativnosti regresijskoga modela. Ona je, prema definiciji, drugi korijen iz varijance
regresijskoga modela. Nerijetko se, analogno standardnoj devijaciji cjelokupnoga osnovnoga
skupa, matematiki netono interpretira kao prosjeno odstupanje originalnih od regresijskih
vrijednosti. Radi potpunosti, navodimo formulu prema kojoj se rauna standardna devijacija
regresijskoga modela:

2
1 1 1
1
2 2
n n n
i i i i
y
i i i
SR
y a y b x y
n n
= = =
| |
= =
|

\

.

Napomenimo da se u inferencijalnoj statistici standardna devijacija definira na potpuno isti
nain, ali je, zbog razliitosti izrauna varijance, pripadna formula za izravni izraun
drugaija od gore navedene. U tom se sluaju govori o procjeni standardne devijacije
osnovnoga skupa.

4.2.3.3. Koeficijent varijacije regresijskoga modela

Koeficijent varijacije regresijskoga modela (oznaka:
y
V
) je relativna mjera reprezentativnosti

modela i predstavlja postotni udio standardne devijacije regresijskoga modela u odnosu na
aritmetiku sredinu svih empirijskih (ili, prema Svojstvu 1., procijenjenih) vrijednosti zavisne
varijable:

100
y
y
V
y
=

Ekvivalentno, moemo rei da koeficijent varijacije regresijskoga modela mjeri relativno
prosjeno odstupanje empirijskih vrijednosti zavisne varijable Y od procijenjenih vrijednosti


Poslovna statistika


te varijable i iskazuje rezultat u postotcima. to je vrijednost koeficijenta
y
V
blia nuli,
reprezentativnost regresijskoga modela je bolja.

4.2.3.4 Koeficijent determinacije regresijskoga modela

Koeficijent determinacije (oznaka: R
2
) je relativna mjera reprezentativnosti regresijskoga
modela. Definira se kao omjer protumaenoga dijela ukupnoga zbroja kvadrata odstupanja
(SP) i ukupnoga zbroja kvadrata odstupanja (ST), a moe poprimiti sve vrijednosti iz
segmenta [0, 1]. Objanjava se kao postotni udio modelom protumaenoga dijela zbroja
kvadrata svih odstupanja u odnosu na ukupan zbroj kvadrata svih odstupanja, a rauna prema
formuli:

2
2
2 1 1 1
2
2 2
1 1
( )
( )
n n n
i i i
i i i
n n
i i
i i
y y a y b x y n y
SP
R
ST
y y y n y
= = =
= =
+
= = =

to je njegova vrijednost blia 1, reprezentativnost regresijskoga modela je bolja (donekle
suprotno od koeficijenta varijacije).

Napomenimo da su u sluaju jednostavne linearne regresije koeficijent determinacije i
Pearsonov koeficijent jednostavne linearne korelacije vezani relacijom:

2
R r = ,

pri emu je predznak Pearsonova koeficijenta linearne korelacije jednak predznaku
regresijskoga koeficijenta a.

Koeficijent determinacije openito se moe objasniti i kao razmjer varijance zavisne varijable
objanjen nezavisnom varijablom. Npr., utvrdimo li da je Pearsonov koeficijent linearne
korelacije izmeu varijabli kolinik inteligencije i prosjena ocjena na studiju iznosi r = 0.5,
onda je pripadna vrijednost koeficijenta determinacije modela jednostavne linearne regresije
kojim se najbolje moe opisati promatrana veza jednaka

R
2
= 0.5
2
= 0.25,


Poslovna statistika


to, slobodno govorei, znai da se priblino 25% uspjeha na studiju moe objasniti
inteligencijom studenata.

Istaknimo da u MS EXCEL-u jednadbu, te vrijednost koeficijenta determinacije bilo kojega
od ponuenih regresijskih modela moemo dobiti ukljuivanjima podopcija Prikai jednadbu
na grafikonu i Prikai R-kvadratnu vrijednost na grafikonu u podopciji Mogunosti opcije
Dodaj crtu trenda.

Primjer 4. Na temelju podataka iz Primjera 1. izraunajmo koeficijent varijacije i koeficijent
determinacije dobivenoga modela jednostavne linearne regresije. Objasnimo znaenje
dobivenih vrijednosti.

U Primjeru 1. dobivena je sljedea jednadba modela jednostavne linearne regresije:

y
= 54.603 x 1010.3.

Izraunajmo najprije vrijednost koeficijenta varijacije toga modela. Koristei navedenu
jednadbu najprije za svaku empirijsku vrijednost nezavisne varijable X raunamo
odgovarajuu procijenjenu vrijednost zavisne varijable Y. Potom izraunamo kvadrat razlike
svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajue procijenjene
vrijednosti te varijable, te zbrojimo dobivene rezultate. Tako dobivamo trei i etvrti stupac
sljedee tablice:

proizvodnja
okolade
[000 kom.]
(x
i
)
ukupna
dobit
[000 kn]
(y
i
)
procijenjena
ukupna dobit
[000 kn]
(
i
y
)

(y
i

i
y
)
2

20 220 81,76 19110.3
25 280 354,775 5591.301
32 520 736,996 47087.26
28 500 518,584 345.3651
40 1250 1.173,82 5803.392
35 1000 900,805 9839.648
36 980 955,408 604.7665
30 600 627,79 772.2841
ukupno: 5.350 5.349,938 89154.32


Poslovna statistika


Tako je vrijednost koeficijenta varijacije jednaka:

100
y
y
V
y
= =
1 1
89.154, 32
8
2 2 8 2
100 100 100
1 5350
n n
i i
i i
SR SR
n
n n
y y
n
= =

= =

18.23%,

pa moemo rei da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca relativno
slab. Vrijednost koeficijenta determinacije ve smo dobili u Primjeru 1. i ona iznosi
R
2
= 0.9064. To znai da je modelom jednostavne linearne regresije protumaeno 90.64%
ukupnih odstupanja, odnosno, da se 90.64% ovisnosti ukupne dobiti o proizvodnji okolade
moe objasniti modelom jednostavne linearne regresije. Prema obama pokazateljima,
moemo zakljuiti da je model reprezentativan.

Primjer 5. Na temelju podataka iz Primjera 2. izraunajmo koeficijent varijacije i koeficijent
determinacije dobivenoga modela jednostavne linearne regresije. Objasnimo znaenje
dobivenih vrijednosti.

U Primjeru 2. dobivena je sljedea jednadba modela jednostavne linearne regresije:

y
= 10.402 x 10.95.

Kao i u Primjeru 4., izraunajmo najprije vrijednost koeficijenta varijacije toga modela.
Koristei navedenu jednadbu najprije za svaku empirijsku vrijednost nezavisne varijable X
raunamo odgovarajuu procijenjenu vrijednost zavisne varijable Y. Potom izraunamo
kvadrat razlike svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajue
procijenjene vrijednosti te varijable, te zbrojimo dobivene rezultate. Tako dobivamo trei i
etvrti stupac sljedee tablice:


Poslovna statistika


prosjean broj
zaposlenih
(x
i
)
ukupan godinji
promet
[000 ]
(y
i
)
procijenjeni ukupan
godinji promet
[000 ]
(
i
y
)

(y
i

i
y
)
2

22 250 217,894 1030.79524
31 300 311,512 132.52614
90 920 925,23 27.3529
82 850 842,014 63.7762
43 400 436,336 1320.3049
65 680 665,18 219.6324
59 630 602,768 741.58182
16 180 155,482 601.13232
61 670 623,572 2155.55918
46 420 467,542 2260.24176
35 350 353,12 9.7344
50 460 509,15 2415.7225
ukupno: 6110 6109,8 10978.35977

Tako je vrijednost koeficijenta varijacije jednaka:

100
y
y
V
y
= =
1 1
10978.35977
12
2 2 12 2
100 100 100
1 6110
n n
i i
i i
SR SR
n
n n
y y
n
= =

= =

6.507631929%,

pa moemo rei da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca vrlo slab,
odnosno da je model reprezentativan. Vrijednost koeficijenta determinacije ve smo dobili u
Primjeru 2. i ona iznosi R
2
= 0.9823. Dakle, 98,23% veze izmeu ukupnoga godinjega
prometa i prosjenoga broja zaposlenika moe se objasniti modelom jednostavne linearne
regresije.

Zadatak za vjebu: Izraunajte koeficijent varijacije i koeficijent determinacije modela
jednostavne linearne regresije iz Primjera 3. Objasnite znaenje dobivenih vrijednosti.


Poslovna statistika


4.3. Primjeri nelinearnih modela jednostavne regresije

Odnos zavisne i nezavisne varijable esto nije linearan (ravnomjerne promjene nezavisne
varijable ne uzrokuju ravnomjerne promjene zavisne varijable). U takvim je sluajevima
potrebno je pronai neku drugu (nelinearnu) funkciju koja najbolje pokazuje ovisnost zavisne
o nezavisnoj varijabli. U nastavku se razmatraju modeli jednostruke regresije u kojima su te
funkcije eksponencijalna funkcija, logaritamska funkcija i opa potencija. Ti se modeli
odgovarajuim zamjenama varijabli uvijek mogu svesti na model jednostavne linearne
regresije, ali to neemo uiniti budui da MS Excel omoguuje rad i s takvim vrstama modela
jednostavne regresije.

4.3.1. Model jednostavne eksponencijalne regresije

Standardni oblik regresijske jednadbe modela jednostavne eksponencijalne regresije je:

Y
= B A
X
pri emu dodatno vrijede nejednakosti:

A, B > 0, A 1.

Ove nejednakosti su posljedice injenice da eksponencijalna funkcija nije definirana za A 0,
te da za A = 1 dobivamo konstantnu funkciju Y
= B koja je, zapravo, poseban sluaj modela

jednostavne linearne regresije.

I za ovaj model navodimo interpretacije obaju njegovih parametara (A i B). Zbog neto
kompliciranije interpretacije parametra A navodimo i odgovarajui matematiki izvod te
interpretacije.

B procijenjena (ili oekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 0. (U istinitost ove tvrdnje lako se moete uvjeriti uvrstite li X = 0 u
gornju jednadbu modela jednostavne eksponencijalne regresije i primijenite injenicu da za
svaki strogo pozitivan realan broj A vrijedi jednakost A
0
= 1.) Kao i kod modela jednostavne
linearne regresije, odmah treba napomenuti da interpretacija toga parametra nerijetko ne
odgovara realnoj situaciji. Zbog toga ovaj parametar nije od osobite vanosti u dodatnim
analizama.


Poslovna statistika


Interpretacija parametra A u ovom sluaju nije izravna kao kod modela jednostavne linearne
regresije, nego posredna. Naime, vrijedi sljedee:

Svojstvo 1. Ako se vrijednost nezavisne varijable X promijeni za k jedinica mjere, onda e se
oekivana vrijednost zavisne varijable Y promijeniti za prosjeno 100 (A
k
1)%. Pritom
predznak broja k oznaava poveanje ili smanjenje vrijednosti nezavisne varijable X, a
predznak parametra A
k
1 oznaava prosjeno poveanje ili smanjenje oekivane vrijednosti
zavisne varijable Y.

Dokaz: Neka je x
1
poetna vrijednost nezavisne varijable x. Pripadna regresijska vrijednost
zavisne varijable y je:

1
1
x
y B A
= .

Odmah primijetimo da je, zbog uvjeta A, B > 0, A 1, svaka oekivana vrijednost zavisne
varijable y strogo vea od nule (to slijedi i iz injenice da je podruje vrijednosti bilo koje
eksponencijalne funkcije skup R
+
= 0,+), pa posebno i razliita od nule.

Ako se vrijednost x
1
promijeni za k jedinica mjere, nova vrijednost te varijable je:
x
2
= x
1
+ k.

(Pritom za k > 0 imamo poveanje vrijednosti varijable x
1
, a za k < 0 smanjenje njezine
vrijednosti.) Pripadna regresijska vrijednost zavisne varijable y je

2 1 1 1
2 1
( )
x x k x x k k k
y B A B A B A A A B A A y

+
= = = = = .

Stoga je relativna promjena vrijednosti zavisne varijable y jednaka:

2 1 1 1 1
1 1 1
( 1)
1
k k
k
y y A y y y A
y A
y y y

= = = = ,

odnosno, u postotcima,

100 ( 1) %
k
y A
( =

,


Poslovna statistika


to je i valjalo pokazati.

Dakle, kod modela jednostavne eksponencijalne regresije dodatno se rauna i interpretira broj
S
k
= A
k
1. Posebno, za k = 1 vrijednost S
1
= 100 (A 1) uobiajeno se naziva prosjena
stopa promjene (oekivanih) vrijednosti zavisne varijable Y. Ako model jednostavne
eksponencijalne regresije reprezentativno opisuje vezu izmeu zavisne i nezavisne varijable,
priblino jednaka stopa promjene vrijedi i za empirijske vrijednosti zavisne varijable Y.

I za model jednostavne eksponencijalne regresije mogu se raunati koeficijent varijacije i
koeficijent determinacije tako da se u formule navedene u tokama 4.2.3.3. i 4.2.3.4. umjesto
originalnih vrijednosti uvrtavaju logaritmi tih vrijednosti. Koeficijent determinacije moe se
dobiti izravno pomou MS Excela, dok koeficijent varijacije moramo izraunati ''klasino''.
Ilustrirajmo to na primjerima.

Primjer 1. Uprava tvornice zamjenskih dijelova za eljeznika vozila ''Grudelj d.d.'' iz
Bibinja razmatra ovisnost ukupnih jedininih trokova o opsegu proizvodnje jednoga od
zamjenskih dijelova. Istraivanjem dobiveni podaci navedeni su u sljedeoj tablici:

jedinini trokovi
[kn]
opseg proizvodnje
[000 kom.]
549 60
582 54
618 50
700 45
748 36
817 32
900 25
998 23
1.193 18
1.540 10

Prikaimo dobivene podatke odgovarajuim grafikonom (uz kojega navedimo sve potrebne
oznake), pa odredimo jednadbu modela jednostavne eksponencijalne regresije koji najbolje
opisuje promatranu ovisnost i interpretirajmo parametre toga modela. Naposljetku,
procijenimo reprezentativnost dobivenoga modela pomou koeficijenta determinacije, ukupne
jedinine trokove pri opsegu proizvodnje od 40 000 komada i opseg proizvodnje u sluaju
kad ukupni jedinini trokovi iznose 800,00 kn


Poslovna statistika


Odgovarajui grafiki prikaz empirijskih podataka je dijagram rasprenja prikazan na
sljedeoj slici:

Odgovarajua jednadba modela jednostavne eksponencijalne regresije, zajedno s pripadnom
krivuljom, dana je na sljedeoj slici:

Zapiimo je najprije u standardnom obliku Y
= B A
X
. U ovome je sluaju B = 1624, dok je
vrijednost parametra A jednaka


Poslovna statistika


A = e
0,019
0.98118.
pa jednadba modela jednostavne eksponencijalne regresije zapisana u standardnom obliku
glasi:

Y
= 1624 0.98118
X
.

Odgovarajue interpretacije parametara su:

B = 1624 oekivana vrijednost jedininih trokova u sluaju kad nema proizvodnje iznosi
1.624,00 kn. (Ova interpretacija nema smisla jer se jedinini trokovi uvijek raunaju u
odnosu na jedinicu proizvedenoga proizvoda, a ako nije proizveden niti jedan proizvod, nema
smisla govoriti o jedininim trokovima.)

A = 0.98118 ovu emo vrijednost najlake interpretirati raunajui prosjenu stopu
promjene:

S
1
= 100 (A 1) = 100 (0.98118 1) = 1.882.

Dakle, ukoliko se opseg proizvodnje povea za 1000 komada, jedinini trokovi e se
oekivano smanjiti za prosjeno 1.882%. Odatle slijedi npr. da ukoliko se opseg proizvodnje
povea za 100 komada, oekivano prosjeno smanjenje jedininih trokova iznosi

S
0.1
= 100 (A
0.1
1) = 100 (0.98118
0.1
1) = 0.18982%,

a ukoliko se opseg proizvodnje smanji za 200 komada, oekivano prosjeno poveanje
jedininih trokova iznosi

S
0.2
= 100 (A
0.2
1) = 100 (0.98118
0.2
1) = 0.380723% itd.

Koeficijent determinacije dobivenoga modela je R
2
= 0.9466, to znai da se 94.66% ovisnosti
jedininih trokova o opsegu proizvodnje moe objasniti modelom jednostavne
eksponencijalne regresije. Budui da je navedeni koeficijent relativno blizu 1, moemo rei
da je dobiveni model reprezentativan.

Preostaje nam procijeniti po jednu vrijednost zavisne, odnosno nezavisne varijable.
Procijenjeni iznos ukupnih jedininih trokova u sluaju kad opseg proizvodnje iznosi 40 000
komada dobit emo tako da u jednadbu regresijskoga modela uvrstimo x = 40:


Poslovna statistika


Y
= 1624 0.98118
40
= 759.51.

Dakle, procijenjeni ukupni jedinini trokovi u sluaju kad opseg proizvodnje iznosi 40 000
komada iznose 759,51 kn.

Nadalje, iz dobivene jednadbe regresijskoga modela slijedi

ln ln1624
ln0.98118
y
X
= ,

pa procijenjenu vrijednost opsega proizvodnje u sluaju kad ukupni jedinini trokovi iznose
800,00 kn dobivamo tako da u navedenu jednadbu uvrstimo y = 800:

ln800 ln1624
37.265
ln0.98118
X
= .

Dakle, procijenjena vrijednost opsega proizvodnje u sluaju kad ukupni jedinini trokovi
iznose 800,00 kn jednaka je 37265 komada.

Primjer 2. Promatramo ovisnost temperature netom skuhane kave o vremenu proteklom
nakon ulijevanja kave u alicu
110
. Podaci su dani u donjoj tablici.

vrijeme [min.]
temperatura [C]
0 82
5 76
8 70
11 65
15 61
18 57
22 52
25 51
30 47
34 45
38 43
42 41
45 39
50 38

110
Preciznije reeno, nakon ulijevanja kave iz dezve ili kavokuhala u alicu.


Poslovna statistika


a) Ovisnost temperature kave o vremenu grafiki prikaimo odgovarajuim grafikonom (uz
kojega navedimo sve potrebne oznake).
b) Odredimo jednadbu modela jednostavne eksponencijalne regresije koji najbolje opisuje
promatranu ovisnost i objasnimo znaenje parametara dobivenoga modela.
c) Na temelju koeficijenta determinacije procijenimo reprezentativnost modela.
d) Na temelju rezultata b) podzadatka procijenimo poetnu temperaturu kave i odredimo
relativnu pogreku u odnosu na empirijski dobivenu vrijednost.
e) Na temelju rezultata b) podzadatka procijenimo kolika e biti temperatura kave tono 1 sat
nakon ulijevanja u alicu.
f) 1992. jedna od goi restorana ''McDonald's'' tuila je restoran jer je sluajnim
prolijevanjem kave temperature 82C po svojim rukama zaradila teke opekotine. Vjetak na
suenju tada je posvjedoio da tekuina temperature 82C koja je u dodiru s ljudskom koom
bila barem pet sekundi izaziva teke opekotine i ustvrdio da bi se takve posljedice izbjegle da
se kava posluuje pri temperaturi ne veoj od 68C. ena je dobila spor i odtetu od
2.700.000,00 USD. Jedna od posljedica toga poznatoga sudskoga procesa bila je da veina
restorana u SAD danas posluuje kavu ija je temperatura priblino 68C. Na temelju
rezultata b) podzadatka procijenimo koliko dugo treba ekati da se netom skuhana kava
ohladi na temperaturu od 68C.
g) Pretpostavimo da temperatura sobe u kojoj se nalazi posluena kava iznosi 23C. to se
moe rei o temperaturi kave nakon tono 2 sata na temelju dobivenoga modela jednostavne
eksponencijalne regresije? Objasnimo svoj odgovor.

Ovisnost temperature kave o vremenu prikazana je donjim dijagramom rasipanja:


Poslovna statistika


Jednadba modela jednostavne eksponencijalne regresije, zajedno s pripadnom krivuljom,
prikazana je na donjoj slici:

Dobivenu jednadbu najprije zapiimo u standardnom obliku Y
= B A
X
. U ovome je sluaju
B = 78.159, dok je vrijednost parametra A jednaka

A = e
0.016
0.98413.

Dakle, jednadba dobivenoga modela jednostavne eksponencijalne regresije je

Y
= 78.159 0.98413
X
.

Parametre dobivenoga modela interpretiramo na sljedei nain:

B = 78.159 procijenjena poetna temperatura kave iznosi 78.159C. Budui da empirijska
poetna temperatura kave iznosi 82C, relativna pogreka procjene poetne temperature je:

p =
82 78.159
100
82
4.68%.


Poslovna statistika


A = 0.98413 izraunat emo oekivanu prosjenu stopu promjene temperature kave:

S
1
= 100 (A 1) = 1.5873.

Dakle, temperatura kave e se oekivano smanjiti za 1.5873% u jednoj minuti.

Temperaturu kave nakon jednoga sata (= 60 minuta) procijenit emo tako da u jednadbu
modela jednostavne eksponencijalne regresije uvrstimo x = 60:

Y
= 78.159 0.98413
60
30C,

dok emo vrijeme potrebno da se kava ohladi na temperaturu 68C procijeniti tako da iz
jednadbe

Y
= 78,159 0.98413
X

izrazimo nepoznaznicu X:

ln ln78.159
ln0.98413
Y
X
=

i u dobiveni izraz uvrstimo Y = 68:

ln68 ln78.159
ln0.98413
X
= 8,7 minuta = 8 minuta i 42 sekunde.

Temperatura kave bit e jednaka sobnoj temperaturi, odnosno 23C, nakon

ln23 ln78.159
ln0.98413
X
= 76,5 minuta = 76 minuta i 30 sekundi.

Potom se kava prestaje hladiti i zadrava temperaturu okoline (sobe) od 23C. Stoga e
stvarna temperatura kave za 120 minuta biti jednaka 23C. Prognostika temperatura kave za
120 minuta je dvostruko manja:


Poslovna statistika


Y
= 78.159 0.98413
120
11.46C.

Na ovom smo primjeru ukazali na tzv. problem ekstrapolacije u regresijskim modelima.
Grubo govorei, regresijski model moe davati dobre procjene za vrijednosti nezavisne
varijable X koje se nalaze unutar segmenta omeenoga najmanjom i najveom empirijskom
vrijednou te varijable. (U promatranom primjeru rije je o segmentu [0, 50].) Meutim, za
vrijednosti izvan toga segmenta kvaliteta procjene opada to je vrijednost udaljenija od donje
ili gornje granice segmenta. Npr. u promatranom bismo primjeru za x = 51 jo mogli oekivati
relativno dobru procjenu temperature kave, ali x = 120 je vrijednost vie nego dvostruko vea
od gornje granice segmenta [0, 50], pa se za tu vrijednost dobiva loa procjena odgovarajue
vrijednosti zavisne varijable Y. Stoga, kad god je to mogue, treba izbjegavati procjenu
vrijednosti zavisne varijable za vrijednosti nezavisne varijable izvan segmenta omeenoga
najmanjom i najveom empirijski dobivenom vrijednou.
111

4.3.2. Model jednostavne logaritamske regresije

Standardni oblik regresijske jednadbe ovoga modela je:

Y
= A ln x + B,

pri emu vrijednosti nezavisne varijable X nuno moraju biti strogo pozitivne jer je prirodno
podruje definicije bilo koje logaritamske
112
funkcije skup 0, +. Kao i kod svih prethodnih
modela, znaaj parametara A i B u analizi regresijskoga modela nije jednak: parametar A je
bitno znaajniji od parametra B. U nastavku navodimo njihove interpretacije u obliku dvaju
svojstava:

B procijenjena (ili oekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 1 jedinici mjere. Ova se tvrdnja lako provjeri uvrtavanjem x = 1 u
jednadbu regresijskoga modela i koritenjem injenice da je ln 1 = 0.

111
U promatranom je primjeru opisani problem ekstrapolacije dodatno izraen zbog fizikalne neusklaenosti
dobivenoga modela s realnim stanjem: prema fizikalnim zakonima, kava se ne moe ohladiti na temperaturu
manju od temperature okoline, a prema dobivenom regresijskom modelu, za velike vrijednosti nezavisne
varijable x temperatura kave bit e sve blia 0C zbog asimptotskoga pribliavanja odgovarajuega grafa osi Ox.
112
U ovome je sluaju rije o tzv. prirodnom logaritmu: baza logaritma je broj e 2,7182818284590452353603.


Poslovna statistika


Interpretacija varijable A, kao i kod modela jednostavne eksponencijalne regresije, nije
izravna, nego ''zaobilazna'' (neizravna) i temelji se na sljedeem svojstvu:

Svojstvo 1. Neka je p > 100 proizvoljan, ali fiksiran realan broj. Ako se vrijednost nezavisne
varijable X promijeni za p%, procijenjena (ili oekivana) prosjena promjena vrijednosti
zavisne varijable Y iznosi A ln 1
100
p | |
+
|
\
. Posebno, za p = 171.82818284590452353603
procijenjena prosjena promjena vrijednosti zavisne varijable Y iznosi tono A.

Uvjet p > 100 postavljen je zbog zahtjeva da vrijednost nezavisne varijable X mora biti
strogo pozitivna: smanjenje konkretne vrijednosti nezavisne varijable X za barem 100%
povlailo bi da je nova vrijednost te varijable nepozitivna (strogo negativna ili nula), a takve
vrijednosti ne mogu biti obuhvaene regresijskim modelom.

Dokaz: Analogno kao i kod modela jednostavne eksponencijalne regresije, neka je x
1
poetna
vrijednost varijable X i neka je p postotak promjene te varijable. Ako je p > 0, rije je o
poveanju vrijednosti x
1
za p%, a ako je p < 0, rije je o smanjenju vrijednosti x
1
za p%.
Pripadna oekivana vrijednost zavisne varijable Y jednaka je:

1 1
ln y A x B
= + .

Nakon promjene vrijednosti x
1
za p%, nova vrijednost te varijable je:

2 1 1 1
1
100 100
p p
x x x x
| |
= + = +
|
\
.

Pripadna oekivana vrijednost zavisne varijable Y jednaka je

2 2 1 1 1
ln ln 1 ln 1 ln ln 1
100 100 100
p p p
y A x B A x B A A x B A y

( | | | | | |
= + = + + = + + + = + +
| | | (
\ \ \
.
otkuda slijedi da je ukupna prosjena promjena vrijednosti zavisne varijable Y jednaka

2 1
ln 1
100
p
y y A

| |
= +
|
\
,


Poslovna statistika


to je i trebalo pokazati. Napomenimo da se pridjev prosjena navodi zbog izvoda formule za
procijenjenu vrijednost parametra A u kojemu se koriste prosjeci vrijednosti nezavisne i
zavisne varijable, pa je i sm parametar A pokazatelj prosjene promjene.

Primjer 1. Prije tono 10 godina istodobno je posaeno ukupno 12 jednogodinjih sadnica
odreene vrste vinje. U trenutku sadnje prosjena visina jedne sadnice bila je 182.88 cm.
Podaci o prosjenoj visini stabala tijekom svake od minulih 10 godina navedeni su u donjoj
tablici. Promatra se ovisnost prosjene visine izraslih stabala o njihovoj starosti.

starost [god.] prosjena visina [cm]
1 182.88
2 289.56
3 396.24
4 457.2
5 502.92
6 533.4
starost [god.] prosjena visina [cm]
7 563.88
8 579.12
9 594.36
10 600.456
11 603.504

a) Prikaimo ovisnost prosjene visine stabala o njihovoj starosti odgovarajuim grafikonom
uz kojega navedimo sve potrebne oznake.
b) Odredimo jednadbu modela jednostavne logaritamske regresije koji najbolje opisuje
promatranu ovisnost. Objasnimo znaenje svih parametara dobivenoga modela.
c) Procijenimo reprezentativnost modela dobivenoga u rjeenju b) podzadatka pomou
koeficijenta determinacije.
d) Koristei rezultat b) podzadatka procijenimo prosjenu visinu svih stabala etiri i pol
godine nakon sadnje.
e) Koristei rezultat b) podzadatka procijenimo trenutak (raunajui od trenutka sadnje) u
kojemu e prosjena visina svih stabala biti 3 metra.
f) Koristei rezultat b) podzadatka procijenimo prosjenu visinu svih posaenih stabala tono
20 godina nakon sadnje i utvrdimo realistinost dobivene procjene.

Ovisnost prosjene visine svih stabala o njihovoj starosti grafiki prikazujemo donjim
dijagramom rasipanja:


Poslovna statistika


Jednadba modela jednostavne logaritamske regresije, zajedno s pripadnom krivuljom,
navedena je na donjoj slici:

Najvaniji parametri dobivenoga modela jednostavne logaritamske regresije su:

A = 186.18 Ovaj emo parametar interpretirati pomou p = 10. Dakle, ako se starost svih
sadnica povea za 10%, procijenjeno (oekivano) poveanje njihove prosjene visine iznosi
186.18 ln
10
1
100
| |
+
|
\
17.74485 cm.

B = 185.91 Procijenjena (oekivana) prosjena visina svih jednogodinjih sadnica u
trenutku sadnje iznosi 185.91 cm.


Poslovna statistika


Koeficijent determinacije dobivenoga modela iznosi R
2
= 0.9863, otkuda slijedi da je 98.63%
ovisnosti prosjene visine stabala o njihovoj starosti objanjeno modelom jednostavne
logaritamske regresije, to znai da je model reprezentativan.

etiri i pol godine nakon sadnje sva stabla bit e stara ukupno 1 + 4,5 = 5.5 godina, pa e
njihova procijenjena prosjena visina u tom trenutku biti

Y
= 186.18 ln 5.5 + 185.91 503.3 cm.

Trenutak u kojemu e prosjena visina svih stabala biti 3 metra (= 300 cm) odredit emo tako
da iz dobivene jednadbe modela jednostavne logaritamske regresije

Y
= 186.18 ln x + 185.91

izrazimo x:

185.91
186.18
y
X e
=

i u dobivenu formulu uvrstimo y = 300. Dobivamo:

300 185.91
186.18
X e
= 1.8455 godina = 1 godina 10 mjeseci i 5 dana.

Dakle, raunajui od trenutka sadnje, procijenjeno vrijeme u kojemu e prosjena visina svih
stabala biti tono 3 metra iznosi 10 mjeseci i 5 dana.

Tono 20 godina nakon sadnje procijenjena prosjena visina svih stabala (ija e starost tada
biti 1 + 20 = 21 godinu) iznosi

Y
= 186.18 ln 21 + 185.91 752.74 cm.

Vrijednost x = 21 je gotovo dvostruko vea od gornje granice segmenta [1, 11] u kojemu smo
radili procjene parametara, pa ova procjena ne mora biti realistina. Ipak, u praksi se pokazalo
da stabla vinje prosjeno narastu u rasponu od 4.5 do ak 9 metara. Stoga procijenjenu
vrijednost ne treba unaprijed odbaciti kao potpuno pogrenu, tim vie to logaritamska
funkcija za sve vee i vee vrijednosti nezavisne varijable x raste sve ''sporije''.


Poslovna statistika


4.3.3. Model jednostavne potencijske regresije (POWER)
113

Standardni oblik jednadbe modela potencijske regresije je:

A
Y B X = .

Podsjetimo da se, za proizvoljan, ali fiksiran realan broj a R, funkcija f(x) = x
a
naziva opa
potencija. Njezino je prirodno podruje definicije skup 0, +, pa analogno kao i u modelu
jednostavne logaritamske regresije vrijednosti nezavisne varijable X ne mogu biti
nepozitivni realni brojevi (strogo negativni realni brojevi i nula).

Za analizu regresijskoga modela ponovno je znaajniji parametar A, ali kao u svim
prethodnim modelima navodimo interpretacije obaju parametara modela:

B procijenjena (oekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 1 jedinici mjere. Ova je interpretacija jednaka interpretaciji istoga
regresijskoga parametra u modelu jednostavne logaritamske regresije, a lako se provjeri tako
da se u jednadbu modela jednostavne potencijske regresije uvrsti x = 1 i primijeni injenica
da za svaki realan broj a R vrijedi jednakost: 1
a
= 1.

Interpretacija parametra A se temelji na sljedeem svojstvu:

Svojstvo 1. Neka je p > 100 proizvoljan, ali fiksiran realan broj. Ako se vrijednost nezavisne
varijable X promijeni za p%, procijenjena (oekivana) promjena vrijednosti zavisne varijable
Y iznosi 100 1 1 %
100
A
p
(
| |
+
( `
|
\
(
)
.

Dokaz: Analogno ranijim dokazima, neka je x
1
poetna vrijednost nezavisne varijable X.
Pripadna oekivana vrijednost zavisne varijable Y jednaka je:

113
Engleska rije power ima vie znaenja, a jedno od njih je i potencija. Stoga je naziv ovoga modela preveden
kao potencijski. Uobiajeni hrvatski prijevod naziva modela (dvostruko logaritamski) potjee od injenice da se
u tzv. linearizaciji modela (svoenju modela odgovarajuim zamjenama na model jednostavne linearne
regresije) vrijednosti nezavisne i zavisne varijable pojavljuju kao logaritmandi.


Poslovna statistika


1 1
A
y B x
= .

1
promijeni za p%, nova vrijednost nezavisne varijable bit e:

2 1 1 1
1
100 100
p p
x x x x
| |
= + = +
|
\
.

Pripadna vrijednost zavisne varijable Y jednaka je

2 2 1 1 1
1 1 1
100 100 100
A A A
A A
p p p
y B x B x B x y

( | | | | | |
= = + = + = +
| | | (
\ \ \
,

Ve smo utvrdili da je podruje vrijednosti svake ope potencije skup svih strogo pozitivnih
realnih brojeva, to znai da su obje vrijednosti
1
y
i
2
y
strogo vee od nule, a samim tim i

razliite od nule. Zbog toga je dobro definirana relativna promjena vrijednosti zavisne
varijable Y i ona je jednaka

1
1 1
2 1
1 1 1
1 1
1
100
100
1 1
100
A
A
A
p
p
y
y y
y y p
s
y y y

(
| |
| |
+
(
| +
|
\
( | |
\
= = = = +
|
\
,

odnosno, iskazano u postotcima,

100 1 1 %
100
A
p
s
(
| |
= +
( `
|
\
(
)
,


Koristei razvoj u binomni red

2 3
( 1) ( 1) ( 2)
1 1 ...
100 100 2 10000 6 1000000
A
p p A A p A A A p
A
| |
+ = + + + +
|
\
,


Poslovna statistika


pokazuje se da za relativno male vrijednosti broja p (npr. p [1, 1]) i A > 0 vrijedi
aproksimacija:

1 1
100 100
A
p p
A
| |
+ +
|
\

Odavde slijedi sljedee

Svojstvo 2. Ako se vrijednost nezavisne varijable X promijeni za p%, pri emu je p relativno
mali realan broj i A > 0, procijenjena (oekivana) promjena vrijednosti zavisne varijable Y
iznosi (p A)%. Posebno, za p = 1 ta promjena iznosi A%.

Dakle, pri interpretaciji parametra A obino emo uzimati p = 1. Istaknimo da se u
ekonomskim analizama ovim regresijskim modelom omoguava tzv. mjerenje elastinosti
zavisne varijable u odnosu na nezavisnu varijablu.

Ilustrirajmo primjenu modela jednostavne potencijske regresije na dvama primjerima.

Primjer 1. Tvornica eljeznikih vagona lamperajevi iz Pikorevaca razmatra ovisnost
utroenih radnih sati neposrednih radnika na montai vagona o ukupnom (kumulativnom)
broju montiranih vagona. Dobiveni podaci navedeni su u sljedeoj tablici.

ukupan (kumulativni) broj
montiranih vagona
rad neposrednih radnika
[000 sati/vagon]
10 59.2
20 48.7
30 46.3
40 42.1
50 40.2
60 37.9
70 36.9
80 35.7

a) Promatranu ovisnost grafiki prikaimo odgovarajuim grafikonom uz kojega navedimo
sve potrebne oznake.
b) Odredimo jednadbu modela jednostavne potencijske regresije koji najbolje opisuje
promatranu ovisnost i objasnimo znaenje parametara dobivenoga modela.
c) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije.


Poslovna statistika


d) Na temelju rezultata b) podzadatka procijenimo ukupno vrijeme rada neposrednih radnika
po jednom vagonu ako je montirano ukupno 45 vagona.
e) Na temelju rezultata b) podzadatka procijenimo ukupan (kumulativni) broj montiranih
vagona ako utroeni radni sati neposrednih radnika iznose 41 000 radnih sati po vagonu.

Ovisnost utroenih radnih sati neposrednih radnika na montai o ukupnom (kumulativnom)
broju montiranih vagona grafiki prikazujemo donjim dijagramom rasipanja:

Jednadba modela jednostavne potencijske regresije, zajedno s pripadnom krivuljom,
navedena je na sljedeoj slici:


Poslovna statistika


Najvaniji parametri dobivenoga modela su:

B = 102.53 Procijenjeni rad neposrednih radnika na montai prvoga vagona iznosi
102 530 radnih sati.

A = 0.241 (uzimamo p = 1) Ako se ukupan (kumulativni) broj montiranih vagona povea
za 1%, utroeni radni sati neposrednih radnika po jednom vagonu oekivano e se smanjiti za
0.241%.

Koeficijent determinacije dobivenoga regresijskoga modela je R
2
= 0.9938, to znai da se
99.38% ovisnosti rada neposrednih radnika o ukupnom (kumulativnom) broju montiranih
vagona moe objasniti modelom jednostavne potencijske regresije, tj. dobiveni je model vrlo
reprezentativan.

Ukupno vrijeme rada neposrednih radnika na montai ukupno 45 vagona procijenit emo tako
da u jednadbu dobivenoga regresijskoga modela

Y
= 102.53 x
0.241

uvrstimo x = 45:

Y
= 102.53 45
0.241
= 40.9663

Dakle, traeno procijenjeno vrijeme montae po jednom vagonu iznosi 40 966.3 sati.

Ukupan (kumulativni) broj montiranih vagona u sluaju kad se za montau jednoga vagona
utroi 41 000 radnih sati dobit emo tako da iz jednadbe

Y
= 102.53 x
0.241

izrazimo x:

0.241
102.52
X
y
| |
=
|
\

i u dobivenu jednadbu uvrstimo y = 41:


Poslovna statistika


1000
241
102.52
41
X
| |
=
|
\
45.

Dakle, procijenjeni ukupan (kumulativni) broj montiranih vagona jednak je 45.

Napomenimo da realna funkcija dobivena kao jednadba modela jednostavne potencijske
regresije pripada tipu tzv. funkcij uenja (engl. learning function), a temelji se na
pretpostavci da se utroak radnih sati smanjuje s ponavljanjem iste radne operacije. Stoga se
modeli jednostavne potencijske regresije esto primijenjuju pri ugovaranju dinamike
izvoenja radova ili isporuke serije odreenih proizvoda (npr. eljeznikih vagona, aviona,
brodova i sl.).

Primjer 2. Na uzorku od ukupno 11 afrikih antilopa (gazela) ispituje se ovisnost izmeu
duljine i srednjega promjera tzv. ramenih kostiju. Dobiveni podaci prikazani su u donjoj
tablici.

srednji promjer
[mm]
duljina
[mm]
17.6 159.9
26 206.9
31.9 236.8
38.9 269.9
45.8 300.6
51.2 323.6
58.1 351.7
64.7 377.6
66.7 384.1
80.8 437.2
82.9 444.7

a) Ovisnost duljine ramenih kosti o njihovu srednjem promjeru grafiki prikaimo
odgovarajuim grafikonom uz kojega navedimo sve potrebne oznake.
b) Odredimo jednadbu modela jednostavne potencijske regresije koji najbolje opisuje
promatranu ovisnost. Navedimo sve parametre toga modela i objasnimo njihovo znaenje.
c) Procijenimo reprezentativnost dobivenoga regresijskoga modela na temelju koeficijenta
determinacije.


Poslovna statistika


d) Na temelju rezultata b) podzadatka procijenimo duljinu ramenih kostiju iji je srednji
promjer 84 mm.
e) Na temelju rezultata b) podzadatka procijenimo srednji promjer ramenih kostiju ija je
duljina 40 cm.
Ovisnost duljine ramenih kostiju o njihovu srednjem promjeru grafiki je prikazana donjim
dijagramom rasipanja:

Jednadba modela jednostavne potencijske regresije, zajedno s pripadnom krivuljom,
navedena je na donjoj slici:


Poslovna statistika


Najvaniji parametri dobivenoga modela jednostavne potencijske regresije su:

B = 24.13 Procijenjena duljina ramenih kostiju iji je srednji promjer 1 mm iznosi 24.13
mm. (Interpretacija ovoga parametra ne odgovara realnoj situaciji jer su druga istraivanja
pokazala da je najmanja zabiljeena duljina ramenih kostiju priblino 140 mm = 14 cm.)

A = 0.6595 (uzimamo p = 1) Ako se srednji promjer ramenih kostiju povea za 1%,
oekivano relativno prosjeno poveanje duljine ramenih kostiju iznosi 0.6595%.
Koeficijent determinacije dobivenoga modela jednostavne potencijske regresije iznosi R
2
= 1,
to ukazuje na injenicu da se dobivenim regresijskim modelom potpuno moe objasniti
ovisnost duljine ramenih kostiju antilope o njihovu srednjem promjeru. Taj je rezultat
posljedica zaokruivanja izrauna koeficijenta determinacije na 4 decimalna mjesta. Izrauna
li se R
2
na 10 decimalnih mjesta, dobiva se R
2
= 0.9999874242. U svakom sluaju, rije je o
vrlo reprezentativnom modelu jednostavne regresije.

Procijenjenu duljinu ramenih kostiju iji je srednji promjer 84 mm dobit emo tako da u
jednadbu dobivenoga modela jednostavne potencijske regresije

Y
= 24.13 x
0.6595

uvrstimo x = 84:

Y
= 24.13 84
0.6595
448.4 mm.

Stoga traena procijenjena duljina ramenih kostiju iznosi 448.4 mm.

Srednji promjer ramenih kostiju ija je duljina 40 cm (= 400 mm) procijenit emo tako da iz
dobivene jednadbe modela jednostavne potencijske regresije izrazimo x:

2000
1319
24.13
y
X
| |
=
|
\

pa u dobivenu jednakost uvrstimo y = 400:

2000
1319
400
24.13
X
| |
=
|
\
70.7.


Poslovna statistika


Stoga traeni procijenjeni srednji promjer ramenih kostiju iznosi 70.7 mm.

afrika antilopa (gazela)

4.4. Primjer modela viestruke (multiple) regresije: model viestruke linearne
regresije

U ovoj se toki ukratko opisuje najjednostavniji primjer modela viestruke ili multiple
regresije, a to je model viestruke linearne regresije. Podsjetimo da openito modeli
viestruke regresije imaju jednu zavisnu i barem dvije nezavisne varijable. U sluajevima u
kojima se pojavljuju najmanje tri nezavisne varijable nemogue je dati grafiki prikaz. No, i u
takvim se sluajevima mogu raunati odgovarajui analogoni koeficijenata linearne
korelacije, koeficijenata determinacije itd., te dati interpretacije parametara dobivenoga
modela viestruke regresije. Reeno emo pokazati na primjeru modela viestruke linearne
regresije.

Opi oblik modela viestruke linearne regresije je:

Y = A
1
X
1
+ A
2
X
2
+ + A
n
X
n
+ B + e,

a odgovarajua jednadba toga modela je

Y
= A
1
x
1
+ A
2
x
2
+ + A
n
x
n
+ B.

U objema jednakostima su, analogno kao i u modelu jednostavne linearne regresije, A
1
, A
2
,
, A
n
regresijski koeficijenti modela, B slobodni lan, a e stohastika (sluajna) varijabla


Poslovna statistika


koja ''mjeri'' pogreku procjene. Za svaki i = 1, 2, , n interpretacija regresijskoga
koeficijenta A
i
glasi:

A
i
je procijenjena (oekivana) prosjena promjena vrijednosti varijable X
i
u sluaju kada se
vrijednost te varijable povea za 1 jedinicu mjere, a vrijednosti svih ostalih varijabli ostanu
nepromijenjene.

Navedena se interpretacija moe poopiti za bilo koji realan broj k R:

k A
i
je procijenjena (oekivana) prosjena promjena vrijednosti varijable X
i
u sluaju kad se
vrijednost te varijable promijeni za k jedinica mjere, a vrijednosti svih ostalih varijabli ostanu
nepromijenjene.

Slobodni lan B je manje vaan parametar modela, ali radi potpunosti navodimo i njegovu
interpretaciju:

B je procijenjena (oekivana) vrijednost zavisne varijable Y u sluaju kad su vrijednosti svih
nezavisnih varijabli X
1
, , X
n
jednake nuli. (Ova interpretacija, naroito u ekonomiji, vrlo
esto ne odgovara realnoj situaciji.)

Primjer 1. (izbori za kanadski parlament) Ispituje se ovisnost ukupnoga postotka dobivenih
glasova (a time i mandata) relativnoga pobjednika na svakim pojedinim parlamentarnim
izborima o postotcima glasova dobivenih u etiri kanadske regije: R
1
, R
2
, R
3
i R
4
. Dobiveni
podaci su prikazani u sljedeoj tablici.


Poslovna statistika


izborna
godina
postotak na
dravnoj razini
postotak u
regiji
R
1

postotak u
regiji
R
2

postotak u
regiji
R
3

postotak u
regiji
R
4
1949. 73 74 78 58 61
1953. 64 34 78 35 38
1957. 42 64 52 29 32
1958. 79 76 73 95 82
1962. 44 55 49 88 27
1963. 49 61 62 6 32
1965. 50 45 69 2 32
1968. 59 22 74 25 70
1972. 41 31 56 7 17
1974. 54 41 71 11 35
1979. 48 56 58 78 68
1980. 52 63 74 4 0
1984. 75 78 74 80 68
1988. 57 34 63 67 38
1993. 60 97 67 39 19
1997. 52 34 72 17 18
2000. 57,5 60 77 17 15
2004. 43,8 69 53 11 22

a) Odredimo jednadbu modela viestruke linearne regresije i objasnimo znaenje parametara
dobivenoga modela.
b) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije, te
statistiku znaajnost pojedinih regresorskih varijabli i cijeloga modela (uz razinu
pouzdanosti od 95%).
c) Relevantne predizborne ankete (provedene od strane neovisnih agencija) pokazuju da e
stranka S u regiji R
1
osvojiti 51% glasova, u regiji R
2
67% glasova, u regiji R
3
12% glasova i u
regiji R
4
15% glasova. Na temelju rezultata a) podzadatka utvrdimo moe li ta stranka
raunati na relativnu izbornu pobjedu.
d) Na temelju rezultata a) podzadatka procijenimo najmanji postotak glasova koji stranka S
treba dobiti u njoj tradicionalno sklonoj regiji R
2
tako da bude relativni pobjednik izbora ako
se na temelju predizbornih anketa procjenjuje da e ta stranka u regiji R
1
osvojiti 55%
glasova, u regiji R
3
38% glasova, a u regiji R
4
41% glasova.

Za dobivanje i analizu modela viestruke linearne regresije u MS Excelu koristimo proceduru
Regression u okviru alata Analiza podataka (Data Analysis). Primjenom te procedure
dobivamo sljedee vrijednosti:


Poslovna statistika


koeficijent viestruke linearne korelacije (Multiple R): 0.96556752, otkuda slijedi da postoji
jaka linearna veza izmeu postotka na dravnoj razini, kao zavisne varijable, i postotaka na
regionalnoj razini, kao nezavisnih varijabli;
koeficijent determinacije: 0.932320637, otkuda slijedi da je dobiveni model viestruke
linearne regresije reprezentativan (objanjava priblino 93.25% ovisnosti zavisne varijable o
svim etirima nezavisnim varijablama);
p vrijednost koeficijenta viestruke linearne korelacije (p vrijednost modela viestruke
linearne regresije): 1,76513E-07 = 0.000000176512 dobiveni koeficijent viestruke
linearne korelacije i dobiveni model viestruke linearne regresije su statistiki znaajni;
slobodni lan: -17.3211733 (teoretski, to je ukupan postotak mandata na dravnoj razini u
sluaju da pobjednika stranka niti u jednoj regiji ne osvoji niti jedan glas, ali takva
interpretacija ne odgovara realnoj situaciji)
koeficijent uz varijablu Postotak u regiji R
1
: 0.129717918 Ako se postotak dobivenih
glasova u regiji R
1
povea za 1, oekivano prosjeno poveanje postotka dobivenih glasova
na dravnoj razini iznosi (priblino) 0.13;
p vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
1
: 0.011263866 uz
razinu pozdanosti od 95%, postoji statistiki znaajan utjecaj postotka glasova dobivenih u
regiji R
1
na ukupan postotak dobivenih glasova na dravnoj razini;
2
: 0.857302 Ako se postotak dobivenih glasova u
regiji R
2
povea za 1, oekivano prosjeno poveanje postotka dobivenih glasova na dravnoj
razini iznosi (priblino) 0.86;
2
: 3.96069E-07 =
0,000000396069 uz razinu pozdanosti od 95%, postoji statistiki znaajan utjecaj postotka
glasova dobivenih u regiji R
2
3
glasova u regiji R
3
3
: 0.00900155 uz
regiji R
3
4
glasova u regiji R
4
4
: 0.049511477 uz
regiji R
4


Poslovna statistika


Primijetimo da prema stroem kriteriju (uz razinu pouzdanosti od 99%) utjecaj postotka
glasova dobivenih u regijama R
1
i R
4
ne bi bio statistiki znaajan

Za svaki i = 1, 2, 3, 4 oznaimo s x
i
postotak glasova koje je pobjednika stranka dobila u
regiji R
i
. Tada jednadba modela viestruke linearne regresije koji opisuje promatranu
ovisnost glasi:

Y
= 0.129717918 x
1
+ 0.857302 x
2
+ 0.117393926 x
3
+ 0.112526063 x
4
17.3211733.

Procjenu moe li stranka koja u regiji R
1
osvoji 51% glasova, u regiji R
2
67% glasova, u regiji
R
3
12% glasova i u regiji R
4
15% glasova raunati na relativnu izbornu pobjedu napravit emo
tako da u gornju jednadbu uvrstimo x
1
= 67, x
2
= 52, x
3
= 12 i x
4
= 15:

Y
= 0.129717918 51 + 0.857302 67 + 0.117393926 12 + 0.112526063 15 17.3211733,

Y
= 49.83029292.

Budui da procijenjeni rezultat nije strogo vei od 50 [%], stranka ne bi trebala raunati na
relativnu pobjedu na parlamentarnim izborima.
Najmanji postotak glasova koji stranka S treba dobiti u njoj tradicionalno sklonoj regiji R
2

tako da bude relativni pobjednik izbora u drugom podsluaju procijenit emo tako da rijeimo
nejednadbu

Y
50,

tj. tako da po x
2
rijeimo nejednadbu

0.129717918 55 + 0.857302 x
2
+ 0.117393926 38 + 0.112526063 41 17.3211733 50

Odavde je
x
2
59.62,

pa se moe zakljuiti da bi stranka S u njoj tradicionalno sklonoj regiji R
2
trebala dobiti
najmanje 60% ukupnih glasova biraa u toj regiji tako da moe raunati na relativnu pobjedu
na parlamentarnim izborima.


Poslovna statistika


5. INDIVIDUALNI BROJANI POKAZATELJI
RAZVOJA VREMENSKOGA NIZA

Vrijednosti neke pojave u vremenu obino odreujemo i usporeujemo u odreenim
vremenskim razdobljima. Vremensko razdoblje u kojemu smo posljednji put odredili
vrijednost neke pojave naziva se tekue ili izvjetajno razdoblje, a sama odreena vrijednost
tekua vrijednost te pojave. Sva razdoblja prije tekuega u kojima smo odreivali vrijednost
promatrane pojave nazivaju se prethodna razdoblja. Od svih njih najznaajnije je neposredno
prethodno razdoblje: to je, zapravo, vremensko razdoblje u kojemu smo pretposljednji put
odredili vrijednost promatrane pojave.

Primjer 1. Promatramo ukupan broj sklopljenih i razvedenih brakova u Republici Hrvatskoj u
razdoblju od 2002. do 2006. godine.

godina
brakovi
sklopljeni razvedeni
2002. 22 806 4 496
2003. 22 337 4 934
2004. 22 700 4 985
2005. 22 138 4 883
2006. 22 092 2 651
izvor: Mjeseno statistiko izvjee 3/08, Dravni zavod za statistiku, Zagreb, 2008.

U ovome je primjeru tekue ili izvjetajno razdoblje 2006. godina jer je, prema navedenoj
tablici, u toj godini posljednji put izvreno brojanje sklopljenih, odnosno razvedenih brakova.
Prethodna razdoblja su 2002., 2003., 2004. i 2005. godina, a neposredno prethodno razdoblje
je 2005. godina.

Primjer 2. Promatramo kretanje prosjene mjesene isplaene neto-plae po jednom
zaposleniku u svim pravnim osobama u Republici Hrvatskoj koje se bave financijskim
posredovanjem za razdoblje od sijenja 2007. godine do sijenja 2008. godine.

godina mjesec prosjena neto-plaa [kn]

2007.
sijeanj 6.460,00
veljaa 6.604,00
rujan 6.567,00
listopad 6.569,00
studeni 8.228,00
prosinac 6.709,00
2008. sijeanj 7.152,00


Poslovna statistika


U ovome je primjeru tekue ili izvjetajno razdoblje sijeanj 2008. godine. Prethodna
razdoblja su sijeanj, veljaa, rujan, listopad, studeni i prosinac 2007. godine. Neposredno
prethodno razdoblje je prosinac 2007. godine. Uoimo da je razdoblje neposredno prethodno
mjesecu rujnu 2007. godine mjesec veljaa 2007. godine, a ne mjesec kolovoz 2007. godine.
No, to ne znai da se u razdoblju od oujka do kolovoza 2007. godine nije pratilo kretanje
promatrane prosjene neto-plae, nego iskljuivo da ti podaci nisu navedeni u tablici.
Nerijetko se vrijednosti promatrane pojave iz razliitih razloga
114
usporeuju s jednom te
istom vrijednou pojave odreenom u nekomu razdoblju. Ta, jedna te ista vrijednost naziva
se bazna vrijednost, a razdoblje u kojemu je odreena bazno razdoblje.

Primjer 3. Promatramo prosjean godinji broj korisnika novane naknade na Hrvatskom
zavodu za zapoljavanje u razdoblju od 2003. do 2007. godine:

godina prosjean godinji broj
korisnika novane naknade
2003. 67 977
2004. 70 467
2005. 72 802
2006. 66 407
2007. 59 603

Stanje u svakoj pojedinoj godini moemo usporediti sa stanjem u 2007. godini, pa npr.
moemo zakljuiti (kako?) da je u 2003. godini bilo za 35.6% vie korisnika novane naknade
nego u 2007. godini, u 2004. godini za 14% vie korisnika novane naknade nego u 2007.
godini itd. U ovome je primjeru bazno razdoblje 2007. godina, a bazna vrijednost 59 603
(vrijednost promatrane pojave u baznom razdoblju).

Uobiajeni grafiki prikaz vremenskoga niza jest linijski grafikon. Naslov takvoga grafikona
obino je izraz tipa ''Kretanje pojave X u razdoblju od do''. Pritom emo, radi
jednostavnosti, izraz tipa ''razdoblje od 2000. do 2007. godine'' , interpretirati kao ''vremensko
razdoblje od 01.01.2000. do 31.12.2007., tj. u to emo razdoblje ''ukljuiti'' cijelu 2000.
godinu i cijelu 2007. godinu
115
. Grafiki prikazi podataka iz Primjera 1. i Primjera 3. su
sljedee dvije slike.

114
Jedan od najeih razloga je politike prirode: npr. u predizbornoj kampanji trenutno vladajua stranka
obino usporeuje prosjene plae, cijene, vanjski dug itd. u svakoj godini obnaanja vlasti sa stanjem u godini
neposredno prije prolih parlamentarnih izbora na kojima je preuzela obnaanje vlasti.
115
Matematiki precizno, pod pojmom ''razdoblje izmeu trenutka X
1
i trenutka X
2
'' podrazumijevat emo
zatvoreni interval (segment) [X
1
, X
2
].


Poslovna statistika


Budui da kretanje vrijednosti neke pojave pratimo u vremenu, promatranu pojavu moemo
shvatiti kao funkciju vremena, odnosno, sukladno razmatranjima iz 4. poglavlja, shvatiti
vrijeme kao nezavisnu varijablu (X), a promatranu pojavu kao zavisnu varijablu (Y).
Uobiajenoj oznaci nezavisne varijable (X) pridodat emo indeks t kako bismo naglasili da je
rije o posebnom tipu nezavisne varijable. Dakle, nezavisnu vremensku varijablu oznaavat
emo s X
t
.


Poslovna statistika


Radi jednostavnosti, promatrat emo sluajeve kada se vrijednosti neke pojave odreuju u
jednakim (pravilnim) vremenskim intervalima (npr. tono jednom mjeseno svakoga mjeseca,
tono jednom godinje svake godine itd.). Te vrijednosti poredat emo sukladno kronolokoj
skali modaliteta (vidjeti 1. poglavlje), tj. skup vrijednosti promatrane pojave emo kronoloki
urediti radi pojednostavljivanja daljnje statistike analize.

5.1. Definicija i vrste vremenskih nizova

(Konaan) Vremenski niz je niz od ukupno n N odreenih, kronoloki ureenih vrijednosti
neke pojave. Vrijednosti koje tvore vremenski niz obino nazivamo frekvencije
116
. Budui da
smo istakli kako emo kretanje neke pojave promatrati kao funkciju vremena, potrebno je
precizno definirati to e biti prirodno podruje definicije (domena), a to podruje vrijednosti
(kodomena) takvoga pridruivanja.

Smatramo intuitivno prihvatljivim pretpostaviti da vrijednost promatrane pojave ne ovisi o
broju vezanom uz razdoblje u kojemu je izmjerena vrijednost pojave
117
. Tako npr. u Primjeru
1. broj razvedenih brakova u 2003. godini (4 934) ne smatramo na bilo koji nain povezanim
s brojem 2002, broj sklopljenih brakova u 2004. godini (22 700) ne smatramo na bilo koji
nain povezanim s brojem 2004 itd. Stoga emo za prirodno podruje definicije (domenu)
neemo uzimati npr. skupove tipa {2002, 2003, 2004, 2005, 2006}. Kako bismo to vie
pojednostavnili statistiku analizu, poetnom razdoblju (odnosno, razdoblju u kojemu smo
prvi put odredili vrijednost promatrane pojave) dodijelit emo vrijednost vremenske varijable
X
t
= 0. Osnovni razlog takvom pridruivanju jest koritenje modela jednostavne linearne
regresije i jednostavne eksponencijalne regresije u analizi vremenskih nizova: ti modeli
pretpostavljaju da se vrijednost zavisne varijable Y moe izraunati u sluaju kad je vrijednost
nezavisne varijable jednaka nuli
118
. Stoga emo, slobodno govorei, vrijednosti vremenske
varijable poeti brojati od nule
119
. Preciznije, poetnom vremenskom razdoblju dodijelit emo
vrijednost vremenske varijable t = 0, njemu neposredno sljedeem vremenskom razdoblju
vrijednost t = 1, itd. Imamo li ukupno n vremenskih razdoblja u kojima smo odreivali
vrijednost neke pojave, posljednjem od njih a to je, zapravo, tekue razdoblje dodijelit

116
Navedeni je naziv svojevrstan vremenski analogon naziva apsolutna frekvencija kojega smo susreli u 2.
poglavlju.
117
Javno iznoenje navedene pretpostavke nau malu visoku kolu ozbiljno izlae estokim prosvjedima
numerologa, astrologa i njima slinih ''-loga'', ali pojednostavljuje daljnju statistiku analizu.
118
tovie, jedan od parametara svakoga od tih modela interpretira se upravo kao vrijednost odgovarajue
funkcije za x = 0.
119
Za sve vjernike: oprez, t = 0 ne znai da je prva vrijednost pojave izmjerena u godini Kristova roenja.


Poslovna statistika


emo vrijednost vremenske varijable t = n 1. Prema tome, prirodno podruje definicije
(domena) svake funkcije vremena koju budemo razmatrali bit e konaan skup {0, 1, ,
n 1}.

Podruje vrijednosti (kodomena) svake funkcije vremena bit e skup frekvencija. Radi
jednostavnosti, s Y
k
oznaavat emo frekvenciju pridruenu vrijednosti vremenske varijable
X
t
= k. Tako je npr. Y
0
vrijednost pojave pridruena vrijednosti vremenske varijable t = 0,
odnosno vrijednost pojave u poetnom razdoblju (jer je t = 0 vrijednost nezavisne varijable
dodijeljena poetnom vremenskom razdoblju) a Y
n 1
vrijednost pojave pridruena vrijednosti
vremenske varijable t = n 1, odnosno vrijednost pojave u tekuem razdoblju (jer je t = n 1
vrijednost vremenke varijable dodijeljena tekuem razdoblju). Ovakav dogovor svakako treba
imati na umu prigodom provedbe statistike analize.

U prvi mah nam se moda ini da smo pogrijeili kad smo rekli da emo kretanje pojave u
vremenu opisati kao funkciju vremena. Naime, nae dosadanje shvaanje pojma funkcije
pretpostavlja da, nakon definiranja prirodnoga podruja definicije (domene) i podruja
vrijednosti (kodomene), zadamo ''formulu'' (preciznije, analitiki izraz u zatvorenoj formi)
pomou koje se za svaku pojedinu vrijednost nezavisne varijable rauna pripadna vrijednost
zavisne varijable. Meutim, u matematici se funkcija moe potpuno definirati na tri naina:
ve opisanom ''formulom'', tablino i grafiki. Tablini i grafiki prikaz naroito su pogodni
naini zadavanja funkcije ukoliko je njezino prirodno podruje definicije (domena) relativno
''mali'' konaan skup, a u analizi vremenskih nizova imamo upravo takav sluaj. Stoga emo
spomenutu funkciju vremena uvijek najprije definirati tablino, a potom emo potpuno
analogno kao u regresijskoj analizi nastojati pronai najbolju ''formulu'', tj. analitiki izraz
kojim moemo definirati istu tu funkciju. Taj e izraz praktiki uvijek biti priblino toan jer
je korelacija vremena i promatrane pojave vrlo rijetko funkcijska. Iz toga se razloga statistiki
modeli koriteni u analizi vremenskih nizova mogu ubrojiti u regresijske modele, pa se
njihova reprezentativnost moe procjenjivati na isti nain kao i za sve druge regresijske
modele.

Zakljuno spomenimo da sve vremenske nizove moemo podijeliti u dvije skupine:

1.) intervalni vremenski niz to je niz frekvencija dobivenih mjerenjem u odreenomu
vremenskom intervalu (npr. broj noenja u svratitu ''Zlatna koko'' u krabutniku u
razdoblju od 2001. godine do 2007. godine, broj vozila na autocesti Zagreb Lipovac u
razdoblju od 08:00 do 20:00 sati itd.).

2. trenutani vremenski niz to je niz frekvencija dobivenih mjerenjem ili promatranjem u
odreenomu trenutku (npr. broj stanovnika mjesta Sveti Petar u umi u razdoblju od 1971.


Poslovna statistika


godine do 2001. godine stanje na dan 30.6., broj vozila na autocesti Zagreb Lipovac dana
15.svibnja 2008. u 12:00 sati itd.).

5.2. Pokazatelji pojedinanih apsolutnih promjena

Bilo koja razlika vrijednosti dviju frekvencija promatrane pojave naziva se apsolutna
promjena te pojave. Apsolutna promjena moe biti pozitivna ili negativna: ako je njezin
predznak +, govorimo o poveanju vrijednosti pojave, a ako je njezin predznak , govorimo o
smanjenju vrijednosti pojave.

Primjer 4. Godinama (x) iz Primjera 3. pridruimo vrijednosti vremenske varijable (t) prema
formuli: t = x 2003. Drugim rijeima, 2003. godini pridruimo t = 0, 2004. godini
pridruimo t = 1 itd. Izraunajmo razlike Y
0
Y
4
i Y
3
Y
1
i objasnimo njihovo znaenje.
Imamo redom:

Y
0
Y
4
= 67 977 59 603 = 8 374,

to znai da je 2003. godine prosjean godinji broj korisnika novane naknade bio za 8 374
vei nego 2007. godine (ili, ekvivalentno, da je 2007. godine prosjean godinji broj korisnika
novane naknade bio za 8 374 manji nego 2003. godine). Nadalje,

Y
3
Y
1
= 66 407 70 467 = 4 060,
to znai da je 2006. godine prosjean godinji broj korisnika novane naknade bio za 4 060
manji nego 2004. godine (ili, ekvivalentno, da je 2004. godine prosjean godinji broj
korisnika novane naknade bio za 4 060 vei nego 2006. godine).

U praksi se najee raunaju vrijednosti niza uzastopnih apsolutnih promjena (oznaka: Y
t
)
neke pojave. Te se vrijednosti dobiju tako da se od vrijednosti pojave u tekuemu razdoblju
oduzmemo vrijednost pojave u neposredno prethodnomu razdoblju, tj.

Y
t
= Y
t
Y
t 1
, za svaki t = 1, 2, 3, ..., n 1.

Primjer 5. Izraunajmo vrijednosti uzastopnih apsolutnih promjena prosjenoga broja
korisnika novane pomoi (podaci iz Primjera 3.). Dobivamo:


Poslovna statistika


godina t prosjean godinji broj
uzastopne apsolutne
promjene (Y
t
)
2003. 0 67 977 nepoznata
2004. 1 70 467 2 490
2005. 2 72 802 2 335
2006. 3 66 407 -6 395
2007. 4 59 603 -6 804

U presjeku drugoga retka i treega stupca gornje tablice upisali smo rije nepoznata jer se
vrijednost uzastopne apsolutne promjene prosjenoga godinjega broja korisnika novane
naknade za 2003. godinu dobije tako da se od prosjenoga godinjega broja korisnika novane
naknade u 2003. godini oduzme prosjean godinji broj korisnika novane naknade u 2002.
godini, a potonji podatak nemamo naveden u tablici. Ovo pravilo vrijedi pri svakom
raunanju apsolutnih promjena:

Pravilo 1. Vrijednost uzastopne apsolutne promjene za poetno razdoblje (t = 0) uvijek je
nepoznata. OPREZ! Pogreno je kao vrijednost uzastopne apsolutne promjene za
poetno razdoblje (t = 0) navesti broj 0 (nula) jer broj 0, kao pokazatelj apsolutne
promjene, znai jednakost vrijednosti pojave u odgovarajuim razdobljima, a ne da taj
pokazatelj ne moemo efektivno izraunati.

Iz dobivenoga stupca tablice vidimo npr. da je prosjean broj korisnika novane naknade u
2004. godini bio za 2 490 vei nego u 2003. godini, prosjean broj korisnika novane naknade
u 2006. godini bio je za 6 395 manji nego u 2005. godini itd.

Istaknimo i da se apsolutne promjene mogu raunati u odnosu na isto (bazno) vremensko
razdoblje. Odgovarajui se pokazatelji dobiju tako da se od frekvencije pojave u tekuemu
razdoblju oduzme frekvencija pojave u baznomu razdoblju (b):

*Y
t
= Y
t
Y
b
, za svaki t = 0, 1, , n 1.

Primjer 6. Izraunajmo pokazatelje apsolutnih promjena u odnosu na 2004. godinu za
podatke iz Primjera 3. Budui da je b = 1, tj. Y
b
= Y
1
= 70 467, dobivamo:

godina t prosjean godinji broj
pojedinane apsolutne
promjene u odnosu na
2004. godinu (*Y
t
)
2003. 0 67 977 -2 490
2004. 1 70 467 0
2005. 2 72 802 2 335
2006. 3 66 407 -4 060
2007. 4 59 603 -10 864


Poslovna statistika


Iz posljednjega stupca dobivene tablice moemo zakljuiti npr. da je prosjean broj korisnika
novane pomoi u 2005. godini bio za 2 335 vei, a prosjean broj korisnika novane pomoi
u 2006. godini za 4 060 manji nego u 2004. godini.

5.3. Modeli trenda

Ukoliko postoji odreena pravilnost u promjenama vrijednosti promatrane pojave u
odreenom vremenskom razdoblju (tj. ukoliko vremenski niz ima tendenciju rasta ili pada),
kaemo da vremenski niz ima trend. Tendencija rasta ili pada se vrlo dobro moe ''oitati''
izraunavanjem vrijednosti uzastopnih apsolutnih apsolutnih promjena: ako je dobiveni niz
rastui, tj. ukoliko za svaki t = 1, 2, , n 2 vrijedi nejednakost

Y
t
Y
t + 1
,

kaemo da vremenski niz ima tendenciju rasta, a ukoliko vrijedi nejednakost

Y
t
Y
t + 1
,

kaemo da vremenski niz ima tendenciju pada. U takvim se sluajevima kretanje promatrane
pojave moe opisati pomou odgovarajuega modela trenda. Grubo govorei, modeli trenda,
zapravo, nisu nita drugo negoli ''obini'' regresijski modeli u kojima ''ulogu'' nezavisne
varijable X preuzima vremenska varijabla t.

Ukoliko se promatrana pojava mijenja za priblino jednake apsolutne iznose u svakoj jedinici
vremena, njezino kretanje moemo opisati modelom linearnoga trenda. Odgovarajua
jednadba modela linearnoga trenda i pripadni parametri isti su kao i kod modela jednostavne
linearne regresije, samo to se u sluaju modela linearnoga trenda vrijednost parametra A
interpretira kao oekivana prosjena promjena vrijednosti varijable Y u jedinici vremena.

Ukoliko se, pak, promatrana pojava ne mijenja linearno, nego sve bre (ili sporije) ovisno o
vrijednosti vremenske varijable, njezino kretanje moemo opisati modelom eksponencijalnoga
trenda. Odgovarajua jednadba i pripadni parametri toga modela trenda isti su kao i kod
modela jednostavne eksponencijalne regresije, samo to se u sluaju modela
eksponencijalnoga trenda vrijednost parametra A interpretira kao oekivana relativna
prosjena promjena vrijednosti varijable Y u jedinici vremena.

Reprezentativnost modela trenda obino se procjenjuje na temelju koeficijenta varijacije toga
modela, ali se za procjenu moe koristiti i koeficijent determinacije. Formule za izraun


Poslovna statistika


navedenih pokazatelja jednake su odgovarajuim formulama iz podtoaka 4.2.3.3. i 4.2.3.4.
Kad god je to mogue, treba izraunati oba navedena pokazatelja.

Ilustrirajmo primjenu modela trenda na sljedeem primjeru:

Primjer 1. U donjoj je tablici prikazano kretanje prosjene cijene nafte u SAD u razdoblju od
1. travnja 2007. do 31. travnja 2008. godine.

mjesec i godina t prosjena cijena nafte
[USD/barel]
travanj 2007. 0 63,98
svibanj 2007. 1 63,45
lipanj 2007. 2 67,49
srpanj 2007. 3 74,12
kolovoz 2007. 4 72,36
rujan 2007. 5 79,91
listopad 2007. 6 85,80
studeni 2007. 7 94,77
prosinac 2008. 8 91,69
sijeanj 2008. 9 92,97
veljaa 2008. 10 95,39
oujak 2008. 11 105,46
travanj 2008. 12 112,58
Izvor: Energy Information Administration slubena energetska statistika Vlade SAD

a) Prikaimo kretanje prosjene cijene nafte u promatranom razdoblju linijskim grafikonom s
ishoditem u poetnoj godini razdoblja promatranja. Uz grafikon navedimo sve potrebne
oznake.
b) Odredimo jednadbu modela linearnoga, odnosno eksponencijalnoga trenda koji najbolje
opisuje kretanje promatrane pojave. Objasnimo znaenje parametara trenda i prikaimo
dobivene modele grafiki.
c) Na temelju koeficijenata determinacije procijenimo koji od navedenih modela trenda bolje
opisuje kretanje prosjene cijene nafte. Potom na temelju reprezentativnijega modela trenda
prognozirajmo kretanje prosjene cijene nafte u svakom pojedinom mjesecu do kraja 2008.
godine.
d) Ukoliko se kretanje prosjene cijene nafte nastavi prema modelu odabranom u c)
podzadatku, odredimo u kojem mjesecu moemo oekivati da cijena nafte prvi put dosegne
200 USD/barel.


Poslovna statistika


Kretanje prosjene cijene nafte na amerikom tritu u promatranom razdoblju grafiki je
prikazano sljedeim linijskim grafikonom:

Jednadbe modela linearnoga, odnosno eksponencijalnoga trenda zajedno s pripadajuim
krivuljama trenda i koeficijentima determinacije navedene su na sljedeoj slici:

Zasebno emo analizirati svaki model trenda:

model linearnoga trenda: njegovi parametri su:


Poslovna statistika


A = 3.9743 oekivano mjeseno prosjeno poveanje prosjene cijene nafte iznosi
priblino 4 USD po barelu;
B = 60.767 procijenjena prosjena cijena nafte u travnju 2007. godine iznosi
priblino 60,77 USD
model eksponencijalnoga trenda: njegovi parametri su:
A = e
0.0475
= 1.048646 100 (A 1) 4.865 oekivani prosjean mjeseni rast
prosjene cijene nafte iznosi 4.865%;
B = 62.614 procijenjena prosjena cijena nafte u travnju 2007. godine iznosi
priblino 62,61 USD

Koeficijent determinacije modela linearnoga trenda iznosi 0.9561, to znai da se 95.61%
periodinih promjena prosjene cijene nafte moe objasniti modelom linearnoga trenda. S
druge strane, koeficijent determinacije modela eksponencijalnoga trenda iznosi 0.9609, to
znai da se 96.09% periodinih promjena prosjene cijene nafte moe objasniti modelom
eksponencijalnoga trenda. Prema kriteriju koeficijenata determinacije, model
eksponencijalnoga trenda je reprezentativniji.

Prosjenu cijenu nafte u svakom pojedinom mjesecu preostalom do kraja 2008. godine
moemo prognozirati na dva naina:

1.) uvrtavanjem x = 13, x = 14, , x = 19 i x = 20 u svaku od dobivenih jednadbi;
2.) (u MS Excelu) koritenjem funkcije TREND za prognozu pomou modela linearnoga
trenda, odnosno GROWTH za prognozu pomou modela eksponencijalnoga trenda.

U oba sluaja dobivamo:

mjesec i
godina
t prognoza pomou modela
linearnoga trenda
prognoza pomou modela
eksponencijalnoga trenda
svibanj 2008. 13 112,43 USD 116,05 USD
lipanj 2008. 14 116,41 USD 121,69 USD
srpanj 2008. 15 120,38 USD 127,61 USD
kolovoz 2008. 16 124,36 USD 133,81 USD
rujan 2008. 17 128,33 USD 140,32 USD
listopad 2008. 18 132,30 USD 147,14 USD
studeni 2008. 19 136,28 USD 154,29 USD
prosinac 2008. 20 140,25 USD 161,79 USD

Da bismo procijenili kada e prosjena cijena nafte prvi puta dosegnuti 200 USD po barelu,
trebamo rijeiti jednadbu


Poslovna statistika


62.614 1.048646
t
= 200

Njezino je rjeenje
120
:
ln200 ln62.614
ln1.048646
t

= 24.

Vrijednost vremenske varijable t = 24 odgovara travnju 2009. godine. Prema tome, ukoliko se
kretanje prosjene cijene nafte nastavi prema modelu eksponencijalnoga trenda, moe se
oekivati da e prosjena cijena nafte u travnju 2009. godine dosegnuti 200 USD/barel.

5.4. Osnovni brojani pokazatelji relativnih promjena

U praksi se esto pojavljuje problem analiziranja i usporedbe dinamike kretanja najmanje
dviju razliitih pojava. Vrijednosti tih pojava obino su iskazane u razliitim mjernim
jedinicama ili se, pak, znaajno razlikuju po svojoj veliini. Zbog toga se u takvim
sluajevima, umjesto apsolutnih promjena, izraunavaju i interpretiraju relativni pokazatelji
promjena tih pojava.

Jedna od najeih mjera relativnih promjena je koeficijent dinamike (oznaka: K
t
). Koeficijent
dinamike jednak je omjeru apsolutne promjene frekvencija dvaju uzastopnih razdoblja i
frekvencije pojave u kronoloki prvom od tih dvaju razdoblja:

1 1
1
t t
t
t t
Y Y
K
Y Y

= = za svaki t = 1, 2, , n 1.

Usko vezana uz koeficijent dinamike je pojedinana stopa promjene (oznaka: S
t
) neke pojave.
Ona iskazuje relativnu promjenu vrijednosti pojave u dvaju uzastopnim razdobljima, a dobije
se mnoenjem koeficijenta dinamike sa 100:

S
t
= K
t
100 =
1
100 1
t
t
Y
Y
| |

|
\
, za svaki t = 1, 2, , n 1.

120
Svima kojima rjeavanje eksponencijalno-logaritamskih jednadbi predstavlja teak i zahtjevan matematiki
problem preporuuje se da navedenu jednadbu rijee koritenjem procedure Traenje rjeenja (Goal Seek).


Poslovna statistika


Pojedinana stopa promjene zapravo predstavlja postotak promjene frekvencije neke pojave u
tekuemu razdoblju u odnosu na prethodno razdoblje. Stoga se uz numeriku vrijednost
pojedinane stope promjene uvijek pie znak %.

Osim za dva uzastopna razdoblja, pojedinana stopa promjene moe se raunati i prigodom
usporeivanja vrijednosti neke pojave tijekom svakoga od n razdoblja s vrijednou te pojave
u proizvoljno odabranom, ali fiksiranom razdoblju. U takvim sluajevima pojedinanu stopu
promjene vrijednosti pojave u tekuemu razdoblju u odnosu na vrijednost te pojave u
(proizvoljnom, ali fiksiranom) baznom razdoblju dobivamo iz izraza:

*
100 1 100
t t
t
b b
Y Y
S
Y Y
| |
= =
|
\
, za svaki t = 0, 1, 2, , n 1.

Primjer 1. U sljedeoj su tablici prikazani podaci o kretanju broja osnovanih registriranih
pravnih osoba u Republici Hrvatskoj u proteklih godinu dana.

razdoblje broj osnovanih registriranih
pravnih osoba
1. kvartal 2007. 3 724
2. kvartal 2007. 3 567
3. kvartal 2007. 3 240
4. kvartal 2007. 3 500
1. kvartal 2008. 3 783
izvor: Broj i struktura poslovnih subjekata u Republici Hrvatskoj, priopenje br. 11.1.1/1,
Dravni zavod za statistiku, Zagreb, 9.5.2008.

Izraunajmo koeficijente dinamike promjene broja osnovanih registriranih pravnih osoba u
uzastopnim vremenskim razdobljima, te odgovarajue pojedinane stope promjene, pa
objasnimo znaenje dobivenih rezultata za 3. kvartal 2007. godine i 1. kvartal 2008. godine.
Potom usporedimo brojeve osnovanih registriranih pravnih osoba u svakom pojedinom
kvartalu s brojem osnovanih registriranih pravnih osoba u posljednjem kvartalu 2007. godine i
objasnimo znaenje pokazatelja koji odgovara 1. kvartalu 2007. godine.

Najprije izraunavamo koeficijente dinamike i njima odgovarajue stope promjene:


Poslovna statistika


razdoblje t broj osnovanih registriranih
pravnih osoba
K
t
S
t

1. kvartal 2007. 0 3 724 nepoznat nepoznata
2. kvartal 2007. 1 3 567 -0.04216 -4.2159 %
3. kvartal 2007. 2 3 240 -0.09167 -9.16737 %
4. kvartal 2007. 3 3 500 0.080247 8.024691 %
1. kvartal 2008. 4 3 783 0.080857 8.085714 %

U presjecima 2. retka i 3., odnosno 4. stupca upisali smo rijei nepoznat i nepoznata jer nam
za izraunavanje vrijednosti odgovarajuega pokazatelja nedostaju podaci iz 1. kvartalu
neposredno prethodnoga razdoblja, tj. iz 4. kvartala 2006. godine.

Iz dobivene tablice vidimo da je broj osnovanih registriranih pravnih osoba u 3. kvartalu
2007. godine bio za priblino 9.17% manji nego u 2. kvartalu iste godine, te da je broj
osnovanih registriranih pravnih osoba u 1. kvartalu 2008. godine bio za priblino 8.09% vei
nego u 4. kvartalu 2007. godine.

Sada izraunavamo pojedinane stope promjene uzimajui 4. kvartal 2007. godine kao bazno
razdoblje:

razdoblje t broj osnovanih registriranih
pravnih osoba
*
t
S
1. kvartal 2007. 0 3 724 6.4%
2. kvartal 2007. 1 3 567 1.91429%
3. kvartal 2007. 2 3 240 -7.42857%
4. kvartal 2007. 3 3 500 0%
1. kvartal 2008. 4 3 783 8.08571%

Pokazatelj koji odgovara 1. kvartalu 2007. godine jednak je 6.4%, to znai da je broj
osnovanih registriranih pravnih osoba u 1. kvartalu 2007. godine bio za 6.4% vei nego u
posljednjem kvartalu 2007. godine.

5.5. Individualni indeksi

Jedna od najee rabljenih relativnih promjena vrijednosti neke pojave su tzv. indeksi.
Pomou njih usporeujemo odnos stanja jedne ili vie pojava u razliitim vremenskim
razdobljima (''vremenskim tokama'') ili u istim vremenskim razdobljima, ali na razliitim
mjestima (tj. u razliitim gradovima, regijama, dravama, skupinama drava itd.)


Poslovna statistika


Opa podjela razlikuje dvije vrste indeksa: individualne i skupne. Individualni indeksi prate
razvoj tono jedne pojave u vremenu ili prostoru, te se uobiajeno dijele na verine (lanane)
indekse i indekse na stalnoj bazi (bazne indekse). Za razliku od jednostavnih, skupni indeksi
prate razvoj barem dvije razliite pojave u vremenu ili prostoru.

U nastavku se ukratko opisuje svaka pojedina vrsta indeksa.

5.5.1. Verini (lanani) indeksi

Verini (lanani) indeks (oznaka: V
t
) predstavlja pokazatelj relativne promjene stanja neke
pojave u dvama uzastopnim vremenskim razdobljima. On je, dakle, pokazatelj relativne
promjene stanja neke pojave u tekuemu razdoblju u odnosu na tekuem razdoblju
neposredno prethodno razdoblje. Ukoliko kretanje pojave promatramo tijekom n razdoblja,
onda ukupno n 1 verinih indeksa raunamo pomou relacije:

V
t
=
1
t
t
Y
Y
100, za svaki t = 1, 2, , n 1,

ili, ekvivalentno, na temelju koeficijenata dinamike:

V
t
= (K
t
+ 1) 100, za svaki t = 1, 2, , n 1.

Svaki verini indeks zapravo predstavlja postotni udio vrijednosti promatrane pojave u
tekuemu razdoblju u odnosu na vrijednost te pojave u neposredno prethodnomu razdoblju.
Ako je V
t
= A, onda opa interpretacija toga indeksa glasi:

Na svakih 100 jedinica mjere promatrane pojave u razdoblju (t 1) dolazi A jedinica mjere te
pojave u razdoblju t.

Istaknimo da, kao i koeficijent dinamike, verini indeks nije definiran za poetno razdoblje
(t = 0), pa se u takvim sluajevima obino stavlja rije nepoznat.
121

121
Ova injenica znai da je pogreno kao verini indeks za poetno razdoblje definirati broj 0. U ovom bi
sluaju vrijednost 0 povlaila da znamo vrijednost promatrane pojave u razdoblju koje neposredno prethodi
poetnom razdoblju i da je ta vrijednost jednaka nuli. Oito, niti jedna niti druga posljedica nisu istinite.


Poslovna statistika


Umjesto iz koeficijenta dinamike, pojedinanu stopu promjene u uzastopnim vremenskim
razdobljima moemo izraunati i pomou odgovarajuega verinoga indeksa:

S
t
= V
t
100, za svaki t = 1, 2, , n 1.

Primjer 1. U sljedeoj su tablici navedeni podaci o ukupnom broju zaposlenih u
djelatnostima financijskoga posredovanja u svakom od mjeseci koji tvore 1. kvartal 2008.
godine.

mjesec ukupan broj zaposlenih
sijeanj 1 604
veljaa 1 636
oujak 1 621
izvor: Zaposleni u obrtu i u djelatnostima slobodnih profesija u prvom tromjesenju 2008.,
priopenje br. 9.2.2/1, Dravni zavod za statistiku, Zagreb, 12.5.2008.

Izraunajmo odgovarajue koeficijente dinamike, verine indekse i pojedinane stope
promjene, pa objasnimo znaenje vrijednosti dobivenih za oujak 2008.

Vrijednosti traenih relativnih pokazatelja navedene su u sljedeoj tablici:

mjesec t ukupan broj zaposlenih K
t
V
t
S
t
sijeanj 0 1 604 nepoznat nepoznat nepoznata
veljaa 1 1 636 0.01995 101.995 1.995012 %
oujak 2 1 621 -0.00917 99.08313 -0.91687 %

Iz dobivenih pokazatelja zakljuujemo da je na svakih 100 zaposlenih u djelatnostima
financijskoga posredovanja u oujku 2008. godine dolazilo priblino 102 zaposlena u veljai
iste godine, odnosno da je broj zaposlenih u djelatnostima financijskoga posredovanja u
oujku 2008. godine bio za priblino 0.92% manji nego u veljai iste godine.

Pomou svih n 1 verinih indeksa kojima mjerimo dinamiku promjene vrijednosti neke
pojave u n razdoblja, te zadane vrijednosti te pojave u bilo kojem od tih n razdoblja (oznaimo
ga s b) moemo izraunati vrijednosti pojave u svakom od preostalih n 1 razdoblja na
temelju sljedeih relacija:

1
1
100, za .
, za .
100
t
t
t
t t
t
Y
Y t b
V
V Y
Y b t
= <
= <


Poslovna statistika


Ilustrirajmo taj postupak na primjeru.

Primjer 2. U sljedeoj su tablici navedeni verini indeksi promjene prosjene isplaene
mjesene neto-plae u razdoblju od 2003. do 2007. godine.

godina t V
t
2003. 0 nepoznat
2004. 1 105.9
2005. 2 105.9
2006. 3 105.2
2007. 4 105.2
izvor: Mjeseno statistiko izvjee 3/2008, Dravni zavod za statistiku, oujak, 2008.

Ako je prosjena mjesena isplaena neto-plaa u 2006. godini iznosila 4.603,00 kn,
odredimo prosjene mjesene isplaene neto-plae u svakoj od preostalih godina.

2006. godini odgovara vrijednost vremenske varijable t = 3, pa je Y
3
= 4.603,00. Za t < 3,
odnosno t = 0, 1, 2 dobivamo redom:

3
2
3
2
1
2
1
0
1
4.603, 00
100 100 4.375, 48
105.2
4.375, 48
100 100 4.131, 70
105.9
4.131, 70
100 100 3.901, 52
105.9
Y
Y
V
Y
Y
V
Y
Y
V
= =
= =
= =

dok za t > 3, odnosno t = 4 dobivamo:

4 3
4
105, 2 4.603, 00
4.842, 36
100 100
V Y
Y

= = .

Dobivene podatke moemo zapisati u obliku tablice:

godina t prosjena mjesena
isplaena netoplaa [kn]
V
t
2003. 0 3.901,52 nepoznat
2004. 1 4.131,70 105.9
2005. 2 4.375,46 105.9
2006. 3 4.603,00 105.2
2007. 4 4.842,36 105.2


Poslovna statistika


Pri raunanju prosjenoga tempa promjene promatrane pojave rabimo geometrijsku sredinu
verinih indeksa (oznaka: G). Pojam geometrijske sredine ve smo upoznali u toki 3.1.2. pa
emo jo jednom navesti samo osnovnu formulu za njezino raunanje (u terminologiji
verinih indeksa):

1
1 2 1
...
=
n
n
V V V G .

Iz definicije verinih indeksa slijedi da njihovu geometrijsku sredinu moemo izraunati i
prema formuli:

100 1
0
1
=

n
n
Y
Y
G

Stoga moemo zakljuiti da za alternativno raunanje vrijednosti geometrijske sredine
verinih indeksa moramo znati samo prvi (Y
0
) i posljednji (Y
n1
) lan vremenskoga niza. To je
ujedno i najvei nedostatak geometrijske sredine (kao mjere prosjenoga tempa promjene) jer
ne uzima u obzir sve frekvencije vremenskoga niza (za razliku od, npr., ranije spomenutih
modela trenda), nego iskljuivo prvu i posljednju frekvenciju. Pomou spomenute
geometrijske sredine verinih indeksa rauna se i prosjena stopa promjene vrijednosti
promatrane pojave (oznaka: S ):

S = G 100.

Kao i svi drugi relativni pokazatelji, i prosjena stopa promjene iskazuje se u postotcima. Na
temelju nje se okvirno mogu procijeniti (prognozirati) frekvencije te pojave i u buduim
vremenskim razdobljima uz nunu pretpostavku da se dinamika pojave ne mijenja u odnosu
na dinamiku pojave u promatranomu razdoblju. Pri takvim se prognozama koristi relacija:

t
t
G
Y Y |
\
|
=
100
0
, za t = n, n + 1,

No, budui da prosjena stopa promjene ovisi iskljuivo o prvoj i posljednjoj frekvenciji u
vremenskom nizu, u praksi se navedene vrijednosti prognoziraju uglavnom na temelju nekoga
od modela trenda.
Primjer 3. Na temelju podataka iz Primjera 2. izraunajmo prosjenu godinju stopu
promjene prosjene mjesene isplaene neto-plae u razdoblju od 2003. do 2007. godine, pa
procijenimo prosjenu mjesenu isplaenu neto-plau u Republici Hrvatskoj za svaku od
godina u razdoblju od 2008. do 2010. godine.


Poslovna statistika


Geometrijska sredina verinih indeksa jednaka je

4
4 4
0
4.842, 36
100 100
3.901, 52
Y
G
Y
= = = 105.5494197.

Stoga je prosjena godinja stopa promjene

S = G 100 = 105.5494197 100 5.55%,

to znai da su u promatranom razdoblju prosjene mjesene isplaene netoplae rasle za
prosjeno 5.55% godinje. Budui da 2008. godini odgovara vrijednost vremenske varijable
t = 5, 2009. godini t = 9, a 2010. godini t = 10, prognozu prosjenih mjesenih isplaenih
neto-plaa za 2008., 2009. i 2010. godinu dajemo na temelju izraza:

5 5
5
0
6 6
6
0
7 7
7
0
105.5494197
3.901, 52 5.111, 08
100 100
105.5494197
3.901, 52 5.394, 71
100 100
105.5494197
3.901, 52 5.694, 09
100 100
G
Y Y
G
Y Y
G
Y Y
| | | |
= =
| |
\ \
| | | |
= =
| |
\ \
| | | |
= =
| |
\ \

Dakle, procijenjena prosjena mjesena isplaena neto-plaa u Republici Hrvatskoj za 2008.
godini iznosi 5.111,08 kn, u 2009. godini 5.394,71 kn, a u 2010. godini 5.694,09 kn (uz
smjelu pretpostavku da nee doi do znaajnije promjene dinamike kretanja plaa).
Spomenimo zakljuno da se verini indeksi grafiki uobiajeno prikazuju specifinim
linijskim grafikonom ili jednostavnim stupcima. Tako su npr. grafiki prikazi verinih indeksa
iz Primjera 3. sljedei grafikoni:


Poslovna statistika


5.5.2. Indeksi na stalnoj bazi (bazni indeksi)

Indeksi na stalnoj bazi (krae: bazni indeksi) pokazatelji su relativnih promjena u tekuemu
razdoblju u odnosu na neko proizvoljno, ali fiksirano bazno razdoblje. Oznaimo li to
razdoblje s b, onda za svako pojedino razdoblje t odgovarajui indeks I
t
na stalnoj bazi b
raunamo pomou relacije:


Poslovna statistika


100 =
b
t
t
Y
Y
I , za svaki t = 0, 1, 2, , n 1.

Iz navedene relacije proizlaze sljedea svojstva koja je vrlo korisno primijeniti pri provjeri
ispravnosti izrauna indeksa na stalnoj bazi:

Svojstvo 1. Za t = b vrijedi jednakost I
b
= 100.
Svojstvo 2. Pretpostavimo da je b n 1, tj. da posljednje od ukupno n razdoblja nije ujedno
i bazno razdoblje. Tada za t = b + 1 vrijedi jednakost:

I
t
= V
t
.

Ekvivalentno, indeks razdoblja t na stalnoj bazi b jednak je verinomu indeksu razdoblja t
ako i samo ako je t = b + 1.

Indeks na stalnoj bazi zapravo predstavlja postotni udio frekvencije promatrane pojave u
tekuemu razdoblju u odnosu na frekvenciju promatrane pojave u baznomu razdoblju. Stoga je
njegova opa interpretacija sljedea:

I
t
= A Na svakh 100 jedinica mjere pojave A u razdoblju b dolazi A jedinica mjere pojave
A u razdoblju B.

Kao i za verine indekse, i za indekse na stalnoj bazi moe se raunati odgovarajua
pojedinana stopa promjene (oznaka:
*
t
S ) u odnosu na bazno razdoblje b, i to prema formuli:

*
t
S = I
t
100 , za svaki t = 0, 1, 2, , n 1.

Primjer 4. U donjoj su tablici navedeni podaci o prosjenom godinjem broju ena
zaposlenih u pravnim osobama, obrtu i djelatnostima slobodnih profesija u Republici
Hrvatskoj za razdoblje od 1997. do 2006. godine.


Poslovna statistika


godina t prosjean broj zaposlenih ena
[000]
1997. 0 546
1998. 1 574
1999. 2 571
2000. 3 573
2001. 4 578
2002. 5 580
2003. 6 595
2004. 7 606
2005. 8 617
2006. 9 640
Dravni zavod za statistiku, Zagreb, 2007.

Izraunajmo indekse na stalnoj bazi 2003 = 100 i odgovarajue pojedinane stope promjene,
pa objasnimo znaenje navedenih pokazatelja za 2000. i 2006. godinu. Potom dobivene bazne
indekse prikaimo grafiki jednostavnim stupcima.

Traeni indeksi na stalnoj bazi 2003 = 100 i njima odgovarajue stope promjene navedene su
u sljedeoj tablici:

godina t prosjean broj zaposlenih ena
[000]
I
t
*
t
S
1997. 0 546 91.76471 -8.23529
1998. 1 574 96.47059 -3.52941
1999. 2 571 95.96639 -4.03361
2000. 3 573 96.30252 -3.69748
2001. 4 578 97.14286 -2.85714
2002. 5 580 97.47899 -2.52101
2003. 6 595 100 0
2004. 7 606 101.8487 1.848739
2005. 8 617 103.6975 3.697479
2006. 9 640 107.563 7.563025

Iz dobivenih rezultata vidimo da na svakih 100 zaposlenih ena u 2003. godini dolazi
priblino 96 zaposlenih ena u 2000. godini, odnosno priblino 108 zaposlenih ena u 2006.
godini. Ekvivalentno reeno, prosjean broj zaposlenih ena u 2000. godini je za priblino
3.69% manji, a u 2006. godini za priblino 7.56% vei nego u 2003. godini.


Poslovna statistika


Indekse na stalnoj bazi obino grafiki prikazujemo jednostavnim stupcima. Grafiki prikaz
indeksa na stalnoj bazi 2003 = 100 je donja slika:

Vidjeli smo da sve frekvencije neke pojave moemo odrediti pomou verinih indeksa i bilo
koje unaprijed zadane frekvencije te pojave. Analogno, moemo ih odreivati i pomou svih
unaprijed zadanih indeksa na nekoj stalnoj bazi b i (barem) jedne unaprijed zadane
frekvencije te pojave. Ovisno o zadanoj frekvenciji, razlikujemo sljedea dva podsluaja:

1.) Ako je zadana frekvencija pojave u baznomu razdoblju b (tj. vrijednost Y
b
), tada
vrijednosti pojave u svakom od n razdoblja
122
dobivamo iz jednakosti:

100
t b
t
I Y
Y

= , za svaki t = 0, 1, 2, , n 1.

2.) Ako je zadana frekvencija pojave u nekom drugom razdoblju t
1
razliitomu od baznoga (tj.
ako je zadana frekvencija
1
t
Y , pri emu je t
1
b), tada najprije izraunamo frekvenciju
promatrane pojave u baznomu razdoblju b pomou relacije:

100
t
b
t
Y
Y
I
=

122
Navedena formula oito vrijedi i u sluaju t = b.


Poslovna statistika


(I
t
je indeks razdoblja t na stalnoj bazi b). Na taj nain ovaj podsluaj svodimo na podsluaj
1. pa za raunanje vrijednosti pojave u ostalim godinama primijenjujemo formulu navedenu u
tomu sluaju.

Napomenimo da i iz indeksa na stalnoj bazi neovisno o izboru stalne baze b moemo
izraunati prosjenu stopu promjene frekvencija neke pojave u promatranomu razdoblju, i to
prema formuli:
1
1
0
1 100
n
n
I
S
I
| |
=
|
|
\
.
Primjer 5. Zadani su indeksi na stalnoj bazi 2005 = 100 zaposlenih u pravnim osobama svih
oblika vlasnitva.

godina t indeks na stalnoj bazi
2005 = 100
1997. 0 89
1998. 1 96
1999. 2 95
2000. 3 95
2001. 4 95
2002. 5 95
2003. 6 98
2004. 7 99
2005. 8 100
2006. 9 104

Odredimo prosjean broj zaposlenih u pravnim osobama svih oblika vlasnitva u svakoj
pojedinoj godini ako je poznato da je prosjean broj zaposlenih u pravnim osobama svih
oblika vlasnitva u 1997. godini iznosio 995 000. Potom odredimo prosjenu godinju stopu
promjene broja zaposlenih i objasnimo znaenje dobivene vrijednosti.

Iz podataka Y
0
= 995 000, b = 8 (jer 2005. godini odgovara t = 8) i I
0
= 89 slijedi:

0
8
0
995000
100 100
89
b
Y
Y Y
I
= = = 1 117 978.

Dakle, prosjean broj zaposlenih u baznoj godini iznosi 1 117 978. Na temelju toga podatka
raunamo prosjean broj zaposlenih u svakoj od preostalih godina:


Poslovna statistika


1 8 1
1
8 2
2
3 4 5 2
8 6
6
8 7
7
8 9
9
1117978 96
1073258
100 100 100
1117978 95
1062079
100 100
1062079
1117978 98
1095618
100 100
1117978 99
1106798
100 100
1117978 104
1162697
100 100
b
Y I Y I
Y
Y I
Y
Y Y Y Y
Y I
Y
Y I
Y
Y I
Y

= = =

= =
= = =

= =

= =

= =

Dobivene podatke pregledno moemo zapisati u sljedeoj tablici:

godina t prosjean broj zaposlenih
[000 000]
1997. 0 0.95
1998. 1 1.073258
1999. 2 1.062079
2000. 3 1.062079
2001. 4 1.062079
2002. 5 1.062079
2003. 6 1.095618
2004. 7 1.106798
2005. 8 1.117978
2006. 9 1.162697

Prosjena godinja stopa promjene broja zaposlenih iznosi:

1 9
9
1 9
0 0
104
1 100 1 100 1 100 1.745668
89
n
n
I I
S
I I
| | | | | |
= = =
| | |
\ \ \
.

Prema tome, prosjean broj zaposlenih u pravnim osobama svih oblika vlasnitva u
promatranom se razdoblju poveavao za prosjeno 1.75% godinje. Primijetimo da dobiveni
pokazatelj relativno loe opisuje kretanje prosjenoga broja zaposlenih u promatranom
razdoblju jer se u podrazdoblju od 1999. do 2002. godine navedeni prosjean broj nije


Poslovna statistika


mijenjao. Zbog toga je u takvim sluajevima za analizu promjena promatrane pojave
primjerenije rabiti modele trenda.

5.5.3. Pretvorba indeksa

Jedna od znaajnih prednosti individualnih indeksa jest mogunost pretvorbe
(preraunavanja) svake pojedine vrste indeksa u preostalu vrstu indeksa bez poznavanja
frekvencija koje tvore vremenski niz. Drugim rijeima, promjene promatrane pojave moemo
analizirati i bez poznavanja originalnih emipirijskih frekvencija te pojave.

Pretvorbe individualnih indeksa moemo podijeliti na tri tipa:

1.) pretvorba indeksa na stalnoj bazi b u indekse na stalnoj bazi b
1
b;
2.) pretvorba indeksa na stalnoj bazi b u verine indekse;
3.) pretvorba verinih indeksa u indekse na stalnoj bazi b.

Na po jednom primjeru opisat emo svaki pojedini tip.

Primjer 6. Indekse na stalnoj bazi 2005 = 100 navedene u Primjeru 5. pretvorimo u indekse
na stalnoj bazi 2000 = 100. U tu svrhu koristimo sljedeu formulu:

100
1
*
=
b
t
t
I
I
I , za svaki t = 0, 1, 2, , n 1,
pri emu su:

*
t
I indeks razdoblja t na ''novoj'' stalnoj bazi b
1
;
I
t
indeks razdoblja t na ''staroj'' stalnoj bazi b;
1
b
I indeks razdoblja b
1
na ''staroj'' stalnoj bazi b.

U ovome su primjeru b = 8 (jer 2005. godini odgovara t = 8) i b
1
= 3 (jer 2000. godini
odgovara t = 3). Tako dobivamo:


Poslovna statistika


* 0
0
3
* 1
1
3
* 2
2
3
* * *
4 5 2
* 6
6
3
* 7
7
3
* 8
8
3
*
9
89
100 100 93.68421
95
96
100 100 101.0526
95
95
100 100 100
95
100
98
100 100 = 103.1579
95
99
100 100 = 104.2105
95
100
100 100 105.2632
95
I
I
I
I
I
I
I
I
I
I I I
I
I
I
I
I
I
I
I
I
I
I
= =
= =
= = =
= = =
= =
= =
= = =
=
9
3
104
100 100 109.4737
95 I
= =

Dobivene rezultate pregledno moemo prikazati u sljedeoj tablici:

godina t indeks na stalnoj bazi
2000 = 100
1997. 0 94
1998. 1 101
1999. 2 100
2000. 3 100
2001. 4 100
2002. 5 100
2003. 6 103
2004. 7 104
2005. 8 105
2006. 9 109

Primjer 7. Indekse na stalnoj bazi 2005 = 100 navedene u Primjeru 5. pretvorimo u verine
indekse. U tu svrhu koristimo sljedeu jednadbu:

1
100
t
t
t
I
V
I

= , za svaki t = 1, 2, , n 1.


Poslovna statistika


Tako redom dobivamo:

1
1
0
2
2
1
3
3
2
4 5 3
6
6
5
7
7
6
8
8
7
9
9
8
96
100 100 118.5185
89
95
100 100 98.95833
96
95
100 100 100
95
100
98
100 100 103.1579
95
99
100 100 101.0204
98
100
100 100 101.0101
99
104
100
100
I
V
I
I
V
I
I
V
I
V V V
I
V
I
I
V
I
I
V
I
I
V
I
= =
= =
= = =
= = =
= =
= =
= =
= = 100 104 =

Dobivene rezultate pregledno moemo zapisati u sljedeoj tablici:

godina t verini indeks (V
t
)
1997. 0 nepoznat
1998. 1 119
1999. 2 99
2000. 3 100
2001. 4 100
2002. 5 100
2003. 6 103
2004. 7 101
2005. 8 101
2006. 9 104

Primjer 8. Zadani su verini indeksi prosjene isplaene neto-plae po zaposlenome u
svakom od mjeseci u 2007. godini:


Poslovna statistika


mjesec t verini indeks V
t
sijeanj 0 nepoznat
veljaa 1 96
oujak 2 98.9
travanj 3 98.1
svibanj 4 100.7
lipanj 5 100.1
srpanj 6 100.3
kolovoz 7 100.6
rujan 8 98.0
listopad 9 100.6
studeni 10 106.0
prosinac 11 102.4
izvor: Mjeseno statistiko izvjee 3/08, Dravni zavod za statistiku, Zagreb, travanj 2008.

Odredimo indekse na stalnoj bazi (rujan 2007. = 100), objasnimo znaenje indeksa
dobivenoga za prosinac 2007. godine i procijenimo prosjenu mjesenu stopu promjene
prosjene isplaene neto-plae. U ovom je sluaju b = 8 jer rujnu 2007. godine odgovara
vrijednost vremenske varijable t = 8. Indeks I
t
na stalnoj bazi (rujan 2007. = 100) raunamo
prema sljedeim jednakostima:

1
1
100 za ;
100 za ;
za .
100
t
t
t
t
t t
t
I t b
I
I t b
V
I V
I b t
= =
= <
= <

Prigodom pretvorbe, dakle, kreemo od baznoga indeksa I
8
. On je jednak I
8
= 100. Pomou
njega raunamo najprije vrijednosti indeksa I
7
, I
6
, I
5
, I
4
, I
2
, I
1
i I
0
koristei drugu od triju gore
navedenih jednakosti. Imamo redom:

8
7
8
7
6
7
6
5
6
100
100 100 102.04082
98.0
102.04082
100 100 101.43222
100.6
101.43222
100 100 101.12884
100.3
I
I
V
I
I
V
I
I
V
= =
= =
= =


Poslovna statistika


5
4
5
4
3
4
3
2
3
2
1
2
1
0
1
101.12884
100 100 101.02781
100.1
101.02781
100 100 100.32553
100.7
100.32553
100 100 102.26863
98.1
102.26863
100 100 103.4061
98.9
103.4061
100 100 107.71469
96
I
I
V
I
I
V
I
I
V
I
I
V
I
I
V
= =
= =
= =
= =
= =

Vrijednosti indeksa I
9
, I
10
i I
11
raunamo pomou posljednje od triju navedenih formula:

8 9
9
9 10
10
10 11
11
100 100.6
100 100.6
100 100
100.6 106.0
100 106.636
100 100
106.636 102.4
109.19526
100 100
I V
I
I V
I
I V
I

= = =

= = =

= =

Dobivene rezultate pregledno moemo zapisati u sljedeoj tablici:

mjesec t indeks na stalnoj bazi I
t

(rujan = 100)

sijeanj 0 107.71
veljaa 1 103.41
oujak 2 102.27
travanj 3 100.33
svibanj 4 101.03
lipanj 5 101.13
srpanj 6 101.43
kolovoz 7 102.04
rujan 8 100
listopad 9 100.6
studeni 10 106.64
prosinac 11 109.2

Vrijednost indeksa za prosinac jednaka je (priblino) 109.2, to znai da na svakih 100 kn
prosjene isplaene netoplae u rujnu 2007. godine dolazi po 109.2 kn prosjene isplaene


Poslovna statistika


netoplae u prosincu iste godine. Ekvivalentno moemo rei da je prosjena isplaena neto
plaa u prosincu 2007. godine bila za 9.2% vea nego u rujnu iste godine.

Prosjena mjesena promjena isplaene mjesene netoplae jednaka je:

1
1 2 1
100 ... 100 0.1242
n
n
S G V V V
= = ,

to znai da su se u promatranom razdoblju prosjene mjesene netoplae poveavale za
priblino 0.1242% mjeseno.

5.6. Skupni indeksi

Kako je istaknuto u toki 5.5., individualnim (verinim ili baznim) indeksima prati se
dinamika kretanja neke pojave iskazane jednim statistikim nizom. Meutim, esto je
potrebno pratiti kretanje barem dvije pojave koje, prema nekom kriteriju, pripadaju istoj
skupini. Tako se npr. moe pratiti kretanje proizvodnje svih vrsta proizvoda neke tvornice,
kretanje prometa svih trgovina nekoga trgovakoga lanca, kretanje cijena na malo osnovnih
ivotnih potreptina itd. Takve se pojave predoavaju barem dvama statistikim nizovima, a
prate se tzv. skupnim indeksima.

Problem raunanja skupnih indeksa ne moe se postaviti jednoznano, tj. nema jedinstvenoga
analitikog izraza koji bi posluio za raunanje svih skupnih indeksa. U praksi se najee
koriste Laspeyresov
123
i Paascheov
124
oblik skupnih indeksa. Prije nego li objasnimo
spomenute indekse, uvedimo neke dogovorne oznake.

Razdoblje u kojem iskazujemo dinamiku promjene pojave nazivamo tekue ili izvjetajno
razdoblje, a razdoblje u odnosu na koje se iskazuje dinamika pojava naziva se bazno
razdoblje. Sukladno tome, definiramo sljedee veliine:

p
0
:= cijena u baznomu razdoblju;
p
1
:= cijena u tekuemu razdoblju;
q
0
:= koliina u baznomu razdoblju;
q
1
:= koliina u tekuemu razdoblju.

123
Ernst Louis tienne Laspeyres (1834. 1913.), njemaki ekonomist i statistiar.
124
Hermann Paasche (1851. 1925.), njemaki ekonomist i statistiar.


Poslovna statistika


Slova p i q su prva slova engleskih rijei price = cijena i quantity = koliina. Brojani indeks
0 (napisan u subskriptu) uvijek oznaava pojavu u baznomu razdoblju, dok brojani indeks 1
uvijek oznaava pojavu u tekuemu razdoblju.

Istaknimo jo da se vrijednost neke robe u odreenomu razdoblju definira kao umnoak
iznosa koliine te robe i njezine cijene po jedinici mjere koliine u istom razdoblju. Ako je
npr. cijena 1 kg kruha jednaka 5 kn, onda je vrijednost 2 kg kruha jednaka:

2 kg 5
kg
kn
= 10 kn.

(jer je jedinica mjere koliine 1 kg). Vrijednost neke robe obino se iskazuje u istoj jedinici
mjere kao i odgovarajua cijena te robe (po jedinici koliine)

5.6.1. Skupni indeksi koliina

5.6.1.1. Laspeyresov skupni indeks koliina

Laspeyresov skupni indeks koliina (oznaka: q
01
(p
0
)) je pokazatelj relativne promjene ukupnih
koliina promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne
koliine te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene cijene iz baznoga
razdoblja. (Dakle, fiksirana veliina pri izraunu ovoga skupnog indeksa jest p
0
.)

Praktino najjednostavniji za izraun je tzv. agregatni Laspeyresov skupni indeks koliina
definiran formulom:

1 0
1
01 0
0 0
1
( ) 100
n
i i
i
n
i i
i
q p
q p
q p
=
=

U brojniku navedenoga izraza nalaze se hipotetske vrijednosti odreenih koliina robe
proizvedenih u tekuem razdoblju, ali raunate prema cijenama iz baznoga razdoblja. U
nazivniku navedenoga izraza nalaze se stvarne vrijednosti koliina iste robe (proizvedenih u
baznom razdoblju) raunate prema cijenama iz baznoga razdoblja. Budui da i u brojniku i u
nazivniku imamo iste cijene, razlika izmeu brojnika i nazivnika moe biti iskljuivo
posljedica promjene proizvedenih koliina robe, a ni u kojem sluaju posljedica promjene


Poslovna statistika


cijena te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
proizvedenih koliina.

Analogno kao i individualne indekse, i Laspeyresov skupni indeks koliina najlake
interpretiramo rabei odgovarajuu stopu promjene:
01
0 01 0
( ) ( ) 100
q
S p q p = [%]

5.6.1.2. Paascheov skupni indeks koliina

Paascheov skupni indeks koliina (oznaka: q
01
(p
1
koliina promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne
koliine te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene cijene iz
tekuega razdoblja. (Dakle, fiksirana veliina pri raunanju ovoga skupnog indeksa jest p
1
.)

Praktino najjednostavniji za izraun je tzv. agregatni Paascheov skupni indeks koliina
definiran formulom:

1 1
1
01 1
0 1
1
( ) 100
n
i i
i
n
i i
i
q p
q p
q p
=
=
.

U brojniku navedenoga izraza nalaze se stvarne vrijednosti odreenih koliina robe
proizvedenih u tekuem razdoblju i raunate prema cijenama iz toga razdoblja. U nazivniku
navedenoga izraza nalaze se hipotetske vrijednosti koliina iste robe proizvedenih u baznom
razdoblju, ali raunate prema cijenama iz tekuega razdoblja. Budui da i u brojniku i u
nazivniku imamo iste cijene, razlika izmeu brojnika i nazivnika moe biti iskljuivo
posljedica promjene proizvedenih koliina robe, a ni u kojem sluaju posljedica promjene
cijena te robe. Stoga i navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
proizvedenih koliina robe.

Analogno kao i Laspeyresov skupni indeks koliina, i Paascheov skupni indeks koliina
najlake interpretiramo rabei odgovarajuu stopu promjene:

01
1 01 1
( ) ( ) 100
q
S p q p = [%].


Poslovna statistika


Primjer 9. Promatraju se prosjene prodajne cijene (PDV uraunat) i prodane koliine etiri
razliite vrste proizvoda u trgovini ''Sve po malo kuna'' u Frkljevcima tijekom listopada i
studenoga 2008. g. Podaci su navedeni u donjoj tablici.

vrsta
proizvoda
prosjena prodajna
cijena u listopadu
2008.
[kn/kg]
prodana koliina
u listopadu 2008.
[kg]
prosjena prodajna
cijena u studenom
2008.
[kn/kg]
prodana koliina
u studenom 2008.
[kg]
brano
T-850
2,19 190 2,39 200
smea
espresso
kava
89 50 88 54
sitna
morska
sol
3,05 170 2,99 150
bijeli
eer
12,10 190 12,20 180

Izraunajmo Laspeyresov i Paascheov skupni indeks koliina, pa objasnimo njihovo znaenje.
U ovome je primjeru bazno razdoblje listopad 2008., a tekue (izvjetajno) razdoblje studeni
2008. Stoga emo prosjenu prodajnu cijenu u listopadu oznaiti s p
0
, prodanu koliinu u
listopadu s q
0
, prosjenu prodajnu cijenu u studenom s p
1
, a prodanu koliinu u studenom s q
1
.
Laspeyresov skupni indeks koliina jednak je:

4
1 0
1
01 0 4
0 0
1
01 0
200 2.19 54 89 150 3.05 180 12.10 7879.50
( ) 100 100 100
190 2.19 50 89 170 3.05 190 12.10 7683.60
( ) 102.54959
i i
i
i i
i
q p
q p
q p
q p
=
=
+ + +
| |
= = =
|
+ + +
\

Pripadna stopa promjene iznosi

01
0 01 0
( ) ( ) 100
q
S p q p = = 102.54959 100 = 2.54959.

Zakljuujemo da su prodane koliine svih promatranih vrst proizvoda u studenom bile za
2.54959% vee od nego u listopadu raunajui uz neizmijenjene cijene iz listopada.

Paascheov skupni indeks koliina jednak je


Poslovna statistika


4
1 1
1
01 1 4
0 1
1
01 1
200 2.39 54 88 150 2.99 180 12.20 7874.50
( ) 100 100 100
190 2.39 50 88 170 2.99 190 12.20 7680.60
( ) 102.52721
i i
i
i i
i
q p
q p
q p
q p
=
=
+ + +
| |
= = =
|
+ + +
\


01
1 01 1
( ) ( ) 100
q
S p q p = = 102.52721 100 = 2.52721.

Zakljuujemo da su prodane koliine svih promatranih vrst proizvoda u studenom bile za
2.54959% vee od nego u listopadu raunajui uz neizmijenjene cijene iz studenoga.

Dakle, za iste prodane koliine dobivaju se razliite vrijednosti skupnoga indeksa ako se u
izraun uzmu cijene iz razliitih razdoblja. Stoga skupni indeks nije jednoznana precizna
mjera relativnih promjena neke skupine pojava, nego iskljuivo mjera uz unaprijed zadane
pretpostavke. U ovom su primjeru izraunati skupni indeksi prodanih koliina promatranih
vrsta proizvoda izraunati uz pretpostavku da su odnosi vrijednosti pojedinih vrsta proizvoda
onakvi kakve izraavaju cijene u listopadu 2008.g., odnosno cijene u studenom 2008.g. Time
se ne umanjuje znaaj skupnih indeksa, nego se daje naglasak na obvezu njihova tumaenja
uz uvaavanje pretpostavki pod kojima su izraunati.

5.6.1.3. Fisherov skupni indeks koliina

U praksi se esto koristi i Fisherov
125
skupni indeks koliina ili idealni skupni indeks koliina
(oznaka: Q
01
) Taj je indeks, po definiciji, jednak geometrijskoj sredini Laspeyresova i
Paascheova skupnoga indeksa koliina, tj.

01 01 0 01 1
( ) ( ) Q q p q p = .

Fisherov skupni indeks koliina se najjednostavnije interpretira pomou pripadne stope
promjene. Ona se rauna pomou izraza:

125
Irving Fisher (1867. 1947.), ameriki ekonomist, jedan od tvoraca neoklasine ekonomije.,


Poslovna statistika


01
01
100
Q
S Q = [%]

i predstavlja prosjenu relativnu promjenu koliina u tekuemu razdoblju u odnosu na
koliine u baznomu razdoblju.

Primjer 10. Izraunajmo Fisherov skupni indeks koliina na temelju podataka iz prethodnoga
primjera i objasnimo njegovo znaenje. Dobivamo:

01 01 0 01 1
7879.50 7874.50
( ) ( ) 100 102.5384
7683.60 7680.60
Q q p q p = = = ,
pa je pripadna stopa promjene

01
01
100
Q
S Q = = 102.5384 100 = 2.5384.

Zakljuujemo da su koliine svih promatranih vrst proizvoda u studenom 2008. bile za
prosjeno 2.5384% vee nego u listopadu 2008.

5.6.2. Skupni indeksi cijena

Skupni indeksi cijena mjere relativnu promjenu razine cijena za odreeni asortiman robe,
usluga itd. U praksi postoji vie razliitih vrsta skupnih indeksa cijena: skupni indeks cijena
na malo, skupni indeks cijena na veliko, skupni indeks izvoznih cijena, skupni indeks cijena u
turizmu itd. Odmah napomenimo da se niti jednim od tih indeksa ne mogu obuhvatiti cijene
svih roba i usluga, pa se time nameu nimalo trivijalni problemi izbora proizvoda i(li) usluga
koji e biti reprezentanti skupine za koju elimo izraunati skupne indekse cijena, problemi
izbora cijene (kada i gdje treba prikupiti podatke o cijenama odabranih proizvoda i(li) usluga)
itd. Sve to ukazuje na injenicu da, iako skupne indekse nije teko izraunati, treba biti vrlo
oprezan u njihovoj interpretaciji, a napose u poopavanju zakljuaka izvedenih pomou
odabranih reprezentanata na cijelu skupinu.

Dva najea skupna indeksa cijena su Laspeyresov skupni indeks cijena i Paascheov skupni
indeks cijena koje emo upoznati u nastavku.


Poslovna statistika


5.6.2.1. Laspeyresov skupni indeks cijena

Laspeyresov skupni indeks cijena (oznaka: p
01
(q
0
cijena promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne cijene
te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene koliine iz baznoga
razdoblja. (Dakle, fiksirana veliina pri raunanju ovoga skupnog indeksa jest q
0
.)
Praktino najjednostavniji za izraun je tzv. agregatni Laspeyresov skupni indeks cijena
definiran formulom

1 0
1
01 0
0 0
1
( ) 100
n
i i
i
n
i i
i
p q
p q
p q
=
=

Uoimo da se u brojniku navedenoga izraza nalaze hipotetske vrijednosti odreenih koliina
robe proizvedenih u baznom razdoblju, ali raunate prema cijenama iz tekuega razdoblja. U
nazivniku navedenoga izraza nalaze se stvarne vrijednosti koliina iste robe (proizvedenih u
baznom razdoblju) raunate prema cijenama iz baznoga razdoblja. Budui da i u brojniku i u
nazivniku imamo iste koliine, razlika izmeu brojnika i nazivnika moe biti iskljuivo
posljedica promjene cijena promatrane robe, a ni u kojem sluaju posljedica promjene
koliina te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
promatranih cijena.
Analogno kao i skupne indekse koliina, i skupne indeks cijena najlake interpretiramo rabei
odgovarajue stope promjene. Za Laspeyresov skupni indeks cijena pripadajua stopa
promjene rauna se prema formuli:

01
0 01 0
( ) ( ) 100
p
S q p q = [%]

5.6.2.2. Paascheov skupni indeks cijena

Paascheov skupni indeks cijena (oznaka: p
01
(q
1
cijena promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne cijene
te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene koliine iz tekuega
razdoblja. (Dakle, fiksirana veliina pri raunanju ovoga skupnoga indeksa jest q
1
.)
Praktino najjednostavniji za izraun je tzv. agregatni Paascheov skupni indeks cijena
definiran formulom:


Poslovna statistika


1 1
1
01 1
0 1
1
( ) 100
n
i i
i
n
i i
i
p q
p q
p q
=
=

Uoimo da se u brojniku navedenoga izraza nalaze stvarne vrijednosti odreenih koliina robe
proizvedenih u tekuem razdoblju raunate prema cijenama iz tekuega razdoblja. U
nazivniku navedenoga izraza nalaze se hipotetske vrijednosti koliina iste robe (proizvedenih
u tekuem razdoblju), ali raunate prema cijenama iz baznoga razdoblja. Budui da i u
brojniku i u nazivniku imamo iste koliine, razlika izmeu brojnika i nazivnika moe biti
iskljuivo posljedica promjene cijena promatrane robe, a ni u kojem sluaju posljedica
promjene koliina te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele
skupine promatranih cijena.

I Paascheov skupni indeks cijena najlake interpretiramo rabei odgovarajuu stopu promjene.
Ona se rauna prema formuli:

01
1 01 1
( ) ( ) 100
p
S q p q = [%]

Primjer 11. Za prosjene prodajne cijene (PDV uraunat) i prodane koliine etiri razliite
vrste proizvoda iz Primjera 9. izraunajmo Lasyperesov i Paascheov skupni indeks cijena, pa
objasnimo njihovo znaenje.

Podsjetimo da je bazno razdoblje listopad 2008., a tekue (izvjetajno) razdoblje studeni 2008.
Stoga prosjenu prodajnu cijenu u listopadu oznaavamo s p
0
, prodanu koliinu u listopadu s
q
0
, prosjenu prodajnu cijenu u studenom s p
1
, a prodanu koliinu u studenom s q
1
.
Laspeyresov skupni indeks cijena jednak je:
4
1 0
1
01 0 4
0 0
1
01 0
2.39 190 88 50 2.99 170 12.2 190 7680.40
( ) 100 100 100
2.19 190 89 50 3.05 170 12.1 190 7683.60
( ) 99.958353
i i
i
i i
i
p q
p q
p q
p q
=
=
+ + +
| |
= = =
|
+ + +
\


01
0 01 0
( ) ( ) 100
p
S q p q = = 99.958353 100 = -0.041647


Poslovna statistika


Zakljuujemo da su prosjene prodajne cijene svih promatranih vrst proizvoda u studenom
bile za priblino 0.042% manje nego u listopadu raunajui uz neizmijenjene prodane
koliine iz listopada.

Paascheov skupni indeks cijena jednak je

4
1 1
1
01 1 4
0 1
1
01 1
2.39 200 88 54 2.99 150 12.2 180 7874.50
( ) 100 100 100
2.19 200 89 54 3.05 150 12.1 180 7879.50
( ) 99.936544
i i
i
i i
i
p q
p q
p q
p q
=
=
+ + +
| |
= = =
|
+ + +
\


01
1 01 1
( ) ( ) 100
p
S q p q = = 99.936544 100 = -0.063456

Dakle, prosjene prodajne cijene svih promatranih vrst proizvoda u studenome bile su za
priblino 0,063% manje nego u listopadu raunajui uz neizmijenjene prodane koliine iz
studenoga.

5.6.2.3. Fisherov skupni indeks cijena

Analogno Fisherovu skupnu indeksu koliina, definira se Fisherov skupni indeks cijena ili
idealni skupni indeks cijena (oznaka: P
01
) Taj je indeks, po definiciji, jednak geometrijskoj
sredini Laspeyresova i Paascheova skupnoga indeksa cijena, tj.

01 01 0 01 1
( ) ( ) P p q p q = .

Fisherov skupni indeks koliina se najjednostavnije interpretira pomou pripadne stope
promjene. Ona se rauna pomou izraza:

01
01
100
P
S P = [%]

i predstavlja prosjenu relativnu promjenu cijena u tekuemu razdoblju u odnosu na cijene u
baznomu razdoblju.


Poslovna statistika


Primjer 12. Izraunajmo Fisherov skupni indeks cijena na temelju podataka iz Primjera 9. i
objasnimo njegovo znaenje. Dobivamo:

01 01 0 01 1
7680.40 7874.50
( ) ( ) 100 99.94745
7683.60 7879.50
P p q p q = = = ,


01
01
100
P
S P = = 99.94745 100 = 0.52555.

Zakljuujemo da su cijene svih promatranih vrst proizvoda u studenom 2008. bile za
prosjeno 0.52555% manje nego u listopadu 2008.

5.6.3. Skupni indeksi vrijednosti

Skupni indeks vrijednosti (oznaka: V
01
) je pokazatelj relativne promjene ukupne vrijednosti
promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupnu vrijednost te
skupine pojava u baznomu razdoblju. Rauna se prema formuli:

1 1
1
01
0 0
1
100
n
i i
i
n
i i
i
p q
V
p q
=
=

Kao i svi ostali indeksi, najlake ga je interpretirati pomou pripadajue stope promjene. Ona
se rauna prema formuli:

01
V
S = V
01
100 [%].

Napomenimo da se skupni indeks vrijednosti moe izraunati i kao umnoak Laspeyresova
indeksa cijena i Paascheova indeksa koliina podijeljenoga sa 100, odnosno Paascheova
indeksa cijena i Laspeyresova indeksa koliina podijeljenoga sa 100. Tonije, vrijede sljedee
jednakosti:

01 0 01 1 01 1 01 0
01
( ) ( ) ( ) ( )
100 100
p q q p p q q p
V

= =


Poslovna statistika


Takoer, skupni indeks vrijednosti jednak je umnoku Fisherova skupnoga indeksa cijena i
Fisherova skupnoga indeksa koliina podijeljenoga sa 100, tj. vrijedi jednakost:

01 01
01
100
P Q
V

= .

Primjer 13. Za promatrane vrste proizvoda iz Primjera 9. izraunajmo skupni indeks
vrijednosti i objasnimo njegovo znaenje. Radi tonosti izrauna koristit emo originalnu
formulu za skupni indeks vrijednosti, a potom emo provjeriti dobiveni rezultat koristei
netom navedene jednakosti. Imamo redom:

4
1 1
1
01 4
0 0
1
01
2.39 200 88 54 2.99 150 12.2 180 7874.50
100 100 100
2.19 190 89 50 3.05 170 12.1 190 7683.60
102.484512
i i
i
i i
i
p q
V
p q
V
=
=
+ + +
| |
= = =
|
+ + +
\


01
V
S = V
01
100 = 102.484512 100 = 2.484512.

Zakljuujemo da je ukupna vrijednost promatrane skupine rob u studenom 2008. bila za
priblino 2.48% vea nego u listopadu 2008.

Izraun skupnoga indeksa vrijednosti pomou Laspeyresovih i Paascheovih, odnosno
Fisherovih indeksa daje sljedee rezultate:

01 0 01 1
01
( ) ( ) 99.958353 102.52721
102.48451
100 100
p q q p
V

= = =
01 1 01 0
01
( ) ( ) 99.936544 102.54959
102.48442
100 100
p q q p
V

= = =
01 01
01
99.94745 102.5384
100 100
P Q
V

= = = 102.48452

Za postizanje vee tonosti u izraunima odgovarajue skupne indekse trebali bismo
izraunati na vie decimalnih mjesta. Najtonija je svakako vrijednost dobivena iz originalne
formule za izraun skupnoga indeksa vrijednosti jer sadri najmanje podataka dobivenih
priblinim izraunima pa tu formulu treba primjenjivati kad god je to mogue.


Poslovna statistika


Primjer 14. U sljedeoj su tablici navedeni podaci o broju ostvarenih noenja i prosjenim
cijenama jednoga noenja u gradu dralovgradu u tri razliita sektora za 2007. i 2008. godinu.

vrsta
usluge
prosjena cijena jednoga
noenja u 2007. g.
[]
ostvareni broj
noenja u 2007. g.
[000]
prosjena cijena jednoga
noenja u 2008. g.
[]
ostvareni broj
noenja u 2008. g.
[000]
hoteli 80 32 90 30
kampovi 29 12 25 13
privatni
smjetaj
60 44 59 51

Odredimo:

a) Za koliko su se ukupno promijenile prosjene cijene jednoga noenja u 2008. godini u
odnosu na 2007. godinu raunajui uz neizmijenjen ostvaren broj noenja u 2007. godini?
b) Za koliko se ukupno promijenio ostvaren broj noenja u 2008. godini u odnosu na 2007.
godinu raunajui uz neizmijenjene prosjene cijene jednoga noenja u 2008. godini?
c) Za koliko su se prosjeno promijenile prosjene cijene jednoga noenja u 2008. godini u
odnosu na 2007. godinu?
d) Je li ostvarena prognoza gradonaelnika dralovgrada Mutimira Lupiglupostia da e
ukupna vrijednost svih noenja ostvarenih u 2008. godini biti za 10% vea nego u prethodnoj
godini? Objasnimo svoj odgovor.

Najprije primijetimo da je u ovome primjeru 2007. godina bazna godina, a 2008. godina
tekua ili izvjetajna godina. Stoga su veliine u drugomu stupcu cijene u baznoj godini, pa
emo ih oznaiti s p
0
. Na isti nain oznaavamo i ostale stupce: u treemu su stupcu
vrijednosti koliina u baznoj godini koje oznaavamo s q
0
, u etvrtomu stupcu vrijednosti
veliine p
1
, a u posljednjemu stupcu vrijednosti veliine q
1
. Stoga poetnu tablicu moemo
zamijeniti sljedeom:

vrsta usluge p
0
q
0
p
1
q
1
hoteli 80 32 90 30
kampovi 29 12 25 13
privatni smjetaj 60 44 59 51

a) U ovome je sluaju neizmijenjena veliina broj noenja u 2007. godini odnosno, sukladno
gornjim oznakama, veliina q
0
. Promatramo relativnu promjenu cijena uz pretpostavku o
neizmijenjenoj veliini q
0
, pa raunamo Laspeyresov skupni indeks cijena (p
01
(q
0
)):


Poslovna statistika


3
1 0
1
01 0 3
0 0
1
90 32 25 12 59 44 5776
( ) 100 100 100 104.10959
80 32 29 12 60 44 5548
i i
i
i i
i
p q
p q
p q
=
=
+ +
| |
= = = =
|
+ +
\


01
0
( )
p
S q = p
01
(q
0
) 100 = 104.10959 100 = 4.10959.

Stoga zakljuujemo: Raunajui uz neizmijenjen ostvareni broj noenja u 2007. godini,
prosjene cijene jednoga noenja u 2008. godini bile su za priblino 4.11% nego u 2007.
godini.

b) U ovome je sluaju neizmijenjena veliina prosjena cijena jednoga noenja u 2008.
godini, tj., sukladno ranijim oznakama, veliina p
1
. Promatramo relativnu promjenu
ostvarenih noenja uz pretpostavku o fiksiranoj veliini p
1
, pa raunamo Paascheov skupni
indeks koliina (q
01
(p
1
)):

3
1 1
1
01 1 3
0 1
1
30 90 13 25 51 59 6034
( ) 100 100 100 104.46676
32 90 12 25 44 59 5776
i i
i
i i
i
q p
q p
q p
=
=
+ +
| |
= = = =
|
+ +
\


01
1
( )
q
S p = q
01
(p
1
) 100 = 4.46676.

Stoga zakljuujemo: Raunajui uz neizmijenjene prosjene cijene jednoga noenja u 2008.
godini, ostvareni broj noenja u 2008. godini bio je za 4.46676% vei nego u 2007. godini.

c) U ovome sluaju raunamo prosjenu promjenu cijena u tekuem razdoblju u odnosu na
cijene u baznom razdoblju. U tu emo svrhu izraunati Fisherov skupni indeks cijena, pa e
rjeenje biti tom indeksu pripadajua stopa promjene. Fisherov skupni indeks cijena jednak je:

01 01 0 01 1
01
90 32 25 12 59 44 90 30 25 13 59 51
( ) ( ) 100
80 32 29 12 60 44 80 30 29 13 60 51
103.7417
P p q p q
P
+ + + +
= =
+ + + +
=


Poslovna statistika


a njemu pripadna stopa promjene

01
01
100
P
S P = = 103.7417 100 = 3.7417.

Dakle, prosjene cijene jednoga noenja u 2008. godini bile su za prosjeno 3.7417% vee
nego u 2007. godini.

d) U ovome sluaju usporeujemo stopu promjene koja odgovara skupnom indeksu
vrijednosti s oekivanom stopom promjene. Najprije raunamo skupni indeks vrijednosti:

3
1 1
1
01 3
0 0
1
90 30 25 13 59 51 6034
100 100 100 108.76
80 32 29 12 60 44 5548
i i
i
i i
i
p q
V
p q
=
=
+ +
| |
= = = =
|
+ +
\
,

01
V
S = V
01
100 = 108.76 100 = 8.76

Stoga moemo zakljuiti: Ukupna vrijednost noenja u 2008. godini je za 8.76% vea nego u
2007. godini. Dakle, gradonaelnikova prognoza se nije ostvarila
126
.

5.6.4. Neki posebni oblici skupnih indeksa i njihova primjena

U odreenim ekonomskim analizama esto se koriste razliiti oblici individualnih i skupnih
indeksa. Tako se npr. skupni indeks cijena moe raunati za cijene na malo, cijene na veliko,
cijene poljoprivrednih proizvoda, cijene tzv. "sindikalne koarice" itd. Pogledajmo to na
sljedeim primjerima.

5.6.4.1. Izraunavanje realnih plaa na osnovu skupnih indeksa trokova ivota

Jedan od najvanijih oblika skupnih indeksa cijena je indeks potroakih cijena
127
. Indeks
potroakih cijena odraava promjene na razini cijena dobara i usluga koje u tijeku vremena

126
Gradonaelnikova prognoza ne bi bila istinita niti da smo skupni indeks V
01
raunali kao kolinik umnoka
indeksa p
01
(q
0
) q
01
(p
1
) i broja 100. Provjerite to.
127
Sve do 2004. godine umjesto indeksa potroakih cijena raunao se tzv. indeks trokova ivota koji je imao
istu namjenu kao i indeks potroakih cijena. Od 2004. godine u statistikim se izvjeima primjenjuje indeks
potroakih cijena, a u svrhu usklaivanja hrvatskih statistikih izvjea sa svjetskim izvjeima i pokazateljima.


Poslovna statistika


nabavlja, koristi se njima ili plaa referentno stanovnitvo radi osobne potronje, te je
jedinstvena i opa mjera inflacije u Republici Hrvatskoj. On je samo mjera kretanja cijena
dobara i usluga osobne potronje, a ne stvarnih promjena razlike i strukture osobne potronje,
za koje se podaci prikupljaju posebnim anketama. Izraunava se i objavljuje na osnovi oko
590 reprezentativnih dobara i usluga. Svakog mjeseca prikupi se vie od 27 000 cijena na
unaprijed definiranu uzorku prodajnih mjesta na unaprijed definiranu uzorku prodajnih mjesta
na devet lokacija (gradova) u Republici Hrvatskoj (Zagreb, Slavonski Brod, Osijek, Sisak,
Rijeka, Pula, Split, Dubrovnik i Varadin), odabranih prema kriteriju broja stanovnika i
reprezentativnosti za pojedinu statistiku regiju. Za klasificiranje izdataka koristi se
Klasifikacija osobne potronje prema namjeni (COICOP) koja izdatke dijeli u sljedeih 12
osnovnih kategorija dobara i usluga:

- prehrana i bezalkoholna pia;
- alkoholna pia i duhan;
- odjea i obua;
- stanovanje, voda, energija, plin i druga goriva;
- pokustvo, oprema za kuu i redovito odravanje;
- zdravstvo;
- promet;
- komunikacije;
- rekreacija i kultura;
- obrazovanje;
- ugostiteljske usluge;
- ostala dobra i usluge
128
.

Indeks potroakih cijena slui ponajprije za mjerenje inflacije (porasta cijena) u privredi, a
moe se koristiti i u druge svrhe (npr. za ouvanje vrijednosti kod ugovora s indeksnim
klauzulama, deflacioniranje (uklanjanje utjecaja inflacije) odreenih vrijednosnih pokazatelja
itd.).

Pomou indeksa potroakih cijena mjeri se utjecaj potroakih cijena na nominalne plae.
Tako se dobiju realne plae ije kretanje slui za opis kretanja ivotnoga standarda
stanovnitva. Realne plae i pripane indekse realnih plaa kao pokazatelje njihove dinamike
kretanja izraunavamo prema formulama:

128
Definicije navedene u prvom dijelu ove toke preuzete su iz Statistikoga ljetopisa Republike Hrvatske za
2008. godinu, DZS, Zagreb, 2009.


Poslovna statistika


100
100
NP
RP
IPC
INP
IRP
IPC
=
=

pri emu su:

RP iznos realne plae;
NP iznos nominalne plae;
IPC indeks potroakih cijena na stalnoj bazi;
IRP indeks realne plae na stalnoj bazi;
INP indeks nominalne plae na stalnoj bazi.

Istaknimo da se svi ovdje navedeni indeksi na stalnoj bazi obavezno moraju odnositi na isto
bazno razdoblje (tj. moraju se odnositi na razdoblje u odnosu na ije potroake cijene
raunamo iznose realnih plaa).

Primjer 15. Prosjene mjesene neto-plae u Republici Hrvatskoj i verini indeksi
potroakih cijena za razdoblje od rujna 2008. do sijenja 2009. godine navedeni su u donjoj
tablici.

Razdoblje
Prosjena
mjesena
neto-plaa
[kn]
Verini indeks
potroakih
cijena
rujan 2008. 5.203
listopad 2008. 5.263 100.0879507
studeni 2008. 5.397 99.73637961
prosinac 2008. 5.410 99.38325991
sijeanj 2009. 5.307 101.2411348

Izraunajmo realne plae i pripadne indekse realnih plaa na stalnoj bazi prosinac 2008. =
100. Objasnimo vrijednosti izraunate za listopad 2008. godine i odredimo ukupnu relativnu
promjenu realnih plaa u promatranom razdoblju.

Verine indekse potroakih cijena najprije moramo pretvoriti u indekse potroakih cijena na
stalnoj bazi (uzimajui prosinac 2008. godine a bazno razdoblje, tj. b = prosinac 2008.).
Koristimo formule:


Poslovna statistika


1
1
100 za prosinac 2008.;
100 za prosinac 2008.;
za prosinac 2008. .
100
t
t
t
t
t t
t
I t
I
I t
V
I V
I t
= =
= <
= <

Tako najprije imamo:

I
prosinac
= 100,

pa

prosinac
prosinac
100
100 100 100.6206
99.38326
100, 6206
100 100 100.8865
99.73638
100.8865
100 100 100.7979
100.088
studeni
studeni
listopad
studeni
listopad
rujan
listopad
I
I
V
I
I
V
I
I
V
= =
= =
= =
,

dok za sijeanj 2009. dobivamo:

prosinac
100 101.2411
101.2411
100 100
sijeanj
sijeanj
I V
I

= = = .

(To smo mogli zakljuiti i bez raunanja. Zato?) Dobivene podatke pregledno zapiimo u
posljednji stupac sljedee tablice:

Razdoblje
Prosjena mjesena
neto-plaa [kn]
Verini indeks
potroakih cijena
Indeks potroakih cijena
(prosinac 2008. = 100)
rujan 2008. 5.203 100.7978724
listopad 2008. 5.263 100.0879507 100.8865248
studeni 2008. 5.397 99.73637961 100.6205674
prosinac 2008. 5.410 99.38325991 100
sijeanj 2009. 5.307 101.2411348 101.2411348

Realne plae (uz prosinac 2008. kao bazno razdoblje) raunamo prema formuli:


Poslovna statistika


prosjena mjesena neto-plaa
100
indeks potroakih cijena na stalnoj bazi (prosinac 2008. = 100)
RP = .

Tako redom imamo:

prosinac
5.203
100 5.161,82
100.7979
5.263
100 5.216, 75
100.8865
5.397
100 5.363, 72
100.6206
prosjena mjesena netoplaa za prosinac = 5.410
5.307
100 5.241
101.2411
rujan
listopad
studeni
sijeanj
RP
RP
RP
RP
RP
=
=
=
=
= , 94

Potom raunamo indeks realnih plaa (IRP) ponovno uzimajui prosinac 2008. godine kao
bazno razdoblje. Taj indeks moemo izraunati izravno iz gore navedenih realnih plaa kao:

realna plaa u tekuem razdoblju
100
realna plaa u prosincu 2008.
IRP =

pa dobivamo:

prosinac
5.161,82
100 95.41248
5.410
5.216, 75
100 96.42795
5.410
5.363, 72
100 99.14445
5.410
100
5.241, 94
100 96.89354
5.410
rujan
listopad
studeni
sijeanj
IRP
IRP
IRP
IRP
IRP
=
=
=
=
=

Sve dobivene podatke moemo pregledno zapisati tablino:


Poslovna statistika


Razdoblje
Prosjena
mjesena
neto-plaa
[kn]
Verini
indeks
potroakih
cijena
Iindeks potroakih
cijena
(prosinac 2008. =
100)
Realne plae
(bazno razdoblje:
prosinac 2008.)
Indeks realnih
plaa
(prosinac
2008. = 100)
rujan 2008. 5.203 100.7978724 5.161,82 95.41248245
listopad
2008.
5.263
100.0879507 100.8865248 5.216,75 96.42795188
studeni 2008. 5.397 99.73637961 100.6205674 5.363,71 99.14444616
prosinac
2008.
5.410
99.38325991 100 5.410 100
sijeanj
2009.
5.307
101.2411348 101.2411348 5.241,94 96.89353887

Iz tablice vidimo da su realne plae u listopadu 2008. godine, uz potroake cijene iz
prosinca 2008. godine, iznosile 5.216,75 kn. Pripadni indeks realnih plaa interpretiramo
pomou odgovarajue stope promjene:

S
t
= IRP 100.
Stoga imamo:

S
listopad
= IRP
listopad
100 = 96.42795188 100 = -3.57204812.

Zakljuujemo da su, uz potroake cijene iz prosinca 2008. godine, u listopadu 2008. godine
realne plae bile za priblino 3.57% manje nego u prosincu iste godine.

Ukupnu relativnu promjenu, tj. ukupan postotak promjene realnih plaa u promatranom
razdoblju moemo izraunati na dva razliita naina:

1.) odreivanjem omjera posljednje i prve vrijednosti realne plae uz potroake cijene iz
prosinca 2008. godine:

100 100
5.241, 94
100 100
5.161,82
1.552267
sijeanj
rujan
Y
P
Y
P
P
=
=

2.) odreivanjem omjera posljednjeg i prvog indeksa realnih plaa (uz prosinac 2008.
godine kao bazno razdoblje):


Poslovna statistika


100 100
96.89354
100 100
95.41248
1.552267
sijeanj
rujan
IRP
P
IRP
P
P
=
=

Zakljuujemo da su se, uz potroake cijene iz prosinca 2008. godine, u promatranom
razdoblju realne plae ukupno poveale za priblino 1.55%.

Napomena: Apsolutna vrijednost realnih plaa ovisi o razdoblju za kojega su vezane
potroake cijene (tj. za razliita bazna razdoblja dobivamo razliite vrijednosti realnih plaa),
pa se prigodom njihova raunanja obvezatno mora navesti uz koje su bazno razdoblje vezane
potroake cijene (upravo kako smo to uinili u prethodnomu primjeru). No, prigodom
raunanja indeksa ili odgovarajuih stopa promjene nije bitno uz koje su razdoblje vezane
potroake cijene jer vrijednost indeksa (odnosno, stope promjene) ne ovisi o izboru razdoblja
za kojega veemo potroake cijene. U tome je prednost uporabe pokazatelja relativnih
promjena.

5.6.4.2. Vrijednost u stalnim cijenama i indeks fizikoga obujma

Jedna od vrlo estih pojava u ekonomskim analizama jest tzv. deflacija. Tim se postupkom
uklanja utjecaj promjena cijena na vrijednosno izraene pojave, a provodi se tako da se
nominalne vrijednosti (vrijednosti izraene u tekuim cijenama) podijele s odgovarajuim
skupnim indeksom cijena (kojega nazivamo deflator). Njegova obiljeja openito ovise o
strukturi pojave ije vrijednosti deflacioniramo. Potreba za deflacijom osobito se javlja pri
inflacijskim kretanjima u kojima promjene cijena onemoguuju uvid u stvarni razvoj
promatranih pojava (npr. koliina proizvoda, koliina usluga itd.). Deflacionirane vrijednosti
nazivamo i vrijednosti u stalnim cijenama, a openito ih odreujemo pomou formule

100
TC
SC
V
V
IC
=

gdje su:

V
SC
vrijednost iskazana u stalnim cijenama;
V
TC
vrijednosti iskazana u tekuim cijenama;
IC indeks cijena na stalnoj bazi.


Poslovna statistika


Tipini primjeri deflatora su ranije spomenuti indeks potroakih cijena i tzv. indeks fizikoga
obujma. Taj je indeks poseban oblik skupnoga indeksa koliina, a raunamo ga pomou
izraza:

( )
100
( )
SC t
t
SC b
V
IFO
V
= , za t = 0, 1, , n 1

gdje su:

(IFO)
t
indeks fizikoga obujma za razdoblje t;
(V
SC
)
t
vrijednost u stalnim cijenama za razdoblje t;
(V
SC
)
b
vrijednost u stalnim cijenama za bazno razdoblje b.

Indeks fizikoga obujma rabimo, primjerice, kada elimo usporeivati bruto domai proizvod
u odreenoj godini (iskazan u stalnim cijenama) s bruto domaim proizvodom u nekoj
odabranoj baznoj godini.

Pokaimo primjenu ovih vrsta indeksa na primjeru.

Primjer 16. U donjoj su tablici navedeni podaci o proizvodnji u tekuim cijenama, indeksu
cijena na stalnoj bazi 2005 = 100 i proizvodnji u stalnim cijenama iz 2005. godine.

Godina Verini
indeks
cijena
Proizvodnja u
tekuim
cijenama
[000 000 ]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u stalnim cijenama
iz 2005. godine
[000 000 ]
Indeks
fizikoga
obujma
(2005 = 100)
1997. 69.76990634 0,90296810
1998. 0.75 74.65379979
1999. 76.89341378 1,14444132
2000. 0.96 77.66234792
2001. 82.32208879 1,29977266
2002. 1.23 85.61497235
2003. 88.18342152 1,54224000
2004. 1.52 92.59259259
2005. 100 1,85000000
2006. 1,98 110
2007. 118,8 2,11279461
2008. 2,75 125.928
Dopunimo navedenu tablicu podacima koji nedostaju, pa potom pomou reprezentativnijega
od dvaju modela trenda (jednostavni linearni i jednostavni eksponencijalni model trenda)
prognozirajmo kretanje proizvodnje (iskazane u stalnim cijenama iz 2005. godine) u razdoblju


Poslovna statistika


od 2009. do 2013. godine. Zakljuno, odredimo ukupnu relativnu promjenu i prosjenu
godinju relativnu promjenu cijena u promatranom razdoblju, te oekivanu ukupnu relativnu
promjenu i oekivanu prosjenu godinju relativnu promjenu proizvodnje (iskazane u stalnim
cijenama iz 2005. godine) u razdoblju od 2009. do 2013. godine.

Izraunajmo najprije verine indekse cijena koristei zadane indekse na stalnoj bazi 2005 =
100. Podsjetimo da se indeksi na stalnoj bazi pretvaraju u verine indekse pomou relacije:

1
100
t
t
t
I
V
I

= , za svaki t = 1, 2, , n 1.

Pritom 1997. godini odgovara vrijednost vremenske varijable t = 0, 1998. godini vrijednost
vremenske varijable t = 1 itd. Verini indeks cijena za 1997. godinu nije mogue izraunati,
pa emo u odgovarajui stupac tablice upisati rije nepoznat. Za ostale godine dobivamo:

1
1
0
2
2
1
3
3
2
74.65379979
100 100 107;
69.76990634
76.89341378
100 100 103;
74.65379979
77.66234792
100 100 101;
76.89341378
IC
V
IC
IC
V
IC
IC
V
IC
= = =
= = =
= = =

itd. Tako drugi stupac zadane tablice izgleda ovako:

Verini
indeks
cijena
nepoznat
107
103
101
106
104
103
105
108
110
108
106


Poslovna statistika


Nepoznate proizvodnje u tekuim cijenama izraunat emo koristei relaciju

100
TC
SC
V
V
IC
=

iz koje je
100
SC
TC
V IC
V

= .

Tako je vrijednost proizvodnje u tekuim cijenama za 1997. godinu jednaka

0 0
0
( ) 0.90296810 69.76990634
( ) 0.63
100 100
SC
TC
V IC
V

= = = ,

vrijednost proizvodnje u tekuim cijenama za 1999. godinu

2 2
2
( ) 1.14444132 76.89341378
( ) 0.88
100 100
SC
TC
V IC
V

= = =

itd. Stoga trei stupac zadane tablice izgleda ovako:

Proizvodnja u
tekuim cijenama
[000 000 ]
0,63
0,75
0,88
0,96
1,07
1,23
1,36
1,52
1,85
1,98
2,51
2,75

Peti stupac tablice popunjavamo koristei definicijsku relaciju za vrijednost u stalnim
cijenama:


Poslovna statistika


100
TC
SC
V
V
IC
= .

Tako se dobiva:

1998
1998
1998
2000
2000
2000
2002
2002
2002
( ) 0.75
( ) 100 100 1.00463741;
74.65379979
( ) 0.96
( ) 100 100 1.23612024;
77.66234792
( ) 1.23
( ) 100 100 1.43666460;
85.61497235
TC
SC
TC
SC
TC
SC
V
V
IC
V
V
IC
V
V
IC
= = =
= = =
= = =

itd. Stoga peti stupac zadane tablice izgleda ovako:

Proizvodnja u stalnim cijenama
iz 2005. godine
[000 000 ]
0.90296810
1.00463741
1.14444132
1.23612024
1.29977266
1.43666460
1.54224000
1.64160000
1.85000000
1.80000000
2.11279461
2.18378756

Indeks fizikoga obujma izraunat emo koristei relaciju

( )
100
( )
SC t
SC b
V
IFO
V
= , za t = 0, 1, 2, , 10, 11 i b = 8,

jer 2005. godini odgovara vrijednost vremenske varijable t = 8. Zbog toga je:


Poslovna statistika


0
0
8
1
1
8
2
2
8
( ) 0.90296810
100 100 48.80908667;
( ) 1.85
( ) 1.00463741
100 100 54.30472482;
( ) 1.85
( ) 1.14444132
100 100 61.86169300;
( ) 1.85
SC
SC
SC
SC
SC
SC
V
IFO
V
V
IFO
V
V
IFO
V
= = =
= = =
= = =

itd. Prema tome, posljednji stupac zadane tablice izgleda ovako:

Indeks
fizikoga
obujma
(2005 = 100)
48.80908667
54.30472482
61.86169300
66.81731017
70.25798141
77.65754595
83.36432432
88.73513514
100
97.29729730
114.20511421
118.04257087

a cijela tablica ovako:

Godina Verini indeks
cijena
Proizvodnja u
tekuim cijenama
[000 000 ]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u
stalnim cijenama
iz 2005. godine
[000 000 ]
Indeks
fizikoga
obujma
(2005 = 100)
1997. nepoznat 0.63 69.76990634 0.90296810 48.80908667
1998. 107 0.75 74.65379979 1.00463741 54.30472482
1999. 103 0.88 76.89341378 1.14444132 61.861693
2000. 101 0.96 77.66234792 1.23612024 66.81731017
2001. 106 1.07 82.32208879 1.29977266 70.25798141
2002. 104 1.23 85.61497235 1.43666460 77.65754595
2003. 103 1.36 88.18342152 1.54224000 83.36432432
2004. 105 1.52 92.59259259 1.64160000 88.73513514
2005. 108 1.85 100 1.85000000 100


Poslovna statistika


Godina Verini indeks
cijena
Proizvodnja u
tekuim cijenama
[000 000 ]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u
stalnim cijenama
iz 2005. godine
[000 000 ]
Indeks
fizikoga
obujma
(2005 = 100)
2006. 110 1.98 110 1.80000000 97.2972973
2007. 108 2.51 118.8 2.11279461 114.2051142
2008. 106 2.75 125.928 2.18378756 118.0425709

Iz navedenih podataka vidimo npr. da je 2001. godine proizvodnja iskazana u stalnim
cijenama iz 2005. godine bila za 100 70.25798141 = 29.74201859% manja nego u 2005.
godini, a 2007. godine za 114.20511421 100 = 14.20511421% vea nego u 2005. godini.

Kretanje proizvodnje u stalnim cijenama iz 2005. godine, kao i jednadbe modela
jednostavnoga linearnoga trenda i modela jednostavnoga eksponencijalnoga trenda s
odgovarajuim koeficijentima determinacije navedene su na donjoj slici:

Koeficijent determinacije modela jednostavnoga eksponencijalnoga trenda (R
2
= 0.986) je
vei od koeficijenta determinacije modela jednostavnoga linearnoga trenda (R
2
= 0.984), pa je


Poslovna statistika


model jednostavnoga eksponencijalnoga trenda reprezentativniji. Koristei funkciju
GROWTH u MS Excelu prognoziramo vrijednosti proizvodnje u stalnim cijenama iz 2005.
godine u razdoblju od 2009. do 2013. godine:

godina t prognozirana proizvodnja
[000 000 ]
2009 12 2.42576156
2010 13 2.62304438
2011 14 2.83637186
2012 15 3.06704888
2013 16 3.31648645

(Ista se prognoza moe dobiti tako da se u jednadbu modela jednostavnoga
eksponencijalnoga trenda

0.0782
0.9492 0.9492 1.0813389048
x x
y e

= =

uvrtavaju redom vrijednosti x = 12, x = 13, , x = 16.)

Za izraun relativnih pokazatelja promjene cijen, odnosno proizvodnje bit e korisna
sljedea tri svojstva:

Svojstvo 1. Prosjena stopa promjene vrijednosti neke pojave (iskazana u postotcima) jednaka
je razlici geometrijske sredine verinih indeksa te pojave i broja 100.

Dokaz: Neka je Y
i
vrijednost promatrane pojave u razdoblju i, i = 0, 1, 2, , n 1. Oznaimo
sa S prosjenu stopu promjene vrijednosti te pojave (iskazanu u postotcima). Tada mora
vrijediti jednakost:

( )
1
1 0
1
n
n
Y Y S

= + ,

a odavde je

1
1
0
1
n
n
Y
S
Y
+ = .

Geometrijska sredina G svih n 1 verinih indeksa te pojave jednaka je:


Poslovna statistika


1 1
1 3 2 1 1 1 2
1 1 1 1
1 1 1 0 1 2 3 2 0
100 100 ... 100
n n
n i n n n
n n n n
i
i i i n n
Y Y Y Y Y Y Y
G V
Y Y Y Y Y Y Y

= =
| |
= = = =
|
\

,

odnosno, uvaavajui prethodnu jednakost,

100 (1 ) G S = + .

Odavde slijedi

100
1 100
100 100
G G
S G
= = = [%],


Iz navedenoga dokaza jo se jednom moe uoiti nedostatak geometrijske sredine (i iz nje
izvedene prosjene relativne stope promjene) kao pokazatelja za prognozu vrijednosti neke
pojave. U dokazu se nita ne govori o meuvrijednostima Y
1
, Y
2
, , Y
n 2
, ve se iskljuivo
zahtijeva da se podudaraju prva (nulta) i posljednja ((n 1)va) vrijednost pojave. Zbog toga
je za prognoziranje buduih vrijednosti te pojave bolje primijeniti ranije spomenute modele
trenda.

Svojstvo 2. Za svaki i = 0, 1, , n 1 neka su Y
i
vrijednosti neke pojave u razdoblju i, a I
i

pripadni indeksi na stalnoj proizvoljnoj, ali fiksiranoj bazi b, za bilo koji b {0, 1, , n 1}.
Tada je prosjena stopa S promjene vrijednosti te pojave (iskazana u postotcima) jednaka

1
1
0
100 1
n
n
I
S
I
| |
=
|
|
\
[%].

Dokaz: Prema prethodnom dokazu je

1
1
0
1
n
n
Y
S
Y
+ = ,

odnosno


Poslovna statistika


1 1
1 1
0 0
1 100 1
n n
n n
Y Y
S
Y Y

| |
= =
|
|
\
[%].

Stoga je dovoljno dokazati da vrijedi jednakost:

1 1
0 0
n n
I Y
I Y

= ,

a ona izravno slijedi iz definicije indeksa na stalnoj bazi:

1
1 1
0
0 0
n
n b n
b
Y
I Y Y
Y
I Y
Y

= = .

Svojstvo 3. Neka je S prosjena stopa promjene neke pojave (iskazana u postotcima) u
nekom razdoblju. Tada je ukupna relativna promjena vrijednosti te pojave (iskazana u
postotcima) u promatranom razdoblju:

( )
1
1 1
n
p S

= + [%].

Dokaz: Prema dokazu Svojstva 1. vrijedi jednakost:

( )
1
1 0
1
n
n
Y Y S

= + .

Ukupna relativna stopa promjene iskazana u postotcima jednaka je:

1 0
0
100
n
Y Y
p
Y

= .
Iz tih dviju jednakosti slijedi:

( )
( )
1
1
0
0 0
1 0
0 0 0
1 1
1
100 100 100
n
n
n
Y S
Y S Y
Y Y
p
Y Y Y
(
+
+
(

= = = ,


Poslovna statistika


odnosno

( )
1
1 1 100
n
p S

(
= +
(

,


Na temelju prethodnih svojstava rjeavamo preostali dio zadataka iz Primjera 16. Ukupnu
relativnu promjenu i prosjenu godinju promjenu cijena u promatranom razdoblju izraunat
emo primjenom Svojstava 2. i 3. na indekse cijena na stalnoj bazi 2005 = 100. Tako je
najprije prosjena godinja promjena cijena u promatranom razdoblju jednaka

[ ]
12 1 11
11
12 1 11
0 0
125.928
100 1 100 1 100 1 5.044 %
69.76990634
c
I I
S
I I
| | | | | |
= = =
| | |
\ \ \
,

tj. cijene su rasle prema prosjenoj godinjoj stopi od priblino 5,044%. Ukupna relativna
promjena cijena je

( ) [ ]
12 1
1
5.0439829422782
1 1 100 1 1 100 71.8237 %
100
n
c
p S
(
| |
(
= + = +
(
|
(

\
(

,

tj. u promatranom se su razdoblju cijene poveale za ukupno priblino 71.8237%.

Oekivanu ukupnu relativnu promjenu i oekivanu prosjenu godinju promjenu proizvodnje
u stalnim cijenama iz 2005. godine za razdoblje od 2009. do 2013. godine izraunat emo
koristei Svojstvo 3. i formulu

1 1
1 1
0 0
1 100 1
n n
n n
Y Y
S
Y Y

| |
= =
|
|
\
[%].
Izraunajmo najprije oekivanu prosjenu godinju promjenu proizvodnje. Budui da imamo
ukupno 5 prognoziranih vrijednosti proizvodnje u stalnim cijenama iz 2005. godine, to je n =
= 5, pa je Y
n 1
= krajnja prognozirana vrijednost proizvodnje = 3.31648645 i Y
0
= poetna
prognozirana vrijednost proizvodnje = 2.42576156. Stoga je

5 1 4
3.31648645 3.31648645
100 1 100 1 8.13282
2.42576156 2.42576156
p S

| | | |
= =
| |
\ \
[%],


Poslovna statistika


tj. proizvodnja u stalnim cijenama iz 2005. godine u razdoblju od 2009. do 2013. godine
oekivano e rasti po prosjenoj godinjoj stopi od priblino 8.13282%. Oekivano ukupno
poveanje proizvodnje u stalnim cijenama iz 2005. godine u razdoblju od 2009. do 2013.
godine dobit emo iz jednakosti:

( ) [ ]
5 1
1
8.13282
1 1 100 1 1 100 36.7194 %
100
n
p
p
p S
(
| |
(
= + = +
(
|
(

\
(

,

tj u promatranom e se razdoblju proizvodnja u stalnim cijenama iz 2005. godine oekivano
ukupno poveati za priblino 36.7194%.

Zakljuno napomenimo da bi sve gore izraunate relativne vrijednosti promjena cijena,
odnosno proizvodnje ostale nepromijenjene ukoliko bismo za bazno razdoblje uzeli bilo koju
drugu godinu promatranoga razdoblja. To, dakako, ne vrijedi za prognoziranu proizvodnju u
stalnim cijenama jer njezine vrijednosti izravno ovise o tome koju smo godinu odabrali za
baznu godinu (za drugu baznu godinu dobit emo druge vrijednosti proizvodnje u stalnim
cijenama iz te godine). Zbog toga se pri ekonomskim analizama u ovakvim sluajevima ee
primjenjuju relativni pokazatelji promjena vrijednosti neke pojave.


Poslovna statistika


6. LITERATURA

1. M. Papi: ''Primijenjena statistika u MS Excelu'' (2. izdanje), VP ''Libertas''
Naklada ''Zoro'', Zagreb, 2008.
2. M. Vukievi, M. Papi: Matematiko-statistiki prirunik za poduzetnike, Golden-
marketing Tehnika knjiga, Zagreb, 2003.
3. I. oi: Primijenjena statistika, kolska knjiga, Zagreb, 2004.
4. V.Serdar, I. oi: Uvod u statistiku, kolska knjiga, Zagreb, 2000.
5. A. Rozga, B. Gri: Poslovna statistika, Veleuilite u Splitu
129
, Split, 1999.
6. Statistiki ljetopisi Republike Hrvatske i Mjesena statistika izvjea [objavljeni na
www.dzs.hr ], Dravni zavod za statistiku, Zagreb
7. ene i mukarci u Hrvatskoj (publikacija objavljena na www.dzs.hr), Dravni zavod
za statistiku, Zagreb, 2007.
8. Sveuilina anketa o kvaliteti nastave objavljena na www.unizg.hr, Sveuilite u
Zagrebu, Zagreb, 2008.
9. nastavni materijali iz kolegija Statistika objavljeni na www.efos-statistika.com,
Ekonomski fakultet Sveuilita u Osijeku, Osijek, 2009.
10. nastavni materijal doc.dr.sc. Snjeane Pivac iz kolegija Poslovna statistika objavljen
na www.efst.hr/nastava/44/12.Skupni_indeksi._Doc._dr._S._Pivac.pdf, Ekonomski
fakultet Sveuilita u Splitu, Split, 2009.
11. lanci objavljeni na Wikipedii:
http://en.wikipedia.org/wiki/Correlation,
http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient,
http://en.wikipedia.org/wiki/Regression_analysis,
http://en.wikipedia.org/wiki/Dollar_cost_averaging,
http://en.wikipedia.org/wiki/Trend_estimation

129
Dananji Sveuilini studijski centar za strune studije Sveuilita u Splitu.

Poslovna Statistika - Skripta

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Poslovna Statistika - Skripta

Uploaded by

Copyright:

Available Formats

ELEKTROTEHNIKI ODJEL

(y) = {x S: f(x) = y}. Navedeni

(y), gdje je f funkcija iz

= , gdje je IQ interkvartil osnovnoga skupa. O interkvartilu

poprima minimalnu vrijednost za x = X ,

sugerira da je rije o vrijednosti koja se izraunava na temelju jednadbe

= 54.60276339 30 1010.284974 = 627.797927

sugerira da vrijednost varijable x procjenjujemo, a oznaka y da je vrijednost

= 10.4023396 40 10.95031313 = 405.1432707

= 5.953418082 2.5 + 33.09751978 = 18.21397458.

ukupan zbroj kvadrata odstupanja svih empirijskih

) je apsolutna mjera reprezentativnosti

) je relativna mjera reprezentativnosti

= B koja je, zapravo, poseban sluaj modela

= 8,7 minuta = 8 minuta i 42 sekunde.

= 76,5 minuta = 76 minuta i 30 sekundi.

= 186.18 ln 5.5 + 185.91 503.3 cm.

= 1.8455 godina = 1 godina 10 mjeseci i 5 dana.

= 186.18 ln 21 + 185.91 752.74 cm.

strogo vee od nule, a samim tim i

= 0.129717918 51 + 0.857302 67 + 0.117393926 12 + 0.112526063 15 17.3211733,

You might also like