Professional Documents
Culture Documents
Poslovna statistika
mr.sc. Bojan Kovai, predava 1
POSLOVNA
STATISTIKA
interna skripta
pripremio:
mr.sc. Bojan Kovai, predava
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 2
SADRAJ
PREDGOVOR ....................................................................................................................5
0. REKLI SU O STATISTICI ...................................................................................8
1. UVOD U STATISTIKU .............................................................................................8
1.1. Pojam statistike ............................................................................................................................ 8
1.2. Opisna i inferencijalna statistika .................................................................................................. 8
1.3. Statistika analiza, statistiki skup i obiljeja elemenata statistikog skupa .............................. 9
1.3.1. Skale obiljeja ...................................................................................................................... 11
1.3.2. Vrste obiljeja ...................................................................................................................... 14
2. FAZE STATISTIKOGA ISTRAIVANJA ...................................................... 18
2.1. Odreivanje cilja i razrada plana istraivanja ............................................................................ 18
2.2. Organizirano prikupljanje statistikih podataka ........................................................................ 19
2.3. Grupiranje statistikih podataka ................................................................................................ 21
2.3.1. Grupiranje kvalitativnih podataka ....................................................................................... 21
2.3.2. Grupiranje kvantitativnih podataka .................................................................................... 23
2.3.3. Kumulativni nizovi frekvencija ............................................................................................. 25
2.3.4. Dijagram ''stablo list'' (stem leaf) .................................................................................. 30
2.4. Tablini prikaz statistikih podataka .......................................................................................... 32
2.5. Grafiki prikaz statistikih podataka .......................................................................................... 38
2.5.1. Povrinski grafikoni .............................................................................................................. 39
2.5.2. Histogram ............................................................................................................................ 47
2.5.3. Linijski grafikoni ................................................................................................................... 54
2.5.4. Ostale vrste grafikona ............................................................................................................. 59
3. OSNOVNE KARAKTERISTIKE NUMERIKIH NIZOVA ........................... 63
3.1. Srednje vrijednosti numerikih nizova ........................................................................................ 63
3.1.1. Aritmetika sredina ............................................................................................................. 64
3.1.2. Geometrijska sredina ........................................................................................................... 75
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 3
3.1.3. Harmonijska sredina ............................................................................................................ 80
3.1.4. Kvantili ................................................................................................................................. 84
3.1.5. Mod ..................................................................................................................................... 92
3.2. Mjere rasprenja (disperzije) ...................................................................................................... 94
3.2.1. Raspon varijacije .................................................................................................................. 95
3.2.2. Interkvartil ........................................................................................................................... 97
3.2.3. Interpercentilni razmak ....................................................................................................... 98
3.2.4. Varijanca i standardna devijacija ........................................................................................ 99
3.2.5. Srednje apsolutno odstupanje ........................................................................................... 105
3.2.6. Koeficijent varijacije........................................................................................................... 108
3.2.7. Koeficijent kvartilne devijacije ........................................................................................... 111
3.3. Standardizirano obiljeje .......................................................................................................... 115
3.4. Vrste razdioba (distribucija) ..................................................................................................... 119
3.4.1. Mjere asimetrije ................................................................................................................ 120
3.4.2. Mjere zaobljenosti ............................................................................................................. 124
3.5. Programska potpora deskriptivnoj statistikoj analizi ............................................................. 126
4. KORELACIJSKA I REGRESIJSKA ANALIZA ............................................. 127
4.1. Korelacijska analiza .................................................................................................................. 128
4.1.1. Spearmanov koeficijent korelacije ranga .......................................................................... 139
4.2. Regresijska analiza ................................................................................................................... 146
4.2.1. Model jednostavne linearne regresije ............................................................................... 148
4.2.2. Analiza varijance modela jednostavne linearne regresije ................................................. 164
4.2.3. Mjere reprezentativnosti modela jednostavne linearne regresije ..................................... 166
4.2.3.1. Varijanca regresijskoga modela ............................................................................................... 166
4.2.3.2. Standardna devijacija regresijskoga modela ........................................................................... 167
4.2.3.3. Koeficijent varijacije regresijskoga modela .............................................................................. 167
4.2.3.4 Koeficijent determinacije .......................................................................................................... 168
4.3. Primjeri nelinearnih modela jednostavne regresije .................................................................. 172
4.3.1. Model jednostavne eksponencijalne regresije ................................................................... 172
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 4
4.3.2. Model jednostavne logaritamske regresije ....................................................................... 181
4.3.3. Model jednostavne potencijske regresije (POWER) .......................................................... 186
4.4. Primjer modela viestruke (multiple) regresije: model viestruke linearne regresije ............... 194
5. INDIVIDUALNI BROJANI POKAZATELJI RAZVOJA VREMENSKO-
GA NIZA ......................................................................................................................... 199
5.1. Definicija i vrste vremenskih nizova.......................................................................................... 202
5.2. Pokazatelji pojedinanih apsolutnih promjena ........................................................................ 204
5.3. Modeli trenda .......................................................................................................................... 206
5.4. Osnovni brojani pokazatelji relativnih promjena .................................................................... 210
5.5. Individualni indeksi ................................................................................................................... 212
5.5.1. Verini (lanani) indeksi ..................................................................................................... 213
5.5.2. Indeksi na stalnoj bazi (bazni indeksi) ............................................................................... 218
5.5.3. Pretvorba indeksa .............................................................................................................. 224
5.6. Skupni indeksi ........................................................................................................................... 229
5.6.1. Skupni indeksi koliina ....................................................................................................... 230
5.6.1.1. Laspeyresov skupni indeks koliina .......................................................................................... 230
5.6.1.2. Paascheov skupni indeks koliina............................................................................................. 231
5.6.1.3. Fisherov skupni indeks koliina ................................................................................................ 233
5.6.2. Skupni indeksi cijena .......................................................................................................... 234
5.6.2.1. Laspeyresov skupni indeks cijena ............................................................................................. 235
5.6.2.2. Paascheov skupni indeks cijena .............................................................................................. 235
5.6.2.3. Fisherov skupni indeks cijena ................................................................................................... 237
5.6.3. Skupni indeksi vrijednosti .................................................................................................. 238
5.6.4. Neki posebni oblici skupnih indeksa i njihova primjena .................................................... 242
5.6.4.1. Izraunavanje realnih plaa na osnovu skupnih indeksa trokova ivota ................................ 242
5.6.4.2. Vrijednost u stalnim cijenama i indeks fizikoga obujma ........................................................ 248
6. LITERATURA .......................................................................................................... 260
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 5
PREDGOVOR
Jedna od najprimjenjivanijih matematikih disciplina u gotovo svim podrujima ovjekova
djelovanja danas je nesumnjivo statistika. Bez te su discipline dananja znanost i cjelokupan
ljudski ivot praktiki nezamislivi. Prikupljanje podataka, njihova obrada i analiza, te
izvoenje zakljuaka na temelju tih postupaka provode se u tolikoj mjeri da su razvojem
moderne informatike tehnologije usporedno razvijeni i ''specijalizirani'' raunalni programi
namijenjeni potrebama statistike analize i statistike openito. S druge strane, zbog svojega
rairenoga podruja primjene, statistika je vrlo esto potpuno neopravdano i neutemeljeno bila
meta razliitih kritika koje su je nastojale obezvrijediti, prikazati njezina podruja i metode
kao ''neto zanimljivo samo statistiarima'', a statistiare kao neshvaene asocijalne udake
koji, umjesto druenja s tzv. normalnim ljudima i uivanja u svim ljepotama i arima
ovozemaljskoga ivota, radije odabiru uivanje u hrpama i tonama podataka, tablicama,
grafovima i slinim statistikim objektima.
Jo od samoga poetka svojega bavljenja statistikom u studentskim danima nastojao sam tu
matematiku disciplinu promatrati sa stajalita da je rije o disciplini nita manje vrijednoj i
nita manje vanoj od algebre, analize, geometrije i inih matematikih disciplina. Kasnije, kao
predava statistikih kolegija na razliitim visokim kolama, s vie ili manje uspjeha nastojao
sam pribliiti statistiku studentima i ukazati im na svu pogrenost uobiajenih zabluda o
statistici. Kao rezultat takvoga pristupa razvile su se sljedee temeljne postavke koje se
provlae kroz ova skripta:
1.) Statistika je sastavni dio matematike, unato injenicama da je znatan dio strunjaka
uporno pokuava ubrojiti u sastavnice ekonomske znanosti. Iako se statistika ponajvie
primjenjuje u ekonomiji, pa se na ekonomskim fakultetima zbog toga izuava kao posebno
podruje, temelji statistike i statistikoga naina miljenja su iskljuivo matematiki.
2.) Nitko ne moe zamijeniti istraivaa prigodom interpretacije rezultata statistike analize.
Raunala i ''specijalizirani'' raunalni programi mogu vrlo brzo i tono izraunati sve eljene
statistike pokazatelje, ali ne mogu dati njihovu univerzalnu interpretaciju jer ona ovisi o
svakom pojedinom razmatranom sluaju. Statistiar mora znati uz koje se temeljne
pretpostavke izraunavaju pojedine statistiki pokazatelji i provjeriti vrijede li te pretpostavke
u sluaju koji razmatra. Ukoliko ne vrijede, dobiveni statistiki pokazatelj bit e tono
izraunat, ali nee biti reprezentativan, tj. nee dovoljno dobro opisivati podatke iz kojih je
izraunat.
3.) Ne postoje univerzalni statistiki pokazatelji koji bi dovoljno reprezentativno opisivali
bilo koji statistiki niz podataka. Ova zabluda naroito se odnosi na aritmetiku sredinu
(popularni ''prosjek'') koju se, zbog jednostavnosti njezina izrauna, uporno nastoji ''progurati''
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 6
kao univerzalni statistiki pokazatelj prikladan za opis bilo kojega statistikoga niza.
Pojednostavljivanje ovdje uzrokuje nereprezentativnost dobivenoga statistikoga pokazatelja,
to u svojim kritikama esto iskoritavaju protivnici statistike. Ispravan pristup ovoj
problematici je tipian pristup problemima matematikoga modeliranja: klasificirati
statistike probleme u tzv. klase dovoljno meusobno ''slinih'' problema koji se mogu rijeiti
uz iste polazne pretpostavke i istu, zadovoljavajuu reprezentativnost dobivenih rezultata.
Spomenuta klasifikacija nije nimalo jednostavna i predstavlja problem o kojemu se raspravlja
i dan-danas, ali takav je sluaj s apsolutnom veinom matematikih problema.
Stoga se na samom poetku pisanja ovih skripta pojavio sljedei problem: kako na dovoljno
jednostavan i razumljiv nain, ali uz uvaavanje svih gore navedenih postavki, napisati tekst
koji e istodobno biti i podloga za predavanja i nastavni materijal prema kojemu e studenti
moi pripremati ispit iz poslovne statistike? Navedeni je problem razlog to je ovaj tekst
nastajao tijekom mojih svakogodinjih predavanja statistike u gotovo svim godinama 21.
stoljea. Naime, odgovorno tvrdim da bilo koja skripta moe biti nastavni materijal prema
kojemu e studenti moi pripremati ispit ako i samo ako je skripta bila efektivno koritena u
nastavi tijekom najmanje 5 godina. U tom su smislu i svi studenti sluai statistikih
kolegija koje sam predavao koautori ovih skripta jer su mi njihova pitanja, konstruktivne
kritike i komentari pomogli uvidjeti na koje dijelove gradiva treba posebno obratiti pozornost
i dodatno ih pojasniti jer nisu sami po sebi dovoljno razumljivi.
Iako u nazivu skripta stoji Poslovna statistika, ova bi se skripta mogla zvati i Osnove
statistike. Gradivo koje je u njoj izloeno, naime, veina e statistiara proglasiti upravo
''osnovama osnovnih osnova'' statistike. No, upravo te ''osnove osnovnih osnova'' danas tvore
podruje koje se najee primjenjuje u razliitim poslovnim analizama i, kao takvo, sasvim
je primjereno studentima strunih studija. Stoga skripta mogu koristiti svi studenti strunih
studija ekonomije, ali i neekonomskih studija poput fizioterapije, upravnoga prava itd., te svi
koji u svojim poslovima primjenjuju ma koji dio izloenoga gradiva.
Konceptualno je skripta podijeljena u pet poglavlja. U prva dva poglavlja obraeni su osnovni
statistiki pojmovi definirani s matematikoga stajalita, te osnovne faze statistikoga
istraivanja. Posebna se pozornost posveuje statistikim tablicama i grafikonima, kao i
njihovim interpretacijama. U treem se poglavlju obrauju u praksi najee koritene srednje
vrijednosti i mjere rasprenosti (disperzije) uz poseban naglasak na reprezentativnost svake
pojedine srednje vrijednosti. etvrto je poglavlje posveeno osnovama korelacijske i
regresijske analize, pri emu se temeljne postavke i ideje uglavnom izlau na problemima u
kojima se razmatraju tono dvije varijable. U petom, posljednjem poglavlju izlau se osnove
analize vremenskih nizova i opisuju neke posebne vrste skupnih indeksa.
Kao dio osnovnoga teksta u svim je poglavljima naveden relativno velik broj detaljno
rijeenih primjera od kojih je vei dio rijeen ''klasino'' (bez koritenja bilo kojega od
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 7
''specijaliziranih'' raunalnih programa), a manji dio uz koritenje MS Excela. Budui da je
rije o nastavnom materijalu namijenjenom za predavanja, tehnike rjeavanja statistikih
problema u MS Excelu ovdje se ne opisuju zasebno, a zainteresirani ih itatelj moe pronai u
literaturi [1]. Uz gotovo sve izraunate statistike pokazatelje navedena je njihova
interpretacija, a gdje god je to bilo primjereno, komentirana je i reprezentativnost konkretnoga
pokazatelja.
Ugodna mi je dunost da se na kraju ovoga predgovora iskreno zahvalim svima koji su na bilo
koji nain pomogli u nastajanju ovih skripta. To se ponajprije odnosi na ve spomenute
studente koji su svojim pitanjima, konstruktivnim kritikama i komentarima utjecali na zavrnu
verziju, odnosno kvalitetu skripta. U tom smislu unaprijed zahvaljujem i svima onima koji
budu proitali skripta i ukazali na neku nenamjerno napravljenu tiskarsku pogreku, te dali
konstruktivnu kritiku, primjedbu ili prijedlog za poboljanje osnovnoga teksta.
U Zagrebu, poetkom svibnja 2011.
Bojan Kovai
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 8
0. REKLI SU O STATISTICI
1
''Statistika je poput bikinija: otkriva ono sugestivno, a skriva ono vitalno.'' (Aaron Levenstein)
''Kad bi netko stao jednom nogom u kipuu vodu, a drugom nogom u hladnjak, statistiar bi
rekao da se taj ovjek nalazi u prosjeno ugodnoj temperaturi.'' (Walter Heller)
''Postoje tri vrste lai: la, prokleta la i statistika.'' (Mark Twain)
''Statistika je bajka razuma.'' (Martin Kessel)
''Statistika je skup tonih podataka koji daje pogrean rezultat.'' (Anonimus)
''Statistika naa dika: togod hoe, ona slika.'' (Vladimir Bulatovi Vib)
''Ja jedem kupus, ti jede meso u prosjeku jedemo sarmu.'' (Anonimus)
1. UVOD U STATISTIKU
1.1. Pojam statistike
Statistika je znanstvena disciplina koja na organiziran nain pristupa prikupljanju, odabiru,
grupiranju, prezentaciji i analizi podataka, te interpretiranju rezultata provedene analize u
svrhu ostvaraja postavljenih istraivakih ciljeva. Da bi se ostvarili svi prethodno navedeni
zadaci i ciljevi, statistika je razvila svoje vlastite metode i tehnike. One se danas primjenjuju u
vrlo razliitim podrujima: ekonomiji, zdravstvu, kulturi, politici, sportu, obrazovanju,
znanosti itd.
1.2. Opisna i inferencijalna statistika
Kao zasebna znanstvena disciplina, statistika se grubo moe podijeliti na dva posebna dijela:
opisnu (deskriptivnu) i inferencijalnu statistiku. Potonji se esto smatra dijelom tzv.
matematike statistike.
Opisna (deskriptivna) statistika temelji se na konkretnim rezultatima dobivenima nekim
istraivanjima ili mjerenjima. U tim se istraivanjima skup svih promatranih objekata
1
Mnogobrojni slikovitiji komentari studenata koji su vie-manje uspjeno polagali statistike kolegije iz
udorednih razloga ovdje nisu navedeni.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 9
obuhvaa u cijelosti. Zadaa opisne statistike je "opisati'' dobivene rezultate, tj. srediti ih i
saeti tako da budu to pregledniji, razumljiviji i pogodniji za interpretaciju, daljnju analizu i
primjenu.
Inferencijalna statistika temelji se na djelominu obuhvatu skupa svih promatranih objekata.
Rezultati se dobivaju ispitivanjem odreenoga dijela (uzorka) promatranih objekata. Koristei
metodu "od pojedinanoga ka opemu" (tzv. induktivna metoda) izvode se zakljuci o
karakteristikama (obiljejima) svih promatranih objekata. Pri izvedbi takvih zakljuaka
postoji odreeni rizik pogreno izvedenih zakljuaka. Rizik i nesigurnost u primjeni rezultata
dobivenih istraivanjem na temelju uzorka procjenjuje se na temelju naela teorije
vjerojatnosti.
U ovom emo se kolegiju baviti opisnom statistikom jer se taj dio statistike praktino najvie
primijenjuje u razliitim poslovnim sustavima, procesima itd.
1.3. Statistika analiza, statistiki skup i obiljeja elemenata statistikog skupa
Statistika analiza bilo koje prirodne ili drutvene pojave ili procesa nuno se temelji na
statistikim informacijama, metodama i tehnikama.
Statistikom analizom dobiva se uvid u strukturu pojava ili procesa u vremenu i prostoru, te
uvid u njihovu meusobnu povezanost. Predmet statistike analize razliita su kvalitativna i
kvantitativna obiljeja promatranih pojava ili procesa vezanih za promatrani skup objekata.
Statistiki skup je osnovni pojam u statistici (kao, uostalom, i skup u matematici). Tvore ga
statistike jedinice ili elementi (osobe, poslovni subjekti, regije, drave, predmeti itd.) koji
imaju barem jedno zajedniko svojstvo (obiljeje ili varijabla
2
) koje od elementa do elementa
oituje statistiku promjenjivost. Ukupan broj elemenata statistikoga skupa naziva se opseg
statistikoga skupa.
3
Prema opsegu, statistike skupove (kao i sve druge skupove) dijelimo na
konane i beskonane, a prema vrsti elemenata na stvarne (realne) i zamiljene
4
(hipotetine).
Stvarni statistiki skupovi sastoje se od elemenata koji postoje u tekuem vremenu i prostoru,
a zamiljeni statistiki skupovi sastoje se od elemenata generiranima razliitim modelima
2
U opisnoj se statistici izraz varijabla obino poistovjeuje s izrazima obiljeje i svojstvo, dok se u
matematikoj statistici odnosi iskljuivo na numerika obiljeja.
3
U teoriji skupova taj se broj, inae, naziva kardinalni broj skupa, dok se termin opseg vie koristi u
geometrijskim razmatranjima.
4
Pritom izraz zamiljen ne znai stanje statistikoga skupa u kojemu svi njegovi elementi promiljaju npr. o
besmrtnosti komarca malariara, nego nepostojanje u realnom svijetu.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 10
procesa ili pokusa. Poslovna statistika se u pravilu bavi realnim konanim statistikim
skupovima.
Ve je istaknuto da statistiki skup tvore elementi koji imaju barem jedno zajedniko
svojstvo. Stoga za svaki element statistikoga skupa znamo odgovarajui podatak o tome
svojstvu. Skup svih takvih podataka naziva se osnovni skup ili populacija
5
. Poput
statistikoga, i osnovni skup moe biti konaan ili beskonaan, te stvaran ili zamiljen.
Bilo koji neprazan podskup
6
statistikoga skupa i osnovnoga skupa naziva se uzorak. Dakle,
pod terminom uzorak podrazumijevamo i neki dio elemenata statistikoga skupa i
odgovarajue podatke o tim elementima. U opisnoj se statistici nerijetko pojmovi
statistikoga skupa, osnovnoga skupa i uzorka poistovjeuju jer se statistika analiza provodi
na isti nain neovisno o kojem od tih triju tipova skupa je rije. Nasuprot tome, inferencijalna
statistika strogo razdvaja navedene pojmove jer provedba statistike analize ovisi o tome iz
kojega se od tih triju skupova uzimaju podaci koji se ele analizirati.
Statistiki skup nuno mora biti precizno definiran kako bi se na temelju njegove definicije
moglo jasno i jednoznano odrediti pripada li neki element tome skupu ili ne. Statistiki skup
mora biti definiran pojmovno, prostorno i vremenski. Pojmovna definicija utvruje pripadnost
bilo kojega objekta navedenom skupu, prostorna definicija utvruje prostor kojemu pripadaju
svi elementi statistikoga skupa, a vremenska definicija utvuje vremensko razdoblje ili
vremenski trenutak za koji su vezani svi elementi statistikoga skupa.
Primjer 1. Promatra se statistiki skup koji tvore svi studenti 1. godine strunoga studija
raunovodstva i financija Visoke kole za financijski menadment u pikovini na dan
01.03.2010. Definirajmo navedeni skup pojmovno, prostorno i vremenski:
pojmovna definicija: studenti 1. godine strunoga studija raunovodstva i financija
prostorna definicija: Visoka kola za financijski menadment u pikovini
7
vremenska definicija: 01.03.2010.
5
Izraz populacija obino se rabi iskljuivo u kontekstu vezanom za odreeni skup ivih bia (populacija ljudi,
udnovatih kljunaa, krokodila itd.).
6
Iz teorije skupova je poznato da je jedan od podskupova svakoga skupa tzv. prazan skup (skup koji nema niti
jednoga jedinoga elementa). Prazni skupovi (pa, prema tome, i prazni uzorci) koriste se iskljuivo u
matematikoj statistici.
7
Pri prostornom definiranju skupa obino se navodi i npr. naziv radne organizacije, visokoobrazovne ustanove
itd. iako bi moda prirodnije pripadali pojmovnoj definiciji. Takoer, iako u pravilu ne treba pretjerivati s
prostornim definiranjem, pa npr. rei: Visoka kola za financijski menadment u pikovini, drava: Republika
Hrvatska, kontinent: Europa, planet: Zemlja, galaksija: Miljena staza, nerijetko ipak treba istaknuti neke
dodatne prostorne pokazatelje (naroito ukoliko se npr. radi o radnicima na crno u gradu Ouagadougou).
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 11
Taj skup je zamiljen i konaan, a njegov opseg iznosi 100 [studenata]
8
. Primjer osnovnoga
skupa vezanoga za promatrani statistiki skup jest skup svih zakljunih ocjena iz kolegija
Poslovna matematika, pri emu s 0 moemo oznaiti injenicu da student dosad nije uspio
poloiti navedeni kolegij. Stoga osnovni skup tvore ukupno 100 zakljunih ocjena
9
. Jedan od
uzoraka toga skupa je npr. Top 20, tj. skup svih studenata koji su navedeni kolegij uspjeli
poloiti sa zakljunom ocjenom izvrstan
10
.
1.3.1. Skale obiljeja
Kako je istaknuto, obiljeja (varijable) elemenata statistikog skupa su odgovarajua svojstva
po kojima usporeujemo te elemente. Svako obiljeje se javlja u vie pojavnih oblika
(modaliteta). Skup svih modaliteta nekoga obiljeja naziva se skala
11
. Tako je npr. skala
modaliteta obiljeja ''spol'' muki i enski, skala modaliteta obiljeja ''dan u tjednu''
ponedjeljak, utorak, srijeda, etvrtak, petak, subota i nedjelja, skala modaliteta ''mjesec u
godini'' sijeanj, veljaa, oujak, travanj, svibanj, lipanj, srpanj, kolovoz, rujan, listopad,
studeni i prosinac itd. Prilikom podjele elemenata statistikoga skupa prema barem jednom
obiljeju kad god je to mogue treba utvrditi skalu modaliteta. To se poglavito odnosi na
obiljeja iji se modaliteti ne iskazuju numerikim vrijednostima (tzv. kvalitativna obiljeja).
Skale obiljeja mogu se podijeliti sukladno odreenim metrikim svojstvima. Na temelju toga
razlikujemo nominalnu, redosljednu (ordinalnu ili rang), intervalnu i omjernu skalu.
Nominalna skala zadaje se u obliku skupa iji su elementi nenumerike vrijednosti: slovne
oznake, pridjevi, kategorije itd. Ti se elementi prigodom definiranja skale mogu navesti
proizvoljno odabranim redoslijedom. Nominalne skale dodatno se dijele na atributivne
(varijabilitet promatranoga obiljeja iskazuje se opisno) i prostorne (varijabilitet
promatranoga obiljeja iskazuje se zemljopisnim jedinicama). U nekim se sluajevima
8
Skup je zamiljen jer dotina visokoobrazovna ustanova (naalost) jo ne postoji.
9
Te ocjene, naravno, meusobno nisu u parovima razliite jer ih ima svega 5 razliitih: 0, 2, 3, 4 i 5. Koristei
npr. Dirichletovo naelo moe se pokazati da sigurno postoji barem 20 studenata koji imaju istu zakljunu
ocjenu iz Poslovne matematike.
10
Pritom odmah treba naglasiti da taj uzorak nije reprezentativan, tj. na temelju njega ne moemo izvui istinit
zakljuak o uspjehu svih studenata na ispitima iz Gospodarske matematike.
11
Unato upornom zagovaranju glazbeno nadarenih statistiara, sintagma ljestvica modaliteta (jo) nije ula u
svakodnevnu uporabu.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 12
nenumerike oznake zamjenjuju numerikima
12
, pri emu navedene numerike oznake slue
iskljuivo kao identifikatori, pa s njima nema smisla provoditi nikakve raunske operacije.
Npr. zamijenimo li nenumeriki modalitet muki numerikim modalitetom 0, a nenumeriki
modalitet enski modalitetom 1, onda nema smisla zapisati niti raunati npr. 0 + 1, 0 1 itd.
13
Istaknimo da nominalna skala ponajprije slui za razvrstavanje (kategorizaciju) elemenata
osnovnoga skupa u kategorije, a ukoliko je njihov broj vrlo velik, skala se utvruje dogovorno
i u takvim sluajevima govorimo o nomenklaturi. Tipini primjeri su razliite nomenklature
djelatnosti, industrijskih proizvoda, usluga itd.
Redosljedna (ordinalna, rang) skala elementima statistikoga skupa pridruuje slovne
oznake, simbole ili brojeve prema intenzitetu mjerenoga svojstva, pa se elementi potom
klasificiraju i ureuju sukladno stupnju promatranoga svojstva. Poredak modaliteta ovdje nije
proizvoljan: modalitete obino navodimo od onoga koji oznaava najmanji stupanj svojstva
do onoga koji oznaava najvei stupanj svojstva ili obrnuto. Tipini primjeri redosljedne skale
su skala ocjena (1, 2, 3, 4, 5), skala stupnjeva strune spreme, skala stupnjeva zadovoljstva
kvalitetom nastave iz kolegija ''Zabavljake vjetine'' itd. Iako ova skala ima bolja metrika
svojstva od nominalne, osnovni nedostatak joj je nemogunost preciznoga utvrivanja razlika
mjerenoga svojstva: npr. mi znamo da je ocjena 5 bolja od ocjene 2, ali ne moemo npr. rei
da je ocjena 5 za 3 bolja od ocjene 2.
14
Ukoliko elementima statistikoga skupa pridruujemo realne brojeve sukladno intenzitetu
promatranoga svojstva, dobit emo intervalnu skalu. Ona uvijek ima definiranu mjernu
jedinicu i dogovorno utvrenu nulu, pa ima bolja metrika svojstva od prethodnih dviju skala
jer omoguuje i razvrstavanje i rangiranje i brojano utvrivanje razlika mjerenoga svojstva.
Naime, s podacima dobivenima mjerenjem na intervalnoj su skali suvislo definirane operacije
zbrajanja i oduzimanja
15
, pa tako jednake razlike brojeva na skali govore o jednakoj razlici
mjerenih svojstava. Npr. ako je temperatura zraka na Zavianu -20C, u Zagrebu 0C, a u
Splitu 20C, onda se moe rei da je u Zagrebu za 20C toplije nego na Zavianu, a za 20C
hladnije nego u Splitu. Takoer, dogovorno utvrena nula znai da element statistikoga
skupa posjeduje odreeno svojstvo i da je modalitet toga svojstva jednak nuli. Konkretno,
12
Takva je ''zamjena'' zapravo bijekcija sa skale nenumerikih modaliteta u jednakobrojnu skalu numerikih
modaliteta: svaki nenumeriki modalitet zamjenjuje se tono jednim numerikim modalitetom i nikoja dva
nenumerika modaliteta nisu zamijenjena istim numerikim modalitetom.
13
ovinisti (i ovinistice?) bi vjerojatno vrlo rado definirali operaciju mnoenja, a feministice (i feministi?)
operaciju zbrajanja ovakvih brojeva sukladno uobiajenoj aritmetici.
14
Tj., opet ne moemo definirati operacije zbrajanja i oduzimanja. Ovo se pravilo praktino zanemaruje
prigodom raunanja prosjene ocjene, o emu e biti govora u posebnom poglavlju.
15
Mnoenje i dijeljenje se ne definiraju zbog problema tipa: ''Temperatura zraka u Zagrebu je 0C. Ako je na
Zavianu 20 puta hladnije nego u Zagrebu, kolika je temperatura zraka na Zavianu?''.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 13
injenica da je temperatura zraka u Zagrebu 0C znai da zrak u Zagrebu ima svoju
temperaturu i da je ta temperatura jednaka 0C.
16
Skala s najboljim metrikim svojstvima je tzv. omjerna skala. Ona se dobije tako da se
elementima statistikoga skupa pridrue realni brojevi sukladno intenzitetu mjerenoga
svojstva, a, osim definirane mjerne jedinice, ima i nulu koja oznaava nepostojanje svojstva.
Zbog toga se na takvoj skali mogu definirati sve etiri osnovne raunske operacije jer razlike i
omjeri vrijednosti imaju suvislo tumaenje. Npr. ako Blaenko na tekuem raunu ima
10.000,00 kn, a Draenko 100.000,00 kn, onda Draenko na svojem tekuem raunu ima 10
puta vie novaca, odnosno za 90.000,00 kn vie od Blaenka. Nadalje, ako Vlatka na svojem
deviznom raunu ima 0,00 , znai da je njezin devizni raun potpuno prazan, tj. da na njemu
(do daljnjega) nema novaca.
Poseban tip skale obiljeja je kronoloka skala. Ona obino sadri vremenska razdoblja
poredana kronoloki, tj. poevi od razdoblja koje je nastupilo najranije i zavravajui s
razdobljem koje je nastupilo najkasnije. Modaliteti kronoloke skale mogu se iskazivati
nazivima (npr. skala dana u tjednu, skala mjeseci u godini itd.) ili brojevima (npr. skala
minuta u pojedinom satu, skala sati u danu, skala datuma u pojedinom mjesecu, skala godina,
desetljea, stoljea itd.). Na tako formiranoj skali ima smisla definirati operacije zbrajanja i
oduzimanja, pri emu se u nekim sluajevima uobiajene operacije zbrajanja i oduzimanja
realnih brojeva zamijenjuju operacijama zbrajanja i oduzimanja modulo n
17
, pri emu je
obino n {7, 12, 24, 28, 29, 30, 31, 60}. Tipini primjeri kronolokih skala su: skala dana u
tjednu {ponedjeljak, utorak, srijeda, etvrtak, petak, subota, nedjelja}, skala godina u prvom
desetljeu ovoga tisuljea {2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010}
itd.
16
Matematiki nadareni statistiari odmah e se sjetiti da se na isti nain u matematici definiraju skupovi
povrine nula: to su skupovi koji imaju povrinu i ta povrina je jednaka 0. Tipian primjer takvoga skupa je
toka u bilo kojem euklidskom prostoru.
17
Zbrajanje modulo n (oznaka: +
n
) je binarna operacija definirana formulom: a +
n
b := (a + b) mod n = ostatak
pri dijeljenju zbroja a + b (dobivenoga uobiajenim zbrajanjem cijelih brojeva) brojem n. Npr. na skali sati u
danu je 17 +
24
8 = ostatak pri dijeljenju broja 17 + 8 s 24 = ostatak pri dijeljenju broja 25 s 12 = 1. Oduzimanje
modulo n (oznaka:
n
) je binarna operacija na skali modaliteta definirana opisno s: a
n
b = broj c takav da je b +
n
c = a. Npr. na skali sati u danu je 1
24
8 = 17 jer je, kako smo vidjeli, 17 +
24
8 = 1.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 14
1.3.2. Vrste obiljeja
Sukladno navedenoj podjeli skala, opa podjela obiljeja razlikuje kvalitativna, kvantitativna i
vremenska obiljeja.
Kvalitativna obiljeja su obiljeja kod kojih su svojstva elemenata statistikoga skupa
iskazana odreenim pridjevima ili atributima, kategorijama i sl. Ova obiljeja mogu biti
nominalna i redosljedna (obiljeja ranga).
Nominalna obiljeja vezana su uz nominalnu skalu izraavanja modaliteta promatranoga
obiljeja, a dodatno se dijele na atributivna i prostorna (geografska). Atributivna obiljeja su
obiljeja iji modaliteti iskazuju svojstva elemenata statistikoga skupa. Tipini primjeri
takvih obiljeja su: spol, boja kose, boja oiju, brano stanje, tip osobnoga automobila, vrsta
trgovakoga drutva, horoskopski znak, politika stranka itd. Atributivno obiljeje ija se
skala sastoji od tono dva modaliteta nazivamo alternativno obiljeje. Tipini primjeri
takvoga obiljeja su: spol (npr. na statistikomu skupu svih ljudi) sa skalom {muki, enski}
18
;
nain studiranja (npr. na statistikom skupu svih studenata Visoke kole za financijski
menadment u Bedekovini na dan 01.03.2008.) sa skalom {redovni, izvanredni} itd.
Primjer 2. Primjer alternativnoga statistikoga obiljeja:
Razdioba svih studenata Visoke kole za financijski menadment u pikovini koji su poloili
kolegij Poslovna matematika putem kolokvija u akademskoj godini 2007/2008. prema spolu
spol broj
studenata
struktura
[%]
muki 10 27.03
enski 27 72.97
ukupno 37 100.00
Izvor: osobna evidencija predmetnoga nastavnika, veljaa 2008.
Zadatak 1. a) Definirajte statistiki skup u gornjem primjeru pojmovno, prostorno i
vremenski, pa odredite njegov opseg.
b) Odredite osnovni skup i njegov opseg.
18
Novije socioloke analize u priznatim znanstvenim asopisima ''Glorija'', ''Tena'', ''Story'' itd. ozbiljno
ugroavaju ovu tradicionalistiko-konzervativnu podjelu svih ljudi prema spolu.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 15
Prostorno (geografsko) obiljeje je nominalno obiljeje iji modaliteti odraavaju vezu
elemenata statistikoga skupa s odreenim prostorom. Primjeri takvoga obiljeja su: mjesto
roenja, dravljanstvo, prebivalite, boravite, sjedite tvrtke, drava ili ekonomska unija
drava s kojom se vri odreena trgovinska razmjena itd.
Redosljedna obiljeja ili obiljeja ranga vezana su uz ordinalnu skalu iskazivanja modaliteta.
Tipini primjeri obiljeja ranga su ranije spomenuta ocjena, struna kvalifikacija, stupanj
akademskoga obrazovanja, stupanj zadovoljstva kvalitetom nastave itd.
Primjer 3. Primjer redosljednoga statistikoga obiljeja:
Razdioba svih studenata Visoke poslovne kole ''Mutimir kegro'' iz pikovine u akademskoj
godini 2006/07. prema stupnju zadovoljstva radom studentske referade
(stanje na dan 30.09.2007.)
stupanj zadovoljstva broj studenata struktura [%]
vrlo nezadovoljan 15 9.32
nezadovoljan 32 19.88
uglavnom nezadovoljan 21 13.04
ni zadovoljan ni nezadovoljan 38 23.60
uglavnom zadovoljan 27 16.77
zadovoljan 17 10.56
vrlo zadovoljan 11 6.83
ukupno: 161 100.00
Izvor: Studentski zbor VP ''Mutimir kegro''
Kvantitativna obiljeja su obiljeja kod kojih se svojstva elemenata statistikoga skupa
izraavaju brojevima, a vezana su uz intervalnu i omjernu skalu iskazivanja modaliteta.
Kvantitativna obiljeja esto se nazivaju i numerika obiljeja, a dodatno se dijele na
diskretna (diskontinuirana) i kontinuirana.
Diskretno (diskontinuirano) obiljeje je obiljeje ija je skala modaliteta konaan skup
(openito, realnih) brojeva takav da izmeu svakih dvaju modaliteta postoji razmak. Razmak
izmeu dvaju modaliteta je, zapravo, apsolutna vrijednost
19
njihove razlike. Tipini primjeri
obiljeja su broj soba u stanu, broj djece u obitelji, iznos ukupnih mjesenih primanja itd.
19
Podsjetnik za nematematiki nastrojene statistiare: apsolutna vrijednost bilo kojega realnoga broja x
definirana je formulom
, za 0;
| | =
, za 0.
x x
x
x x
<
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 16
Pritom modalitet diskretnoga obiljeja ne mora biti nuno cjelobrojan. Postoje i
etveroipolsobni stanovi, iznos mjesenih primanja moe biti necjelobrojan, veliina obue
moe biti 48 i pol, ali neovisno o tome izmeu bilo kojih dvaju razliitih modaliteta uvijek
postoji spomenuti razmak.
Primjer 4. Primjer kvantitativnoga diskretnoga obiljeja:
Razdioba svih zaposlenika u tvrtki ''Brodolomac d.d.'' iz Mua prema broju djece
(stanje na dan 31.12.2007.)
broj djece broj zaposlenih struktura [%]
0 175 15.31
1 244 21.35
2 438 38.32
3 194 16.97
4 i vie 92 8.05
ukupno 1.143 100.00
Izvor: Sluba ljudskih potencijala tvrtke ''Brodolomac''
Kontinuirano obiljeje je obiljeje ija je skala modaliteta (teoretski) beskonaan skup. Ta je
skala najee poluotvoreni interval a, b]
20
ili konana unija takvih poluotvorenih intervala.
Praktino, to znai da modalitet obiljeja moe biti bilo koja vrijednost unutar nekoga od
intervala koji tvore omjernu skalu. Tipini primjeri ovoga obiljeja su visina, masa itd.
Primjer 5. Primjer kvantitativnoga kontinuiranoga obiljeja:
Razdioba svih uenika 4.b razreda gimnazije ''Ljilja Koki'' iz Kaine u k.god. 2007/2008.
prema visini (stanje na dan 01.03.2008.)
visina [cm] broj uenika struktura [%]
(160) 165 3 11.11
165 170 6 22.22
170 175 7 25.93
175 180 4 14.81
180 185 5 18.52
185 (195) 2 7.41
ukupno: 27 100.00
Izvor: osobna evidencija uitelja tjelesne i zdravstvene kulture Joe Kotrmelca
20
Podsjetnik za nematematiki nastrojene statistiare: a, b] je skup svih realnih brojeva koji su strogo vei od
realnoga broja a, a manji ili jednaki realnom broju b, tj. a, b] = {x R: a < x b}.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 17
Zadatak 2. a) Definirajte statistike skupove u Primjerima 3. 5. pojmovno, prostorno i
vremenski, pa odredite njihove opsege.
b) Odredite osnovne skupove u Primjerima 3. 5. i njihove opsege.
c) Odredite skale modaliteta obiljeja promatranih u Primjerima 3. 5.
Pri razlikovanju diskretna i kontinuirana obiljeja u nekim je sluajevima vrlo vano precizno
definirati promatrano kvantitativno obiljeje. Npr. "starost (ovjeka, drveta, zgrade)" je
kvantitativno kontinuirano obiljeje, no, ukoliko to obiljeje predefiniramo kao "navrene
godine starosti", ono postaje kvantitativno diskretno obiljeje (zato?).
Poseban tip obiljeja je vremensko obiljeje. To je obiljeje vezano uz kronoloku skalu
modaliteta, odnosno odgovarajui kronoloki ureaj. Sukladno njemu grupiramo elemente
osnovnoga skupa i dobivamo vremenski statistiki niz. Vremenski niz moe biti intervalan i
trenutaan ovisno o tome jesu li podaci iz osnovnoga skupa dobiveni neprekidnim praenjem
i kumuliranjem promatrane pojave u odabranom vremenskom intervalu ili pak odreivanjem
stanja pojave u odabranim vremenskim trenutcima.
Primjer 6. Primjer intervalnoga vremenskoga niza:
Razdioba ostvarenoga prometa u trgovini na malo u Kraljevini Dajdamda u razdoblju od
2002.-2006. prema godini
godina ostvareni promet
[000 000 USD]
2002. 9.45575824
2003. 11.79383472
2004. 18.51123944
2005. 25.55631827
2006. 30.10276687
Izvor: Statistiki ljetopis Kraljevine Dajdamda za 2007. godinu
Primjer 7. Primjer trenutanoga vremenskoga niza
Razdioba svih studenti koji su poloili ispit iz Poslovne statistike na Veleuilitu u Brlog
Gradu na ispitnim rokovima u razdoblju od 01.09.2007. do 01.03.2008. prema datumu
polaganja ispita
datum broj studenata
01.09.2007. 2
20.09.2007. 1
04.10.2007. 26
12.02.2008. 0
29.02.2008. 1
Izvor: Studentska sluba Veleuilita u Brlog Gradu
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 18
2. FAZE STATISTIKOGA ISTRAIVANJA
Statistiko istraivanje openito moemo podijeliti na sljedee faze:
1. Odreivanje cilja i razrada plana istraivanja;
2. Organizirano prikupljanje statistikih podataka;
3. Grupiranje i sreivanje statistikih podataka;
4. Tablini i grafiki prikaz statistikih sreenih podataka;
5. Statistika analiza i interpretacija njezinih rezultata.
U ovom emo se kolegiju detaljno baviti fazama 3., 4. i 5., pa emo prve dvije faze ovdje
spomenuti samo okvirno.
2.1. Odreivanje cilja i razrada plana istraivanja
Iako se vrlo esto neopravdano zanemaruje, ova je faza zapravo jedna od najvanijih faza
cjelokupnoga statistikog istraivanja. Naime, prije negoli se krene na prikupljanje podataka,
svakako treba jasno i precizno definirati to se eli postii statistikim istraivanjem jer ve
dobro definiran cilj istraivanja moe nametnuti prirodan izbor pogodnih metoda za
prikupljanje podataka. Ukoliko cilj istraivanja i plan istraivanja nisu dovoljno precizno
definirani, mogue je uzalud prikupiti veliki broj podataka koje potom nije mogue dostatno
kvalitetno podvrgnuti statistikoj analizi i interpretaciji.
Druga velika prednost preciznoga definiranja cilja i plana istraivanja je to znatno
pojednostavljuje i skrauje cjelokupni postupak. Npr. pretpostavimo da elimo ispitati
zainteresiranost hrvatskih umirovljenika za aktivno sudjelovanje u teaju osnova rada na
osobnim raunalima. Iako npr. odlazak u Hrvatsku stranku umirovljenika i razgovor s
njezinim elnicima moe dati korisne podatke o cilju naega istraivanja, ta relativno jeftina i
kratkotrajna metoda nije dobra za postizanje eljenoga cilja
21
jer stav elnika stranke ne mora
odravati stav relativne veine hrvatskih umirovljenika. Teorijski najbolja metoda je postaviti
odgovarajue anketno pitanje svakom pojedinom umirovljeniku, ali ta je metoda npr. zbog
21
Navedena metoda, meutim, moe biti vrlo korisna za postavljanje hipoteze istraivanja. Hipoteza je temeljna
neprovjerena pretpostavka koju nastojimo potvrditi ili oboriti statistikim istraivanjem. U navedenom bi
primjeru (nakon obavljenih razgovora u HSU) postavljena hipoteza mogla glasiti: ''Veina hrvatskih
umirovljenika je zainteresirana za sudjelovanje u teajevima osnova rada na osobnim raunalima.''
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 19
svoje dugotrajnosti
22
uzrokovane znatnim brojem hrvatskih umirovljenika praktiki potpuno
neprimjerena. Praktino najpogodnija metoda je izabrati dovoljno reprezentativan uzorak
23
i
(npr. telefonski) anketirati sve lanove toga uzorka. Metodama izbora uzoraka i procjenjivanja
njihove reprezentativnosti bavi se posebna statistika disciplina teorija uzoraka. Detalje ovdje
izostavljamo.
2.2. Organizirano prikupljanje statistikih podataka
Statistiki podaci obino se prikupljaju:
a) brojanjem (npr. iznos mjesene plae svakoga od djelatnika tvtke ''Drpcommerce'')
b) mjerenjem (npr. masa svake od natjecateljica za Miss Mlijene staze)
c) ocjenjivanjem (npr. stupanj zadovoljstva kvalitetom nastave iz Poslovne statistike);
d) evidentiranjem (npr. zakljune ocjene iz Poslovne statistike svih studenata Visoke
kole za financijski menadment u Bedekovini koji su poloili taj kolegij u proloj
akademskoj godini);
e) anketiranjem (intervjuiranjem) (npr. politika stranka za koju na predstojeim mjesnim
izborima namjerava glasovati svaki stanovnik Mua)
Rezultat organiziranoga prikupljanja statistikih podataka su tzv. ''sirovi'' (negrupirani,
neobraeni) podaci. Iz njih se najjasnije vidi koji je element osnovnoga skupa pridruen
svakom pojedinom elementu statistikoga skupa. Uoimo da obrnuta tvrdnja nije tona jer bez
grupiranja i sreivanja podataka openito ne moemo ''oitati'' kojim je sve elementima
statistikoga skupa pridruen svaki element osnovnoga skupa.
Najpoznatija, a moda i najprimjenjivanija metoda organiziranoga prikupljanja statistikih
podataka je anketiranje. Anketa predstavlja skup razliitih postupaka kojima se pobuuju,
prikupljaju i analiziraju izjave anonimnih ljudi
24
kako bi se dobili podaci o njihovu ponaanju,
stavu prema odreenom problemu, miljenju, interesima, preferencijama itd. Ti se podaci
dobivaju na temelju anketnih upitnika koji sadre promiljeno odabrana pitanja koja trebaju
22
Drugi prirodan razlog je cijena praktine provedbe takve metode koja nerijetko predstavlja ozbiljnu prepreku
za kvalitetnu provedbu statistikoga istraivanja.
23
Vrlo esta pogreka statistikih istraivanja upravo je ''megalomanija'' odgovarajuih planova istraivanja jer
se istraivanje planira obaviti na prevelikom uzorku.
24
Psiholoka istraivanja pokazuju da je uvjet anonimnosti sudionika ankete iznimno vaan jer ak moe utjecati
na iskrenost u davanju odgovora na anketna pitanja, a time i na realnost rezultata provedene ankete.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 20
biti jednostavna, jasna i nesugestivna. Ta se pitanja mogu postaviti pismeno i usmeno.
Usmeno postavljanje anketnih pitanja obino se naziva intervjuiranje
25
.
U nastavku navodimo primjer prvoga dobro strukturirane ankete za procjenu nastavnika i
kolegija koja se sukladno naelima Bolonjskoga procesa provodi na svim znanstveno-
nastavnim sastavnicama Sveuilita u Zagrebu. Jedini moebitni nedostatak navedene ankete
je pretpostavka da svaki pojedini anketirani student poznaje temeljni postotni raun od sto, to
u praksi ne mora biti sluaj.
25
Moderna praksa nerijetko pokazuje da se postavljanje pitanja (unaprijed) u pismenoj formi i prepisivanje
njihovih odgovora takoer naziva intervju, napose ukoliko je rije o medijski poznatim osobama (npr.
predsjednici drava, premijeri vlada itd.). Sa statistikoga je stanovita takvo izjednaavanje potpuno pogreno.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 21
2.3. Grupiranje statistikih podataka
Nakon to su prikupljanjem (i odgovarajuim unosom) dobiveni ''sirovi'' statistiki podatci,
vrlo esto ih treba ''srediti'' tako da budu to pregledniji i laki za daljnju statistiku analizu
26
.
U tu se svrhu koristi grupiranje statistikih podataka. Osnovna ideja grupiranja je podijeliti
statistiki skup na podskupove prema svim modalitetima koji tvore skalu obiljeja, tj. za svaki
pojedini modalitet utvrditi (prebrojati) kolikom broju elemenata statistikoga skupa je
pridruen dotini modalitet. Pritom treba potovati dva osnovna naela:
- iskljuivost: svaki element statistikoga skupa ne moe istodobno biti u barem dva
razliita podskupa;
- iscrpnost: svaki element statistikoga skupa mora biti obuhvaen grupiranjem
podataka.
27
2.3.1. Grupiranje kvalitativnih podataka
Kako je ve istaknuto, grupiranjem podataka za svaki pojedini modalitet utvrujemo kolikom
je broju elemenata statistikoga skupa pridruen taj modalitet. Dobiveni broj obino se naziva
apsolutna frekvencija (uestalost). Neformalno, apsolutna frekvencija nekoga modaliteta
jednaka je ukupnom broju pojavljivanja toga modaliteta u osnovnom skupu
28
. Budui da je
svakom elementu statistikoga skupa nuno pridruen tono jedan modalitet, zbroj apsolutnih
frekvencija svih modaliteta mora biti jednak opsegu statistikoga skupa
29
.
Relativna frekvencija modaliteta jednaka je koliniku odgovarajue apsolutne frekvencije
toga modaliteta i opsega statistikoga skupa. Takav se raun provodi jer elimo vidjeti
kolikom dijelu statistikoga skupa je pridruen odreeni modalitet. Iako je relativna
26
Izuzetak su sluajevi kad osnovni skup sadri relativno malo (obino 30) podataka.
27
Budui da je preslikavanje f koje svakom elementu statistikoga skupa S pridruuje tono jedan element skale
modaliteta M funkcija, za svaki modalitet y M ima smisla definirati skup f
= 7.
Uz grupiranje statistikih podataka esto se javlja tzv. problem nominalnih razreda. Naime,
grupiranjem modaliteta kvantitativnoga obiljeja u razrede dobivamo tono jedan od sljedeih
dvaju sluajeva:
1.) gornja granica svakoga pojedinoga razreda, osim posljednjega, jednaka je donjoj granici
neposredno sljedeega razreda;
2.) gornja granica svakoga pojedinoga razreda, osim posljednjega, nije jednaka donjoj granici
neposredno sljedeega razreda (tj. izmeu dvaju uzastopnih razreda postoji razmak).
Prvi sluaj praktino primijenjujemo uvijek kad analiziramo modalitete kvantitativnoga
kontinuiranoga obiljeja kojih teorijski moe biti beskonano mnogo. Granice tako dobivenih
razreda nazivamo prave granice i razredi s takvim granicama se najee koriste u statistici.
37
O tipovima razdiobe podataka bit e vie rijei kasnije u poglavlju o mjerama asimetrije. Ovdje istaknimo
jedino da noviji statistiki radovi predlau da se irine razreda, umjesto izvedeno iz Sturgesova pravila, raunaju
prema Freedman Diaconisovoj formuli:
3
2 IQ
h
n
.
Primjer 1. Zadan je numeriki niz Smiljkovih mjesenih netoplaa (iskazanih u kn) u
proloj (2007.) godini:
1.810,25; 1.810,25; 1.810.25; 1.850,5; 1.850,5; 1.850,5; 1.862,4; 1.862,4; 1.862,4; 1.875,8;
1.875,8; 1.875,8
Izraunajmo Smiljkovu prosjenu mjesenu neto-plau u proloj godini:
1.810, 25 +1.810, 25 + 1.810.25 + 1.850, 5 + 1.850, 5 + 1.850, 5 + 1.862, 4 + 1.862, 4 + 1.862, 4
12
1.875, 8 + 1.875, 8 + 1.875, 8
1.849, 7375 1.849, 74
12
X = +
+ =
Dakle, Smiljkova prosjena mjesena netoplaa u proloj (2007.) godini iznosi priblino
1.849,74 kn. Uporabljujui ovakvu reenicu mi niz od ukupno 12 numerikih vrijednosti
zamjenjujemo jednom jedinom vrijednou: 1.849,74 kn. Stoga se prirodno postavlja pitanje
''uspjenosti'' takve zamjene, odnosno, preciznije, opisuje li dobivena vrijednost dovoljno
dobro niz podataka kojega zamjenjuje. Odgovor emo moi djelomino dati nakon
iskazivanja opih svojstava bilo koje aritmetike sredine, a potpuno nakon definiranja mjera
rasprenja (disperzije) u sljedeem poglavlju.
Ukoliko se aritmetika sredina rauna iz grupiranih podataka, govorimo o vaganoj ili
ponderiranoj aritmetikoj sredini. Pri izraunu vagane aritmetike sredine razlikujemo
sluajeve kad modaliteti kvantitativnoga obiljeja nisu grupirani u razrede i kad su modaliteti
kvantitativnoga obiljeja grupirani u razrede.
U prvom sluaju zapravo se radi o ''skrivenoj'' jednostavnoj aritmetikoj sredini jer grupiranje
podataka iskljuivo prema modalitetima nije nita drugo nego ''skraeni'' (tablini) zapis
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 66
numerikoga niza. Formalno, ako su x
1
, x
2
, , x
k
meusobno razliiti modaliteti
kvantitativnoga obiljeja, a f
1
, f
2
, , f
k
njima odgovarajue apsolutne frekvencije, onda se
vagana aritmetika sredina rauna pomou izraza
1 1 2 2 1
1 2
1
...
...
k
i i
k k i
k
k
i
i
f x
f x f x f x
X
f f f
f
=
=
+ + +
= =
+ + +
esto se kae da u izrazima ovoga oblika apsolutne frekvencije imaju ulogu pondera ili teine
pojedinoga modaliteta, pa otuda i naziv odgovarajue aritmetike sredine.
Primjer 2. Zadana je razdioba svih studenata 1. godine studija smjehologije na Vioj
uzaludnoj koli u pikovini (akademska godina 2007/2008.) prema broju poloenih
jednosemestralnih kolegija:
broj poloenih jednosemestralnih kolegija broj studenata
0 7
1 12
2 17
3 25
4 21
5 18
ukupno: 100
izvor: studentska sluba Vie uzaludne kole u pikovini
Navedena tablica zapravo zamjenjuje niz od 100 numerikih podataka koji se sastoji od 7
nula, 12 jedinica, 17 dvojki, 25 trojki, 21 etvorke i 18 petica. Budui da nam je bitno lake
umjesto ukupno 99 operacija zbrajanja izvriti 6 operacija mnoenja i 4 operacije zbrajanja,
prosjean broj poloenih jednosemestralnih ispita raunamo kao vaganu aritmetiku sredinu:
6
1
6
1
7 0 12 1 17 2 25 3 21 4 18 5 295
2.95
100 100
i i
i
i
i
f x
X
f
=
=
+ + + + +
= = = =
.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 67
Dobiveni rezultat obino interpretiramo ovako: Prosjean broj poloenih jednosemestralnih
kolegija po jednom studentu priblino iznosi 3.
61
Ovdje treba pripaziti i na red rijei u
reenici: prilog prosjeno uvijek dolazi neposredno ispred veliine na koju se odnosi. Stoga je
pogreno rei: Svi promatrani studenti prosjeno su poloili 3 jednosemestralna kolegija ili
Prosjean promatrani student poloio je 3 jednosemestralna kolegija jer sintagma prosjeno
poloiti obino znai poloiti s ocjenom dobar(3), a sintagma prosjean student obino znai
student iji je prosjek ocjena priblino 3,00. Odmah primijetimo da je tono 3
jednosemestralna kolegija uistinu poloilo tono 25 studenata, a ne svih 100, pa je u ovakvim
sluajevima nuno izraunati dodatne pokazatelje reprezentativnosti aritmetike sredine.
Zadatak 1. a) Definirajte statistiki skup iz prethodnoga primjera pojmovno, prostorno i
vremenski, pa odredite njegov opseg i odgovarajui osnovni skup.
b) Prema kojemu je obiljeju podijeljen zadani statistiki skup? U koju grupu obiljeja
pripada i uz koju je skalu izraavanja modaliteta vezano to obiljeje? Objasnite svoje
odgovore.
Aritmetika sredina moe se raunati i ukoliko su, umjesto, apsolutnih zadane odgovarajue
(''obine'') relativne frekvencije. Radi jednostavnosti, pretpostavimo da su relativne
frekvencije iskazane u postotcima. Formalno, ako su x
1
, x
2
, , x
k
meusobno razliiti
modaliteti kvantitativnoga obiljeja, a p
1
, p
2
, , p
k
njima odgovarajue relativne frekvencije
iskazane u postotcima
62
, onda se vagana aritmetika sredina rauna pomou izraza
1 1 2 2
1
...
k
k k i i
i
X p x p x p x p x
=
= + + + =
.
63
Ilustrirajmo primjenu ove formule na sljedeem primjeru.
Primjer 3. Podaci o broju djece u svakoj obitelji iz mjesta Svinjarevci u veljai 2008. godine
obraeni su i grafiki prikazani strukturnim krugom.
61
Strogo formalna interpretacija, sukladno definiciji aritmetike sredine, glasi: Svaki od promatranih studenata
poloio je prosjeno 3 jednosemestralna kolegija. No, u interpretacijama se obino primjenjuje zamjena izraza
''svaki element nekoga skupa X ima svojstvo S'' izrazom ''svi elementi skupa X imaju svojstvo S''.
62
Relativne frekvencije p
1
, , p
k
ovdje su razlomci s nazivnikom 100, ali mogu biti iskazane i kao proporcije
(decimalni zapisi omjera apsolutne frekvencije modaliteta i totala).
63
itatelji upoznati s osnovama diskretne teorije vjerojatnosti odmah e uoiti da je navedeni izraz zapravo
definicija matematikoga oekivanja diskretne sluajne varijable koja poprima vrijednosti x
1
, x
2
, , x
n
.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 68
Na temelju navedenih podataka moemo izraunati prosjean broj djece po jednoj obitelji iz
promatranoga mjesta:
7
1
16 0 18 1 28 2 23 3 9 4 4 5 2 6 211
2.11
100 100 100
i i
i
p x
X
=
+ + + + + +
= = = =
Dobiveni rezultat moemo objasniti ovako: Prosjean broj djece po jednoj (promatranoj)
obitelji jednak je 2. Opet treba pripaziti i na red rijei u reenici jer je pogreno rei npr.
Prosjena (promatrana) obitelj ima dvoje djece (kako to esto ine u javnim medijima!).
Zadatak 2. a) Definirajte statistiki skup u prethodnom primjeru pojmovno, prostorno i
vremenski, pa odredite pripadni osnovni skup.
b) Prema kojemu je obiljeju podijeljen zadani statistiki skup? U koju grupu obiljeja
pripada i uz koju je skalu izraavanja modaliteta vezano to obiljeje? Objasnite svoje
odgovore.
Spomenimo jo da vagana aritmetika sredina dobivena iz relativnih frekvencija teorijski
mora biti identiki jednaka jednostavnoj aritmetikoj sredini, ali da praktino dolazi do vie-
manje znaajnih odstupanja nastalih uslijed priblinih izrauna relativnih frekvencija. to je
priblini izraun relativnih frekvencija toniji, spomenuto odstupanje bit e manje, pa se u
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 69
ovakvim sluajevima preporuuje izraunavati relativne frekvencije na najmanje 5 decimalnih
mjesta.
U sluajevima poput netom razmotrenih, dakle, jednostavna aritmetika sredina identiki
mora biti jednaka vaganoj aritmetikoj sredini. No, ukoliko podatke grupiramo u razrede,
dolazi do razlika koje, u pravilu, ovise o veliini (irini) pojedinih razreda, a ne o ukupnom
broju razreda. Objasnimo nastajanje tih razlika na konkretnom primjeru.
Primjer 4. Zadana je razdioba svih nezaposlenih dravljana Republike Ljenarije u veljai
2008. godine prema dobi
navrene godine starosti broj nezaposlenih [000]
15 24 25.2
25 49 75.8
50 64 19.2
65 0.6
izvor: mjeseno statistiko izvjee Dravnoga zavoda za statistiku Republike Ljenarije, oujak 2008.
Da bismo mogli izraunati aritmetiku sredinu i u ovom sluaju, zadane nominalne granice
razreda trebamo pretvoriti u prave, te procijeniti gornju granicu posljednjega (otvorenoga)
razreda. Procijenit emo da spomenuta gornja granica jednaka 70. U sluaju obiljeja
navrene godine starosti prave granice se dobiju izjednaavanjem gornje granice prethodnoga
razreda s donjom granicom tekuega razreda :
navrene godine starosti broj nezaposlenih [000]
15 25 25.2
25 50 75.8
50 65 19.2
65 (70) 0.6
Prigodom raunanja aritmetike sredine iz podataka grupiranih u prave razrede, ulogu
ponder (tein) i dalje imaju apsolutne frekvencije, ali ''uloge'' modaliteta x
1
, x
2
, , x
k
preuzimaju razredne sredine. Tonije, za svaki pojedini razred trebamo izraunati njegovu
razredu sredinu, pa dobivenoj vrijednosti kao ponder pridruiti odgovarajujuu apsolutnu
frekvenciju. Upravo na ovom mjestu nastaju spomenute razlike izmeu jednostavne i vagane
aritmetike sredine: razliite podatke grupirane u isti razred zamjenjujemo istim podatkom, tj.
razrednom sredinom. Konkretno, razredna sredina prvoga razreda je
1
15 25
20
2
s
+
= = ,
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 70
pa u daljnjem izraunu niz od 25 200 podataka iz prvoga razreda meu kojima sigurno ima
meusobno razliitih (jer inae grupiranje u razrede nema smisla) zamjenjujemo nizom od
25 200 meusobno jednakih podataka i svaki od tih novih podataka jednak je razrednoj
sredini prvoga razreda, tj. 20. Budui da takvu zamjenu ne provodimo kod izrauna
jednostavne aritmetike sredine, nego pri njezinu izraunu rabimo originalne podatke, vagana
aritmetika sredina izraunata iz podataka grupiranih u razrede je u pravilu loiji reprezentant
promatranoga statistikoga skupa od jednostavne aritmetike sredine.
64
Izraunom razrednih sredina dobivamo:
navrene godine starosti razredna sredina broj nezaposlenih [000]
15 25 20 25.2
25 50 37.5 75.8
50 65 57.5 19.2
65 (70) 67.5 0.6
pa je vagana aritmetika sredina izraunata iz podataka grupiranih u razrede
65
:
4
1
4
1
25.2 20 75.8 37.5 19.2 57.5 0.6 67.5 4491
37.177
25.2 75.8 19.2 0.6 120.8
i i
i
i
i
f s
X
f
=
=
+ + +
= = =
+ + +
Dobiveni rezultat moemo interpretirati ovako: Procijenjeni prosjek navrenih godina starosti
promatranih dravljana priblino je jednak 37 (pogreno je rei npr. Prosjean nezaposleni
dravljanin Republike Ljenarije ima navrenih 37 godina ili neku slinu ''mudroliju''). Ovdje
obavezno moramo navesti rije procijenjena jer smo navedeni rezultat dobili koristei
procjenu gornje granice posljednjega razreda, te zamijenivi originalne podatke razrednim
sredinama (u svakom od tih sluajeva smo napravili odreenu pogreku, pa ne moemo
govoriti o stvarnoj, nego iskljuivo o procijenjenoj aritmetikoj sredini).
64
Iznimka''koja potvruje pravilo'' su nizovi podataka s ekstremno velikim ili ekstremno malim vrijednostima.
Grupiranjem takvih nizova u razrede i zamjenom originalnih podataka razrednom sredinom mogue je znatno
smanjiti razliku izmeu pojedinih ekstremno velikih vrijednosti i ostalih vrijednosti skupa, a time i donekle
poboljati reprezentativnost aritmetike sredine.
65
Prigodom izrauna aritmetike sredine ''mjernu jedinicu'' apsolutnih frekvencija (000) moemo zanemariti, tj.
ne moramo raunati s tisuama. Razlog tome je to se ista jedinica pojavljuje i u brojniku i u nazivniku
odgovarajuega razlomka, pa prigodom dijeljenja dolazi do njezinoga kraenja.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 71
Zadatak 3. a) Definirajte statistiki skup iz prethodnoga primjera pojmovno, prostorno i
vremenski, pa odredite njegov opseg.
b) Prema kojemu je obiljeju podijeljen zadani statistiki skup? U koju grupu obiljeja
pripada i uz koju je skalu izraavanja modaliteta vezano to obiljeje? Objasnite svoje
odgovore.
c) U koliko su razreda podijeljeni dobiveni podaci? Za svaki od njih odredite donju granicu,
gornju granicu i veliinu.
Za izraunavanje aritmetike sredine iz grupiranih podataka, umjesto apsolutnih, moemo
koristiti i relativne frekvencije. Radi jednostavnosti pretpostavit emo da su relativne
frekvencije ve iskazane u postotcima. U takvom sluaju razredne sredine imaju ulogu
modaliteta, a relativne frekvencije ulogu pondera (teina). Njihov je zbroj jednak 100, pa e
se u nazivniku odgovarajuega razlomka nai broj 100. Ilustrirajmo to primjerom.
Primjer 5. Zadana je struktura ena ovisnica o drogama lijeenih u zdravstvenim
ustanovama u Republici Hrvatskoj tijekom 2005. godine prema navrenim godinama starosti:
navrene godine starosti struktura [%]
14 0.5
15 19 12.1
20 24 27.0
25 29 25.8
30 34 14.4
35 39 18.0
40
2.2
ukupno: 100
izvor: ''ene i mukarci u Republici Hrvatskoj u 2007. godini, Dravni zavod za statistiku, 2008.
Procijenimo prosjenu navrenu dob svih promatranih ena. Kao donju granicu prvoga
razreda uzmimo 10, a kao gornju granicu posljednjega razreda uzmimo 60. Nominalne
granice pretvorimo u prave izjednaavanjem gornje granice prethodnoga razreda s donjom
granicom tekuega razreda:
navrene godine starosti struktura [%]
(10) 15 0.5
15 20 12.1
20 25 27.0
25 30 25.8
30 35 14.4
35 40 18.0
40 (60) 2.2
ukupno: 100
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 72
Kako smo ve istakli, u ovakvim sluajevima razredne sredine shvaamo kao modalitete, a
relativne frekvencije (iskazane u postotcima) kao pondere (teine). Zbroj svih relativnih
frekvencija uvijek je jednak 100, pa prije izrauna procijenjene aritmetike sredine najprije
moramo izraunati odgovarajue razredne sredine (s
i
):
navrene godine starosti razredna sredina struktura [%]
(10) 15 12.5 0.5
15 20 17.5 12.1
20 25 22.5 27.0
25 30 27.5 25.8
30 35 32.5 14.4
35 40 37.5 18.0
40 (60) 50 2.2
ukupno: 100
Procijenjena aritmetika sredina izraunata iz grupiranih podataka je:
7
1
0.5 12.5 12.1 17.5 27 22.5 25.8 27.5 14.4 32.5 18 37.5 2.2 50
100 100
2788
27.88
100
i i
i
p s
X
=
+ + + + + +
= = =
= =
Dobiveni rezultat moemo interpretirati ovako: Procijenjena prosjena dob svih promatranih
ena je priblino jednaka 28 godina (pogreno je npr. rei: Prosjena ena ovisnica o
drogama ima navrenu dob od 28 godina i sl.).
Naposljetku, u praksi se esto javlja sluaj kad treba izraunati ''prosjek prosjeka'', tj.
aritmetiku sredinu aritmetikih sredina. U takvim sluajevima treba poznavati apsolutne ili
relativne frekvencije odgovarajuih modaliteta
66
. Ulogu pondera (teina) u ovom sluaju
imaju zadane aritmetike sredine. Pokaimo to na primjeru:
Primjer 6. Zadani su podaci o ukupnom broju zaposlenih u Republici Hrvatskoj u podruju
financijskoga posredovanja na dan 31.3.2006. i njihovim prosjenim mjesenim neto
plaama u razdoblju od 01.01.2006. do 31.3.2006.
66
Zadavanje navedenih vrijednosti je nuan uvjet za izraun prosjene vrijednosti svih podataka. Bez
poznavanja navedenih vrijednosti izraun aritmetike sredine aritmetikih sredina je praktiki besmislen.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 73
vrsta djelatnosti broj zaposlenih prosjena mjesena
neto plaa [kn]
financijsko posredovanje
osim osiguranja i mirovinskih
fondova
25 310
6.616,00
osiguranje i mirovinski fondovi
osim obveznoga osiguranja
6 077 6.505,00
pomone djelatnosti u
financijskom posredovanju
1 763 4.444,00
ukupno: 33 150
izvor: Statistiki ljetopis Republike Hrvatske za 2006. godinu, Dravni zavod za statistiku, Zagreb, 2007.
Procijenimo prosjenu mjesenu netoplau svih promatranih zaposlenika u navedenom
razdoblju. Trebamo, dakle, izraunati aritmetiku sredinu aritmetikih sredina netoplaa.
Brojevi zaposlenih su apsolutne frekvencije i one imaju uobiajenu ulogu pondera (teine),
dok iznosi prosjenih netoplaa imaju ulogu modaliteta. Stoga je aritmetika sredina
aritmetikih sredina netoplaa jednaka
3
1
3
1
25310 6.616, 00 6077 6.505, 00 1763 4.444, 00 214.816.617, 00
6.480,14
25310 6077 1763 33150
i i
i
i
i
f x
X
f
=
=
+ +
= = =
+ +
Prema tome, procijenjena prosjena mjesena neto plaa svih promatranih zaposlenika u
navedenom razdoblju iznosi 6.480,14 kn. Rije procijenjena ovdje navodimo zato jer ne
znamo metodologiju izrauna zadanih prosjenih mjesenih netoplaa: mogue je da su one
izraunate iz originalnih podataka, ali je isto tako mogue da su izraunate i iz podataka
grupiranih u razrede. Stoga je u interpretaciji primjereno koristiti rije procijenjena neovisno
o tome to je mogue da je dobivena vrijednost ujedno i stvarna prosjena mjesena neto-
plaa promatranih zaposlenika.
Zadatak 4. a) Definirajte statistiki skup iz prethodnoga primjera pojmovno, prostorno i
vremenski, pa odredite njegov opseg.
b) Prema kojemu je obiljeju podijeljen zadani statistiki skup? U koju grupu obiljeja
pripada i uz koju je skalu izraavanja modaliteta vezano to obiljeje? Objasnite svoje
odgovore.
Primjer 7. (problem kolskih ocjena) Kako smo ve ranije istakli, kolske ocjene su primjer
kvalitativnoga redosljednoga obiljeja i vezane su uz redosljednu skalu izraavanja
modaliteta, pa se nad njima ne mogu provoditi osnovne raunske operacije. No, u praksi se u
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 74
brojnim sluajevima odreuje prosjena ocjena ili prosjek ocjena (kao zbroj svih ocjena
podijeljen s njihovim ukupnim brojem) iako ta veliina, prema dosad iskazanoj statistikoj
teoriji, uope nema smisla. U emu se zapravo sastoji ovaj prividni paradoks?
Prigodom odreivanja (pogreno: raunanja!) prosjene ocjene
67
mi zapravo kodiramo svaku
pojedinu ocjenu, tj. svakoj ocjeni bijektivno pridruujemo tono jedan prirodan broj: ocjeni
''nedovoljan'' pridruujemo prirodan broj 1, ocjeni ''dovoljan'' prirodan broj 2, ocjeni ''dobar''
prirodan broj 3, ocjeni ''vrlo dobar'' prirodan broj 4 i ocjeni ''izvrstan'' prirodan broj 5. Na taj
nain kvalitativni niz ocjena bijektivno preslikavamo u numeriki niz prirodnih brojeva, pa
budui da je na skupu prirodnih brojeva definirana operacija zbrajanja moemo raunati
aritmetiku sredinu dobivenoga numerikoga niza i zaokruiti je na najblii prirodan broj.
Jedno od osnovnih svojstava aritmetike sredine
68
je da se ona nalazi izmeu najmanje i
najvee vrijednosti u numerikom nizu, a to u ovom sluaju znai da je rije o jednom od
prirodnih brojeva izmeu 1 i 5. Dekodiranjem dobivenoga prirodnoga broja, tj. ''oitavanjem''
kojoj je ocjeni pridruen taj prirodan broj, dobivamo spomenutu prosjenu ocjenu.
Opisani postupak kodiranja i dekodiranja je vrlo est u statistici, a primjenjuje se u
sluajevima kad je niz kvalitativnih podataka potrebno (dovoljno reprezentativno) opisati
tono jednim podatkom. Alternativni naini opisivanja takvih podataka u sluaju redosljednih
obiljeja mogu biti i odreivanje moda ili medijana
69
.
Na kraju ove toke navodimo osnovna svojstva aritmetike sredine koja uvelike mogu
koristiti pri gruboj procjeni
70
je li izraunata aritmetika sredina dobar reprezentant
numerikoga niza.
Svojstvo 1. Svaka razdioba u kojoj su vrijednosti obiljeja pridruene elementima skupa na
temelju intervalne ili omjerne skale ima aritmetiku sredinu.
Svojstvo 2. (potpunost) Pri izraunu aritmetike sredine niza numerikih podataka
obuhvaene su sve vrijednosti numerikoga niza.
Svojstvo 3. (jedinstvenost) Svaki numeriki niz ima tono jednu aritmetiku sredinu.
Svojstvo 4. Aritmetika sredina moe posluiti za usporedbu dvaju ili vie numerikih nizova
nastalih grupiranjem prema istom kvantitativnom obiljeju.
Svojstvo 5. Aritmetika sredina se uvijek nalazi izmeu najmanje (x
min
) i najvee (x
max
)
vrijednosti numerikoga niza, tj. vrijede nejednakosti:
67
Napomenimo da se prosjena ocjena praktino ne rauna ukoliko je barem jedan element odgovarajuega
kvalitativnoga niza jednak ''nedovoljan''. To osobito znaju uenici koji mue muku s ''ispravljanjem ocjena''.
68
Vidjeti svojstvo 5. na sljedeoj stranici.
69
Navedeni se naini u kolstvu ipak ne primjenjuju unato injenici da bi cjelokupna uenika populacija
nesumnjivo zduno podrala da zakljuna ocjena iz nekoga predmeta bude mod niza pozitivnih ocjena pojedinih
podruja iz dotinoga predmeta.
70
Statistike pokazatelje ''finijih'' procjena reprezentativnosti aritmetike sredine navodimo u sljedeem
poglavlju.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 75
x
min
X x
max
.
Svojstvo 6. Aritmetika je sredina jedina srednja vrijednost takva da je zbroj odstupanja svih
elemenata numerikoga niza od nje uvijek jednak nuli.
71
Tonije, vrijede sljedee jednakosti:
1
( ) 0
n
i
i
x X
=
=
1
( ) 0
n
i i
i
f x X
=
=
Svojstvo 7. (svojstvo minimuma zbroja kvadrata) Neka je x
1
, x
2
, , x
k
zadani numeriki niz
podataka. Tada realna funkcija f(x) =
2
1
( )
n
i
i
x x
=
= =
.
Primjer 2. Zadana je razdioba studenata 1. godine strunoga studija raunovodstva i financija
na Veleuilitu u Pikorevcima dana 20.3.2008. prema broju lanova domainstva u kojemu
ive.
broj lanova domainstva broj studenata
2 25
3 20
4 30
5 15
6 10
ukupno: 100
Geometrijska sredina zadane razdiobe jednaka je
100 25 20 30 15 10
2 3 4 5 6 G = 3.419482401.
U promatranim primjerima osnovni je problem bio to dobiveni rezultat nismo mogli
uobiajeno interpretirati. Drugim rijeima, mogli smo rei da je prosjena vrijednost svih
lanova niza u Primjeru 1. priblino jednaka 2.6, a prosjean broj lanova domainstva po
jednom studentu iz Primjera 2. priblino jednak 3, ali te bismo interpretacije uobiajeno
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 77
shvaali kao interpretacije aritmetike sredine zbog ve istaknutoga uobiajenoga
poistovjeivanja pojma prosjek s aritmetikom sredinom. Stoga se namee pitanje u kojim
situacijama geometrijsku sredinu moemo tono interpretirati kao prosjenu vrijednost neke
pojave. Tipina takva situacija je raunanje prosjene promjene cijena u nekom promatranom
razdoblju
74
. Tonije, promatramo sljedei opi problem:
Problem: Neka se pojava (npr. cijena, mjesena plaa, broj stanovnika) tijekom razdoblja od
ukupno n vremenskih jedinica promijenila ukupno m puta. Oznaimo te promjene s p
1
, p
2
, ,
p
m
i pretpostavimo da su iskazane u postotcima. Odredimo prosjenu promjenu p promatrane
pojave u jednoj vremenskoj jedinici.
Odgovor: Neka je C
0
poetna vrijednost pojave, a C
n
njezina vrijednost na kraju razdoblja od
n vremenskih jedinica. Koristei formulu za sukcesivnu promjenu osnovne svote
75
dobivamo
da istodobno moraju vrijediti sljedee jednakosti:
0
1 2
0
1
100
1 1 ... 1
100 100 100
n
n
m
n
p
C C
p p p
C C
| |
= +
|
\
| | | | | |
= + + +
| | |
\ \ \
Lijeve strane tih jednakosti su jednake, pa takve moraju biti i desne strane. Njihovim
izjednaavanjem i sreivanjem dobivenoga izraza dobiva se
1 2
100 1 1 ... 1 1
100 100 100
m
n
p p p
p
(
| | | | | |
= + + +
(
| | |
\ \ \
(
.
U sluaju kad je ukupan broj promjena (m) jednak ukupnom broju razdoblja (n) gornju
jednakost moemo zapisati u obliku
1 2
(100 ) (100 ) ... (100 ) 100
n
n
p p p p = + + + ,
pa je u takvim sluajevima prosjena promjena pojave u jedinici vremena jednaka razlici
geometrijske sredine niza 100 + p
1
, 100 + p
2
, , 100 + p
n
i broja 100.
76
74
Takva situacija pripada u analizu vremenskih nizova, o emu emo vie rei u posebnom poglavlju.
75
Preporuuje se ponoviti gradivo postotnoga rauna od sto iz kolegija Gospodarska matematika.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 78
Ilustrirajmo netom provedeno razmatranje na primjerima.
Primjer 3. Cijena loivoga ulja se u minula dva mjeseca mijenjala tono etiri puta: najprije
je poveana za 0.5%, potom je poveana za daljnjih 0.7%, pa je sniena za 0.2% i naposljetku
poveana za jo 1.5%. Odredimo prosjenu mjesenu promjenu cijene loivoga ulja.
Jedinino vremensko razdoblje je 1 mjesec, pa je ukupan broj jedininih razdoblja n = 2, a
ukupan broj promjena cijena m = 4. Te promjene iznose redom p
1
= +0.5, p
2
= +0.7, p
3
= 0.2
i p
4
= +1.5. (Predznak + oznaava da je rije o poveanju cijene, a predznak oznaava da je
rije o snienju cijene.) Traena prosjena promjena jednaka je
1 2 3 4
100 1 1 1 1 1
100 100 100 100
0.5 0.7 0.2 1.5
= 100 1 1 1 1 1
100 100 100 100
1.250239
p p p p
p
(
| | | | | | | |
= + + + + =
(
| | | |
\ \ \ \
(
(
| | | | | | | |
+ + + +
(
| | | |
\ \ \ \
(
Uoimo da je, zbog relativno male razlike izmeu navedenih numerikih vrijednosti,
navedena prosjena promjena priblino jednaka
1 2 3 4 1
0.5 0.7 ( 0.2) 1.5
1.25
2 2
m
i
i
p
p p p p
p
n
=
+ + + + + +
= = =
77
,
ali ne i aritmetikoj sredini svih etiriju promjena koja iznosi
0.5 0.7 ( 0.2) 1.5
4
a
p
+ + +
= = 0.625.
No, u sluajevima kad izmeu numerikih vrijednosti promjena postoje vee razlike, razlika
izmeu aritmetike i geometrijske sredine je bitno izraenija, kako pokazuje sljedei primjer.
76
Brojevi 100 + p
1
, , 100 + p
n
u praksi se nazivaju verini (lanani) indeksi. O njima emo neto vie rei u
toki 5.5.1.
77
Navedeni priblini izraz, naravno, nije aritmetika sredina promatranih promjena jer zbroj svih lanova
numerikoga niza ne dijelimo ukupnim brojem tih lanova.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 79
Primjer 4. Cijena etvornoga metra (''kvadrata'') zemljita u Lokvama u protekle je dvije
godine najprije udvostruena, a potom poveana za jo 20%. Odredimo prosjenu godinju
promjenu cijene etvornoga metra toga zemljita. Iz navedenih podataka vidimo da su
numerike vrijednosti promjena p
1
= +100 i p
2
= +20. Ukoliko bismo traenu prosjenu
godinju promjenu raunali kao jednostavnu aritmetiku sredinu (to je i formalno ispravno
jer imamo dvije promjene u dvije godine), dobili bismo:
100 20
60
2
a
p
+
= = ,
pa bismo zakljuili da se promatrana cijena poveavala za prosjeno 60% godinje. No,
izraunom pomou navedene formule za prosjenu promjenu dobivamo:
(100 100) (100 20) 100 54.91933 p = + + ,
pa zakljuujemo da se promatrana cijena poveavala za prosjeno (priblino) 55% godinje.
Provjerimo dobivena razmatranja uzimajui da je poetna cijena etvornoga metra zemljita
100,00 . Tada je cijena nakon prvoga poveanja 200,00 , a nakon drugoga 240,00 .
Ukoliko cijenu od 100,00 poveavamo dva puta po 60%, dobit emo najprije 160,00 , a
potom 256,00 , to je za 16 (ili 6.67%) vie od stvarne krajnje cijene zemljita. No, ukoliko
cijenu od 100,00 poveavamo dva puta po 54.91933% dobit emo najprije 154,92 , a
potom cijenu od 240,00 , to je i stvarna krajnja cijena.
Netom provedena razmatranja u praksi treba provoditi vrlo oprezno jer je njihov temeljni
nedostatak injenica da prigodom izrauna prosjene promjene zapravo uzimaju u obzir
jedino poetnu i konanu vrijednost pojave, ali ne i njezine meuvrijednosti, to ponekad
moe dovesti do potpuno pogrenih zakljuaka. Pogledajmo to na primjeru.
Primjer 5. Cijena automobila ''Ficho'' u protekle se dvije godine mijenjala dva puta: najprije
je udvostruena, a potom ''prepolovljena'' (sniena za 50%). Poetna cijena je tada oito
jednaka krajnjoj, pa uvrtavanjem p
1
= +100, p
2
= 50 u formulu za prosjenu promjenu
cijene dobivamo da je ta promjena jednaka
(100 100) (100 50) 100 p = + = 0,
otkuda slijedi da se u prosjeku cijena automobila godinje nije mijenjala (pogreno je rei:
prosjena cijena automobila se godinje nije mijenjala!). Taj zakljuak, meutim, oito
nedovoljno reprezentativno opisuje navedeno kretanje cijena automobila jer smo u
promatrane dvije godine imali ukupno dvije razliite promjene: jedno poveanje i jedno
snienje. Aritmetika sredina je jo loiji pokazatelj:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 80
100 ( 50)
25
2
a
p
+
= = ,
pa bismo zakljuili da se cijena automobila prosjeno poveavala za 25% godinje, to je u
suprotnosti s tonom injenicom da je poetna cijena automobila jednaka njegovoj krajnjoj
cijeni. Stoga sve vrste sredina treba primjenjivati oprezno i uz dodatne statistike analize, a
nikako ''ablonski'' i prema nekom automatizmu.
3.1.3. Harmonijska sredina
Neka je x
1
, x
2
, , x
n
konaan numeriki niz podataka takav da za svaki i = 1, 2, , n vrijedi
nejednakost x
i
> 0. Harmonijska sredina (oznaka: H) navedenoga numerikoga niza definira
se kao reciprona vrijednost aritmetike sredine recipronih vrijednosti svih elemenata
niza.
78
. Za numerike nizove kojima je barem jedan lan najvie jednak nuli harmonijska
sredina se ne definira.
Sukladno navedenoj definiciji, harmonijska sredina negrupiranih numerikih podataka rauna
se iz izraza:
1 2 1
1 1 1 1
...
n
n i i
n n
H
x x x x
=
= =
+ + +
.
Primjer 1. Odredimo harmonijsku sredinu niza 2, 3, 6. Ona je jednaka
3
3
1 1 1
2 3 6
H = =
+ +
.
Pretpostavimo sada da su podaci grupirani, tj. da imamo ukupno n razliitih modaliteta x
1
, x
2
,
, x
n
. Za svaki i = 1, 2, , n oznaimo s f
i
apsolutnu frekvenciju modaliteta x
i
. Tada je
vagana (ponderirana) harmonijska sredina izraunata iz grupiranih podataka dana izrazom
78
Iako se od itanja naglas ove definicije moe zapetljati jezik, navedena je definicija uistinu jedina potpuno
ispravna definicija harmonijske sredine.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 81
1 2 1
1 2
1 1 2
...
...
n
i
n i
n
n i
i n i
f
f f f
H
f f f f
x x x x
=
=
+ + +
= =
+ + +
.
Primjer 2. Odredimo harmonijsku sredinu za razdiobu iz Primjera 2. u toki 3.1.2.:
broj lanova domainstva broj studenata
2 25
3 20
4 30
5 15
6 10
ukupno: 100
Ona je jednaka
5
1
5
1
100 150
3.19149
25 20 30 15 10
47
2 3 4 5 6
i
i
i
i i
f
H
f
x
=
=
= = =
+ + + +
.
Kao ni u sluaju geometrijske sredine, ni ovdje interpretacije Prosjena vrijednost svih
lanova niza 2, 3, 6 jednaka je 3 i Prosjean broj lanova domainstva po jednom studentu
priblino je jednak 3 ne zvue kao prirodne interpretacije harmonijske sredine.
79
Zbog toga
hamonijsku sredinu koristimo prigodom rjeavanja problema u kojima se pojavljuju obrnuto
razmjerne veliine. U nastavku dajemo dva primjera takvih problema.
Primjer 1. etiri radnika rade istovrstan posao, ali razliitim brzinama. U etiri sata prvi je
radnik izradio 48 komada proizvoda, drugi 80 komada, trei 96 komada, a etvrti 120
komada. Odredimo prosjeno vrijeme izrade jednoga proizvoda za sve radnike zajedno, te
prosjean broj izraenih proizvoda po jednoj osmosatnoj radnoj smjeni.
79
Prilikom itanja ovih dviju interpretacija, ali bez naznake o kojoj se srednjoj vrijednosti radi, svaki
nestatistiki nastrojen homo sapiens odmah bi pomislio da je rije o interpretaciji aritmetike sredine.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 82
Za izradu jednoga proizvoda prvi radnik utroi t
1
=
4 1
48 12
= sati, drugi t
2
=
4 1
80 20
= sati, trei
t
3
=
4 1
96 24
= sati, a etvrti t
4
=
4 1
120 30
= sati. Mi traimo vrijeme t za koje e etvorica
radnika proizvesti ukupno 4 proizvoda. Za navedeno vrijeme t prvi e radnik proizvesti
ukupno
1
12
t
proizvoda, drugi
1
20
t
proizvoda, trei
1
24
t
proizvoda, a etvrti
1
30
t
proizvoda, pa
e sva etvorica u vremenu t proizvesti ukupno
1
12
t
+
1
20
t
+
1
24
t
+
1
30
t
=
t
1 1 1 1
1 1 1 1
12 20 24 30
| |
|
+ + +
|
|
\
proizvoda. Taj broj treba biti jednak 4, pa dobivamo jednadbu
t
1 1 1 1
1 1 1 1
12 20 24 30
| |
|
+ + +
|
|
\
= 4
iz koje je
4
1 1 1 1
1 1 1 1
12 20 24 30
t =
+ + +
.
Prema definiciji harmonijske sredine, odavde izravno slijedi da je traeno prosjeno vrijeme
izrade jednoga proizvoda za sva etiri radnika zajedno jednako harmonijskoj sredini niza t
1
,
t
2
, t
3
, t
4,
tj. niza
1 1 1 1
, , ,
12 20 24 30
:
1
4 4 4 2
1 1 1 1 1 12 20 24 30 86 43
1 1 1 1
12 20 24 30
n
i i
n
H
t
=
= = = = =
+ + +
+ + +
radna sata.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 83
Provjerimo dobiveni rezultat. Za
2
43
sata prvi e radnik proizvesti prosjeno
2
24
43
1
43
12
=
proizvoda, drugi prosjeno
2
40
43
1
43
20
= proizvoda, trei prosjeno
2
48
43
1
43
24
= proizvoda, a etvrti
prosjeno
2
60
43
1
43
30
= proizvoda. Stoga e sva etvorica radnika za
2
43
sata proizvesti prosjeno
24 40 48 60 172
4
43 43 43 43 43
+ + + = = proizvoda. Odatle izravno slijedi da e za 8 radnih sati
promatrana etvorica radnika proizvesti prosjeno
8
2
43
= 172 proizvoda.
Primjer 2. U donjoj su tablici navedeni podaci o prosjenoj prodajnoj cijeni udbenika iz
Poslovne statistike autora Statha Isticka tijekom 2007. godine, te strukturi vrijednosti prodaje
u trima prodajnim podrujima
prodajno
podruje
prosjena prodajna cijena
[kn]
struktura vrijednosti
prodaje [%]
sjever 290,00 25
sredinja regija 300,00 35
jug 295,00 40
Odredimo prosjenu prodajnu cijenu za sva tri prodajna podruja zajedno. Podsjetimo se,
vrijednost prodaje jednaka je umnoku ukupnoga broja prodanih proizvoda i cijene jednoga
proizvoda, dok je prosjena prodajna cijena jednaka koliniku vrijednosti prodaje i ukupnoga
broja prodanih proizvoda. Budui da su postoci vrijednosti prodaje upravno razmjerni
vrijednostima prodaje svakoga pojedinoga podruja, traenu prosjenu prodajnu cijenu
izraunat emo kao vaganu harmonijsku sredinu shvaajui prosjene prodajne cijene kao
modalitete, a strukture vrijednosti prodaje kao pondere (teine):
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 84
3
1
3
1
25 35 40
295, 45
25 35 40
290 300 295
i
i
i
i i
p
H
p
x
=
=
+ +
= =
+ +
kn.
Zakljuno istaknimo da meu trima sredinama numerikoga niza vrijedi poznata A G H
nejednakost, tj. ako su A, G i H redom aritmetika, geometrijska i harmonijska sredina istoga
numerikoga niza, onda vrijedi nejednakost
H G A.
Znakovi jednakosti vrijede ako i samo ako je odgovarajui numeriki niz konstantan, tj. ako
je a
k
= c, za neki strogo pozitivan realan broj c 0, + i za svaki k = 1, 2, , n.
3.1.4. Kvantili
Neka je x
1
, x
2
, , x
m
niz modaliteta kvantitativnoga ili kvalitativnoga redosljednoga obiljeja.
Svaki takav niz moemo urediti tako da podatke ili poredamo po veliini (od najmanjega do
najveega ili obrnuto) ako je rije o modalitetima kvantitativnoga obiljeja ili poredamo
prema stupnjevima intenziteta mjerenoga svojstva ako je rije o modalitetima kvalitativnoga
redosljednoga obiljeja. Na taj nain dobivamo ureeni niz podataka.
Primjer 1. a) Niz kvantitativnih modaliteta 10, 7, 14, 5, 20, 8 moemo zapisati kao ureeni
niz 5, 7, 8, 10, 14, 20 ili kao ureeni niz 20, 14, 10, 8, 7, 5.
b) Niz kvalitativnih redosljednih modaliteta SSS, VSS, VS, VSS, SSS, VS, VS, VSS,
SSS moemo zapisati kao ureeni niz SSS, SSS, SSS, VS, VS, VS, VSS. VSS, VSS ili
kao ureeni niz VSS, VSS, VSS, VS, VS, VS, SSS, SSS, SSS.
U daljnjem, radi odreenosti, pretpostavljamo da je konaan niz kvantitativnih, odnosno
kvalitativnih redosljednih modaliteta ureen uzlazno, tj. od najmanjega (najloijega) prema
najveemu (najboljemu), te promatramo iskljuivo tako ureene konane nizove. Problem
koji emo razmatrati jest:
Problem 1: Zadani ureeni konaan niz podijeliti na jednakobrojne dijelove zadravajui
pritom svojstvo ureenosti niza. Formalnije i preciznije, ureeni skup S = (x
1
, x
2
, , x
m
)
podijeliti na n ureenih podskupova S
1
, S
2
, , S
n
tako da vrijede sljedea svojstva:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 85
1.) card(S
1
) = card(S
2
) = = card(S
n
), tj. svi podskupovi S
1
, S
2
, , S
n
imaju jednako mnogo
elemenata;
2.) za svaki i = 2, , n svaki element skupova S
1
, S
i
1
nije vei od svakoga elementa
skupa S
i
ili, ekvivalentno, za svaki x
1
1
i
k
k
S
i svaki y S
i
vrijedi nejednakost x y;
3.) svaka dva uzastopna lana niza S
1
, S
2
, , S
n
imaju najvie jedan zajedniki element, dok
nesusjedni lanovi niza nemaju niti jedan zajedniki element;
4.)
1
n
i
i
S
=
= S
1
S
2
S
n
= S, tj. unija
80
svih ureenih podskupova treba biti jednaka
polaznom ureenom skupu.
Odmah primijetimo da u postavci navedenoga problema nema uobiajenoga zahtjeva da
skupovi na koje dijelimo polazni ureeni skup nemaju niti jedan zajedniki element, tj. da su
meusobno disjunktni. Taj zahtjev je namjerno izostavljen jer dozvoljavamo mogunost da se
isti lan niza pojavi u dva uzastopna podskupa. Formalno se ne navodi niti bilo kakva veza
izmeu brojeva m i n, no, moe se pokazati da iz uvjeta 1.), 3.) i 4.) slijedi nejednakost n m.
Ona se intuitivno moe objasniti kao injenica da ureeni skup od m elemenata moemo
podijeliti na najvie m dijelova tako da svi dijelovi imaju jednako mnogo elemenata.
Primjer 2. Sukladno gore navedenim uvjetima, podijelimo ureeni niz 1, 2, 3, 4 na dva
jednakobrojna dijela. Traimo dva ureena podskupa S
1
i S
2
ureenoga skupa S = (1, 2, 3, 4)
takva da svaki element skupa S
1
nije vei od svakoga elementa skupa S
2
, da skupovi S
1
i S
2
imaju najvie jedan zajedniki element, te da njihova unija daje skup S. Lako se vidi da je
jedina mogunost takve podjele S
1
= (1, 2) i S
2
= (3, 4).
Primjer 3. Sukladno uvjetima problema, ureeni niz iz Primjera 1. podijelimo na tri
jednakobrojna dijela. Sada traimo tri ureena podskupa S
1
, S
2
i S
3
takva da svaki element
skupa S
1
nije vei od svakoga elementa skupa S
2
i svaki element skupa S
2
nije vei od svakoga
elementa skupa S
3
, te da unija svih triju ureenih skupova daje skup S. Nije teko vidjeti da je
jedina mogunost takve podjele S
1
= (1, 2), S
2
= (2, 3) i S
3
= (3, 4). Uoimo da skupovi S
1
i S
2
imaju zajedniki element 2, skupovi S
2
i S
3
zajedniki element 3, dok skupovi S
1
i S
3
nemaju
zajednikih elemenata.
80
Navedenu uniju dobijemo tako da svaki od podskupova najprije shvatimo kao ''obian'' skup, napravimo
uobiajenu operaciju unije skupova uz dozvoljeno ponavljanje elemenata, a potom uredimo dobiveni skup.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 86
Primjer 4. Sukladno uvjetima problema, ureeni niz 1, 2, 3 podijelimo na dva jednakobrojna
dijela. U ovom se sluaju dobiva S
1
= (1, 2) i S
2
= (2, 3). Uoimo da skupovi S
1
i S
2
imaju
zajedniki element 2.
Netom razmatrani problem poopuje se u matematikoj statistici, i to prigodom prouavanja
svojstava kumulativne funkcije distribucije sluajne varijable
81
. Ondje se Problem 1. svodi na
to da se za zadanu sluajnu varijablu X i zadani realan broj p 0, 1 odredi vrijednost x
takva da je vjerojatnost da je vrijednost sluajne varijable X strogo manja od x jednaka
najvie p, a vjerojatnost da je vrijednost sluajne varijable X strogo vea od x jednaka najvie
1 p. Moe se pokazati da traena vrijednost x uistinu postoji i da je jedinstvena, te se ona
naziva pkvantil. Kvantili su vrlo znaajni i u deskriptivnoj statistici, ali njihov osnovni
nedostatak je nemogunost tone interpretacije: deskriptivna statistika ''ne poznaje'' termin
sluajna varijabla, pa se gornja, tona definicija p kvantila mora preinaiti, ime se gubi na
preciznosti (i istinitosti) interpretacije. Priblini deskriptivni ''ekvivalent'' p kvantila je tzv.
(per)centil i njega opisujemo u nastavku.
Percentili ili centili su poloajne vrijednosti koje ureeni niz dijele na ukupno 100
jednakobrojnih dijelova. Ima ih ukupno 100 1 = 99 i oznaavaju se s P
1
, P
2
, P
3
, , P
98
, P
99
.
Priblina formula za izraun k toga percentila P
k
za ureeni niz x
1
, x
2
, , x
m
dana je s:
P
k
= x
c + 1
+ d (x
c + 2
x
c + 1
), za k = 1, 2, , 98, 99,
gdje je c cijeli, a d decimalni dio broja
100
k
(m 1).
82
(Priblina i matematiki neprecizna!)
Interpretacija k toga percentila P
k
obino je jedna od sljedeih interpretacija:
prvih k% lanova niza ima vrijednost manju ili jednaku P
k
,
(100 k)% lanova niza ima vrijednost veu ili jednaku P
k
.
Nerijetko se (opet priblino tono i matematiki neprecizno) kae i da k ti percentil P
k
odvaja k% najmanjih lanova niza, odnosno (100 k)% najveih lanova niza.
81
U matematikoj je statistici sluajna varijabla bilo koja realna funkcija ije je podruje definicije odreeni
vjerojatnosni prostor. Ovdje je spominjemo iskljuivo u kontekstu definiranja kvantila.
82
Upravo navedenu formulu koristi MS Excel prigodom izrauna vrijednosti pojedinih percentila.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 87
Primjer 5. Prikupljanjem podataka o navrenim godinama radnoga staa za ukupno 60
zaposlenika tvrtke ''Mukali commerce d.o.o'' iz Klokoevca i odgovarajuim izraunom
dobivena je vrijednost
P
5
= 7.25
Dobivenu vrijednost moemo interpretirati na jedan od sljedeih dvaju naina:
5% promatranih zaposlenika ima najvie 7.25 godina navrenoga radnoga staa;
95% promatranih zaposlenika ima barem 7.25 godina navrenoga radnoga staa.
Budui da znamo ukupan broj zaposlenih (60), navedene interpretacije zapravo znae da:
- priblino 3 zaposlenika promatrane tvrtke imaju najvie 7 godina navrenoga radnoga
staa;
- priblino 57 zaposlenika ima barem 8 godina navrenoga radnoga staa.
Odmah istaknimo da ovdje prilog ''priblino'' ne znai da npr. tono 3.14 zaposlenika ima
najvie 7 godina navrenoga staa (pa smo taj broj zaokruili na najblii cijeli broj). Greka je
bitno vea: mogue je da tono 2 zaposlenika ili tono 4 zaposlenika promatrane tvrtke imaju
najvie 7 godina navrenoga radnoga staa. Zbog toga je u ovakvim interpretacijama bolje
izbjegavati navoenje konkretnih apsolutnih frekvencija.
Primjer 6. Prikupljanjem podataka o visinama (iskazanima kao cijeli broj cm) za ukupno 30
uenika 8.a razreda Osnovne kole ''tefica niclek'' iz Careva Sela i odgovarajuim
izraunom dobivena je vrijednost
P
30
= 170.66
Dobivenu vrijednost moemo interpretirati na jedan od sljedeih dvaju naina:
30% promatranih uenika visoko je najvie 170.66 cm;
70% promatranih zaposlenika visoko je barem 170.66 cm.
U ovom je sluaju obiljeje ''visina'' kvantitativno diskretno obiljeje (jer zanemarujemo
milimetre, mikrometre itd.), pa navedene interpretacije moemo preformulirati ovako:
30% promatranih uenika visoko je najvie 170 cm;
70% promatranih zaposlenika visoko je barem 171 cm.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 88
Kao i u Primjeru 5., budui da znamo ukupan broj uenika, navedene interpretacije zapravo
znae da je priblino 9 promatranih uenika visoko najvie 170 cm, dok visina svakoga od
preostalih 21 uenika iznosi barem 171 cm. Meutim, mogue je i da tono 10 promatranih
uenika bude visoko najvie 170 cm, pa je opet primjerenije izostaviti interpretaciju s
apsolutnim frekvencijama.
U praksi se vrlo esto koriste dvije posebne vrste percentila: decili i kvartili. Decili su
vrijednosti koje ureeni niz modaliteta dijele na 10 jednakobrojnih dijelova. Ima ih ukupno
10 1 = 9 i oznaavaju se s D
1
, D
2
, , D
9
. Nije teko vidjeti da za svaki i = 1, 2, , 8, 9
vrijedi jednakost
D
i
= P
10 i
koja, zapravo, tvrdi da je i ti decil identiki jednak (10 i) tom percentilu. Ovo vrlo
korisno svojstvo omoguuje da se interpretacija svakoga decila poistovjeti s interpretacijom
njemu odgovarajuega percentila.
Primjer 7. Prikupljanjem podataka o ostvarenom uspjehu (1 nedovoljan, 2 dovoljan, , 5
izvrstan) svih studenata 1. godine strunoga studija raunovodstva i financija Veleuilita u
pikovini akademske godine 2006/2007. koji su kolegij Poslovna statistika polagali putem
dvaju kolokvija i odgovarajuim izraunom dobivena je vrijednost
D
4
= 1.25
Rije je o 4. decilu, a toj vrijednosti odgovara 10 4 = 40. percentil. Stoga dobivenu
vrijednost moemo teorijski interpretirati na jedan od sljedeih dvaju naina:
40% promatranih studenata dobilo je ocjenu najvie 1.25;
60% promatranih studenata dobilo je ocjenu barem 1.25.
Budui da da dobivanje ocjene 1 znai da kolokviji nisu poloeni, navedene interpretacije
moemo preformulirati u sljedee:
40% promatranih studenata nije poloilo kolegij Poslovna statistika putem kolokvija;
60% promatranih studenata je poloilo kolegij Poslovna statistika putem kolokvija.
Primjer 8. Prikupljanjem podataka o stupnju strune spreme (uz uobiajeno rangiranje
stupnjeva strunih sprema) za svakoga zaposlenika tvrtke ''Pijetlovi d.o.o.'' i odgovarajuim
izraunom dobivena je vrijednost
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 89
D
8
= VS.
Rije je o 8. decilu, a toj vrijednosti odgovara 10 8 = 80. percentil. Stoga dobivenu
vrijednost moemo teorijski interpretirati na jedan od sljedeih dvaju naina:
80% promatranih zaposlenika ima viu strunu spremu ili strunu spremu manju od
vie strune spreme;
20% promatranih zaposlenika ima viu strunu spremu ili strunu spremu veu od vie
strune spreme.
Budui da je jedino visoka struna sprema vea od vie strune spreme, drugu interpretaciju
moemo pojednostavniti ovako: 20% promatranih zaposlenika ima viu ili visoku strunu
spremu. U ovom je sluaju ta interpretacija jednostavnija i razumljivija od prve.
Uoimo da se u Primjerima 3. i 4. radilo o odreivanju percentila za niz modaliteta
kvalitativnoga redosljednoga obiljeja.
Jo jedna od spomenutih posebnih vrsta percentila su kvartili. Kvartili su poloajne
vrijednosti koje ureeni numeriki niz dijele na ukupno 4 jednakobrojna dijela. Ima ih ukupno
4 1 = 3, a imaju svoja posebna imena i oznake:
prvi ili donji kvartil (oznaka: Q
1
);
drugi kvartil ili medijan (oznake: Q
2
, M
e
);
trei ili gornji kvartil (oznaka: Q
3
)
Nije teko vidjeti da za svaki i = 1, 2, 3 vrijedi jednakost
Q
i
= P
25 i
koja, zapravo, tvrdi da je i ti kvartil identiki jednak (25 i) tom percentilu. Ovo vrlo
korisno svojstvo omoguuje da se interpretacija svakoga kvartila poistovjeti s interpretacijom
njemu odgovarajuega percentila. Istaknimo da se u sluajevima u kojima, zbog postojanja
ekstremno malih ili ekstremno velikih vrijednosti, aritmetika sredina nije reprezentativan
pokazatelj statistikoga niza kao ''zamjenski'' pokazatelji rabe upravo kvartili, a poglavito
medijan.
Primjer 9. Zadan je ureeni niz prosjenih mjesenih plaa (iskazanima u kn) svih stalno
zaposlenih djelatnika poduzea "Schwindltrade d.o.o." iz uplje Lipe u razdoblju od
01.01.2007. 31.12.2007.:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 90
1.852,95; 1.884,76; 2.248,62; 2.417,25; 2.646,27; 2.718,12; 2.947,83; 3.085,45; 3.090,31;
50.000,64; 60.000,75
Odgovarajuim izraunima se dobiva:
prvi ili donji kvartil: Q
1
= 2.332,935;
medijan: Q
2
= 2.718,12;
trei ili gornji kvartil: Q
3
= 3.087,88;
jednostavna aritmetika sredina: X = 12.081,18 (kn)
Te vrijednosti moemo redom interpretirati na sljedei nain:
25% promatranih djelatnika ima prosjenu mjesenu plau manju od 2.332,94 kn;
50% promatranih djelatnika ima prosjenu mjesenu plau najvie 2.718,12 kn;
25% promatranih djelatnika ima prosjenu mjesenu plau veu od 3.087,88 kn;
Prosjena mjesena plaa svakoga djelatnika navedene tvrtke iznosi 12.081,18 kn.
Iz zadanoga ureenoga niza lako moemo vidjeti da tono 6 promatranih djelatnika ima
prosjenu mjesenu plau najvie 2.718,12 kn, dok 6 promatranih djelatnika ima prosjenu
mjesenu plau barem 2.718,12 kn. (1 djelatnik pripada objema kategorijama.) To znai da je
iznos 2.718,12 tono rjeenje Problema 1. za navedeni niz plaa jer uistinu dijeli niz na dva
jednakobrojna dijela:
(1.852,95; 1.884,76; 2.248,62; 2.417,25; 2.646,27; 2.718,12) i (2.718,12; 2.947,83; 3.085,45;
3.090,31; 50.000,64; 60.000,75).
I sva tri kvartila su tono rjeenje Problema 1. za navedeni niz plaa jer uistinu dijele niz na
etiri jednakobrojna dijela:
(1.852,95; 1.884,76; 2.248,62), (2.417,25; 2.646,27; 2.718,12), (2.718,12; 2.947,83; 3.085,45)
i (3.090,31; 50.000,64; 60.000,75).
Zbog postojanja ekstremno velikih vrijednosti (50.000,64 i 60.000,75) u navedenom nizu
plaa, oito je da su u ovom sluaju sva tri kvartila bitno reprezentativnije vrijednosti od
aritmetike sredine. Stoga je u statistikoj analizi takvih nizova, kad god je to mogue,
primjerenije odrediti barem jedan kvartil (poeljno: sva tri), negoli aritmetiku sredinu.
Svi percentili, pa posebno i sva tri kvartila, mogu se odreivati iz negrupiranih i grupiranih
podataka. Odreivanje pomou grupiranih podataka zasniva se deskriptivnom analogonu
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 91
funkcije distribucije, a to je kumulativni niz ''manje od'' kojega smo ve upoznali. Na primjeru
emo pokazati kako se iz grupiranih podataka odreuje medijan.
Moe se dogoditi da kod parnoga broja elemenata niza prvi sredinji element pripada jednoj, a
drugi sredinji element drugoj frekvenciji kumulativnoga niza. U tom sluaju medijan
predstavlja aritmetiku sredinu dviju njima odgovarajuih vrijednosti diskretnoga obiljeja.
Primjer 10. Zadana je razdioba svih studenata 1. godine studija smjehologije na Vioj
uzaludnoj koli u pikovini (akademska godina 2007/2008.) prema broju poloenih
jednosemestralnih kolegija
83
:
broj poloenih jednosemestralnih kolegija broj studenata
0 7
1 12
2 17
3 25
4 21
5 18
ukupno: 100
izvor: studentska sluba Vie uzaludne kole u pikovini
Odredimo medijan ovako grupiranoga niza podataka i objasnimo dobiveni rezultat. Na ranije
opisani nain formiramo kumulativni niz apsolutnih frekvencija ''manje od'':
broj poloenih jednosemestralnih
kolegija (x
i
)
broj studenata
(f
i
)
kumulativni niz apsolutnih
frekvencija "manje od"
0 7 7
1 12 19
2 17 36
3 25 61
4 21 82
5 18 100
ukupno: 100
Promatrani statistiki niz je ve ureen uzlazno. On ima ukupno 100 lanova. Stoga se
njegovi sredinji lanovi nalaze na mjestima
100
2
i
100
2
+ 1, tj. na 50. i 51. mjestu. Iz stupca u
83
Usporediti s Primjer 2., toka 3.1.1. Aritmetika sredina.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 92
kojemu su navedene kumulativne frekvencije ''oitavamo'' da su na mjestima 37., 38., 39., ,
49., 50., 51., 52., , 59., 60. i 61. ureenoga niza napisane ''trojke''. Prema tome, x
50
= x
51
=
= 3, pa je medijan jednak 3, to bi znailo da je 50% studenata poloilo najvie 3 ispita, a
50% studenata poloilo je najmanje 3 ispita. Ta je interpretacija potpuno tona: na prvih 50
mjesta imamo najprije 7 nula, pa 12 jedinica, pa 17 dvojki i 14 trojki, dok na preostalih 50
mjesta imamo 11 trojki, 21 etvorku i 18 petica.
Na slian se nain iz grupiranih podataka odreuju i preostala dva kvartila. Detalje, kao i
nain odreivanja kvartila iz podataka grupiranih u razrede ovdje izostavljamo.
Na kraju ove toke dajemo pregled najvanijih svojstava medijana kao svojevrsnoj poloajnoj
alternativi aritmetike sredine:
Svojstvo 1. (jedinstvenost medijana) U svakoj razdiobi prema kvantitativnomu ili
kvalitativnom redosljednom obiljeju postoji tono jedan medijan.
Svojstvo 2. Medijan se nalazi izmeu najmanje i najvee vrijednosti obiljeja u razdiobi.
Svojstvo 3. Na vrijednost medijana ne utjeu ekstremne vrijednosti obiljeja u razdiobi.
Svojstvo 4. Medijan se bez tekoa moe odrediti i u razdiobama kod kojih se pojavljuju
otvoreni razredi (osim ako je razred kojem pripada medijan otvoren).
Svojstvo 5. Medijan je srednja vrijednost osobito primjerena za opis izrazito asimetrinih
razdioba.
3.1.5. Mod
Pri analizi statistikih nizova vrlo esto se najprije odreuje najei modalitet koji se
pojavljuje u nizu (tj. modalitet s najveom apsolutnom ili relativnom frekvencijom). Takav
modalitet naziva se mod, oznaava s M
o
i pripada u poloajne srednje vijednosti. Ve iz same
definicije moda oito je da se on moe odrediti neovisno o tipu obiljeja, tj. mod je jedina
srednja vrijednost koja se moe odrediti i za kvalitativna i za kvantitativna obiljeja. Dakako,
nuan uvjet za postojanje moda jest pojavljivanje barem dva jednaka modaliteta u
statistikom nizu.
Oprez: Klasina pogreka prigodom interpretacije modova jest interpretiranje najvee
apsolutne ili relativne frekvencije kao moda pripadnoga osnovnoga skupa. To nije tono:
mod je iskljuivo najei modalitet statistikoga obiljeja, a odreuje se pomou najvee
apsolutne ili relativne frekvencije (za negrupirana obiljeja ili obiljeja grupirana prema
modalitetima).
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 93
Primjer 1. Promatramo skup svih automobila parkiranih u Ratkajevu prolazu 01.04.2008. u
16:30 sati i dijelimo njegove elemente prema obiljeju marka automobila. Analizom
dobivenoga osnovnoga skupa utvrdili smo da je mod promatranoga obiljeja BMW. Prema
tome, meu svim promatranim automobilima ima najvie automobila marke BMW. Iako je
takva interpretacija potpuno tona, ona ne mora dobro opisivati pripadni osnovni skup. Npr.
ako promatrani statistiki skup tvore 2 BMW-a, 1 ''Mercedes'', 1 ''koda Octavia'', 1 ''Opel
Corsa'', 1 ''Grand Cherokee'', 1 ''Yugo'' i 1 ''Fio'', onda opis ''Meu promatranim
automobilima ima najvie automobila marke BMW'' oito nedovoljno dobro opisuje
''arolikost'' skupa promatranih automobila. No, ako promatrani statistiki skup tvore 6 BMW-
a i dvije ''Opel Corse'', onda navedena interpretacija prilino dobro opisuje taj skup.
Primjer 2. Neto-plae (iskazane u kn) svih djelatnika knjigovodstvenoga servisa ''Knjii kod
mene'' iz Koara isplaene u sijenju ove godine tvore niz 1.800,00; 1.800,00; 1.800,00;
1.800,64; 1.800,64; 1.820,25; 1820,25; 30.000,75. Mod promatranoga niza je 1.800,00, to
znai da je najea plaa promatranih djelatnika 1.800,00 kn. Ta vrijednost dobro opisuje
pripadni osnovni skup jer plae 7 od ukupno 8 djelatnika odstupaju od moda za najvie
1,125%.
Primjer 3. Netoplae (iskazane u kn) svih djelatnica knjigovodstvenoga servisa ''. & J.
d.o.o. iz Grudnjaka isplaene u veljai ove godine tvore niz 1.800,00; 1.800,00; 4.928,50;
5.103,75; 5.224,47; 7.842,86; 7.915,92; 10.165,78 i 10.201,54. I u ovome je sluaju mod
promatranoga niza jednak 1.800,00 (interpretacija je ista kao i u Primjeru 2.), no, u ovom
sluaju on loe opisuje pripadni osnovni skup jer plae 7 od ukupno 9 djelatnika odstupaju od
moda za barem 173,806%.
Jedno od osnovnih svojstava moda je da ne mora nuno biti jedinstven. Naime, moe se
dogoditi da barem dva modaliteta imaju jednake apsolutne frekvencije, a da su apsolutne
frekvencije svih ostalih modaliteta strogo manje od njih. Stoga razlikujemo unimodalne
razdiobe (razdiobe koja imaju tono jedan mod), bimodalne razdiobe (razdiobe koja imaju
tono dva moda) i multimodalne razdiobe (razdiobe koje imaju barem tri moda).
Primjer 4. a) Ureeni niz 1, 2, 2, 3, 3, 4, 5 ima tono dva moda: 2 i 3. Stoga je taj niz
bimodalan.
b) Ureeni niz 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5 ima tono tri moda: 1, 2 i 3. Stoga je taj niz
multimodalan.
Uoimo da modovi dobro opisuju oba navedena niza jer je u svakom od njih vie od polovice
elemenata niza jednako nekomu od modova.
Kao i sve ostale srednje vrijednosti, i modovi se mogu odreivati iz negrupiranih i grupiranih
podataka, ali i iz grafikih prikaza razdioba, poglavito Paretova grafikona koji kao prvu
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 94
kategoriju na osi Ox navodi upravo modalnu vrijednost. Iako se ova vrijednost vjerojatno
odreuje najjednostavnije od svih srednjih vrijednosti, treba istaknuti da su sluajevi u kojima
mod dobro opisuje pripadni osnovni skup relativno rijetki. Takoer, jedan od ozbiljnijih
nedostataka veine raunalnih statistikih potpora (npr. MS Excel) je nemogunost ''ispisa''
svih modova pojedine razdiobe. Ukoliko uope postoji mogunost odreivanja moda
primjenom neke funkcije, njezina izlazna vrijednost je prvi mod po veliini, tj. najmanji ili
najvei mod, pa time zapravo gubimo mogunost utvrivanja je li neki statistiki niz
unimodalan, bimodalan ili multimodalan.
Sve navedeno samo potvruje da problem opisa osnovnoga skupa ili statistikoga niza
pomou bilo koje od potpunih ili poloajnih vrijednosti nije nimalo trivijalan i da obavezno
zahtijeva dodatnu statistiku analizu reprezentativnosti odreenih vrijednosti. O nekim
pokazateljima reprezentativnosti govorimo u sljedeoj toki.
3.2. Mjere rasprenja (disperzije)
Izraun neke od potpunih ili poloajnih srednjih vrijednosti predstavlja tek jedan korak u
statistikoj analizi nekoga obiljeja. Sljedei je korak analiza reprezentativnosti izraunate
srednje vrijednosti, odnosno, pojednostavljeno reeno, odreivanje pokazatelja koliko
izraunata srednja vrijednost dobro opisuje elemente osnovnoga skupa. Ti pokazatelji gotovo
su jednako vani kao i izraunate srednje vrijednosti. Ilustrirajmo to na primjeru.
Primjer 1. Tvrtka ''Super Silva d.o.o.'' iz Duhova zapoljava ukupno 10 stalno zaposlenih
djelatnika. Troje djelatnika ima prosjenu mjesenu netoplau 7.800,00 kn, etvero
prosjenu mjesenu neto-plau 8.000,00 kn, a troje prosjenu mjesenu netoplau 8.200,00
kn. Stoga prosjena mjesena netoplaa po zaposleniku u toj tvrtki iznosi 8.000,00 kn.
Tvrtka ''Super Silvio d.o.o.'' iz Duhia takoer zapoljava ukupno 10 stalno zaposlenih
djelatnika. 9 djelatnika ima prosjenu mjesenu netoplau 3.000,00 kn, a jedan djelatnik
prosjenu mjesenu netoplau 53.000,00 kn. Prosjena mjesena netoplaa po zaposleniku
u promatranoj tvrtki takoer iznosi 8.000,00 kn.
Iskljuivo na temelju izraunatih prosjenih mjesenih netoplaa, tj. bez poznavanja
originalnih podataka o prosjenim mjesenim netoplaama namee se zakljuak da meu
promatranim tvrtkama nema razlika u modalitetima obiljeja ''prosjena mjesena plaa'', to
je oito netono.
Kako bi se moglo to bolje opisati stupanj varijabilnosti statistikih podataka, definiraju se
odgovarajui statistiki pokazatelji pod zajednikim imenom mjere rasprenja (stupnja
varijabilnosti; disperzije). Mjere rasprenja openito mogu biti apsolutne i relativne.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 95
Apsolutne mjere rasprenja su raspon varijacije, interkvartil, interpercentilni razmak, srednje
apsolutno odstupanje i varijanca (odnosno, iz nje izvedena standardna devijacija).
Zajedniko obiljeje svih navedenih mjera jest iskazivanje u jedinicama mjere obiljeja
statistikog skupa (kn, , kg, cm itd.)
Relativne mjere rasprenja obino se izraavaju u postocima, a dvije najee su koeficijent
kvartilne devijacije i koeficijent varijacije.
Odmah napomenimo da izbor mjere rasprenja u pravilu ovisi o mjernim svojstvima
statistikih varijabli, tj. ne postoji ''univerzalna'' mjera rasprenja koja bi se mogla primijeniti
u svim sluajevima. Ukoliko je promatrano obiljeje kvantitativno, primjereno je izraunati i
interpretirati sve navedene mjere. Ukoliko je promatrano obiljeje kvalitativno redosljedno, za
analizu rasprenja mogu se koristiti raspon varijacije, interkvartil i koeficijent kvartilne
devijacije. Grubu sliku (''prvi dojam'') o rasprenosti podataka u osnovnom skupu zorno moe
predoiti i odgovarajui grafikon, a rije je o dijagramu rasipanja ili dijagramu rasprenja
spomenutom u 2. poglavlju.
Navedene mjere rasprenja, dakle, shvaamo kao svojevrsne mjere reprezentativnosti srednjih
vrijednosti. Manja mjera rasprenja znai bolju reprezentativnost srednje vrijednosti i
obrnuto
84
. Pomou mjera rasprenja usporeuju se razlike u varijablitetu barem dviju
razdioba, pri emu vrijede sljedea praktina pravila:
Pravilo 1. Ukoliko se radi o razdiobama prema istim obiljejima (s istom skalom modaliteta),
za usporedbu varijabiliteta koriste se apsolutne mjere rasprenja.
Pravilo 2. Ako se radi o razdiobama razliitih obiljeja ili istih obiljeja s razliitim skalama
modaliteta, za usporedbu varijabliteta koriste se relativne mjere rasprenja.
U nastavku se podrobnije opisuje svaka pojedina mjera rasprenja.
3.2.1. Raspon varijacije
Raspon varijacije (oznaka: R) je najjednostavnija mjera rasprenja definirana kao razlika
izmeu najvee (M) i najmanje (m) vrijednosti kvantitativnoga (ili, eventualno, kvalitativnoga
redosljednoga) obiljeja. Dakle,
84
Grubo moemo rei da su te dvije veliine obrnuto razmjerne, premda to matematiki nije tono.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 96
R = M m.
Najmanja mogua vrijednost raspona varijacije jednaka je nuli i nastupa u sluajevima kad je
odgovarajui niz vrijednosti kvantitativnoga obiljeja konstantan. Najvea vrijednost raspona
varijacije ne moe se openito odrediti.
Primjer 2. Navrene godine radnoga staa svih 10 zaposlenika tvrtke ''Super Silva d.o.o.''
tvore niz: 20, 12, 7, 29, 32, 10, 18, 16, 8, 17. Najvea vrijednost u tome nizu je M = 32, a
najmanja m = 7. Stoga je raspon varijacije vrijednosti promatranoga obiljeja
R = M m = 32 7 = 25 (godina).
Primjer 3. Prosjene mjesene netoplae (iskazane u kn) u razdoblju od 01.01.2008. do
31.03.2008. svih 6 zaposlenika knjigovodstvenoga servisa ''Knjii kod mene'' iz Koara na dan
01.04.2008. tvore niz 2.528,42; 2.527,75; 25.000,64; 2.584,12; 2.598,02; 2.576,25. Najvea
vrijednost u tome nizu je M = 25.000,64, a najmanja m = 2.527,75. Stoga je raspon varijacije
promatranoga obiljeja
R = M m = 25.000,64 2.527,75 = 22.472,89 (kn).
Primjer 4. Zadana je razdioba svih nezaposlenih dravljana Republike Ljenarije u veljai
2008. godine prema navrenim godinama starosti:
navrene godine starosti broj nezaposlenih [000]
15 24 25,2
25 49 75,8
50 64 19,2
65 0,6
izvor: Mjeseno statistiko izvjee Dravnoga zavoda za statistiku Republike Ljenarije, oujak 2008.
Da bismo mogli odrediti raspon varijacije ovoga obiljeja, za najmanju vrijednost (m)
uzimamo donju granicu prvoga razreda, a za najveu (M) gornju granicu posljednjega
razreda. Uoimo da je posljednji razred otvoren, pa njegovu gornju granicu moramo
procijeniti sami. Uzmemo li da je procijenjena gornja granica posljednjega razreda 70, slijedi
da je M = 70 i m = 15, pa je procijenjeni raspon varijacije promatranoga obiljeja
R = M m = 70 15 = 55 (godina).
Osnovna prednost raspona varijacije u praktinoj primjeni je jednostavnost njegova izrauna,
odnosno interpretacije. Njegov osnovni nedostatak je koritenje tono dvaju elemenata
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 97
osnovnoga skupa (u sluaju negrupiranih podataka) ili razdiobe (u sluaju grupiranih
podataka) u njegovu izraunu. Stoga ga, kao reprezentativnu mjeru rasprenja, ima smisla
primijeniti u sluajevima kad promatrani niz podataka ne sadri ekstremno velike ili
ekstremno male vrijednosti jer je u suprotnim sluajevima vrlo nepouzdan (npr. u Primjeru 3.
bi se moglo pogreno zakljuiti da promatrane prosjene mjesene plae jako variraju jer
odgovarajui niz sadri ekstremno veliku vrijednost 25.000,64). Jo openitije govorei,
raspon varijacije moe se iskoristiti za ''grubi'' opis osnovnoga skupa ili statistikoga niza, ali
nije dovoljno precizna mjera za daljnju detaljnu analizu tih objekata.
3.2.2. Interkvartil
Interkvartil (oznaka: I
q
) je apsolutna mjera rasprenja definirana kao raspon varijacije
sredinjih 50% elemenata ureenoga niza (kvantitativnih ili kvalitativnih redosljednih)
statistikih podataka. Ekvivalentno reeno, interkvartil je, zapravo, jednak razlici treega
(gornjega) i prvoga (donjega) kvartila:
I
q
= Q
3
Q
1
.
Primjer 5. Prvi (donji) kvartil niza navrenih godina radnoga staa iz Primjera 2. jednak je
Q
1
= 10.5 (godina), a trei (gornji) kvartil istoga niza Q
3
= 19.5. Odatle slijedi da je
interkvartil jednak
I
q
= Q
3
Q
1
= 19,5 10,5 = 9 (godina).
Dakle, raspon varijacije sredinjih 50% navrenih godina radnoga staa iznosi 9 godina. Iz
dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima manje od 10,5 godina
radnoga staa, 25% promatranih zaposlenika ima vie od 19,5 godina radnoga staa, a
navrene godine radnoga staa preostalih 50% promatranih zaposlenika su u rasponu od 9
godina.
Primjer 6. Prvi (donji) kvartil niza prosjenih mjesenih netoplaa iz Primjera 3. jednak je
Q
1
= 2.540,38 (kn), a trei (gornji) kvartil istoga niza Q
3
= 2.594,55 (kn). Odatle slijedi da je
interkvartil jednak
I
q
= Q
3
Q
1
= 2.594,55 2.540,38 = 54,17 (kn).
Dakle, raspon varijacije sredinjih 50% prosjenih mjesenih netoplaa iznosi 54,17 kn. Iz
dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima prosjenu mjesenu neto
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 98
plau manju od 2.540,38 kn, 25% promatranih zaposlenika ima prosjenu mjesenu neto
plau veu od 2.594,55 kn, a preostalih 50% promatranih zaposlenika ima prosjenu mjesenu
netoplau u rasponu od 54,17 kn.
Osnovna prednost interkvartila u odnosu na raspon varijacije je zanemarivanje ekstremno
malih ili ekstremno velikih vrijednosti u statistikom nizu, ime se dobiva toniji opis veine
elemenata niza. No, kao i za raspon varijacije, za izraun interkvartila koriste se tono dvije
poloajne vrijednosti u statistikom nizu, pa u izraunu interkvartila ne sudjeluju svi elementi
niza. Zbog toga se ta mjera rasprenja smatra nepotpunom.
3.2.3. Interpercentilni razmak
Interkvartil je poseban sluaj tzv. interpercentila. Za bilo koja dva prirodna broja k, l N
takva da vrijedi nejednakost 0 < k l < 100 interpercentil je razlika l toga i k toga
percentila:
l k
P P
I
= P
l
P
k
.
Prema definiciji percentila vrijedi ekvivalencija
(k l ) (P
k
P
l
),
pa je bilo koji interpercentil uvijek nenegativan realan broj. Obino se interpretira kao raspon
varijacije sredinjih
85
(l k)% elemenata ureenoga statistikoga niza. Posebno, za k = 25 i
l = 75 dobivamo interkvartil, a ako su oba broja k i l djeljiva s 10, dobivamo tzv. interdecilni
razmak (razlika bilo kojih dvaju decila). Praktino se brojevi k i l obino biraju tako da vrijedi
jednakost
k + l = 100
jer se na taj nain ''odvaja'' jednak postotak ''najloijih'' i ''najboljih'' elemenata niza.
85
Izraz sredinjih posljedica je injenice da percentili P
k
i P
l
, zanemarujui ostalih 97 percentila, dijele ureeni
statistiki niz na 3, openito nejednaka, dijela: prvi (''donji'') dio tvori k% podataka manji ili jednak P
k
, drugi
(''sredinji'') dio tvore podaci smjeteni izmeu P
k
i P
l
, a trei (''gornji'') dio tvori (100 l)% podataka veih ili
jednakih P
l
.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 99
Primjer 7. U tvrtki ''Kamen Steaj d.d.'' iz Brckovljana 10% svih zaposlenika ima prosjenu
mjesenu netoplau manju od 1.900,00 kn, dok drugih 10% svih zaposlenika ima prosjenu
mjesenu netoplau veu od 2.200,00 kn. Iz interpretacije navedenih vrijednosti slijedi:
P
10
= 1.900,00 i P
90
= 2.200,00,
pa je odgovarajui interpercentilni razmak
90 10
P P
I
= P
90
P
10
= 2.200,00 1.900,00 = 300,00 (kn).
Dakle, raspon varijacije sredinjih 90% 10% = 80% prosjenih mjesenih netoplaa iznosi
300,00 kn. Primijetimo da je taj raspon ujedno i razlika 9. i 1. decila.
Primjer 8. U zatitarskoj tvrtki ''Orlovi d.o.o'' iz Donje Vrbe 15% svih zaposlenika nije vie
od 185 cm, a 15% svih zaposlenika nije nie od 197 cm. Iz interpretacije navedenih percentila
slijedi
P
15
= 185 i P
85
= 197,
pa je odgovarajui interpercentilni razmak
85 15
P P
I
= P
85
P
15
= 197 185 = 12 (cm).
Dakle, raspon varijacije sredinjih 85% 15% = 70% visina iznosi 12 cm.
Osnovna prednost interpercentila u odnosu na raspon varijacije je zanemarivanje obino
jednakoga postotka ekstremno malih i ekstremno velikih vrijednosti u statistikom nizu, ime
se dobiva toniji opis veine elemenata niza. No, kao i za raspon varijacije, za izraun
interpercentila koriste se tono dvije poloajne vrijednosti u statistikom nizu, pa u njegovu
izraunu ne sudjeluju svi elementi niza. Zbog toga se ta mjera rasprenja smatra nepotpunom.
3.2.4. Varijanca i standardna devijacija
Varijanca i iz nje izvedena standardna devijacija obino se svrstava u red najvanijih
pokazatelja varijabiliteta ili rasprenosti modaliteta kvantitativnih obiljeja. Osnovni razlog je
injenica da da je zbroj odstupanja svih vrijednosti kvantitativnoga obiljeja od njihove
aritmetike sredine uvijek jednak nuli, pa taj pokazatelj ne moemo koristiti za opis
varijabiliteta statistikoga niza. Drugi je razlog tome to u izraunu varijance, a samim tim i
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 100
standardne devijacije, koristimo sve elemente statistikoga niza, pa je moemo kategorizirati
kao potpunu mjerom rasprenja. Drugim rijeima, varijanca i standardna devijacija mogu se
raunati i iz ''sirovih'' (negrupiranih ili neureenih) i iz grupiranih podataka.
Varijanca (oznaka:
2
(grko slovo itajte: sigma)) se definira kao aritmetika sredina
kvadrata odstupanja vrijednosti kvantitativnoga obiljeja od aritmetike sredine svih
vrijednosti. Nerijetko se varijanca matematiki netono, ali intuitivno prihvatljivije
definira kao prosjeno kvadratno odstupanje vrijednosti kvantitativnoga obiljeja od
aritmetike sredine tih vrijednosti. Sukladno takvoj definiciji, formule za izraun varijance su:
a) za niz negrupiranih podataka x
1
, x
2
, , x
n
ija je aritmetika sredina x :
( )
2
2
1
n
i
i
x x
n
ili, ekvivalentno,
2
2
2
1
n
i
i
x
x
n
=
=
,
b) za podatke ija je aritmetika sredina x grupirane prema tono k razliitih modaliteta tako
da za svaki i = 1, 2, , k modalitet x
i
ima apsolutnu ili relativnu frekvenciju f
i
:
( )
2
2 1
1
k
i i
i
k
i
i
f x x
f
=
=
=
ili, ekvivalentno,
2
2
2 1
1
k
i i
i
k
i
i
f x
x
f
=
=
c) za podatke grupirane u tono k razreda takvih da je za svaki i = 1, 2, , k x
i
razredna
sredina, f
i
odgovarajua apsolutna ili relativna frekvencija, a x aritmetika sredina svih
podataka:
( )
2
2 1
1
k
i i
i
k
i
i
f x x
f
=
=
=
ili, ekvivalentno,
2
2
2 1
1
k
i i
i
k
i
i
f x
x
f
=
=
.
Primijetimo da je varijanca jednaka nuli ako i samo ako je pripadni statistiki niz konstantan,
tj. ako postoji realan broj c R takav da za svaki k = 1, 2, , n vrijedi x
k
= c. U tom je
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 101
sluaju i aritmetika sredina jednaka broju c. No, to promatrani niz sadri vie meusobno
razliitih lanova, tj. to je vei stupanj varijabilnosti niza, to su vea i odstupanja pojedinih
modaliteta kvantitativnoga obiljeja od njihove aritmetike sredine. Stoga moemo zakljuiti
da je varijanca upravno razmjerna stupnju rasprenja statistikoga niza.
Budui je varijanca ''kvadratna'' mjera rasprenja, relativno teko ju je interpretirati. Pomou
drugoga korijena iz varijance dolazimo do praktino najprimjenjenije potpune mjere
rasprenja: standardne devijacije. Standardna devijacija (oznaka: ) je, po definiciji, drugi
korijen iz varijance. Takva formalna definicija obino se zamjenjuje matematiki netonom,
ali intuitivno prihvatljivijom definicijom prema kojoj je standardna devijacija prosjeno
odstupanje vrijednosti kvantitativnoga obiljeja od aritmetike sredine tih vrijednosti ili, jo
krae i jo nepreciznije, prosjeno odstupanje od prosjeka. Istaknimo da je ''mjerna jedinica''
za standardnu devijaciju jednaka ''mjernoj jedinici'' odgovarajuega kvantitativnoga obiljeja
(kn, , kg, cm itd.).
Radi potpunosti, navodimo formule za izraun standardne devijacije:
a) za negrupirane podatke:
( )
2
1
n
i
i
x x
n
ili
2
2
1
n
i
i
x
x
n
=
=
b) za podatke grupirane prema modalitetima ili u razrede:
( )
2
1
1
k
i i
i
k
i
i
f x x
f
=
=
=
ili
2
2 1
1
k
i i
i
k
i
i
f x
x
f
=
=
Primjer 9. Odredimo varijancu i standardnu devijaciju niza navrenih godina radnoga staa iz
Primjera 2. Aritmetika sredina vrijednosti toga obiljeja jednaka je:
20 12 7 29 32 10 18 16 8 17
16.9
10
x
+ + + + + + + + +
= = (godina),
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 102
pa je varijanca tih podataka:
10
2
2
2 1
2 2 2 2 2 2 2 2 2 2
2 2
2
10
20 12 7 29 32 10 18 16 8 17
16.9
10
63.49
i
i
x
x
=
= =
+ + + + + + + + +
=
=
Odavde slijedi da je standardna devijacija jednaka
2
63.49 = = =7.968 8 godina.
Moemo, dakle, rei da je prosjeno odstupanje pojedinanih navrenih godina radnoga
staa od njihove aritmetike sredine priblino 8 godina.
Primjer 10. Promatramo statistiki skup svih stanova u onim stambenim zgradama
(novogradnja i dogradnja) koje su 2006. godine dobile graevinsku dozvolu u Republici
Hrvatskoj. Promatrani skup dijelimo prema broju soba u stanu:
broj soba
(x
i
)
broj stanova
(f
i
)
1 3 256
2 7 428
3 7 244
4 4 414
5 1 794
6 997
7 266
8 118
ukupno: 25 517
izvor: Statistiki ljetopis Republike Hrvatske za 2006. godinu,
Dravni zavod za statistiku, 2007.
Odredimo prosjean broj soba po jednom stanu, te varijancu i standardnu devijaciju broja
soba. Prosjean broj soba po jednom stanu je vagana aritmetika sredina promatrane razdiobe:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 103
8
1
8
1
3256 1 7428 2 7244 3 4414 4 1794 5 997 6 266 7 118 8
25517
2.949
i i
i
i
i
f x
x
f
x
=
=
+ + + + + + +
= =
=
Dakle, prosjean broj soba po jednom stanu iznosi priblino 3. Varijanca broja soba jednaka
je:
8
2
2
2 1
8
1
2 2 2 2
2
2 2 2 2
2
2
3256 1 7428 2 7244 3 4414 4
25517
1794 5 997 6 266 7 118 8
2.949328
25517
1.887192
i i
i
i
i
f x
x
f
=
=
=
+ + +
= +
+ + +
+
=
otkuda slijedi da je odgovarajua standardna devijacija broja soba
2
1.887192 1.373751 = = = .
Dakle, moemo rei da prosjeno odstupanje pojedinanih brojeva soba od njihove
aritmetike sredine iznosi priblino 1,374.
Primjer 11. U donjoj je tablici prikazana razdioba svih poinitelja kaznenih djela u Republici
Hrvatskoj osuenih na bezuvjetni zatvor u 2006. godini prema trajanju zatvorske kazne:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 104
trajanje kazne
[godina]
broj
poinitelja
0 1 2 535
1 2 658
2 3 232
3 5 164
5 10 102
10 15 29
15 11
20 3
20 40 8
ukupno: 3 742
izvor: Statistiki ljetopis Republike Hrvatske za 2006. godinu,
Dravni zavod za statistiku, 2007.
Odredimo prosjeno trajanje kazne po jednom poinitelju, te varijancu i standardnu devijaciju
trajanja kazni. U tablici imamo ukupno 7 pravih razreda i dva modaliteta koja nisu grupirana
u razrede. Za svaki pojedini razred raunamo razrednu sredinu, a potom i vaganu aritmetiku
sredinu:
trajanje kazne
[godina]
broj
poinitelja
(f
i
)
razredna
sredina
(x
i
)
f
i
x
i
f
i
2
i
x
0 1 2 535 0.5 1267.5 633.75
1 2 658 1.5 987 1480.5
2 3 232 2.5 580 1.450
3 5 164 4 656 2.624
5 10 102 7.5 765 5737.5
10 15 29 12.5 362.5 4531.25
15 11 15 165 2.475
20 3 20 60 1.200
20 40 8 30 240 7.200
ukupno: 3 742 5083 27.332
Vagana aritmetika sredina jednaka je:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 105
9
1
9
1
5083
1.358365
3742
i i
i
i
i
f x
x
f
=
=
= = =
,
pa prosjeno trajanje kazne po jednom poinitelju iznosi priblino 1.358365 godina, odnosno
1 godinu 4 mjeseca i 9 dana. Varijanca trajanja kazni iznosi:
9
2
2
2 2 1
9
1
27332
1.358365 5.458961
3742
i i
i
i
i
f x
x
f
=
=
= = =
,
otkuda slijedi da je standardna devijacija trajanja kazni
2
5.458961 2.336442 = = = godina,
tj. prosjeno odstupanje pojedinanih trajanja kazni od njihove aritmetike sredine iznosi
priblino 2.336442 godina, odnosno 2 godine 4 mjeseca i 1 dan. Primijetimo da u
promatranom primjeru neto vie od 85% svih podataka pripada prvim dvama razredima, dok
svi ostali razredi obuhvaaju neto manje od 15% svih podataka. Na temelju aritmetike
sredine i standardne devijacije ne moemo zakljuiti npr. da postoji razred 20 40 kojemu
pripada 8 elemenata osnovnoga skupa, pa statistika analiza promatranoga obiljeja mora
obuhvatiti i izraun dodatnih pokazatelja (npr. koeficijent varijacije o kojemu govorimo u
podtoki 3.2.6.).
3.2.5. Srednje apsolutno odstupanje
Ve je istaknuto da je zbroj svih odstupanja pojedinih vrijednosti kvantitativnoga obiljeja od
aritmetike sredine jednak nuli. No, uzmemo li apsolutnu vrijednost svakoga odstupanja
(izraunamo odstupanje i zanemarimo njegov predznak), dobit emo nenegativne realne
brojeve. Njihov je zbroj biti jednak nuli ako i samo ako je niz vrijednosti kvantitativnoga
obiljeja konstantan, a to openito ne vrijedi (kvantitativna obiljeja imaju najmanje dva
razliita modaliteta). Stoga ima smisla definirati srednje apsolutno odstupanje (oznaka:
x
MAD , pri emu kratica: MAD od engleskih rijei Mean Absolute Deviation) kao prosjeno
apsolutno odstupanje od aritmetike sredine.
x
MAD se izraunava prema sljedeim
formulama:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 106
a) za niz negrupiranih modaliteta kvantitativnoga obiljeja x
1
, x
2
, , x
n
ija je aritmetika
sredina x :
1 2
1
...
n
n k
x
k
x x x x x x x x
MAD
n n
=
+ + +
= =
;
b) za podatke ija je aritmetika sredina x grupirane prema tono k razliitih modaliteta tako
da za svaki i = 1, 2, , k modalitet x
i
ima apsolutnu ili relativnu frekvenciju f
i
:
1 1 2 2
1
1 2
1
...
...
n
k k
n n
k
n x
n
k
k
f x x
f x x f x x f x x
MAD
f f f
f
=
=
+ + +
= =
+ + +
;
c) za podatke grupirane u tono k razreda takvih da je za svaki i = 1, 2, , k x
i
razredna
sredina, f
i
odgovarajua apsolutna ili relativna frekvencija, a x aritmetika sredina svih
podataka:
1 1 2 2
1
1 2
1
...
...
n
k k
n n
k
n x
n
k
k
f x x
f x x f x x f x x
MAD
f f f
f
=
=
+ + +
= =
+ + +
.
Primjer 12. Odredimo srednje apsolutno odstupanje od aritmetike sredine za niz navrenih
godina radnoga staa iz Primjera 2. U Primjeru 9. izraunali smo da je aritmetika sredina
toga niza x = 16.9 (godina), pa je srednje apsolutno odstupanje od aritmetike sredine:
10
1
20 16.9 12 16.9 7 16.9 29 16.9 32 16.9 10 16.9
10 10
18 16.9 16 16.9 8 16.9 17 16.9
+
10
3.1 4.9 9.9 12.1 15.1 6.9 1.1 0.9 8.9 0.1
10
k
x
k
x
x x
MAD
MAD
=
+ + + + +
= = +
+ + +
+ + + + + + + + +
=
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 107
3.1 4.9 9.9 12.1 15.1 6.9 1.1 0.9 8.9 0.1
6.3
10
x
MAD
+ + + + + + + + +
= =
Dakle, prosjeno apsolutno odstupanje od aritmetike sredine iznosi 6.3 godina. Dobivena
vrijednost je strogo manja od standardne devijacije istoga niza ( 8 godina).
Primjer 13. Odredimo srednje apsolutno odstupanje za vrijednosti obiljeja iz Primjera 11:
trajanje kazne
[godina]
broj
poinitelja
razredna
sredina
(x
i
)
0 1 2 535 0.5
1 2 658 1.5
2 3 232 2.5
3 5 164 4
5 10 102 7.5
10 15 29 12.5
15 11 15
20 3 20
20 40 8 30
ukupno: 3 742
U tom smo primjeru izraunali vaganu aritmetiku sredinu:
x = 1.358365 (godina),
pa je traeno srednje apsolutno odstupanje
9
1
9
1
2535 0.5 1.358365 658 1.5 1.358365 232 2.5 1.358365
3742
164 4 1.358365 102 7.5 1.358365 29 12.5 1.358365
3742
k k
k
x
k
k
x
f x x
MAD
f
MAD
=
=
=
+ +
= +
+ + +
+
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 108
11 15 1.358365 3 20 1.358365 8 30 1.358365
3742
1.163
x
MAD
+ +
+
=
Dakle, prosjeno apsolutno odstupanje od aritmetike sredine iznosi priblino 1.63 godina.
Istaknimo da se prosjeno apsolutno odstupanje moe raunati i u odnosu na medijan, pri
emu su odgovarajue formule potpuno analogne navedenima (aritmetika sredina se
zamijeni medijanom, a sve ostale veliine ostaju nepromijenjene). Moe se pokazati i da je
prosjeno apsolutno odstupanje od aritmetike sredine ili medijana uvijek manje ili jednako
standardnoj devijaciji.
Zakljuno istaknimo da dio novijih radova iz statistike preporuuje primjenu srednjih
apsolutnih odstupanja (od aritmetike sredine ili medijana) umjesto ''tradicionalne'' standardne
devijacije jer je praksa pokazala da pogreke u mjerenju, neidealizirani uvjeti provedbe
sluajnih pokusa ili opaanja openito itd. imaju manji utjecaj na prosjeno apsolutno
odstupanje, nego na standardnu devijaciju. Drugim rijeima, sve se vie zagovara da se u
statistikoj analizi realnih procesa (koji se odvijaju u realnim, a ne idealnim uvjetima)
primjenjuje prosjeno apsolutno odstupanje, tim vie to se utvrdilo da primjena takvoga
odstupanja na razliite vrste razdioba daje priblino jednake ili ak bolje rezultate od
standardne devijacije.
3.2.6. Koeficijent varijacije
Ve smo istakli da je standardna devijacija potpuna mjera rasprenja iskazana u jedinicama
promatranoga kvantitativnoga obiljeja. Kao takva, standardna devijacija nije prikladna za
usporedbu varijabiliteta najmanje dvaju razliitih tipova kvantitativnih obiljeja prema
kojima se moe podijeliti isti statistiki skup. Promatramo li npr. skup svih natjecatelja u
izboru za ovogodinjeg Mistera Svrzigaa i podijelimo li sve njegove elemente prema
obiljejima masa i visina, onda na temelju standardne devijacije ne moemo rei razlikuju li
se promatrani natjecatelji vie prema masi ili prema visini. U takvim se sluajevima obavezno
primjenjuju relativne mjere rasprenja jer one ne ovise o ''mjernim jedinicama'' promatranih
obiljeja. Dvije najee primjenjivane mjere su koeficijent varijacije i koeficijent kvartilne
devijacije, a koriste se ponajprije za usporedbu varijabiliteta dvaju razdioba.
Koeficijent varijacije (oznaka: V) definira se kao omjer standardne devijacije i aritmetike
sredine iskazan u postotcima. Slobodno govorei, moemo rei da je koeficijent varijacije
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 109
zapravo prosjeno odstupanje vrijednosti kvantitativnoga obiljeja od aritmetike sredine
iskazano u postotcima. Sukladno netom navedenoj definiciji, koeficijent varijacije neovisno o
tome jesu li podaci grupirani ili nisu raunamo prema formuli:
100 V
x
= .
Istaknimo da se koeficijent varijacije primijenjuje gotovo iskljuivo u statistikoj analizi
kvantitativnih obiljeja vezanih za ordinalnu skalu (zbog dogovorno definirane nule nije
primjenjiv u obiljejima vezanima za intervalnu skalu). Njegovi osnovni nedostaci su loa
reprezentativnost u sluaju ekstremnih vrijednosti ili otvorenih razreda, te osjetljivost na male
promjene aritmetike sredine u sluajevima kad je aritmetika sredina vrlo blizu nuli.
Iako ne postoji opi kriterij procjene varijabiliteta prema vrijednostima koeficijenta varijacije,
jedan od najee primjenjivanih je kriterij naveden u sljedeoj tablici. Naglasimo i injenicu
da je najmanja mogua vrijednost koeficijenta varijacije jednaka nuli (i postie se iskljuivo
za konstantne nizove podataka), dok najvea vrijednosti openito nije odreena. Praktine
primjene pokazuju da koeficijent varijacije relativno rijetko prelazi 100%.
V [%] varijabilitet
0 10 vrlo slab
10 - 30 relativno slab
30 - 50 umjeren
50 - 70 relativno jak
70 vrlo jak
Primjer 16. Za svih 11 nogometaa prve postave NK ''Akumulator'' iz Babine Grede na dan
01.04.2008. prikupljeni su podaci o masi i prosjenim mjesenim netoplaama. Podaci su
prikazani u donjoj tablici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 110
redni br.
nogometaa
masa
[kg]
prosjena mjesena
netoplaa []
1 79 1.190,00
2 89 1.195,00
3 82 1.196,00
4 78 1.185,00
5 91 1.183,00
6 84 1.198,00
7 83 1.197,00
8 86 1.191,00
9 90 1.189,00
10 78 1.300,00
11 81 1.400,00
Utvrdimo razlikuju li se promatrani nogometai vie prema masi ili prema prosjenim
mjesenim neto-plaama. U nizu masa i nizu prosjenih mjesenih netoplaa nema
ekstremno velikih vrijednosti, niti vrijednosti blizu nule, pa koeficijent varijacije obaju
obiljeja raunamo koristei formule za jednostavnu aritmetiku sredinu i standardnu
devijaciju za negrupirani niz podataka. Dobiva se:
obiljeje aritmetika
sredina
standardna
devijacija
koeficijent
varijacije
masa 83.72727 (kg) 4.51444 (kg) 5.391839%
prosjena netoplaa 1.220,36 () 64,88 () 5.316734%
Budui da je koeficijent varijacije masa strogo vei od koeficijenta varijacije prosjenih neto
plaa, zakljuujemo da se promatrani nogometai vie razlikuju prema masama. Uoimo da su
varijabiliteti obaju promatranih obiljeja vrlo slabi, pa praktino moemo zakljuiti da nema
zamjetnih razlika izmeu varijabiliteta promatranih obiljeja.
Primjer 17. Utvrdimo varijabilitet navrenih godina starosti svih nezaposlenih osoba u
Republici Ljenariji u veljai 2008. godine (Primjer 4. u podtoki 3.1.1.):
navrene godine starosti broj nezaposlenih [000]
15 25 25.2
25 50 75.8
50 65 19.2
65 (70) 0.6
U navedenom smo primjeru izraunali:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 111
37.177 x godina,
pa je standardna devijacija raunata iz podataka grupiranih u razrede
= 11.48167 godina,
to znai da je koeficijent varijacije promatranoga obiljeja
11.48167
100 100
37.17715
V
x
= = = 30.88%.
U ovome je sluaju, dakle, varijabilitet ''na granici'' relativno slaboga i umjerenoga, a budui
da je aritmetika sredina raunata iz grupiranih podataka nepreciznija od aritmetike sredine
raunate iz negrupiranih podataka i (obino) manja od nje, moemo zakljuiti da je
varijabilitet vrijednosti promatranoga obiljeja umjeren.
3.2.7. Koeficijent kvartilne devijacije
Kako je ve istaknuto, koeficijent varijacije je lo pokazatelj varijabiliteta vrijednosti
promatranoga obiljeja ukoliko promatrani niz vrijednosti obiljeja sadri ekstremno male ili
ekstremno velike vrijednosti. U takvim se sluajevima rasprenost vrijednosti obiljeja obino
iskazuje interkvartilom (kao apsolutnom mjerom rasprenja), odnosno koeficijentom kvartilne
devijacije kao pripadnom relativnom mjerom rasprenja.
Koeficijent kvartilne devijacije (oznaka: V
q
) je, prema definiciji, omjer interkvartila i zbroja
prvoga i treega kvartila:
3 1
3 1 3 1
q
q
I
Q Q
V
Q Q Q Q
= =
+ +
V
q
se interpretira kao intenzitet varijabiliteta sredinje polovice (sredinjih 50%) elemenata
ureenoga statistikoga niza, a moe poprimiti tono sve vrijednosti iz segmenta [0, 1]. to je
varijablitet sredinje polovice niza manji, vrijednost V
q
je blia 0, a to je varijablitet sredinje
polovice vei, vrijednost V
q
je blia 1. Iako ne postoji opi kritetij za utvrivanje varijabiliteta
sredinje polovice vrijednosti kvantitativnoga obiljeja na temelju koeficijenta kvartilne
devijacije, jedan od najee primijenjenih kriterija naveden je u tablici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 112
V
q
varijabilitet
0.0 - 0.1 vrlo slab
0.1 - 0.2 relativno slab
0.2 - 0.3 umjeren
0.3 - 0.5 relativno jak
0.5 1.0 vrlo jak
Izraun koeficijenta kvartilne devijacije iz obiju vrsta podataka pokazat emo na sljedeim
primjerima.
Primjer 18. Odredimo varijabilitet sredinjih 50% prosjenih mjesenih plaa (iskazanima u
kn) svih stalno zaposlenih djelatnika poduzea "Schwindltrade d.o.o." iz uplje Lipe u
razdoblju od 01.01.2007. 31.12.2007. navedenih u Primjeru 9. U ovom sluaju statistiki niz
sadri dvije ekstremno velike vrijednosti (50.000,64 i 60.000,75), pa je za dobivanje slike o
varijabilitetu primjereno uporabiti koeficijent kvartilne devijacije.
U Primjeru 9. izraunali smo:
prvi ili donji kvartil: Q
1
= 2.332,935;
trei ili gornji kvartil: Q
3
= 3.087,88;
Stoga je koeficijent kvartilne devijacije promatranoga niza jednak
3 1
3 1
3.087, 88 2.332, 935
0.13927
3.087,88 2.332, 935
q
Q Q
V
Q Q
= = =
+ +
.
Dakle, varijabilitet sredinjih 50% prosjenih mjesenih plaa je relativno slab.
Primjer 19. Zadana je razdioba svih honorarnih nastavnika Visoke kole za financijski
menadment u pikovini u zimskom semestru akademske godine 2007/2008. prema
prosjenom mjesenom netohonoraru za sve odrane oblike nastave:
prosjean mjeseni
netohonorar ()
broj
nastavnika
100,00 5
200,00 8
400,00 21
500,00 12
600,00 6
ukupno: 52
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 113
Odredimo koeficijent kvartilne devijacije i objasnimo njegovo znaenje
86
. U ovom sluaju
prvi i trei kvartil odreujemo iz grupiranih podataka, pri emu smo podatke ve zapisali u
obliku ureenoga niza. Ukupan broj podataka jednak je n = 52 i djeljiv je s 4, pa je priblina
pozicija prvoga kvartila jednaka
k
1
=
1 52 1
13.25
4 4
n + +
= = .
Vrijednost prvoga kvartila iz grupiranih podataka odreuje se iz izraza:
Q
1
= 13. vrijednost u nizu +
1
4
(14. vrijednost u nizu 13. vrijednost u nizu) =
= 200,00 +
1
4
(400,00 200,00) = 250,00.
Analogno, priblina pozicija treega kvartila jednaka je
k
2
=
3 3
( 1) (52 1) 39.75
4 4
n + = + = ,
pa je vrijednost treega kvartila:
Q
3
= 39. vrijednost u nizu +
3
4
(40. vrijednost u nizu 39. vrijednost u nizu) =
= 500,00 +
3
4
(500,00 500,00) = 500,00.
Tako je koeficijent kvartilne devijacije jednak
3 1
3 1
500, 00 250, 00
0.33333
500, 00 250, 00
q
Q Q
V
Q Q
= = =
+ +
i zakljuujemo da je varijabilitet sredinjih 50% prosjenih mjesenih netohonorara
relativno jak.
86
U ovome se primjeru iskljuivo radi ilustracije raunanja koeficijenta kvartilne devijacije iz podataka
grupiranih prema modalitetima koriste relacije za izraun kvartila koje se mogu nai u knjizi I. oia
''Primijenjena statistika''.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 114
Primjer 20. Zadana je razdioba svih djelatnika Sveleuilita u Gaelezima na dan 22.3.2008.
prema iznosu primljene ''uskrsnice'':
iznos ''uskrsnice''
()
broj
djelatnika
351,00 500,00 48
501,00 650,00 189
651,00 800,00 88
801,00 950,00 47
951,00 1.100,00 28
ukupno: 400
Odredimo koeficijent kvartilne devijacije i objasnimo dobiveni rezultat.
87
Neprave razrede
najprije pretvorimo u prave i izraunajmo pripadne kumulativne apsolutne frekvencije ''manje
od''. Dobivamo:
iznos ''uskrsnice''
()
broj
djelatnika
kumulativna apsolutna
frekvencija ''manje od''
350,50 500,50 48 48
500,50 650,50 189 237
650,50 800,50 88 325
800,50 950,50 47 372
950,50 1.100,50 28 400
ukupno: 400
etvrtina ukupnoga broja djelatnika jednaka je 100, a 100. element ureenoga niza nalazi se u
razredu 500,50 650,50. Donja granica toga razreda je g
1
= 500,50, odgovarajua apsolutna
frekvencija f
1
= 189, kumulativna apsolutna frekvencija ''manje od'' prethodnoga razreda
jednaka je m
1
= 48, a irina uoenoga razreda je h
1
= 650,50 500,50 = 150. Stoga je prvi
kvartil jednak
Q
1
= g
1
+
1
1
4
n
m
f
h
1
= 500,50 +
400
48
4
150, 00
189
541,77.
87
U ovome se primjeru iskljuivo radi ilustracije raunanja koeficijenta kvartilne devijacije iz podataka
grupiranih u razrede koriste relacije za izraun kvartila koje se mogu nai u knjizi I. oia ''Primijenjena
statistika''.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 115
Nadalje, tri etvrtine ukupnoga broja djelatnika jednake su 300, a 300. element niza nalazi se
u rauzredu 650,50 800,50. Donja granica toga razreda je g
3
= 650,50, odgovarajua
apsolutna frekvencija f
3
= 88, kumulativna apsolutna frekvencija ''manje od'' prethodnoga
razreda jednaka je m
2
= 237, a irina uoenoga razreda je h
3
= 850,50 650,50 = 15,00. Stoga
je trei kvartil jednak
Q
3
= g
3
+
2
3
3
4
n m
f
h
3
= 650,50 +
3
400 237
4
150, 00
88
757,89.
Stoga je koeficijent kvartilne devijacije jednak
3 1
3 1
757,89 541, 77
0.1663
757,89 541, 77
q
Q Q
V
Q Q
= = =
+ +
,
pa zakljuujemo da je varijabilitet sredinjih 50% iznosa ''uskrsnica'' relativno slab.
3.3. Standardizirano obiljeje
U praksi se vrlo esto postavljaju problemi usporedbe razliitih nizova vrijednosti
kvantitativnih obiljeja iskazanima u istim mjernicm jedinicama, ali s razliitim stupnjem
varijabilnosti, problemi usporedbe raznorodnih numerikih nizova, problemi usporedbe
relativnoga poloaja barem dvaju podataka u istom numerikom nizu itd. Tipini primjeri
takvih problema su:
Problem 1. Prosjena godinja netoplaa zaposlenika s visokom strunom spremom u nekoj
tvrtki iznosi 62.000,00 kn uz standardnu devijaciju od 7.100,00 kn. Moe li se rei da je
djelatnik koji ima visoku strunu spremu i ukupnu godinju netoplau 40.000,00 kn
diskriminiran?
Problem 2. Prosjean broj bodova na pismenom ispitu iz Gospodarske matematike odranom
25.02.2008. iznosi 55 uz standardnu devijaciju od 8 bodova. Prosjean broj bodova na
pismenom ispitu iz Osnova raunovodstva odranom 21.02.2008. iznosi 65 uz standardnu
devijaciju 12 bodova. iro je na pismenom ispitu iz Gospodarske matematike ostvario 62
boda, a na pismenom ispitu iz Osnova raunovodstva 75 boda. Na kojemu je ispitu iro
ostvario bolji uspjeh?
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 116
Ovakvi problemi rjeavaju se izraunom vrijednosti tzv. standardiziranoga obiljeja (oznaka:
z). Rije je o linearnoj transformaciji vrijednosti kvantitativnoga obiljeja definiranoj
formulom:
z =
1 x x x
x
= ,
gdje je uobiajeno x aritmetika sredina, a standardna devijacija vrijednosti varijable x.
Moe se pokazati da je aritmetika sredina svakoga standardiziranoga obiljeja jednaka nuli, a
odgovarajua standardna devijacija jednaka 1. Kako bi se mogli donijeti zakljuci o
rasprenosti elemenata polaznoga osnovnoga skupa, koristi se sljedee
Pravilo 1. (ebievljevo
88
pravilo) Neka je X niz vrijednosti kvantitativnoga obiljeja ija je
aritmetika sredina x , a standardna devijacija . Tada se za svaki prirodan broj k > 1 u
segmentu [ x k , x + k ] nalazi najmanje 100
2
1
1
k
| |
|
\
% lanova niza X.
Posljedice: U segmentu [ x 2 , x + 2 ] nalazi se najmanje 75% podataka, a u
segmentu [ x 3 , x + 3 ] nalazi se najmanje 89% podataka bilo kojega niza numerikih
podataka.
Pokaimo na nekoliko primjera primjenu standardiziranoga obiljeja i ebievljeva pravila.
Primjer 1. Rijeimo Problem 1. Izraunajmo vrijednost standardizirana obiljeja za
x = 40.000,00, x = 62.000,00 i = 7.100,00:
z =
40.000, 00 62.000, 00
3.0986
7.100, 00
x x
= = ,
pa zakljuujemo da ukupna godinja plaa od 40.000,00 kn odstupa od prosjene godinje
netoplae nanie za vie od tri standardne devijacije. Prema ebievljevu pravilu, najmanje
89% elemenata niza odstupa od prosjene vrijednosti niza za najvie tri standardne devijacije.
To znai da najvie 100% 89% = 11% elemenata niza odstupa od prosjeka za vie od tri
88
Pafnutij Lavovi ebiev (1821. 1894.), ruski matematiar.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 117
standardne devijacije. Promatrani se djelatnik nalazi upravo u tih 11% elemenata, pa se moe
rei da je diskriminiran.
Primjer 2. Rijeimo Problem 2. Prosudba uspjeha na ispitima mora se temeljiti iskljuivo na
standardiziranom obiljeju jer je ono neovisno o mjernim jedinicama, a eliminira i problem
razliitih raspona varijacije.
Za prvi je pismeni ispit x
1
= 55 i
1
= 8, pa je vrijednost standardizirana obiljeja irina
uspjeha na tom ispitu
z
1
=
1
1
1
62 55
0.875
8
x x
= = .
Za drugi je pismeni ispit x
2
= 65 i
2
= 12, pa je vrijednost standardizirana obiljeja irina
uspjeha na tom ispitu
z
2
=
2
2
2
75 65
0.83333
12
x x
= = .
Budui da je vrijednost standardizirana obiljeja za prvi pismeni ispit strogo vea od
vrijednosti standardizirana obiljeja za drugi pismeni ispit, zakljuujemo da je na pismenom
ispitu iz Gospodarske matematike iro postigao neto bolji uspjeh (odstupanje navie iznosi
87,5% standardne devijacije).
Primjer 3. Teaj dionica (u kn) portfolia zabiljeen na Frkljevakoj burzi u razdoblju od
01.03.2008. do 25.03.2008. bio je sljedei:
126 128 133 128 123 130 122 125 129 133 127 126 130
129 133 123 122 121 126 134 128 126 128 135 135
Dva trgovca dionicama procjenjuju teaj dionice u vremenu predvienom za prodaju. Prvi
trgovac procjenjuje da e cijena biti 140 kn, a drugi da e cijena biti 139 kn. Pretpostavimo da
je kretanje teaja dionice ''normalno''. Odredimo koji se trgovac izlae veem riziku donoenja
pogrene poslovne odluke o prodaji dionice. Najprije treba izraunati aritmetiku sredinu
(prosjeni teaj dionice) i standardnu devijaciju iz negrupiranih podataka. Dobiva se:
x = 128,00 kn, = 4,08 kn.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 118
Izraunajmo vrijednost standardiziranoga obiljeja za svaku pojedinu procjenu i odrediti koja
od njih vie odstupa od prosjeka:
z
1
=
1
140 128
2.94
4, 08
x x
= = ,
z
2
=
1
139 128
2.697
4, 08
x x
= = .
Prema tome, prvi trgovac se izlae veem riziku donoenja pogrene poslovne odluke o
prodaji dionice.
Primjer 4. 20 strunjaka iz podruja managementa i gospodarstva procjenjivalo je godinju
stopu inflacije u Republici Nikoristiji za 2007. godinu:
3,52 3,73 4,05 4,12 4,25 3,85 3,68 3,74 4,19 4,42 4,28 4,36 4,09
3,92 3,67 4,26 4,35 3,59 3,97 4,32
Primjenom ebievljeva pravila za k = 2 odredimo prognostiki interval stope inflacije.
Jednostavna aritmetika sredina procjenjenih vrijednosti godinje stope inflacije iznosi 4.018,
a odgovarajua standardna devijacija 0.280546. Prema tome, traeni prognostiki interval
stope inflacije je [4.018 2 0.280546, 4.018 + 2 0.280546] = [3.457, 4.579].
Primjer 5. (problem skaliranja) Prijamnom ispitu za upis na Ekonomski fakultet Sveuilita
u Banovoj Jaruzi pristupilo je ukupno 2000 kandidata. Prosjean broj bodova iz matematike
iznosio je 150 sa standardnom devijacijom 30 bodova. Povjerenstvo za provedbu
razredbenoga ispita odluilo je skalirati rezultate tako da im aritmetika sredina bude 100, a
standardna devijacija 12. Odredimo broj bodova (na novoj skali) kandidata koji je na ispitu
osvojio tono 130 bodova.
Da bismo preraunali rezultate ispita u skladu s izmijenjenim parametrima, najprije emo
odrediti relativan poloaj postignutoga rezultata od 130 bodova u prvotnom numerikom nizu.
Taj se poloaj svodi na izraun vrijednosti standardiziranoga obiljeja za x = 130, 1 x = 150 i
1
= 30, pa se dobije:
z
1
=
1
1
1
130 150
0.66666
30
x x
= = .
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 119
Dakle, rezultat kandidata odstupa od prvotnoga prosjeka za 0.66666 prvotnih standardnih
devijacija nanie. Stoga i novi broj bodova mora odstupati od predefiniranoga prosjeka za
0.66666 predefiniranih standardnih devijacija nanie, pa je
x
2
= 2 x + z
1
2
= 100 + (0.66666) 12 = 92.
Prema tome, kandidat e na novoj skali imati ukupno 92 boda.
3.4. Vrste razdioba (distribucija)
Razdiobe statistikih skupova prema kvantitativnim obiljejima grupiramo prema tome kako
su vrijednosti obiljeja elemenata toga skupa rasporeene oko najvanije srednje vrijednosti:
aritmetike sredine. U skladu s tim razlikujemo tri osnovne vrste razdioba statistikoga skupa:
Ako su vrijednosti obiljeja elemenata statistikoga skupa ravnomjerno rasporeene oko
aritmetike sredine, govorimo o simetrinoj razdiobi (distribuciji). Kod simetrine razdiobe
sve tri srednje vrijednosti su jednake ( X = M
e
= M
o
).
Ako skup vrijednosti obiljeja elemenata statistikoga skupa sadri barem jednu ekstremno
veliku vrijednost, govorimo o pozitivno asimetrinoj razdiobi (distribuciji). Kod pozitivno
asimetrine razdiobe vrijede nejednakosti: X > M
e
> M
o
.
Ako skup vrijednosti obiljeja elemenata statistikoga skupa sadri barem jednu ekstremno
malu vrijednost, govorimo o negativno asimetrinoj razdiobi (distribuciji). Kod negativno
asimetrine razdiobe vrijede nejednakosti: X < M
e
< M
o
.
Gornje definicije zgodno je popratiti i grafiki:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 120
3.4.1. Mjere asimetrije
Pri opisu razdiobe vrijednosti obiljeja elemenata odreenoga statistikoga skupa, osim
srednjih vrijednosti i mjera rasprenja, koristimo i mjere asimetrije. Tim mjerama nastoji se
jednim numerikim pokazateljem opisati nain rasporeda kvantitativnih podataka prema
aritmetikoj sredini ili nekoj drugoj srednjoj vrijednosti. U praksi se najee koriste tri mjere
asimetrije:
1.) Pearsonova
89
mjera asimetrije (oznaka: S
k
) je mjera asimetrije definirana kao omjer
aritmetike sredine x i medijana M
e,
odnosno moda M
o
, izraen u jedinicama standardne
devijacije :
3 ( )
;
e o
k k
x M x M
S S
= =
Ova je mjera zapravo standardizirano odstupanje medijana ili moda od aritmetike sredine.
Razlika aritmetike sredine i medijana, odnosno moda podijeljena je sa standardnom
devijacijom radi uklanjanja utjecaja mjernih jedinica kvantitativnoga obiljeja na vrijednost
pokazatelja.
Koeficijent S
k
90
moe poprimiti tono sve vrijednosti iz segmenta [3, 3]. Za simetrinu
razdiobu njegova je vrijednost S
k
= 0, za pozitivno asimetrinu S
k
> 0, a za negativno
89
Karl Pearson (1857. 1936.), britanski statistiar, jedan od najzaslunijih za razvoj statistike kao zasebne
znanstvene discipline.
90
Oznaka S
k
potjee od engleske rijei skewness koja znai nagnutost.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 121
asimetrinu S
k
< 0. to je apsolutna vrijednost od S
k
blia 3, asimetrinost je izraenija. Ovaj
koeficijent u pravilu se rauna za razdiobe prema kvantitativnim kontinuiranim varijablama.
2.) Bowleyeva
91
mjera asimetrije (oznaka: S
kQ
) rauna se iz meusobnoga odnosa svih triju
kvartila: prvoga (Q
1
), treega (Q
3
) i medijana (M
e
). Na temelju toga odnosa odreuje se
asimetrinost sredinje polovice (sredinjih 50%) elemenata ureenoga statistikoga niza.
Raunamo je prema formuli:
1 3
3 1
2
e
kQ
Q Q M
S
Q Q
+
=
.
Koeficijent S
kq
poprima tono sve vrijednosti iz segmenta [-1, 1]. Za simetrinu razdiobu je
S
kQ
= 0, za pozitivno asimetrinu S
kQ
> 0, a za negativno asimetrinu S
kQ
< 0. to je apsolutna
vrijednost koeficijenta S
kQ
blia 1, asimetrinost je izraenija.
3.) Koeficijent asimetrije (oznaka:
3
) je potpuna i najee koritena mjera asimetrije
definirana formulom:
3
1
3
( )
n
k
x x
n
gdje je n ukupan broj elemenata statistikoga niza (odnosno podataka u odgovarajuem
osnovnom skupu), x aritmetika sredina tih podataka, a njihova standardna devijacija.
Koeficijent
3
poprima tono sve vrijednosti iz segmenta [-2, 2]. Za simetrinu razdiobu
vrijednost toga koeficijenta je
3
= 0, za pozitivno asimetrinu
3
> 0, a za negativno
asimetrinu
3
< 0. to je apsolutna vrijednost koeficijenta
3
blia 2, asimetrinost je
izraenija.
Valjda istaknuti da koeficijent asimetrije kao potpuna mjera asimetrije uvijek prua
najvjerniju sliku o asimetriji, dok s ostalim dvama mjerama to nije sluaj. Sve tri mjere obino
se (ali ne i uvijek) podudaraju jedino u predznaku, a njihova izravna usporedba nije mogua
jer se odgovarajui izrauni temelje na razliitim principima.
91
Arthur Lyon Bowley (1869. 1957.), engleski ekonomist i statistiar, zasluan za razvoj teorije uzoraka.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 122
Primjer 1. Radi provjere deklarirane mase paketia bombona ''Kiki'' izabran je uzorak od
ukupno 25 razliitih paketia. Mjerenjem mase (iskazane u gramima) dobiveni su sljedei
rezultati:
101 103 98 99 100 102 96 102 101 105 93 98 98
94 96 101 102 97 97 100 93 104 102 91 104
Odredimo vrijednost svih triju pokazatelja asimetrije, objasnimo njihova znaenja i prikaimo
dobivenu razdiobu linijskim grafikonom. Prikaemo li dobivene podatke tablino, dobivamo:
masa
(g)
broj
paketia
91 1
93 2
94 1
96 2
97 2
98 3
99 1
100 2
101 3
102 4
103 1
104 2
105 1
ukupno: 25
Odgovarajuim izraunima lagano se dobiva:
- aritmetika sredina: x = 99.08 (grama);
- medijan: M
e
= 100 (grama);
- mod: M
o
= 102 (grama);
- 1. ili donji kvartil: Q
1
= 97 (grama);
- 3. ili gornji kvartil: Q
3
= 102 (grama);
- standardna devijacija: = 3.69778312 (grama).
Za vjebu objasnite svaku od neposredno izraunatih vrijednosti. Prema tome, traene
vrijednosti mjera asimetrije su:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 123
- Pearsonova mjera asimetrije (odstupanje medijana): S
k
= -0.746393153;
- Pearsonova mjera asimetrije (odstupanje moda): S
k
= -0.789662321;
- Bowleyeva mjera asimetrije: S
kQ
= 0.2;
- koeficijent asimetrije:
3
= -0.471860569.
Pearsonove mjere asimetrije upuuju na zakljuak da je promatrana razdioba srednje
negativno asimetrina (prevladavaju vrijednosti vee od aritmetike sredine), Bowleyeva
mjera asimetrije upuuje na zakljuak da je razdioba sredinjih 50% paketia blago negativno
asimetrina, dok koeficijent asimetrije upuuje na zakljuak da je promatrana razdioba
srednje negativno asimetrina. To se vidi i iz dobivene tablice jer postoji ukupno 13
vrijednosti strogo veih od aritmetike sredine i 12 vrijednosti manjih od nje. Odgovarajui
prikaz linijskim grafikonom dan je na sljedeoj slici.
Primjer 2. Prema podacima Hrvatske elektroprivrede za 2006. godinu
92
, prosjena godinja
potronja elektrine energije po potroau iznosi 2422.168207 kWh uz standardnu devijaciju
2383.869183 kWh. Pritom 25% svih potroaa godinje potroi najvie 683.319 kWh,
polovica svih potroaa najvie 1766.895 kWh, a 25% svih potroaa barem 3370.143 kWh.
Odredimo vrijednosti odgovarajuih relativnih mjera rasprenja i mjera asimetrije, te
objasnimo dobivene rezultate. Iz zadanih podataka slijedi:
92
Podaci su preuzeti iz Statistikoga ljetopisa Republike Hrvatske za 2006. godinu.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 124
- aritmetika sredina: x = 2422.168207 (kWh);
- medijan: M
e
= 1766.895 (kWh);
- 1. ili donji kvartil: Q
1
= 683.319 (kWh);
- 3. ili gornji kvartil: Q
3
= 3370.143 (kWh);
- standardna devijacija: = 2383.869183 (kWh);
pa su traene vrijednosti:
- koeficijent varijacije: V = 98.4188124%, to znai da je stupanj rasprenja
(varijabilitet) godinje potronje elektrine energije vrlo jak;
- koeficijent kvartilne devijacije: V
q
= 66.2846722%, to znai da je stupanj rasprenja
(varijablitet) sredinjih 50% potroaa elektrine energije vrlo jak;
- Pearsonova mjera asimetrije (odstupanje medijana): S
k
= 0.824634017, to znai da je
promatrana razdioba potroaa prema godinjoj potronji elektrine energije srednje
pozitivno asimetrina;
- Bowleyeva mjera asimetrije: S
kQ
= 0.193414976, to znai da je razdioba sredinjih
50% potroaa blago pozitivno asimetrina;
Koeficijent asimetrije ne moemo izraunati na temelju zadanih podataka. Spomenimo tek da
iz originalnih podataka navedenih u referenciranoj literaturi slijedi
3
= 2.133, to znai da je
razdioba potroaa prema godinjoj potronji elektrine energije vrlo pozitivno asimetrina,
tj. vrlo izraeno prevladavaju manje vrijednosti potronje elektrine energije.
3.4.2. Mjere zaobljenosti
Veina pojava u prirodi, raznim gospodarskim i tehnikim procesima i sl. rasporeena je u
skladu s tzv. normalnom razdiobom. Ova se razdioba vrlo precizno definira u matematikoj
statistici i za to je potreban neto sloeniji aparat teorije vjerojatnosti. Ovdje emo samo
napomenuti da je rije o potpuno simetrinoj unimodalnoj razdiobi takvoj da se otprilike svi
podaci (tonije, 99.73% njih) promatranoga obiljeja nalaze u rasponu [ x 3 , x + 3 ],
gdje je x aritmetika sredina, a standardna devijacija razdiobe. Ova je injenica nerijetko
vrlo korisna prigodom procjenjivanja je li neka razdioba (priblino) normalna ili nije.
S obzirom na veliki znaaj normalne razdiobe u statistici, definirane su posebne mjere kojima
se pojedine razdiobe usporeuju s normalnom. To su tzv. mjere zaobljenosti i ima ih tono
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 125
dvije: koeficijent zaobljenosti (kurtosis
93
) i eksces
94
. Koeficijent zaobljenosti (kurtosis)
(oznaka:
4
) je mjera zaobljenosti modalnoga vrha neke razdiobe, dok je eksces (oznaka: )
jednak razlici koeficijenta zaobljenosti i broja 3:
=
4
3.
Od navedene dvije mjere jednostavnija je eksces jer eksces normalne razdiobe iznosi 0, pa je
na temelju te injenice lako izvriti usporedbu. Prema predznaku ekscesa razlikujemo tri vrste
razdioba:
platikurtine iji je eksces strogo manji od nule, tj. < 0;
mezokurtine iji je eksces jednak nuli, tj. = 0;
leptikurtine iji je eksces strogo vei od nule, tj. > 0.
Slobodnije govorei, moemo rei da su platikurtine razdiobe ''plosnatije'', a leptikurtine
''iljastije'' u odnosu na normalnu razdiobu. Usporedba nekih znaajnijih vrsta razdioba s
normalnom razdiobom (krivulja nacrtana crnom bojom) navedena je na donjoj slici.
93
Rije kurtosis na grkom znai izboenost.
94
Rije eksces na latinskom znai prekoraenje ili pretjeranost.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 126
3.5. Programska potpora deskriptivnoj statistikoj analizi
Danas je u uporabi vie razliitih raunalnih programa namijenjenih statistikim analizama.
Najpoznatiji od njih su SAS, SPSS i STATISTICA. U MS EXCEL-u potpunu statistiku analizu
vrijednosti kvantitativnoga obiljeja elemenata statistikoga skupa moemo dobiti rabei alat
Descriptive Statistics smjetenu u izborniku Alati (Tools), opcija: Analiza podataka (Data
Analysis). Taj je alat dio Analysis ToolPak alata za analizu, a stvara statistiki izvjetaj za
podatke u ulaznom rasponu i daje podatke o tendenciji gomilanja podataka oko aritmetike
sredine i njihovoj promjenljivosti (varijabilitetu). Jedini potrebni ulazni podatak jest raspon
elija u kojima su smjeteni negrupirani numeriki podaci. Tzv. izlazni izvjetaj (Summary
Statistics) obavljene statistike analize sadri, izmeu ostalih, i podatke o aritmetikoj sredini,
medijanu, modu, standardnoj devijaciji, varijanci, koeficijentu asimetrije, najmanjoj i najveoj
vrijednosti, opsegu i ukupnom zbroju svih lanova promatranoga numerikoga niza. Primjer
takvog izvjetaja prikazan je u donjoj tablici.
Ocjene iz matematike
Mean 3.46666667
Standard Error 0.21298823
Median 3
Mode 2
Standard Deviation 1.16658456
Sample Variance 1.36091954
Kurtosis -1.4568278
Skewness 0.08605128
Range 3
Minimum 2
Maximum 5
Sum 104
Count 30
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 127
4. KORELACIJSKA I REGRESIJSKA ANALIZA
U prethodnim smo se poglavljima bavili tzv. jednodimenzionalnom analizom
odreenih pojava. Pri tome nismo vodili rauna o uzrocima i posljedicama tih pojava,
odnosno o meusobnoj povezanosti dviju ili vie pojava. U ovom emo poglavlju obratiti
pozornost upravo na takve sluajeve. Pri tome emo (radi analogije s matematikom) termin
obiljeja (koji se obino rabi u kvalitativnim sluajevima) zamijeniti ekvivalentnim nazivom
varijabla (jer emo promatrati kvantitativna obiljeja).
Veza izmeu dviju varijabli openito moe biti funkcijska (deterministika) ili
statistika (sluajna, stohastika). U sluaju funkcijske povezanosti svakoj vrijednosti jedne
varijable odgovara tono odreena i jedinstvena vrijednost druge varijable, dok u sluaju
statistike povezanosti odreenoj vrijednosti jedne varijable mogu odgovarati barem dvije
vrijednosti druge varijable.
Primjer 1. Akcijska cijena jednoga automobila marke ''Ficho'' je 50.000,00 . Neka nam n
oznaava broj kupljenih automobila, a C
n
ukupan iznos koji treba izdvojiti za kupnju tih
automobila. Tada je veza izmeu varijabli n i C
n
funkcijska i moe se opisati analitikim
izrazom (zatvorenom formulom):
C
n
= 50.000,00 n.
To znai da e svaki kupac koji kupi tono n automobila za njih morati izdvojiti tono
50.000,00 n . I u sluaju uvoenja dodatnih varijabli (npr. dodatni popust na gotovinsko
plaanje) veza e i dalje ostati funkcijska.
Primjer 2. ''itluka banka'' odobrava stambene kredite uz 5.99% sloenih dekurzivnih
godinjih kamata na 30 godina uz otplatu jednakim godinjim postnumerando anuitetima.
Neka je C
0
iznos zajma koji se odobrava zajmoprimcu, a C
n
ukupan iznos koji u tih 30 godina
zajmoprimac treba vratiti banci. Tada je veza izmeu varijabli C
0
i C
n
funkcijska i moe se
opisati analitikim izrazom (zatvorenom formulom):
C
n
= 2.17713578 C
0
.
To znai da svaki zajmoprimac koji dobije zajam u iznosu od C
0
kn banci treba vratiti ukupno
2.17713578 C
0
kn.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 128
Pojave koje istrauje statistika obino nisu tako ''vrsto'' povezane kao varijable u prethodnim
primjerima. Tada govorimo o statistikoj ili stohastikoj vezi meu varijablama.
Primjer 3. Ekonomskim je analizama utvreno da postoji veza izmeu izdvajanja za
marketing nekoga prehrambenoga proizvoda i ukupne vrijednosti prodanih komada toga
proizvoda. No, ne moe se rei da npr. sve patete za iju je promidbu utroeno 100.000,00
kn imaju jednake ukupne vrijednosti prodanih komada.
Primjer 4. Ekonomskim je analizama utvreno da postoji veza izmeu ukupnih prosjenih
mjesenih primanja i prosjenih mjesenih izdvajanja za prehranu. No, ne moe se rei da
npr. svi ljudi koji mjeseno zarauju prosjeno 3.000,00 imaju jednaka prosjena mjesena
izdvajanja za prehranu.
Korelacijska analiza primjenom posebnih metoda i tehnika ispituje stupanj povezanosti
izmeu barem dviju varijabli. Ukoliko se utvrdi odreeni stupanj povezanosti izmeu dviju
varijabli, regresijskom analizom razvija se odgovarajui analitiki izraz ili algebarski model
te veze kako bi se moglo prognozirati oekivanu vrijednost jedne varijable za unaprijed
zadanu vrijednost druge varijable.
4.1. Korelacijska analiza
Korelacijska analiza povezanosti dviju varijabli obino se provodi u tri koraka:
1.) konstrukcija odgovarajuega grafikog prikaza odnosa meu varijablama (tzv. dijagram
rasipanja, dijagram rasprenja ili oblak rasprenja);
2.) odreivanje brojanoga pokazatelja jakosti i smjera veze meu varijablama (koeficijent
korelacije);
3.) odreivanje brojanoga pokazatelja statistike znaajnosti koeficijenta korelacije (tzv. p
vrijednost).
Ukoliko se utvruje povezanost najmanje triju varijabli, prvi korak se vrlo esto izostavlja jer
je prostorne analogone dijagrama rasipanja vrlo teko nacrtati ak i uz pomo suvremenih
raunalnih programa. Stoga se dijagram rasipanja obino crta iskljuivo kod utvrivanja
povezanosti tono dviju varijabli.
Govorimo li o odnosu izmeu dviju varijabli, obino razlikujemo nezavisnu varijablu (X) i
zavisnu varijablu (Y). Kako sugeriraju sami nazivi, nezavisna varijabla (X) je ''varijabla koja
utjee'' na drugu varijablu, a mogue utjecaje na nju samu zanemarujemo, dok je zavisna
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 129
varijabla (Y) ''varijabla na koju se utjee'', tj. varijabla ije vrijednosti zavise o vrijednostima
nezavisne varijable X. U praksi, meutim, nije uvijek tono odreeno koja varijabla je
nezavisna, a koja zavisna. Npr. promatramo li varijable ocjena iz matematike i ocjena iz
statistike, onda ocjena iz statistike moe zavisiti o ocjeni iz matematike (dobar matematiar
obino je i dobar statistiar), ali i ocjena iz matematike moe zavisiti i o ocjeni iz statistike
(ako netko na ispitu iz statistike dobije 5, to ga moe motivirati da sjedne i naui matematiku
barem za 4). U takvim sluajevima, dakle, ne moemo potpuno precizno utvrditi koja
varijabla je zavisna, a koja nezavisna. No, u sluajevima kada imamo varijable poput iznos
mjesene plae i iznos mjesenoga izdvajanja za prehranu jasno je da iznos mjesenoga
izdvajanja za prehranu ovisi o iznosu primljene mjesene plae, a da iznos primljene
mjesene plae ne ovisi o iznosu mjesenoga izdvajanja za prehranu (osim ako je posao
djelatnika usko vezan za prehranu, kao to je npr. degustator).
Kako je ve istaknuto, kad god je to mogue, odnos izmeu zavisne i nezavisne varijable
najprije je zgodno predoiti grafiki. U tu se svrhu rabi ve spomenuti dijagram rasipanja.
Taj se dijagram konstruira tako da da toke s odgovarajuim vrijednostima varijabli X i Y
nanesemo u pravokutni koordinatni sustav u ravnini. Iz oblika dijagrama rasipanja moe se
priblino procijeniti postoji li uope veza izmeu dviju varijabli i, ako postoji, kojega je
oblika (pravocrtna (pravolinijska) ili krivocrtna (krivolinijska)).
Primjer 1. Primjeri potpune linearne (pravocrtne) veze izmeu dviju varijabli:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 130
Primjer 2. Primjeri potpune nelinearne (krivocrtne) veze izmeu dviju varijabli:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 131
Primjer 3. Primjer postojanja statistike veze izmeu dviju varijabli:
Primjer 4. Primjer sluajne (statistiki beznaajne) veze izmeu dviju varijabli:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 132
Ukoliko se nakon konstrukcije dijagrama rasipanja utvri postojanje veze meu promatranim
varijablama, prelazi se na izraun odgovarajuega numerikoga pokazatelja jakosti i smjera
utvrene veze. Pritom odreivanje smjera veze znai utvrivanje uzrokuje li poveanje
vrijednosti jedne varijable poveanje ili smanjenje vrijednosti druge varijable. Ako poveanje
vrijednosti jedne varijable uzrokuje poveanje vrijednosti druge varijable, kaemo da je veza
meu varijablama pozitivna. Uzrokuje li, pak, poveanje vrijednosti jedne varijable smanjenje
vrijednosti druge varijable, kaemo da je veza negativna. Treba napomenuti da je teorijski
veza meu varijablama pozitivna (negativna) i ako smanjenje vrijednosti jedne varijable
uzrokuje smanjenje (poveanje) vrijednosti druge varijable, ali se taj kriterij praktino ne
koristi jer su vrijednosti na svakoj od osi u dijagramu rasipanja poredane uzlazno (od
najmanje do najvee), pa je praktinije promatrati poveanje bilo koje vrijednosti umjesto
njezina smanjenja.
Najjednostavniji sluaj analitikoga opisivanja veze meu dvjema varijablama jest ukoliko iz
dijagrama rasipanja utvrdimo da je ta veza linearna. U takvim se sluajevima rauna tzv.
Pearsonov
95
koeficijent jednostavne linearne korelacije (oznaka: r). Uz pretpostavku da
imamo ukupno n ureenih parova (x
i
, y
i
) vrijednosti varijabli X i Y, koeficijent r raunamo
prema formuli:
95
Karl Pearson (1857. 1936.), britanski statistiar, jedan od najzaslunijih za razvoj statistike kao zasebne
znanstvene discipline.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 133
1 1 1
2 2
2 2
1 1 1 1
1
1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
x y x y
n
r
x x y y
n n
= = =
= = = =
=
| | | |
| |
\ \
Moe se pokazati da koeficijent r moe poprimiti sve vrijednosti iz segmenta [1, 1], pa je,
dakle, njegova najmanja vrijednost jednaka 1, a najvea 1. Korelacijska analiza zasebno
interpretira predznak Pearsonova koeficijenta jednostavne linearne korelacije, a zasebno
njegovu apsolutnu vrijednost.
Pozitivan koeficijent jednostavne linearne korelacije (onaj koji je strogo vei od 0, odnosno
onaj kojemu je predznak +) ukazuje da poveanje vrijednosti jedne varijable uzrokuje
poveanje vrijednosti druge varijable, ali i obrnuto: smanjenje vrijednosti jedne varijable
uzrokuje smanjenje vrijednosti druge varijable. Grubo bismo mogli rei da su promatrane
varijable upravno razmjerne, no, to ne bi bilo matematiki korektno: upravna razmjernost
vrijednosti varijabli znai da ako se, za neki k 0, +, vrijednost jedne varijable povea
(smanji) za k%, onda se i vrijednost druge varijable povea (smanji) za k%. Kod linearne
ovisnosti, meutim, to openito nije tono: ako se vrijednost jedne varijable povea (smanji)
za k%, vrijednost druge varijable e se svakako poveati (smanjiti), ali ne nuno za k% (nego
najee za strogo manje od k%).
Negativan koeficijent jednostavne linearne korelacije ukazuje da poveanje vrijednosti jedne
varijable uzrokuje smanjenje vrijednosti druge varijable, ali i obrnuto: smanjenje vrijednosti
jedne varijable uzrokuje poveanje vrijednosti druge varijable. Kao i u sluaju pozitivnoga
koeficijenta, grubo bismo mogli rei da su promatrane varijable obrnuto razmjerne, no, to ne
bi bilo matematiki korektno: obrnuta razmjernost vrijednosti varijabli znai da ako se, za
neki k R, vrijednost jedne varijable povea (smanji) za k%, onda se vrijednost druge
varijable smanji (povea) za k%. Kod linearne ovisnosti, meutim, to openito nije tono: ako
se vrijednost jedne varijable povea (smanji) za k%, vrijednost druge varijable e se smanjiti
(poveati), ali ne nuno za k% (nego najee za strogo vie od k%).
Apsolutna vrijednost koeficijenta korelacije (oznaka:r) ukazuje na jakost linearne veze
meu varijablama. to jerblie nuli, veza je slabija, a to je blie jedinici, veza je jaa.
Jedan od moguih kriterija jakosti veze naveden je u donjoj tablici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 134
koeficijent korelacije jakost veze meu varijablama
1 potpuna
0.80 r < 1 jaka
0.50 r < 0.8 srednje jaka
0.20 r < 0.5 slaba
0.0 < r < 0.2 neznatna
0 potpuna odsutnost
Ovdje odmah treba istaknuti najeu pogreku koja se javlja prigodom uporabe Pearsonova
koeficijenta jednostavne linearne korelacije. Naime, u sluajevima kad je |r| 0, esto se
pogreno zakljuuje da nema nikakve statistike veze meu promatranim varijablama. Veza
meu varijablama moe biti i eksponencijalna, logaritamska, potencijska, polinomna (takva
da je stupanj odgovarajuega polinoma najmanje 2) itd., a ne samo linearna. Zbog toga
prigodom interpretacije ovoga koeficijenta uvijek treba imati na umu da on opisuje iskljuivo
smjer i jakost linearne veze meu varijablama.
Posljednji korak korelacijske analize je procjenjivanje statistike znaajnosti izraunatoga
koeficijenta korelacije. Grubo govorei, takvom procjenom elimo utvrditi je li promjena
vrijednosti zavisne varijable doista uzrokovana utjecajem, odnosno promjenom vrijednosti
nezavisne varijable ili je do promjene vrijednosti zavisne varijable dolo sluajno stjecajem
drugih okolnosti (pod djelovanjem tzv. nekontroliranih uvjeta ili initelja). U tu svrhu s p
oznaavamo vjerojatnost da je do promjene zavisne varijable dolo sluajno stjecajem drugih
okolnosti i taj broj nazivamo p vrijednost. Broj p je neki element segmenta [0, 1] i za njega
odreujemo gornju granicu do koje emo smatrati da je do promjene vrijednosti zavisne
varijable dolo sluajno. Obino se razlikuju dva kriterija:
- blai kriterij: smatramo da je do promjene vrijednosti zavisne varijable dolo sluajno
ako i samo ako je p 0.05 i tada kaemo da smo procjenu izvrili uz razinu
pouzdanosti od 95%;
- stroi kriterij: smatramo da je do promjene vrijednosti zavisne varijable dolo sluajno
ako i samo ako je p 0.01 i tada kaemo da smo procjenu izvrili uz razinu
pouzdanosti od 99%.
Ekvivalentno, prema blaem kriteriju smatramo da je promjena vrijednosti zavisne varijable
doista uzrokovana promjenom vrijednosti nezavisne varijable, tj. da je veza promatranih
varijabli statistiki znaajna ako i samo ako je p < 0.05. U sluaju stroega kriterija
odgovarajui uvjet je p < 0.01.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 135
Budui da emo raditi uglavnom s ''malim'' uzorcima (koji imaju najvie 30 elemenata), p
vrijednost koja odgovara Pearsonovu koeficijentu jednostavne linearne korelacije raunat
emo koristei tzv. Studentovu t razdiobu
96
ili, kako se esto naziva, ''razdiobu malih
uzoraka'' jer se u sluaju ''velikih uzoraka (koji imaju npr. 300 elemenata) praktiki podudara
s normalnom razdiobom. Jedan od modificiranih algoritama za izraun p vrijednosti
Pearsonova koeficijenta jednostavne linearne korelacije na temelju Studentove t razdiobe u
MS Excelu moe se formulirati ovako:
Korak 1. Izraunati Pearsonov koeficijent jednostavne linearne korelacije (r).
Korak 2. Izraunati vrijednost broja d := N 2, gdje je N opseg uzorka (tj. ukupan broj
elemenata u uzorku). Vrijednost d obino se naziva broj stupnjeva slobode
97
.
Korak 3. Izraunati pripadnu t vrijednost prema formuli
2
1
d
t r
r
=
.
Korak 4. Izraunati p vrijednost kao vrijednost Studentove t razdiobe s parametrima |t|, d i
2. (Broj 2 treba upisati jer kod korelacije uvijek promatramo dvosmjerne veze, tj. ne treba
unaprijed zadati koja varijabla je zavisna, a koja nezavisna. Ukoliko se to ipak uini, govori se
o jednosmjernoj vezi.) U MS Excelu ta se vrijednost dobiva primjenom funkcije TDIST.
Korak 5. Usporediti p vrijednost ili s 0.01 (stroi kriterij) ili s 0.05 (blai kriterij). Pearsonov
koeficijent jednostavne linearne korelacije je statistiki znaajan ako i samo ako je p < 0.01
(ili p < 0.05).
Pokaimo primjenu navedenih postupaka na primjerima.
Primjer 5. (preuzeto iz The World Almanac and The Book of Fact, 1975.) Ispituje se odnos
izmeu visine i mase ena u dobi od 30 do 40 godina. Odabrano je ukupno 15 uzoraka ena
navedene dobi i dobiveni su sljedei podaci:
96
Studentovu t-razdiobu je 1908. prvi otkrio engleski statistiar William Sealy Gosset (1876. 1937.), suradnik
Karla Pearsona. On je tada radio za pivovaru Guiness koja je zahtijevala od njega da svoje radove objavljuje
pod pseudonimom, pa je Gosset objavio lanak o novoj razdiobi u Pearsonovu asopisu ''Biometrics'' pod
pseudonimom Student. Taj se pseudonim i danas koristi u nazivu razdiobe.
97
Grubo govorei, broj stupnjeva slobode moe se definirati kao ukupan broj meusobno razliitih ''slobodnih''
(nezavisnih) parametara ije vrijednosti treba zadati kako bi se potpuno odredila vrijednost neke veliine.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 136
uzorak prosjena visina
[m]
prosjena masa
[kg]
1 1.47 52.21
2 1.5 53.12
3 1.52 54.48
4 1.55 55.84
5 1.57 57.2
6 1.60 58.57
7 1.63 59.93
8 1.65 61.29
9 1.68 63.11
10 1.7 64.47
11 1.73 66.28
12 1.75 68.1
13 1.78 69.92
uzorak prosjena visina
[m]
prosjena masa
[kg]
14 1.8 72.19
15 1.83 74.46
ukupno:
24.76 931.17
Odredimo Pearsonov koeficijent jednostavne linearne korelacije i procijenimo njegovu
statistiku znaajnost uz razinu pouzdanosti od 95%. Radi odreenosti, neka nezavisna
varijabla (X) bude varijabla prosjena visina, a zavisna varijabla (Y) varijabla prosjena
masa.
98
Izraunajmo najprije sve potrebne pomone numerike podatke:
98
Suprotna bi pretpostavka (ovisnost visine o masi) bila daleko vie motivirajua npr. za lijeenje od anoreksije i
bulimije.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 137
uzorak
prosjena
visina [m]
(X)
prosjena
masa [kg]
(Y)
x
i
y
i
x
i
2
y
i
2
1 1.47 52.21 76.7487 2.1609 2725.8841
2 1.5 53.12 79.68 2.25 2821.7344
3 1.52 54.48 82.8096 2.3104 2968.0704
4 1.55 55.84 86.552 2.4025 3118.1056
5 1.57 57.2 89.804 2.4649 3271.84
6 1.6 58.57 93.712 2.56 3430.4449
7 1.63 59.93 97.6859 2.6569 3591.6049
8 1.65 61.29 101.1285 2.7225 3756.4641
9 1.68 63.11 106.0248 2.8224 3982.8721
10 1.7 64.47 109.599 2.89 4156.3809
11 1.73 66.28 114.6644 2.9929 4393.0384
12 1.75 68.1 119.175 3.0625 4637.61
13 1.78 69.92 124.4576 3.1684 4888.8064
14 1.8 72.19 129.942 3.24 5211.3961
15 1.83 74.46 136.2618 3.3489 5544.2916
ukupno: 24.76 931.17 1548.245 41.053 58498.5439
Stoga je traeni Pearsonov koeficijent jednostavne linearne korelacije:
15 15 15
1 1 1
2 2
15 15 15 15
2 2
1 1 1 1
2 2
1
15
,
1 1
15 15
1
1548.245 24.76 931.17
15
1 1
41.053 24.76 58498.5439 931.17
15 15
i i i i
i i i
i i i i
i i i i
x y x y
r
x x y y
r
= = =
= = = =
=
| | | |
| |
\ \
=
r = 0,994583794
Prije interpretacije dobivenoga koeficijenta procijenimo njegovu statistiku znaajnost.
Izraunajmo najprije pripadnu t vrijednost:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 138
2
15 2
0.994583794 34.5016057
1 0.994583794
d
t r
r
= =
.
Pripadnu p vrijednost izraunamo koristei MS Excel. Dobivamo:
p = TDIST(34.5016057;152;2) 3.60352E-14 = 0.00000000000000360352.
Oito je p < 0,05, pa postoji statistiki znaajna linearna veza izmeu prosjene visine i
prosjene mase na promatranim uzorcima ena. Iz vrijednosti Pearsonova koeficijenta
jednostavne linearne korelacije zakljuujemo da je ta veza pozitivna i jaka, tj. da e poveanje
prosjene visine vrlo vjerojatno uzrokovati i poveanje prosjene mase (i obrnuto).
Primjer 6. U sljedeoj je tablici navedeno ukupno 10 parova vrijednosti nezavisne varijable X
i zavisne varijable Y.
I x
i
y
i
1 10 0.666654428469398
2 11,8 0.666664817791255
3 16 0.666666644193195
4 20 0.666666666329664
5 30 0.666666666666657
6 50 0.666666666666667
7 70 0.666666666666667
8 90 0.666666666666667
9 120 0.666666666666667
10 600 0.666666666666667
Odgovarajuim se izraunom dobiva da je vrijednost Pearsonova koeficijenta jednostavne
linearne korelacije
r = 0.208423,
pripadna t vrijednost
t 0.602745504,
a toj vrijednosti odgovarajua p vrijednost
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 139
p 0.563369789.
Uz razinu pouzdanosti od 95%, moe se zakljuiti da ne postoji statistiki znaajna linearna
korelacija promatranih varijabli. No, zakljuak da ne postoji bilo kakva korelacija
promatranih varijabli potpuno je pogrean: veza promatranih varijabli, naime, zapravo je
potpuna, tj. funkcijska i dana je analitikim izrazom:
y =
1.05
1
1.5
x
e
+
(primjer tzv. logistike funkcije).
Ovaj primjer jo jednom ukazuje na injenicu da se u primjeni Pearsonova koeficijenta
jednostavne linearne korelacije uporno mora naglaavati rije linearne jer se radi o
pokazatelju iskljuivo linearne, a ne bilo kakve veze izmeu promatranih varijabli.
4.1.1. Spearmanov
99
koeficijent korelacije ranga
Pearsonov se koeficijent jednostavne linearne korelacije u pravilu primjenjuje za utvrivanje
stupnja linearne povezanosti izmeu numerikih varijabli ije jedinice odgovaraju intervalnoj
ili omjernoj skali. No, ukoliko imamo dvije varijable od kojih je barem jedna redosljedna
(varijabla ranga), ne moramo zahtijevati da odreivanje stupnja linearne povezanosti, niti da
vrijednosti varijable (modaliteti) pripadaju intervalnoj ili omjernoj skali. U takvim
sluajevima za odreivanje stupnja linearne veze obino se koristi Spearmanov koeficijent
korelacije ranga (oznaka: r
s
)
Spearmanov koeficijent korelacije ranga pripada u tzv. neparametarske mjere korelacije jer
njegovo izraunavanje ovisi o poretku vrijednosti modaliteta promatranih varijabli, a ne
izravno o samim vrijednostima varijabli. Pritom se ne pretpostavlja da vrijednosti varijable
pripadaju nekoj od uobiajenih razdioba (npr. normalnoj razdiobi), a ve smo istakli da se ne
zahtijeva utvrivanje linearne veze i pripadnost modaliteta intervalnoj ili omjernoj skali.
Napomenimo da se obino ne rauna za pojave u bilo kakvom monotonom (rastuem ili
padajuem) odnosu.
Dakle, pretpostavljamo da modaliteti pripadaju ordinalnoj skali. Sukladno tome, modalitete
moemo rangirati, odnosno poredati od najslabijega prema najboljemu (uzlazno) ili od
99
Charles Edward Spearman (1863. 1945.), engleski statistiar i psiholog, jedan od zaetnika ideje faktorske
analize varijance.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 140
najboljega prema najslabijemu (silazno). Dogovorno emo modalitete rangirati silazno od
najboljega prema najslabijemu tako da najbolji modalitet uvijek ima rang 1. Rang pojedinoga
modaliteta zapravo moemo shvatiti kao broj poloaja (mjesta, pozicije) toga modaliteta u
''rang-listi''.
Oprez: Dogovorno modalitete rangiramo silazno, tj. najbolji modalitet uvijek dobiva rang 1.
No, ovisno o promatranom obiljeju, poveanje ranga ne mora nuno znaiti smanjenje
odgovarajue vrijednosti modaliteta. Npr. rangiramo li neki uzorak studenata prema
trenutnom prosjeku ocjena, onda e student s najboljim prosjekom imati rang 1. Poveanje
ranga (s 1 na 2) u ovom sluaju znai uobiajeno smanjenje vrijednosti modaliteta. No,
rangiramo li isti uzorak studenata prema broju izostanaka s redovne nastave, onda e student s
najmanjim brojem izostanaka imati najbolji rang, tj. u ovome sluaju poveanje ranga povlai
poveanje vrijednosti modaliteta. Ovo obavezno treba imati na umu prigodom interpretacije
Spearmanova koeficijenta korelacije ranga.
Pri ovakvom rangiranju se prirodno pojavljuje problem odreivanja ranga barem dvaju
jednakih modaliteta. U takvim sluajevima govorimo o tzv. vezanim rangovima. Npr. u nizu
ocjena 5, 4, 2, 2, 2 imamo 3 jednaka modaliteta (2), pa treba odrediti rang svakoga od njih.
Budui da su modaliteti meusobno jednaki, nema razloga preferirati bilo kojega od njih, pa
se utvruje tzv. zajedniki rang kao aritmetika sredina trenutnih pozicija istih modaliteta.
Konkretno, vrijednost 5 ima rang 1 (najbolja ocjena), vrijednost 4 ima rang 2, a tri iste
vrijednosti 2 imaju zajedniki rang
3 4 5
4
3
+ +
= jer se u trenutnom nizu nalaze na 3., 4. i 5.
mjestu.
Unato ovakvom nainu ''eliminiranja'' vezanih rangova, treba istaknuti da se u sluajevima
pojave nezanemarivoga broja vezanih rangova (u odnosu na ukupan broj parova vrijednosti
varijabli), umjesto Spearmanova, preporuuje raunanje Pearsonova koeficijenta jednostavne
linearne korelacije. Pritom kao vrijednosti nezavisne, odnosno zavisne varijable treba uzeti
izraunate rangove modaliteta.
Nakon rangiranja modaliteta, Spearmanov koeficijent r
s
rauna se prema formuli :
2
1
3
6
1
n
i
i
s
d
r
n n
=
gdje su:
n ukupan broj elemenata niza vrijednosti varijable X (ili varijable Y)
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 141
d
i
= r(x
i
) r(y
i
) = razlika rangova odgovarajuega para vrijednosti varijable X i varijable Y ,
za svaki i = 1, 2, , n.
Navedimo neka korisna svojstva vezana uz Spearmanov koeficijent korelacije ranga:
Svojstvo 1. Zbroj svih razlika rangova jednak je 0.
Svojstvo 2. Ako su u svakom paru rangovi jednaki, njihove su razlike jednake nuli. U tom je
sluaju vrijednost Spearmanova koeficijenta korelacije ranga jednaka r
s
= 1 i tada govorimo o
potpunoj (savrenoj) pozitivnoj korelaciji ranga.
Svojstvo 3. Ako je redoslijed rangova jedne varijable suprotan redoslijedu rangova druge
varijable, vrijednost Spearmanova koeficijenta korelacije ranga jednaka je r
s
= 1 i tada
govorimo o potpunoj (savrenoj) negativnoj korelaciji ranga.
Svojstvo 4. Kao kriterij jakosti veze meu varijablama ranga koristi se kriterij naveden kod
Pearsonova koeficijenta jednostavne linearne korelacije.
Primjer 1. Na sluajno odabranom uzorku od 10 ljudi ispituje se veza kvocijenta inteligencije
i ukupnoga tjednoga vremena provedenoga u gledanju TV programa. Pritom se, kao radna
pretpostavka, uzima da je poeljno to manje vremena tjedno provoditi pred televizijskim
prijamnikom. Dobiveni podaci prikazani su u donjoj tablici.
kolinik
inteligencije
(IQ)
vrijeme
provedeno u
gledanju TV
[sati/tjedan]
106 7
86 0
100 27
101 50
99 28
103 29
97 20
113 12
112 6
110 17
Ispitajmo vezu promatranih varijabli pomou Spearmanova koeficijenta korelacije ranga.
Najprije rangirajmo modalitete. Kod varijable IQ logino je da osoba (iz promatranoga
uzorka) s najveim kolinikom inteligencije ima rang 1, a osoba s najmanjim koeficijentom
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 142
inteligencije rang 10. Ovdje, dakle, poveanje ranga znai smanjenje vrijednosti varijable,
odnosno smanjenje kolinika inteligencije. Kod varijable vrijeme provedeno u gledanju TV
osobi koja tjedno najmanje vremena provede u gledanju televizijskih programa, u skladu s
polaznom temeljnom pretpostavkom, dodijelit emo rang 1, a osobi koja tjedno najvie
vremena provede u gledanju televizijskih programa rang 10. Tako dobivamo sljedeu tablicu:
kolinik
inteligencije
(IQ)
(x
i
)
vrijeme
provedeno u
gledanju TV
[sati/tjedan]
(y
i
)
r(x
i
)
r(y
i
)
d
i
2
i
d
106 7 4 3 1 1
86 0 10 1 9 81
100 27 7 7 0 0
101 50 6 10 -4 16
99 28 8 8 0 0
103 29 5 9 -4 16
97 20 9 6 3 9
113 12 1 4 -3 9
112 6 2 2 0 0
110 17 3 5 -2 4
ukupno: 0 136
Prema tome, Spearmanov koeficijent korelacije ranga jednak je:
10
2
1
3
6
6 136
1 1
10 10 990
i
i
s
d
r
=
= =
0.175757576.
Dakle, na temelju promatranoga uzorka moe se zakljuiti da postoji neznatna pozitivna
korelacija kolinika inteligencije i vremena provedenim u gledanju televizijskih programa.
Napomenimo da se moe pokazati da je pripadna p vrijednost strogo vea od 0.05, tj. da
izraunati Spearmanov koeficijent korelacije ranga nije statistiki znaajan pokazatelj.
Primjer 2. U donjoj su tablici navedeni ukupni bodovi na pismenim ispitima iz Gospodarske
matematike, odnosno Poslovne statistike za svakoga od 8 sluajno izabranih studenata
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 143
strunoga studija raunovodstva i financija Veleuilita u Frkljevcima u akademskoj godini
2006/2007.
bodovi na ispitu iz
gospodarske matematike
bodovi na ispitu iz
poslovne statistike
45 50
20 10
50 50
0 20
100 90
50 50
30 40
80 100
Odredimo Spearmanov koeficijent korelacije ranga i objasnimo njegovo znaenje. U ovom se
zadatku radi o sluaju gdje nije potpuno jasno koja je varijabla zavisna, a koja nezavisna. No,
kako ispitujemo iskljuivo stupanj veze meu promatranim varijablama, ta injenica nije
bitna. Stoga emo pretpostaviti da su bodovi na ispitu iz Gospodarske matematike nezavisna,
a bodovi na ispitu iz Poslovne statistike zavisna varijabla. Navedene su varijable oito
redosljedne, tj. student koji je na ispitu iz Gospodarske matematike postigao 100 bodova bolji
je od studenta koji je na istom ispitu postigao 50 bodova itd. U oba sluaja modalitete
obiljeja poredat emo silazno jer student s najveim brojem bodova treba ima najvei rang.
Tako dobivamo sljedeu tablicu:
bodovi na ispitu iz Gospodarske matematike
(x
i
)
bodovi na ispitu iz Poslovne statistike
(y
i
)
r(x
i
) r(y
i
) d
i
d
i
2
45 50 5 4 1 1
20 10 7 8 -1 1
50 50 3.5 4 -0.5 0.25
0 20 8 7 1 1
100 90 1 2 -1 1
50 50 3.5 4 -0.5 0.25
30 40 6 6 0 0
80 100 2 1 1 1
ukupno: 0 5.50
Uoimo da u vrijednostima varijable X imamo dvije meusobno jednake (50) koje dijele 3. i
4. mjesto. Stoga je njihov zajedniki rang jednak
2
4 3 +
= 3.5. Analogno, u varijabli Y imamo
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 144
3 takve vrijednosti (ponovno 50) koje dijele 3., 4. i 5. mjesto. Stoga je njihov zajedniki rang
jednak =
+ +
3
5 4 3
4. Tako je traeni Spearmanov koeficijent korelacije ranga jednak:
93 . 0
8 8
50 . 5 6
1
3
=
s
r
Zakljuujemo da postoji jaka pozitivna korelacija izmeu bodova na ispitu iz matematike i
bodova na ispitu iz statistike. Iz dobivena koeficijenta zakljuujemo da poveanje ranga broja
bodova iz Gospodarske matematike vrlo vjerojatno uzrokuje poveanje ranga broja bodova iz
Poslovne statistike. To znai da e student koji ostvari visoki rezultat u jednom ispitu vrlo
vjerojatno postii visoki rezultat i u drugom, i obrnuto. Moe se pokazati da je pripadna p
vrijednost strogo manja od 0,01, pa je dobiveni koeficijent statistiki znaajan.
Primjer 3. Mujaci smeokriloga brzana (Fregata maginificens) imaju crvenu grlenu vreicu
koju u doba svadbenoga plesa
100
nadimaju kao svadbeno ruho (vidjeti sliku) i pomou nje
proizvode poseban zvuk kojim privlae enke. Prouavajui opisano ponaanje, grupa
ornitologa utvrdila je da enke odabiru mujake upravo na temelju veliine njihove grlene
vreice, pa je provedeno dodatno istraivanje postoji li statistiki znaajna korelacija izmeu
obujma grlene vreice i frekvencije zvuka kojim mujaci privlae enke. U donjoj su tablici
navedeni prikupljeni podaci.
100
Svadbeni ples u biologiji je skupni naziv za sva ponaanja koja predstavljaju uvod u parenje ivotinja.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 145
mujak smeokriloga brzana
Korelacija promatranih varijabli utvrena je na temelju Spearmanova koeficijenta korelacije
ranga: mujak s najveim obujmom grlene vreice ima rang 1, a mujak s najmanjim
obujmom rang 18, pri emu mujaci s obujmom grlene vreice 5090 cm
3
imaju rang 6.5. Za
varijablu frekvencija zvuka primijenjen je suprotan kriterij: mujak s najdubljom frekvencijom
zvuka ima rang 1, a mujak s najviom frekvencijom rang 18. Izraunom Spearmanova
koeficijenta korelacije ranga dobiva se:
r
s
= 0.763158.
Dakle, postoji srednje jaka pozitivna korelacija izmeu obujma grlene vreice smeokriloga
brzana i frekvencije zvuka kojim vabi enke. To znai da poveanje ranga obujma grlene
resice vjerojatno uzrokuje poveanje ranga frekvencije zvuka, odnosno da e mujak s veim
obujmom grlene vreice vrlo vjerojatno imati dublju frekvenciju zvuka kojim privlai enke.
Napomenimo da je na temelju odgovarajuega statistikoga pokazatelja utvreno da je
dobiveni rezultat statistiki znaajan, tj. zakljuak izveden iz promatranoga uzorka od 18
mujaka moe se primijeniti i na cjelokupnu populaciju smeokriloga brzana, te da se
ovisnost frekvencije zvuka (zavisne varijable Y) o obujmu grlene vreice (nezavisnoj varijabli
X) moe relativno dobro opisati tzv. regresijskom jednadbom:
obujam
grlene vreice
[cm
3
]
frekvencija
zvuka
[Hz]
1760 529
2040 566
2440 473
2550 461
2730 465
2740 532
3010 484
3080 527
3370 488
3740 485
4910 478
5090 434
5090 468
5380 449
5850 425
6730 389
6990 421
7960 416
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 146
Y = 563.95 e
0,0005 X
.
Zadatak za vjebu: Unesite podatke iz gornje tablice u radni list MS Excela, pa provjerite
valjanost izrauna Spearmanova koeficijenta korelacije ranga. Oprez: Rangove mujaka s
obujmom grlene vreice 5090 cm
3
morate upisati sami.
4.2. Regresijska analiza
Korelacijska je analiza vrlo esto tek prvi korak u utvrivanju meusobne ovisnosti dviju ili
vie promatranih varijabli. Ukoliko se pomou odgovarajuih statistikih pokazatelja utvrdi
da postoji statistiki znaajna veza meu promatranim varijablama, sljedei korak u
istraivanju te veze je tzv. regresijska
101
analiza.
Regresijsku su analizu u statistici prvi koristili matematiari Legendre
102
i Gauss koji su
poetkom 19. stoljea objavili radove o metodi najmanjih kvadrata. Meutim, sm pojam
regresijska analiza u statistiku je uveo Sir Francis Galton
103
. On je 1886. u Glasniku
antropolokoga instituta u Londonu objavio rad u kojemu je promatrao ovisnost visine djece
o prosjenoj visini njihovih roditelja. U tom je istraivanju doao do zanimljiva zakljuka:
ukoliko je prosjena visina obaju roditelja vea od medijana ureenoga niza svih prosjenih
visina roditelja, visina njihova djeteta e oekivano biti manja od prosjene visine obaju
roditelja (i obrnuto: ukoliko je prosjena visina obaju roditelja manja od medijana, visina
njihova djeteta oekivano e biti vea od prosjene visine od prosjene visine obaju roditelja).
Ovakvu je pojavu Galton nazivao efekt nazadovanja ili regresijski efekt. Zaslugom Karla
Pearsona, koji je poopio Galtonova razmatranja na ope statistike modele, rije regresija u
statistici je dobila dananje znaenje iako, praktino, s tim znaenjem nema gotovo nikakvih
dodirnih toaka.
Regresijska analiza ili, krae, regresija openito obuhvaa primjenu razliitih metoda
ispitivanja ovisnosti zavisne varijable (Y) o barem jednoj nezavisnoj varijabli (X). Temeljni je
cilj provedbe takvih metoda vezu izmeu promatranih varijabli izraziti ili opisati
odgovarajuim analitikim izrazom (regresijskim modelom). Takav izraz omoguuje ne samo
101
Rije regresija potjee od latinske rijei regressio = povratak, uzmak, odstupanje, nazadovanje. Objanjenje
uporabe ovoga naziva u statistici slijedi u daljnjem tekstu.
102
Adrien-Marie Legendre (1752. 1833.), francuski matematiar, bavio se matematikom analizom, teorijom
brojeva i algebrom. Jedan od Mjeseevih kratera dobio je ime po njemu.
103
Francis Galton (1822. 1911.), engleski znanstvenik, neak Charlesa Darwina, zaetnik moderne korelacijske
i statistike analize, mentor Karla Pearsona i Charlesa Edwarda Spearmana.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 147
objanjavanje ovisnosti promatranih pojava, nego i procjenjivanje vrijednosti zavisne
varijable Y za odreene vrijednosti barem jedne nezavisne varijable X.
Ovisno o broju zavisnih i nezavisnih varijabli koje se pojavljuju u odgovarajuem modelu,
regresija openito moe biti:
1.) jednostavna (u modelu se pojavljuje tono jedna zavisna i tono jedna nezavisna
varijabla);
2.) viestruka ili multipla (u modelu se pojavljuju tono jedna zavisna i barem dvije nezavisne
varijable).
U ovom emo se kolegiju baviti modelima jednostavne regresije, a od primjera modela
viestruke regresije kratko emo spomenuti samo najjednostavniji i najprimjenjivaniji model
viestruke linearne regresije.
Opi oblik modela jednostavne regresije jest:
Y = f(X) + e ili Y =
^
Y + e.
U ovakvom modelu varijabla e je tzv. stohastika (sluajna) varijabla koja, slobodno
govorei, ''mjeri'' stupanj nesustavnih utjecaja na zavisnu varijablu Y. To je potpuno u skladu s
ranijom podjelom veza mou varijablama na funkcijske i statistike: kod funkcijskih su veza
vrijednosti varijable u jednake nuli, dok su kod statistikih veza one razliite od nule. Opisna
statistika kojom se bavimo u ovom kolegiju ne bavi se posebnom analizom stohastike
varijable e, nego je smatra iskljuivo odstupanjima od funkcijskoga dijela regresijskoga
modela
104
.
O emu se, zapravo, radi? Kad istraujemo ovisnosti pojedinih varijabli, statistikim
istraivanjem dobivamo odreene podatke o vrijednostima tih varijabli. Npr. elimo li utvrditi
kako mjeseno izdvajanje za odjeu zaposlenika tvrtke ''Drpislavi d.o.o.'' iz Babine Grede
ovisi o njihovim mjesenim primanjima, statistikim istraivanjem (npr. anketiranjem)
dobivamo podatke o mjesenim primanjima i izdvajanja za odjeu svakoga od zaposlenika.
Te podatke sredimo i pregledno prikaemo tablino, kako smo to nauili u 2. poglavlju.
Oznaimo li s X nezavisnu varijablu mjesena primanja, a s Y zavisnu varijablu izdvajanja za
odjeu, cilj nam je odrediti funkciju koja e svakoj vrijednosti varijable X pridruiti
statistikim istraivanjima dobivenu vrijednost varijable Y. Najee takva funkcija ne postoji
jer je veza meu varijablama stohastika. Stoga elimo nai funkciju f(X) koja e to tonije
104
Otuda dolazi i oznaka e: engl. error = greka.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 148
vrijednostima varijable X pridruivati vrijednosti varijable Y. U svakom takvom pridruivanju
nuno e se javiti odreena greka (tzv. rezidualno
105
odstupanje). Iako bi teorijski bilo
najbolje da svako pojedino rezidualno odstupanje bude to manje, to praktino nije mogue:
minimiziranje odstupanja nastaloga jednim pridruivanjem u pravilu uzrokuje poveanje
odstupanja nastaloga drugim pridruivanjem. Moe se pokazati da je prosjena vrijednost svih
rezidualnih odstupanja jednaka nuli, to znai da kao i kod uvoenja pojma standardne
devijacije (vidjeti poglavlje 3.) nije mogue minimizirati prosjeno rezidualno odstupanje.
Stoga je potrebno analizirati i minimizirati varijancu svih rezidualnih odstupanja (koja je
uvijek strogo vea od nule). Takvo razmatranje dovodi do definiranja pojmova varijanca
regresije i standardna devijacija regresije o kojima emo neto vie rei u toki 4.2.3.
Prema tome, dva su osnovna cilja koja se ele postii stvaranjem regresijskoga modela:
1) odrediti tip realne funkcije (linearna, kvadratna, eksponencijalna, logaritamska, )
koja najbolje opisuje vezu izmeu promatranih varijabli;
2) procijeniti osnovne parametre te funkcije tako da zbroj kvadrata svih rezidualnih
odstupanja bude to manji.
U nastavku emo dati kratak opis nekoliko takvih regresijskih modela.
4.2.1. Model jednostavne linearne regresije
Ukoliko iz dijagrama rasipanja uvidimo da ravnomjerno poveanje vrijednosti nezavisne
varijable X uzrokuje priblino ravnomjerno poveanje (ili smanjenje) zavisne varijable Y,
regresijski model koji najbolje opisuje promatranu vezu varijabli X i Y jest model jednostavne
linearne regresije.
Opi oblik toga modela je:
Y = aX + b + e,
gdje su a, b R parametri modela, a e, kako je istaknuto u uvodu, stohastika (sluajna)
varijabla. Cilj nam je odrediti parametre a i b tako da varijanca svih rezidualnih odstupanja
bude minimalna. Budui da je graf svake linearne funkcije pravac, to praktino znai da
traimo jednadbu pravca koji e najbolje aproksimirati skup toaka dobiven konstrukcijom
dijagrama rasipanja.
105
Lat. residuum = ostatak; razlika
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 149
Svakim statistikim istraivanjem dobivamo ukupno n razliitih ureenih parova vrijednosti
varijable X i vrijednosti varijable Y, tj. dobivamo ureene parove (x
1
, y
1
), (x
2
, y
2
), (x
n
, y
n
).
Za svaki od tih parova vrijedi jednakost:
y
i
= a x
i
+ b + e
i
, i = 1, 2, , n,
pri emu je e
i
rezidualno odstupanje, odnosno ''promaaj'' koji inimo zamijenimo li
statistikim istraivanjem dobivenu vrijednost y
i
raunski dobivenom vrijednou a x
i
+ b.
106
Time, zapravo, dobivamo sustav od n linearnih jednadbi s n + 2 nepoznanice: a, b, e
1
, e
2
, ,
e
n
. Taj sustav ima beskonano mnogo realnih rjeenja, ali tono jedno od njih zadovoljava
uvjet da varijanca svih rezidualnih odstupanja bude minimalna. Takvo se rjeenje odreuje
tzv. metodom najmanjih kvadrata.
Osnovna ideja metode najmanjih kvadrata je postii da zbroj kvadrata odstupanja empirijskih
vrijednosti zavisne varijable y
i
od oekivanih vrijednosti (oznaka:
i
) te varijable bude
minimalan. Budui da se pri izvodu parametara koristi tzv. diferencijalni raun, u detalje
cijeloga postupka neemo nulaziti, nego emo samo navesti rezultat:
1
2
2
1
,
n
i i
i
n
i
i
x y n x y
a b y a x
x n x
=
=
= =
,
pri emu su x i y redom aritmetika sredina empirijskih vrijednosti varijable x, odnosno
varijable y. Tako smo, dakle, dobili model jednostavne linearne regresije:
y
= a x + b.
(Oznaka y
= a x + b. Ovaj parametar
nema veliko praktino znaenje jer nerijetko nema praktinoga smisla (npr. u modelima koji
promaraju ovisnost izdvajanja za prehranu o ukupnim mjesenim primanjima jer je u takvim
sluajevima praktino besmisleno procjenjivati iznos izdvajanja za prehranu osobe bez
ikakvih ukupnih mjesenih primanja).
Vrijednost a naziva se regresijski koeficijent i to je ujedno najvaniji parametar dobivenoga
modela. Njegova teorijska interepretacija je sljedea: vrijednost a je oekivana prosjena
promjena zavisne varijable y kada se nezavisna varijabla x povea za jednu jedinicu mjere.
Strogo pozitivna vrijednost regresijskoga koeficijenta upuuje na to da jedinini porast
vrijednosti nezavisne varijable X uzrokuje porast vrijednosti zavisne varijable Y (ili, kako se
matematiki netono esto istie, da su varijable X i Y upravno razmjerne), a strogo negativna
vrijednost regresijskoga koeficijenta upuuje na to da jedinini porast vrijednosti nezavisne
varijable X uzrokuje smanjenje vrijednosti zavisne varijable Y (ili, kako se matematiki
netono esto istie, da su varijable X i Y obrnuto razmjerne).
Znaenje regresijskoga koeficijenta nije iskljuivo u promjeni vrijednosti nezavisne varijable
za jednu jedinicu mjere, nego je ono puno vee. Naime, vrijede sljedea svojstva:
Svojstvo 1. Ukoliko se vrijednost nezavisne varijable X promijeni (povea ili smanji) za k
jedinica mjere, oekivana apsolutna prosjena promjena vrijednosti zavisne varijable Y iznosi
k a (jedinica mjere).
Dokaz: Neka je x
1
poetna vrijednost nezavisne varijable X. Tada je pripadna oekivana
vrijednost zavisne varijable Y jednaka
1
y
= a x
1
+ b.
Ukoliko se vrijednost x
1
promijeni za k jedinica mjere, nova vrijednost varijable X je:
x
2
= x
1
+ k,
107
U osnovnoj i srednjoj koli tu vrijednost nerijetko (neprecizno!) nazivaju odsjeak na osi y.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 151
pri emu za k > 0 imamo poveanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje
vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je
2
y
= a x
2
+ b = a (x
1
+ k) + b = a x
1
+ b + a k =
1
y
+ a k,
a odatle slijedi:
2
y
1
y
= a k.
Dakle, apsolutna prosjena promjena vrijednosti zavisne varijable Y jednaka je a k, to je i
trebalo pokazati.
Svojstvo 2. (esta zabluda) Ukoliko se vrijednost nezavisne varijable x promijeni (povea ili
smanji) za k%, oekivana relativna prosjena promjena vrijednosti zavisne varijable y iznosi
k% ako i samo ako je b = 0. Drugim rijeima, promatrane varijable su upravno ili obrnuto
razmjerne ako i samo ako je b = 0.
Dokaz: Neka je x
1
poetna vrijednost zavisne varijable X. Tada je pripadna oekivana
vrijednost zavisne varijable Y jednaka
1
y
= a x
1
+ b.
Ukoliko se vrijednost x
1
promijeni za k%, pri emu je k realan broj takav da je k 0 (za k = 0
poetna vrijednost varijable X se ne mijenja), nova vrijednost varijable X je:
x
2
= x
1
+
100
k
x
1
= (1 +
100
k
) x
1
,
pri emu za k > 0 imamo poveanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje
vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je:
2
y
= a x
2
+ b = a (1 +
100
k
) x
1
+ b = a x
1
+ b + a
100
k
x
1
=
1
y
+ a
100
k
x
1
.
Stoga je pripadna relativna prosjena promjena vrijednosti zavisne varijable Y jednaka:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 152
1 1 1 1 1
2 1
1
1 1 1
100 100 100
k k k
y a x y a x a x
y y
a x b
y y y
+
= = =
+
,
Ta e vrijednost biti jednaka k% ako i samo ako vrijedi jednakost:
2 1
1
100
y y k
y
= ,
odnosno jednakost
1
1
100
100
k
a x
k
a x b
=
+
.
Prema definiciji jednakosti dvaju razlomaka, gornja je jednakost ekvivalentna jednakosti
1 1
100 ( )
100
k
a x a x b k = + ,
tj. jednakosti
a k x
1
= a x
1
k + b k,
a odavde je
b k = 0.
Prema pretpostavci je k 0, pa dijeljenjem s k dobivamo
b = 0,
to je i trebalo pokazati.
Radi potpunosti, spomenimo da se grafiki prikaz bilo kojega modela jednostavne regresije
naziva regresijska krivulja. Regresijske krivulje mogu biti pravci, grafovi eksponencijalne i
logaritamske funkcije, grafovi ope potencije itd. Grafiki prikaz modela jednostavne linearne
regresije uvijek je pravac (jer je grafiki prikaz bilo koje linearne funkcije pravac), i taj se
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 153
pravac naziva regresijski pravac. Njegova jednadba u pravokutnom koordinatnom sustavu u
ravnini podudara se s jednadbom regresijskoga modela, tj. ona glasi: y
= a x + b.
Primjer 1. Menadment tvornice prehrambenih proizvoda ''Mljac-mljac d.d.'' iz Zveaja
razmatra vezu izmeu opsega proizvodnje okolade ''Fantazija'' i ukupne zarade dobivene
prodajom te okolade u proteklih 8 mjeseci. Dobiveni podaci prikazani su u donjoj tablici.
proizvodnja okolade
[000 kom.]
ukupna dobit
[000 kn]
20 220
25 280
32 520
28 500
40 1250
35 1000
36 980
30 600
Prikaimo dobivene podatke dijagramom rasipanja, izraunajmo Pearsonov koeficijent
jednostavne linearne korelacije i procijenimo njegovu statistiku znaajnost na razini
pouzdanosti od 95%. Potom procijenimo parametre modela jednostavne linearne regresije koji
najbolje opisuje ovisnost ukupne dobiti o koliini proizvedene okolade, te, na temelju njega,
ukupnu dobit ukoliko se proizvede 30 000 komada okolade i ukupnu proizvodnju okolade u
mjesecu u kojemu je ostvarena dobit od 800.000,00 kn.
Budui da emo u drugom dijelu zadatka promatrati ovisnost ukupne dobiti o koliini
proizvedene okolade, koliina proizvedene okolade bit e nam nezavisna varijabla X, a
ukupna zarada dobivena prodajom okolade zavisna varijabla Y (za korelacijsku je analizu to
nebitno). Odgovarajui dijagram rasipanja je:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 154
Izraunima analognima onima iz toke 4.1 dobiva se vrijednost Pearsonova koeficijenta
jednostavne linearne korelacije:
r = 0.952039274,
a tom koeficijentu pripadna p vrijednost jednaka je
p = 0.000265976 < 0.05.
Dakle, dobiveni koeficijent je statistiki znaajan, tj. postoji statistiki znaajna linearna veza
izmeu proizvodnje okolade i ukupne dobiti. Iz vrijednosti Pearsonova koeficijenta
jednostavne linearne korelacije moe se zakljuiti da je ta veza pozitivna i jaka, tj. da e
poveanje proizvodnje okolade vrlo vjerojatno uzrokovati poveanje ukupne dobiti.
Regresijski pravac i njegova jednadba, koja je ujedno i jednadba odgovarajuega modela
jednostavne linearne regresije, prikazani su na donjoj slici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 155
Osnovni parametri dobivenoga regresijskog modela jednostavne linearne regresije su:
a = 54.60276339,
b = 1010.284974
(Definiciju i znaenje parametra R
2
navodimo u toki 4.2.3.) Znaenje tih parametara je
sljedee:
a = 54.60276339 Ukoliko se proizvodnja povea za 1000 okolada, oekivano prosjeno
poveanje ukupne dobiti iznosi 54.602,76 kn. (Oprez s mjernim jedinicama!)
b = 1010.284974 Ukoliko tvornica ne proizvede niti jednu okoladu, procjenjuje (ili
oekuje) se gubitak u iznosu od 1.010.284,97 kn. (Opet pripazite na mjerne jedinice!)
Teoretski gledano, na temelju dobivenoga regresijskoga koeficijenta a moemo procijeniti
prosjenu promjenu ukupne dobiti u sluaju bilo koje promjene vrijednosti proizvodnje. No,
zbog pouzdanosti regresijskoga modela vrijednost navedene promjene ne bi trebala biti strogo
vea od raspona varijacije uzorka nezavisne varijable X jer se procjenjivanjem vrijednosti
izvan segmenta odreenoga najmanjom i najveom vrijednosti nezavisne varijable X znaajno
gubi na pouzdanosti procjene.
Npr. ukoliko se mjesena proizvodnja povea za 100 okolada, oekivano prosjeno
poveanje ukupne dobiti iznosit e 5.460,27 kn. Smanji li se mjesena proizvodnja (npr. zbog
remonta strojeva) za 200 okolada, oekivano prosjeno smanjenje ukupne dobiti iznosit e
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 156
10.920,55 kn. Openito, povea (smanji) li se proizvodnja za k okolada mjeseno, oekivano
prosjeno poveanje (smanjenje) ukupne dobiti iznosit e k a = 54,60276 k kn.
Preostaje nam procijeniti ukupnu dobit ukoliko se mjeseno proizvede 30000 komada
okolade. U tu emo svrhu u dobivenu jednadbu modela jednostavne linearne regresije
uvrstiti x = 30, pa emo dobiti:
y
= .
Ovdje oznaka x
= + .
Dakle, procijenjena proizvodnja u mjesecu u kojemu je ostvarena dobit od 800.000,00 kn
priblino iznosi 33154 komada okolade. (Oprez s interpretacijom: vrijednosti varijable
proizvodnja su nuno prirodni brojevi ili nula, pa ne moemo rei npr. da procijenjena
proizvodnja iznosi 33153.7 komada okolade. Slino vrijedi i za vrijednosti varijable y koje
ima smisla raunati na najvie 5 decimalnih mjesta jer 6. decimala oznaava tisuiti dio kune
koji u praksi ne postoji.)
Napomenimo da se u sluaju modela jednostavne linearne regresije p vrijednost koja
odgovara nezavisnoj varijabli X i ukazuje na njezinu statistiku znaajnost podudara s p
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije. U ovom sluaju to znai
da je nezavisna varijabla X statistiki znaajna, tj. da postoji statistiki znaajan utjecaj
proizvodnje okolade na ukupnu dobit. Ovaj pokazatelj ujedno je i pokazatelj statistike
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 157
znaajnosti cijeloga dobivenoga modela jednostavne linearne regresije, tj. dobiveni je model
takoer statistiki znaajan.
Primjer 2. U sljedeoj su tablici navedeni podaci o prosjenom broju zaposlenih tijekom
2007. godine i ukupnom godinjem prometu za svaku od ukupno 12 prodavaonica tvrtke
''Zumkon d.o.o.'' iz Kukae.
prosjean broj zaposlenih ukupan godinji promet
[000 ]
22 250
31 300
90 920
82 850
43 400
65 680
59 630
16 180
61 670
46 420
35 350
50 460
Odnos ukupnoga godinjega prometa i prosjenoga broja zaposlenih prikaimo grafiki
odgovarajuim dijagramom (uz kojega navedimo sve potrebne oznake), pa odredimo
Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu
statistiku znaajnost na razini pouzdanosti od 95%.
Potom procijenimo jednadbu i parametre modela jednostavne linearne regresije koji najbolje
opisuje ovisnost ukupnoga godinjega prometa o prosjenom broju zaposlenih, te utvrdimo
njihovu statistiku znaajnost na razini pouzdanosti od 95%.
Procijenimo i ukupan godinji promet prodavaonice koja je u 2007. godini imala prosjeno 40
zaposlenih, prosjean broj zaposlenih u prodavaonici koja je u 2007. godini ostvarila promet u
iznosu od pola milijuna eura, te promjenu ukupnoga godinjega prometa ukoliko se prosjean
broj zaposlenih u jednoj prodavaonici smanji za 5.
Zbog drugoga dijela zadatka, prosjean broj zaposlenih u jednoj prodavaonici bit e nam
nezavisna varijabla X, a ukupan godinji promet zavisna varijabla Y. Odgovarajui grafiki
prikaz je dijagram rasprenja prikazan na donjoj slici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 158
Izraunima analognima onima iz toke 4.1. dobiva se vrijednost Pearsonova koeficijenta
jednostavne linearne korelacije:
r = 0.991128384,
a tom koeficijentu odgovarajua p vrijednost iznosi
p = 4.26414E-10 = 0.0000000000426414 < 0.05.
Prema tome, dobiveni koeficijent statistiki je znaajan, tj. postoji statistiki znaajna
linearna veza izmeu prosjenoga broja zaposlenih i ukupnoga godinjega prometa. Iz
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zakljuujemo da je ta veza
pozitivna i jaka, tj. da e poveanje prosjenoga broja zaposlenih vrlo vjerojatno uzrokovati i
poveanje ukupnoga godinjega prometa.
Koristei gornji dijagram, moemo odrediti jednadbu modela jednostavne linearne regresije
koji najbolje opisuje promatranu ovisnost, te osnovne parametre toga modela. Zajedno s
odgovarajuim regresijskim pravcem, ti su podaci navedeni na sljedeoj slici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 159
Iz dobivene jednadbe modela jednostavne linearne regresije slijedi da su osnovni parametri
dobivenoga regresijskog modela:
a = 10.4023396,
b = 10.95031313
Njihova znaenja su:
a = 10.4023396 Ukoliko se prosjean broj zaposlenih povea za 1, oekivano prosjeno
poveanje ukupnoga godinjega prometa iznosi 10.402,34 . Odavde izravno slijedi da
ukoliko se prosjean broj zaposlenih smanji za 5, oekivano prosjeno smanjenje ukupnoga
godinjega prometa iznosi 5 10.402,34 = 52.011,70 . Openito, ukoliko se prosjean broj
zaposlenih povea (smanji) za k, oekivano prosjeno poveanje (smanjenje) ukupnoga
godinjega prometa iznosi k a 1.000,00 = k 10.4023396 1.000,00 = 10.402,3396 k .
b = 10.95031313 U ovom sluaju vrijednost x = 0 znai da u prodavaonici tijekom cijele
godine nije radio niti jedan zaposlenik. Takva prodavaonica prirodno nije ostvarila nikakav
ukupni godinji promet. Stoga konstantni lan u ovom sluaju nema svojega znaenja (ranije
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 160
je istaknuto da se u praksi nerijetko javljaju ovakvi sluajevi i da je zbog toga regresijski
koeficijent najvaniji parametar dobivenoga modela).
Analogno kao i u prethodnom primjeru, oekivani ukupan godinji promet prodavaonice u
kojoj je prosjean godinji broj zaposlenih jednak 40 dobijemo tako da u jednadbu
regresijskoga modela uvrstimo x = 40. Dobiva se:
y
=
uvrstimo a = 10.4023396, y = 500 i b = 10.95031313. Dobivamo:
1 10.95031313
500 49.118788
10.4023396 10.4023396
x
= + .
Dakle, traeni procijenjeni prosjean broj zaposlenih priblino iznosi 49. (Opet oprez s
interpretacijom: brojimo ljude, pa dobiveni rezultat nuno mora biti prirodan broj ili nula.)
Iz p vrijednosti izraunate za Pearsonov koeficijent jednostavne linearne korelacije slijedi
da su varijabla X i dobiveni model jednostavne linearne regresije statistiki znaajni. Drugim
rijeima, postoji statistiki znaajan utjecaj prosjenoga broja zaposlenih na ukupan godinji
promet u promatranim prodavaonicama.
Primjer 3. Za 10 odabranih pokrajina Kraljevine Bubumbuj utvreni su narodni dohodak po
stanovniku (per capita) i stopa mortalileta dojenadi u 2007. godini. Dobiveni su podaci
prikazani u sljedeoj tablici.
narodni dohodak po stanovniku
[000 USD]
stopa mortaliteta dojenadi
[]
3,99 12
3,5 13
3,1 15
2,82 17
2 18
1,8 18
1,73 19
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 161
narodni dohodak po stanovniku
[000 USD]
stopa mortaliteta dojenadi
[]
1,56 24
1 29
0,5 35
Odnos stope mortaliteta dojenadi i narodnoga dohotka po stanovniku prikaimo grafiki
odgovarajuim dijagramom (uz kojega navedimo sve potrebne oznake), pa odredimo
Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu
statistiku znaajnost uz razinu pouzdanosti od 95%.
Potom procijenimo jednadbu i parametre modela jednostavne linearne regresije koji najbolje
opisuje ovisnost stope mortaliteta dojenadi o narodnom dohotku po stanovniku, te statistiku
znaajnost regresijskih varijabli i dobivenoga modela jednostavne linearne regresije uz razinu
pouzdanosti od 95%.
Procijenimo i stopu mortaliteta dojenadi pokrajine iji je narodni dohodak po stanovniku u
2007. godini bio 2.500,00 USD, narodni dohodak po stanovniku u pokrajini koja je u 2007.
godini zabiljeila stopu mortaliteta dojenadi 20, te promjenu stope mortaliteta dojenadi
ukoliko se narodni dohodak po stanovniku smanji za 800 USD.
Ponovo radi drugoga dijela zadatka, stopa mortaliteta dojenadi bit e zavisna varijabla Y, a
narodni dohodak po stanovniku nezavisna varijabla X. Odgovarajui grafiki prikaz odnosa
promatranih varijabli je dijagram rasipanja prikazan na sljedeoj slici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 162
Izraunima analognima onima iz toke 4.1. dobiva se vrijednost Pearsonova koeficijenta
jednostavne linearne korelacije:
r = -0.913291451,
a tom koeficijentu pripadna p vrijednost iznosi
p = 0.000222487 < 0.05,
pa zakljuujemo da je dobiveni koeficijent statistiki znaajan, tj. da postoji statistiki
znaajna linearna veza izmeu narodnoga dohotka i stope mortaliteta dojenadi. Iz
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zakljuujemo da je ta veza
negativna i jaka, tj. da e poveanje narodnoga dohotka vrlo vjerojatno uzrokovati smanjenje
stope mortaliteta dojenadi.
Parametri modela jednostavne linearne regresije, kao i odgovarajui regresijski pravac
prikazani su na donjoj slici.
U ovome je sluaju, dakle,
a = 5.953418082;
b = 33.09751978.
Interpretacije tih parametara su:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 163
a = 5.953418082 Ukoliko se narodni dohodak po stanovniku povea za 1.000,00 USD,
oekivano prosjeno smanjenje stope mortaliteta dojenadi iznosi priblino 6. Odatle
izravno slijedi da ukoliko se narodni dohodak po stanovniku smanji za 800 USD, oekivano
prosjeno poveanje stope mortaliteta dojenadi iznosi priblino 0.8 5.953418082
4.762734465, tj. priblino 4.76. Openito, ukoliko se narodni dohodak po stanovniku
povea (smanji) za k USD, oekivano prosjeno smanjenje (poveanje) stope mortaliteta
dojenadi iznosi k |a|
1
1000
= k 5.953418082
1
1000
= 0.005953418082 k .
b = 33.098 I u ovom sluaju konstantni lan nema znaenja jer je praktiki nemogue da
cjelokupni narodni dohodak po stanovniku (varijabla X) iznosi 0,00 USD.
Preostaje procijeniti stopu mortaliteta dojenadi pokrajine iji je narodni dohodak po
stanovniku u 2007. godini bio 2.500,00 USD, te narodni dohodak po stanovniku u pokrajini
koja je u 2007. godini zabiljeila stopu mortaliteta dojenadi 20. U prvom sluaju u
dobivenu jednadbu modela jednostavne linearne regresije uvrstimo x = 2.5, pa dobijemo:
y
=
uvrstimo a = 5.953418082, y = 20 i b = 33.098, pa dobivamo:
1 33.09751978
20 2.2
5.953418082 5.953418082
x
= +
Dakle, traeni procijenjeni narodni dohodak po stanovniku iznosi priblino 2.200,00 USD.
Zakljuno istaknimo da iz p vrijednosti izraunate za Pearsonov koeficijent jednostavne
linearne korelacije slijedi da su i regresorska varijabla X i dobiveni model jednostavne
linearne regresije statistiki znaajni, tj. da postoji statistiki znaajan utjecaj narodnoga
dohotka po stanovniku na stopu mortaliteta dojenadi.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 164
4.2.2. Analiza varijance modela jednostavne linearne regresije
Nakon to smo odredili jednadbu modela jednostavne linearne regresije namee se pitanje
''kvalitete'' dobivenoga modela. Zapravo, promatramo u kojoj mjeri vrijednosti zavisne
varijable procijenjene dobivenim modelom odgovaraju empirijskim vrijednostima, tj. s
kolikom tonou moemo procijeniti vrijednost zavisne varijable za odreenu vrijednost
nezavisne varijable. Procjena reprezentativnosti modela temelji se na ve spomenutoj analizi
varijance rezidualnih odstupanja empirijskih vrijednosti (y
i
) zavisne varijable od procijenjenih
vrijednosti (
i
) te varijable. Tu je analizu grafiki zgodno prikazati donjom slikom.
Prigodom ocjenjivanja reprezentativnosti modela jednostavne linearne regresije koristi se tzv.
jednadba analize varijance toga modela. Ona predstavlja temelj deskriptivne i inferencijalne
statistike analize reprezentativnosti regresijskoga modela, a glasi:
2 2 2
1 1 1
( ) ( ) ( )
n n n
i i i
i i i
y y y y y y
= = =
= +
,
odnosno, u razvijenom obliku,
2 2
2 2
1 1 1 1 1 1
n n n n n n
i i i i i i i i
i i i i i i
y n y a y b x y n y y a y b x y
= = = = = =
| | | |
= + +
| |
\ \
Ova jednadba je posljedica sljedeega netrivijalnoga svojstva modela jednostavne linearne
regresije:
Svojstvo 1. Neka su (x
i
, y
i
) empirijski dobivene vrijednosti nezavisne varijable X, odnosno
zavisne varijable Y, za svaki i = 1, 2, , n. Nadalje, neka su
i
y
procijenjene vrijednosti
dobivene uvrtavanjem vrijednosti x
i
u jednadbu modela jednostavne linearne regresije koji
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 165
najbolje opisuje ovisnost varijable Y o varijabli X, i to za svaki i = 1, 2, , n. Tada je
aritmetika sredina svih procijenjenih vrijednosti jednaka aritmetikoj sredini svih
empirijskih vrijednosti, tj. vrijedi jednakost:
1 1
n n
i i
i i
y y y
= =
= =
.
Objasnimo poblie svaki pojedini lan u gornjoj jednadbi:
ST :=
2
1
( )
n
i
i
y y
=
=
2
2
1
n
i
i
y n y
=
=
2
1 1
n n
i i i
i i
a y b x y n y
= =
+
ovaj se lan naziva protumaeni dio
ukupnoga zbroja kvadrata odstupanja, a zapravo je rije o ukupnom zbroju kvadrata
odstupanja svih procijenjenih vrijednosti zavisne varijable Y od aritmetike sredine tih
vrijednosti
109
(zbog iskazanoga svojstva 1., ta aritmetika sredina jednaka je onoj koja se
pojavljuje u lanu ST);
SR =
2
1
( )
n
i
i
y y
=
2
1 1 1
n n n
i i i i
i i i
y a y b x y
= = =
ovaj se lan naziva neprotumaeni dio
ukupnoga zbroja kvadrata odstupanja ili zbroj kvadrata rezidualnih odstupanja, a zapravo je
rije o zbroju kvadrata odstupanja procijenjenih vrijednosti od odgovarajuih empirijskih
vrijednosti. Slobodno govorei, ovaj lan ''mjeri'' ukupnu pogreku svih n procjenjivanja.
Budui da je prvi lan jednak zbroju preostalih dvaju, praktino se obino raunaju samo
protumaeni i neprotumaeni dio ukupnoga zbroja kvadrata odstupanja. Koristei dobivene
rezultate raunaju se tzv. mjere reprezentativnosti o kojima se govori u sljedeoj toki.
108
Podijeli li se navedeni lan ukupnim brojem parova podataka (n), dobiva se varijanca empirijskih vrijednosti
varijable Y.
109
Podijeli li se navedeni lan ukupnim brojem parova (n), dobiva se varijanca procijenjenih vrijednosti varijable
Y.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 166
4.2.3. Mjere reprezentativnosti modela jednostavne linearne regresije
Za ocjenu reprezentativnosti nekoga regresijskoga modela rabe se pokazatelji analogni
pokazateljima reprezentativnosti aritmetike sredine u deskriptivnoj analizi. Te pokazatelje
nazivamo mjere reprezentativnosti regresijskoga modela, a dijelimo ih na apsolutne i
relativne.
U apsolutne mjere reprezentativnosti ubrajamo varijancu regresijskoga modela i iz nje
izvedenu standardnu devijaciju regresijskoga modela. U raunanju ovih vrijednosti koriste se
svi empirijski i svi procijenjeni podaci.
U relativne mjere reprezentativnosti ubrajamo koeficijent varijacije regresijskoga modela i
koeficijent determinacije regresijskoga modela. Za usporedbu reprezentativnosti dvaju
razliitih regresijskih modela najee se rabe upravo relativne mjere reprezentativnosti.
U nastavku ukratko opisujemo svaku od navedenih mjera reprezentativnosti.
4.2.3.1. Varijanca regresijskoga modela
Osnova za mjerenje reprezentativnosti regresijskoga modela je rasprenje (disperzija) oko
regresijskoga pravca koja se oituje na rezidualnim odstupanjima. to su odstupanja
empirijskih vrijednosti zavisne varijable Y od odgovarajuih procijenjenih vrijednosti manja,
reprezentativnost regresijskoga modela je bolja. Ve smo istaknuli da je aritmetika sredina
svih rezidualnih odstupanja uvijek jednaka nuli, pa se pri analizi rasprenja polazi od analize
kvadrata rezidualnih odstupanja, odnosno od analize njihove varijance. S tim u vezi definira
se pojam varijance regresijskoga modela.
Varijanca regresijskoga modela (oznaka:
2
y
= = =
| |
= =
|
\
Istaknimo da se u inferencijalnoj statistici procjena ovoga pokazatelj rauna kao omjer
veliine SR i broja (n 2) koji, kako smo ve vidjeli, oznaava ukupan broj stupnjeva
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 167
slobode. Takav nain izrauna primijenjuju gotovo svi statistiki raunalni programi, pa je u
takvim sluajevima nuno naglasiti da je rije o procjeni varijance regresije osnovnoga
skupa.
4.2.3.2. Standardna devijacija regresijskoga modela
Standardna devijacija regresijskoga modela (oznaka:
y
) je apsolutna mjera
reprezentativnosti regresijskoga modela. Ona je, prema definiciji, drugi korijen iz varijance
regresijskoga modela. Nerijetko se, analogno standardnoj devijaciji cjelokupnoga osnovnoga
skupa, matematiki netono interpretira kao prosjeno odstupanje originalnih od regresijskih
vrijednosti. Radi potpunosti, navodimo formulu prema kojoj se rauna standardna devijacija
regresijskoga modela:
2
1 1 1
1
2 2
n n n
i i i i
y
i i i
SR
y a y b x y
n n
= = =
| |
= =
|
\
.
Napomenimo da se u inferencijalnoj statistici standardna devijacija definira na potpuno isti
nain, ali je, zbog razliitosti izrauna varijance, pripadna formula za izravni izraun
drugaija od gore navedene. U tom se sluaju govori o procjeni standardne devijacije
osnovnoga skupa.
4.2.3.3. Koeficijent varijacije regresijskoga modela
Koeficijent varijacije regresijskoga modela (oznaka:
y
V
100
y
y
V
y
=
Ekvivalentno, moemo rei da koeficijent varijacije regresijskoga modela mjeri relativno
prosjeno odstupanje empirijskih vrijednosti zavisne varijable Y od procijenjenih vrijednosti
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 168
te varijable i iskazuje rezultat u postotcima. to je vrijednost koeficijenta
y
V
blia nuli,
reprezentativnost regresijskoga modela je bolja.
4.2.3.4 Koeficijent determinacije regresijskoga modela
Koeficijent determinacije (oznaka: R
2
) je relativna mjera reprezentativnosti regresijskoga
modela. Definira se kao omjer protumaenoga dijela ukupnoga zbroja kvadrata odstupanja
(SP) i ukupnoga zbroja kvadrata odstupanja (ST), a moe poprimiti sve vrijednosti iz
segmenta [0, 1]. Objanjava se kao postotni udio modelom protumaenoga dijela zbroja
kvadrata svih odstupanja u odnosu na ukupan zbroj kvadrata svih odstupanja, a rauna prema
formuli:
2
2
2 1 1 1
2
2 2
1 1
( )
( )
n n n
i i i
i i i
n n
i i
i i
y y a y b x y n y
SP
R
ST
y y y n y
= = =
= =
+
= = =
to je njegova vrijednost blia 1, reprezentativnost regresijskoga modela je bolja (donekle
suprotno od koeficijenta varijacije).
Napomenimo da su u sluaju jednostavne linearne regresije koeficijent determinacije i
Pearsonov koeficijent jednostavne linearne korelacije vezani relacijom:
2
R r = ,
pri emu je predznak Pearsonova koeficijenta linearne korelacije jednak predznaku
regresijskoga koeficijenta a.
Koeficijent determinacije openito se moe objasniti i kao razmjer varijance zavisne varijable
objanjen nezavisnom varijablom. Npr., utvrdimo li da je Pearsonov koeficijent linearne
korelacije izmeu varijabli kolinik inteligencije i prosjena ocjena na studiju iznosi r = 0.5,
onda je pripadna vrijednost koeficijenta determinacije modela jednostavne linearne regresije
kojim se najbolje moe opisati promatrana veza jednaka
R
2
= 0.5
2
= 0.25,
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 169
to, slobodno govorei, znai da se priblino 25% uspjeha na studiju moe objasniti
inteligencijom studenata.
Istaknimo da u MS EXCEL-u jednadbu, te vrijednost koeficijenta determinacije bilo kojega
od ponuenih regresijskih modela moemo dobiti ukljuivanjima podopcija Prikai jednadbu
na grafikonu i Prikai R-kvadratnu vrijednost na grafikonu u podopciji Mogunosti opcije
Dodaj crtu trenda.
Primjer 4. Na temelju podataka iz Primjera 1. izraunajmo koeficijent varijacije i koeficijent
determinacije dobivenoga modela jednostavne linearne regresije. Objasnimo znaenje
dobivenih vrijednosti.
U Primjeru 1. dobivena je sljedea jednadba modela jednostavne linearne regresije:
y
= 54.603 x 1010.3.
Izraunajmo najprije vrijednost koeficijenta varijacije toga modela. Koristei navedenu
jednadbu najprije za svaku empirijsku vrijednost nezavisne varijable X raunamo
odgovarajuu procijenjenu vrijednost zavisne varijable Y. Potom izraunamo kvadrat razlike
svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajue procijenjene
vrijednosti te varijable, te zbrojimo dobivene rezultate. Tako dobivamo trei i etvrti stupac
sljedee tablice:
proizvodnja
okolade
[000 kom.]
(x
i
)
ukupna
dobit
[000 kn]
(y
i
)
procijenjena
ukupna dobit
[000 kn]
(
i
y
)
(y
i
i
y
)
2
20 220 81,76 19110.3
25 280 354,775 5591.301
32 520 736,996 47087.26
28 500 518,584 345.3651
40 1250 1.173,82 5803.392
35 1000 900,805 9839.648
36 980 955,408 604.7665
30 600 627,79 772.2841
ukupno: 5.350 5.349,938 89154.32
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 170
Tako je vrijednost koeficijenta varijacije jednaka:
100
y
y
V
y
= =
1 1
89.154, 32
8
2 2 8 2
100 100 100
1 5350
n n
i i
i i
SR SR
n
n n
y y
n
= =
= =
18.23%,
pa moemo rei da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca relativno
slab. Vrijednost koeficijenta determinacije ve smo dobili u Primjeru 1. i ona iznosi
R
2
= 0.9064. To znai da je modelom jednostavne linearne regresije protumaeno 90.64%
ukupnih odstupanja, odnosno, da se 90.64% ovisnosti ukupne dobiti o proizvodnji okolade
moe objasniti modelom jednostavne linearne regresije. Prema obama pokazateljima,
moemo zakljuiti da je model reprezentativan.
Primjer 5. Na temelju podataka iz Primjera 2. izraunajmo koeficijent varijacije i koeficijent
determinacije dobivenoga modela jednostavne linearne regresije. Objasnimo znaenje
dobivenih vrijednosti.
U Primjeru 2. dobivena je sljedea jednadba modela jednostavne linearne regresije:
y
= 10.402 x 10.95.
Kao i u Primjeru 4., izraunajmo najprije vrijednost koeficijenta varijacije toga modela.
Koristei navedenu jednadbu najprije za svaku empirijsku vrijednost nezavisne varijable X
raunamo odgovarajuu procijenjenu vrijednost zavisne varijable Y. Potom izraunamo
kvadrat razlike svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajue
procijenjene vrijednosti te varijable, te zbrojimo dobivene rezultate. Tako dobivamo trei i
etvrti stupac sljedee tablice:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 171
prosjean broj
zaposlenih
(x
i
)
ukupan godinji
promet
[000 ]
(y
i
)
procijenjeni ukupan
godinji promet
[000 ]
(
i
y
)
(y
i
i
y
)
2
22 250 217,894 1030.79524
31 300 311,512 132.52614
90 920 925,23 27.3529
82 850 842,014 63.7762
43 400 436,336 1320.3049
65 680 665,18 219.6324
59 630 602,768 741.58182
16 180 155,482 601.13232
61 670 623,572 2155.55918
46 420 467,542 2260.24176
35 350 353,12 9.7344
50 460 509,15 2415.7225
ukupno: 6110 6109,8 10978.35977
Tako je vrijednost koeficijenta varijacije jednaka:
100
y
y
V
y
= =
1 1
10978.35977
12
2 2 12 2
100 100 100
1 6110
n n
i i
i i
SR SR
n
n n
y y
n
= =
= =
6.507631929%,
pa moemo rei da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca vrlo slab,
odnosno da je model reprezentativan. Vrijednost koeficijenta determinacije ve smo dobili u
Primjeru 2. i ona iznosi R
2
= 0.9823. Dakle, 98,23% veze izmeu ukupnoga godinjega
prometa i prosjenoga broja zaposlenika moe se objasniti modelom jednostavne linearne
regresije.
Zadatak za vjebu: Izraunajte koeficijent varijacije i koeficijent determinacije modela
jednostavne linearne regresije iz Primjera 3. Objasnite znaenje dobivenih vrijednosti.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 172
4.3. Primjeri nelinearnih modela jednostavne regresije
Odnos zavisne i nezavisne varijable esto nije linearan (ravnomjerne promjene nezavisne
varijable ne uzrokuju ravnomjerne promjene zavisne varijable). U takvim je sluajevima
potrebno je pronai neku drugu (nelinearnu) funkciju koja najbolje pokazuje ovisnost zavisne
o nezavisnoj varijabli. U nastavku se razmatraju modeli jednostruke regresije u kojima su te
funkcije eksponencijalna funkcija, logaritamska funkcija i opa potencija. Ti se modeli
odgovarajuim zamjenama varijabli uvijek mogu svesti na model jednostavne linearne
regresije, ali to neemo uiniti budui da MS Excel omoguuje rad i s takvim vrstama modela
jednostavne regresije.
4.3.1. Model jednostavne eksponencijalne regresije
Standardni oblik regresijske jednadbe modela jednostavne eksponencijalne regresije je:
Y
= B A
X
pri emu dodatno vrijede nejednakosti:
A, B > 0, A 1.
Ove nejednakosti su posljedice injenice da eksponencijalna funkcija nije definirana za A 0,
te da za A = 1 dobivamo konstantnu funkciju Y
= .
Odmah primijetimo da je, zbog uvjeta A, B > 0, A 1, svaka oekivana vrijednost zavisne
varijable y strogo vea od nule (to slijedi i iz injenice da je podruje vrijednosti bilo koje
eksponencijalne funkcije skup R
+
= 0,+), pa posebno i razliita od nule.
Ako se vrijednost x
1
promijeni za k jedinica mjere, nova vrijednost te varijable je:
x
2
= x
1
+ k.
(Pritom za k > 0 imamo poveanje vrijednosti varijable x
1
, a za k < 0 smanjenje njezine
vrijednosti.) Pripadna regresijska vrijednost zavisne varijable y je
2 1 1 1
2 1
( )
x x k x x k k k
y B A B A B A A A B A A y
+
= = = = = .
Stoga je relativna promjena vrijednosti zavisne varijable y jednaka:
2 1 1 1 1
1 1 1
( 1)
1
k k
k
y y A y y y A
y A
y y y
= = = = ,
odnosno, u postotcima,
100 ( 1) %
k
y A
( =
,
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 174
to je i valjalo pokazati.
Dakle, kod modela jednostavne eksponencijalne regresije dodatno se rauna i interpretira broj
S
k
= A
k
1. Posebno, za k = 1 vrijednost S
1
= 100 (A 1) uobiajeno se naziva prosjena
stopa promjene (oekivanih) vrijednosti zavisne varijable Y. Ako model jednostavne
eksponencijalne regresije reprezentativno opisuje vezu izmeu zavisne i nezavisne varijable,
priblino jednaka stopa promjene vrijedi i za empirijske vrijednosti zavisne varijable Y.
I za model jednostavne eksponencijalne regresije mogu se raunati koeficijent varijacije i
koeficijent determinacije tako da se u formule navedene u tokama 4.2.3.3. i 4.2.3.4. umjesto
originalnih vrijednosti uvrtavaju logaritmi tih vrijednosti. Koeficijent determinacije moe se
dobiti izravno pomou MS Excela, dok koeficijent varijacije moramo izraunati ''klasino''.
Ilustrirajmo to na primjerima.
Primjer 1. Uprava tvornice zamjenskih dijelova za eljeznika vozila ''Grudelj d.d.'' iz
Bibinja razmatra ovisnost ukupnih jedininih trokova o opsegu proizvodnje jednoga od
zamjenskih dijelova. Istraivanjem dobiveni podaci navedeni su u sljedeoj tablici:
jedinini trokovi
[kn]
opseg proizvodnje
[000 kom.]
549 60
582 54
618 50
700 45
748 36
817 32
900 25
998 23
1.193 18
1.540 10
Prikaimo dobivene podatke odgovarajuim grafikonom (uz kojega navedimo sve potrebne
oznake), pa odredimo jednadbu modela jednostavne eksponencijalne regresije koji najbolje
opisuje promatranu ovisnost i interpretirajmo parametre toga modela. Naposljetku,
procijenimo reprezentativnost dobivenoga modela pomou koeficijenta determinacije, ukupne
jedinine trokove pri opsegu proizvodnje od 40 000 komada i opseg proizvodnje u sluaju
kad ukupni jedinini trokovi iznose 800,00 kn
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 175
Odgovarajui grafiki prikaz empirijskih podataka je dijagram rasprenja prikazan na
sljedeoj slici:
Odgovarajua jednadba modela jednostavne eksponencijalne regresije, zajedno s pripadnom
krivuljom, dana je na sljedeoj slici:
Zapiimo je najprije u standardnom obliku Y
= B A
X
. U ovome je sluaju B = 1624, dok je
vrijednost parametra A jednaka
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 176
A = e
0,019
0.98118.
pa jednadba modela jednostavne eksponencijalne regresije zapisana u standardnom obliku
glasi:
Y
= 1624 0.98118
X
.
Odgovarajue interpretacije parametara su:
B = 1624 oekivana vrijednost jedininih trokova u sluaju kad nema proizvodnje iznosi
1.624,00 kn. (Ova interpretacija nema smisla jer se jedinini trokovi uvijek raunaju u
odnosu na jedinicu proizvedenoga proizvoda, a ako nije proizveden niti jedan proizvod, nema
smisla govoriti o jedininim trokovima.)
A = 0.98118 ovu emo vrijednost najlake interpretirati raunajui prosjenu stopu
promjene:
S
1
= 100 (A 1) = 100 (0.98118 1) = 1.882.
Dakle, ukoliko se opseg proizvodnje povea za 1000 komada, jedinini trokovi e se
oekivano smanjiti za prosjeno 1.882%. Odatle slijedi npr. da ukoliko se opseg proizvodnje
povea za 100 komada, oekivano prosjeno smanjenje jedininih trokova iznosi
S
0.1
= 100 (A
0.1
1) = 100 (0.98118
0.1
1) = 0.18982%,
a ukoliko se opseg proizvodnje smanji za 200 komada, oekivano prosjeno poveanje
jedininih trokova iznosi
S
0.2
= 100 (A
0.2
1) = 100 (0.98118
0.2
1) = 0.380723% itd.
Koeficijent determinacije dobivenoga modela je R
2
= 0.9466, to znai da se 94.66% ovisnosti
jedininih trokova o opsegu proizvodnje moe objasniti modelom jednostavne
eksponencijalne regresije. Budui da je navedeni koeficijent relativno blizu 1, moemo rei
da je dobiveni model reprezentativan.
Preostaje nam procijeniti po jednu vrijednost zavisne, odnosno nezavisne varijable.
Procijenjeni iznos ukupnih jedininih trokova u sluaju kad opseg proizvodnje iznosi 40 000
komada dobit emo tako da u jednadbu regresijskoga modela uvrstimo x = 40:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 177
Y
= 1624 0.98118
40
= 759.51.
Dakle, procijenjeni ukupni jedinini trokovi u sluaju kad opseg proizvodnje iznosi 40 000
komada iznose 759,51 kn.
Nadalje, iz dobivene jednadbe regresijskoga modela slijedi
ln ln1624
ln0.98118
y
X
= ,
pa procijenjenu vrijednost opsega proizvodnje u sluaju kad ukupni jedinini trokovi iznose
800,00 kn dobivamo tako da u navedenu jednadbu uvrstimo y = 800:
ln800 ln1624
37.265
ln0.98118
X
= .
Dakle, procijenjena vrijednost opsega proizvodnje u sluaju kad ukupni jedinini trokovi
iznose 800,00 kn jednaka je 37265 komada.
Primjer 2. Promatramo ovisnost temperature netom skuhane kave o vremenu proteklom
nakon ulijevanja kave u alicu
110
. Podaci su dani u donjoj tablici.
vrijeme [min.]
temperatura [C]
0 82
5 76
8 70
11 65
15 61
18 57
22 52
25 51
30 47
34 45
38 43
42 41
45 39
50 38
110
Preciznije reeno, nakon ulijevanja kave iz dezve ili kavokuhala u alicu.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 178
a) Ovisnost temperature kave o vremenu grafiki prikaimo odgovarajuim grafikonom (uz
kojega navedimo sve potrebne oznake).
b) Odredimo jednadbu modela jednostavne eksponencijalne regresije koji najbolje opisuje
promatranu ovisnost i objasnimo znaenje parametara dobivenoga modela.
c) Na temelju koeficijenta determinacije procijenimo reprezentativnost modela.
d) Na temelju rezultata b) podzadatka procijenimo poetnu temperaturu kave i odredimo
relativnu pogreku u odnosu na empirijski dobivenu vrijednost.
e) Na temelju rezultata b) podzadatka procijenimo kolika e biti temperatura kave tono 1 sat
nakon ulijevanja u alicu.
f) 1992. jedna od goi restorana ''McDonald's'' tuila je restoran jer je sluajnim
prolijevanjem kave temperature 82C po svojim rukama zaradila teke opekotine. Vjetak na
suenju tada je posvjedoio da tekuina temperature 82C koja je u dodiru s ljudskom koom
bila barem pet sekundi izaziva teke opekotine i ustvrdio da bi se takve posljedice izbjegle da
se kava posluuje pri temperaturi ne veoj od 68C. ena je dobila spor i odtetu od
2.700.000,00 USD. Jedna od posljedica toga poznatoga sudskoga procesa bila je da veina
restorana u SAD danas posluuje kavu ija je temperatura priblino 68C. Na temelju
rezultata b) podzadatka procijenimo koliko dugo treba ekati da se netom skuhana kava
ohladi na temperaturu od 68C.
g) Pretpostavimo da temperatura sobe u kojoj se nalazi posluena kava iznosi 23C. to se
moe rei o temperaturi kave nakon tono 2 sata na temelju dobivenoga modela jednostavne
eksponencijalne regresije? Objasnimo svoj odgovor.
Ovisnost temperature kave o vremenu prikazana je donjim dijagramom rasipanja:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 179
Jednadba modela jednostavne eksponencijalne regresije, zajedno s pripadnom krivuljom,
prikazana je na donjoj slici:
Dobivenu jednadbu najprije zapiimo u standardnom obliku Y
= B A
X
. U ovome je sluaju
B = 78.159, dok je vrijednost parametra A jednaka
A = e
0.016
0.98413.
Dakle, jednadba dobivenoga modela jednostavne eksponencijalne regresije je
Y
= 78.159 0.98413
X
.
Parametre dobivenoga modela interpretiramo na sljedei nain:
B = 78.159 procijenjena poetna temperatura kave iznosi 78.159C. Budui da empirijska
poetna temperatura kave iznosi 82C, relativna pogreka procjene poetne temperature je:
p =
82 78.159
100
82
4.68%.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 180
A = 0.98413 izraunat emo oekivanu prosjenu stopu promjene temperature kave:
S
1
= 100 (A 1) = 1.5873.
Dakle, temperatura kave e se oekivano smanjiti za 1.5873% u jednoj minuti.
Temperaturu kave nakon jednoga sata (= 60 minuta) procijenit emo tako da u jednadbu
modela jednostavne eksponencijalne regresije uvrstimo x = 60:
Y
= 78.159 0.98413
60
30C,
dok emo vrijeme potrebno da se kava ohladi na temperaturu 68C procijeniti tako da iz
jednadbe
Y
= 78,159 0.98413
X
izrazimo nepoznaznicu X:
ln ln78.159
ln0.98413
Y
X
=
i u dobiveni izraz uvrstimo Y = 68:
ln68 ln78.159
ln0.98413
X
= 78.159 0.98413
120
11.46C.
Na ovom smo primjeru ukazali na tzv. problem ekstrapolacije u regresijskim modelima.
Grubo govorei, regresijski model moe davati dobre procjene za vrijednosti nezavisne
varijable X koje se nalaze unutar segmenta omeenoga najmanjom i najveom empirijskom
vrijednou te varijable. (U promatranom primjeru rije je o segmentu [0, 50].) Meutim, za
vrijednosti izvan toga segmenta kvaliteta procjene opada to je vrijednost udaljenija od donje
ili gornje granice segmenta. Npr. u promatranom bismo primjeru za x = 51 jo mogli oekivati
relativno dobru procjenu temperature kave, ali x = 120 je vrijednost vie nego dvostruko vea
od gornje granice segmenta [0, 50], pa se za tu vrijednost dobiva loa procjena odgovarajue
vrijednosti zavisne varijable Y. Stoga, kad god je to mogue, treba izbjegavati procjenu
vrijednosti zavisne varijable za vrijednosti nezavisne varijable izvan segmenta omeenoga
najmanjom i najveom empirijski dobivenom vrijednou.
111
4.3.2. Model jednostavne logaritamske regresije
Standardni oblik regresijske jednadbe ovoga modela je:
Y
= A ln x + B,
pri emu vrijednosti nezavisne varijable X nuno moraju biti strogo pozitivne jer je prirodno
podruje definicije bilo koje logaritamske
112
funkcije skup 0, +. Kao i kod svih prethodnih
modela, znaaj parametara A i B u analizi regresijskoga modela nije jednak: parametar A je
bitno znaajniji od parametra B. U nastavku navodimo njihove interpretacije u obliku dvaju
svojstava:
B procijenjena (ili oekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 1 jedinici mjere. Ova se tvrdnja lako provjeri uvrtavanjem x = 1 u
jednadbu regresijskoga modela i koritenjem injenice da je ln 1 = 0.
111
U promatranom je primjeru opisani problem ekstrapolacije dodatno izraen zbog fizikalne neusklaenosti
dobivenoga modela s realnim stanjem: prema fizikalnim zakonima, kava se ne moe ohladiti na temperaturu
manju od temperature okoline, a prema dobivenom regresijskom modelu, za velike vrijednosti nezavisne
varijable x temperatura kave bit e sve blia 0C zbog asimptotskoga pribliavanja odgovarajuega grafa osi Ox.
112
U ovome je sluaju rije o tzv. prirodnom logaritmu: baza logaritma je broj e 2,7182818284590452353603.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 182
Interpretacija varijable A, kao i kod modela jednostavne eksponencijalne regresije, nije
izravna, nego ''zaobilazna'' (neizravna) i temelji se na sljedeem svojstvu:
Svojstvo 1. Neka je p > 100 proizvoljan, ali fiksiran realan broj. Ako se vrijednost nezavisne
varijable X promijeni za p%, procijenjena (ili oekivana) prosjena promjena vrijednosti
zavisne varijable Y iznosi A ln 1
100
p | |
+
|
\
. Posebno, za p = 171.82818284590452353603
procijenjena prosjena promjena vrijednosti zavisne varijable Y iznosi tono A.
Uvjet p > 100 postavljen je zbog zahtjeva da vrijednost nezavisne varijable X mora biti
strogo pozitivna: smanjenje konkretne vrijednosti nezavisne varijable X za barem 100%
povlailo bi da je nova vrijednost te varijable nepozitivna (strogo negativna ili nula), a takve
vrijednosti ne mogu biti obuhvaene regresijskim modelom.
Dokaz: Analogno kao i kod modela jednostavne eksponencijalne regresije, neka je x
1
poetna
vrijednost varijable X i neka je p postotak promjene te varijable. Ako je p > 0, rije je o
poveanju vrijednosti x
1
za p%, a ako je p < 0, rije je o smanjenju vrijednosti x
1
za p%.
Pripadna oekivana vrijednost zavisne varijable Y jednaka je:
1 1
ln y A x B
= + .
Nakon promjene vrijednosti x
1
za p%, nova vrijednost te varijable je:
2 1 1 1
1
100 100
p p
x x x x
| |
= + = +
|
\
.
Pripadna oekivana vrijednost zavisne varijable Y jednaka je
2 2 1 1 1
ln ln 1 ln 1 ln ln 1
100 100 100
p p p
y A x B A x B A A x B A y
( | | | | | |
= + = + + = + + + = + +
| | | (
\ \ \
.
otkuda slijedi da je ukupna prosjena promjena vrijednosti zavisne varijable Y jednaka
2 1
ln 1
100
p
y y A
| |
= +
|
\
,
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 183
to je i trebalo pokazati. Napomenimo da se pridjev prosjena navodi zbog izvoda formule za
procijenjenu vrijednost parametra A u kojemu se koriste prosjeci vrijednosti nezavisne i
zavisne varijable, pa je i sm parametar A pokazatelj prosjene promjene.
Primjer 1. Prije tono 10 godina istodobno je posaeno ukupno 12 jednogodinjih sadnica
odreene vrste vinje. U trenutku sadnje prosjena visina jedne sadnice bila je 182.88 cm.
Podaci o prosjenoj visini stabala tijekom svake od minulih 10 godina navedeni su u donjoj
tablici. Promatra se ovisnost prosjene visine izraslih stabala o njihovoj starosti.
starost [god.] prosjena visina [cm]
1 182.88
2 289.56
3 396.24
4 457.2
5 502.92
6 533.4
starost [god.] prosjena visina [cm]
7 563.88
8 579.12
9 594.36
10 600.456
11 603.504
a) Prikaimo ovisnost prosjene visine stabala o njihovoj starosti odgovarajuim grafikonom
uz kojega navedimo sve potrebne oznake.
b) Odredimo jednadbu modela jednostavne logaritamske regresije koji najbolje opisuje
promatranu ovisnost. Objasnimo znaenje svih parametara dobivenoga modela.
c) Procijenimo reprezentativnost modela dobivenoga u rjeenju b) podzadatka pomou
koeficijenta determinacije.
d) Koristei rezultat b) podzadatka procijenimo prosjenu visinu svih stabala etiri i pol
godine nakon sadnje.
e) Koristei rezultat b) podzadatka procijenimo trenutak (raunajui od trenutka sadnje) u
kojemu e prosjena visina svih stabala biti 3 metra.
f) Koristei rezultat b) podzadatka procijenimo prosjenu visinu svih posaenih stabala tono
20 godina nakon sadnje i utvrdimo realistinost dobivene procjene.
Ovisnost prosjene visine svih stabala o njihovoj starosti grafiki prikazujemo donjim
dijagramom rasipanja:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 184
Jednadba modela jednostavne logaritamske regresije, zajedno s pripadnom krivuljom,
navedena je na donjoj slici:
Najvaniji parametri dobivenoga modela jednostavne logaritamske regresije su:
A = 186.18 Ovaj emo parametar interpretirati pomou p = 10. Dakle, ako se starost svih
sadnica povea za 10%, procijenjeno (oekivano) poveanje njihove prosjene visine iznosi
186.18 ln
10
1
100
| |
+
|
\
17.74485 cm.
B = 185.91 Procijenjena (oekivana) prosjena visina svih jednogodinjih sadnica u
trenutku sadnje iznosi 185.91 cm.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 185
Koeficijent determinacije dobivenoga modela iznosi R
2
= 0.9863, otkuda slijedi da je 98.63%
ovisnosti prosjene visine stabala o njihovoj starosti objanjeno modelom jednostavne
logaritamske regresije, to znai da je model reprezentativan.
etiri i pol godine nakon sadnje sva stabla bit e stara ukupno 1 + 4,5 = 5.5 godina, pa e
njihova procijenjena prosjena visina u tom trenutku biti
Y
= 186.18 ln x + 185.91
izrazimo x:
185.91
186.18
y
X e
=
i u dobivenu formulu uvrstimo y = 300. Dobivamo:
300 185.91
186.18
X e
A
Y B X = .
Podsjetimo da se, za proizvoljan, ali fiksiran realan broj a R, funkcija f(x) = x
a
naziva opa
potencija. Njezino je prirodno podruje definicije skup 0, +, pa analogno kao i u modelu
jednostavne logaritamske regresije vrijednosti nezavisne varijable X ne mogu biti
nepozitivni realni brojevi (strogo negativni realni brojevi i nula).
Za analizu regresijskoga modela ponovno je znaajniji parametar A, ali kao u svim
prethodnim modelima navodimo interpretacije obaju parametara modela:
B procijenjena (oekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 1 jedinici mjere. Ova je interpretacija jednaka interpretaciji istoga
regresijskoga parametra u modelu jednostavne logaritamske regresije, a lako se provjeri tako
da se u jednadbu modela jednostavne potencijske regresije uvrsti x = 1 i primijeni injenica
da za svaki realan broj a R vrijedi jednakost: 1
a
= 1.
Interpretacija parametra A se temelji na sljedeem svojstvu:
Svojstvo 1. Neka je p > 100 proizvoljan, ali fiksiran realan broj. Ako se vrijednost nezavisne
varijable X promijeni za p%, procijenjena (oekivana) promjena vrijednosti zavisne varijable
Y iznosi 100 1 1 %
100
A
p
(
| |
+
( `
|
\
(
)
.
Dokaz: Analogno ranijim dokazima, neka je x
1
poetna vrijednost nezavisne varijable X.
Pripadna oekivana vrijednost zavisne varijable Y jednaka je:
113
Engleska rije power ima vie znaenja, a jedno od njih je i potencija. Stoga je naziv ovoga modela preveden
kao potencijski. Uobiajeni hrvatski prijevod naziva modela (dvostruko logaritamski) potjee od injenice da se
u tzv. linearizaciji modela (svoenju modela odgovarajuim zamjenama na model jednostavne linearne
regresije) vrijednosti nezavisne i zavisne varijable pojavljuju kao logaritmandi.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 187
1 1
A
y B x
= .
Ukoliko se vrijednost x
1
promijeni za p%, nova vrijednost nezavisne varijable bit e:
2 1 1 1
1
100 100
p p
x x x x
| |
= + = +
|
\
.
Pripadna vrijednost zavisne varijable Y jednaka je
2 2 1 1 1
1 1 1
100 100 100
A A A
A A
p p p
y B x B x B x y
( | | | | | |
= = + = + = +
| | | (
\ \ \
,
Ve smo utvrdili da je podruje vrijednosti svake ope potencije skup svih strogo pozitivnih
realnih brojeva, to znai da su obje vrijednosti
1
y
i
2
y
(
| |
| |
+
(
| +
|
\
( | |
\
= = = = +
|
\
,
odnosno, iskazano u postotcima,
100 1 1 %
100
A
p
s
(
| |
= +
( `
|
\
(
)
,
to je i trebalo pokazati.
Koristei razvoj u binomni red
2 3
( 1) ( 1) ( 2)
1 1 ...
100 100 2 10000 6 1000000
A
p p A A p A A A p
A
| |
+ = + + + +
|
\
,
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 188
pokazuje se da za relativno male vrijednosti broja p (npr. p [1, 1]) i A > 0 vrijedi
aproksimacija:
1 1
100 100
A
p p
A
| |
+ +
|
\
Odavde slijedi sljedee
Svojstvo 2. Ako se vrijednost nezavisne varijable X promijeni za p%, pri emu je p relativno
mali realan broj i A > 0, procijenjena (oekivana) promjena vrijednosti zavisne varijable Y
iznosi (p A)%. Posebno, za p = 1 ta promjena iznosi A%.
Dakle, pri interpretaciji parametra A obino emo uzimati p = 1. Istaknimo da se u
ekonomskim analizama ovim regresijskim modelom omoguava tzv. mjerenje elastinosti
zavisne varijable u odnosu na nezavisnu varijablu.
Ilustrirajmo primjenu modela jednostavne potencijske regresije na dvama primjerima.
Primjer 1. Tvornica eljeznikih vagona lamperajevi iz Pikorevaca razmatra ovisnost
utroenih radnih sati neposrednih radnika na montai vagona o ukupnom (kumulativnom)
broju montiranih vagona. Dobiveni podaci navedeni su u sljedeoj tablici.
ukupan (kumulativni) broj
montiranih vagona
rad neposrednih radnika
[000 sati/vagon]
10 59.2
20 48.7
30 46.3
40 42.1
50 40.2
60 37.9
70 36.9
80 35.7
a) Promatranu ovisnost grafiki prikaimo odgovarajuim grafikonom uz kojega navedimo
sve potrebne oznake.
b) Odredimo jednadbu modela jednostavne potencijske regresije koji najbolje opisuje
promatranu ovisnost i objasnimo znaenje parametara dobivenoga modela.
c) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 189
d) Na temelju rezultata b) podzadatka procijenimo ukupno vrijeme rada neposrednih radnika
po jednom vagonu ako je montirano ukupno 45 vagona.
e) Na temelju rezultata b) podzadatka procijenimo ukupan (kumulativni) broj montiranih
vagona ako utroeni radni sati neposrednih radnika iznose 41 000 radnih sati po vagonu.
Ovisnost utroenih radnih sati neposrednih radnika na montai o ukupnom (kumulativnom)
broju montiranih vagona grafiki prikazujemo donjim dijagramom rasipanja:
Jednadba modela jednostavne potencijske regresije, zajedno s pripadnom krivuljom,
navedena je na sljedeoj slici:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 190
Najvaniji parametri dobivenoga modela su:
B = 102.53 Procijenjeni rad neposrednih radnika na montai prvoga vagona iznosi
102 530 radnih sati.
A = 0.241 (uzimamo p = 1) Ako se ukupan (kumulativni) broj montiranih vagona povea
za 1%, utroeni radni sati neposrednih radnika po jednom vagonu oekivano e se smanjiti za
0.241%.
Koeficijent determinacije dobivenoga regresijskoga modela je R
2
= 0.9938, to znai da se
99.38% ovisnosti rada neposrednih radnika o ukupnom (kumulativnom) broju montiranih
vagona moe objasniti modelom jednostavne potencijske regresije, tj. dobiveni je model vrlo
reprezentativan.
Ukupno vrijeme rada neposrednih radnika na montai ukupno 45 vagona procijenit emo tako
da u jednadbu dobivenoga regresijskoga modela
Y
= 102.53 x
0.241
uvrstimo x = 45:
Y
= 102.53 45
0.241
= 40.9663
Dakle, traeno procijenjeno vrijeme montae po jednom vagonu iznosi 40 966.3 sati.
Ukupan (kumulativni) broj montiranih vagona u sluaju kad se za montau jednoga vagona
utroi 41 000 radnih sati dobit emo tako da iz jednadbe
Y
= 102.53 x
0.241
izrazimo x:
0.241
102.52
X
y
| |
=
|
\
i u dobivenu jednadbu uvrstimo y = 41:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 191
1000
241
102.52
41
X
| |
=
|
\
45.
Dakle, procijenjeni ukupan (kumulativni) broj montiranih vagona jednak je 45.
Napomenimo da realna funkcija dobivena kao jednadba modela jednostavne potencijske
regresije pripada tipu tzv. funkcij uenja (engl. learning function), a temelji se na
pretpostavci da se utroak radnih sati smanjuje s ponavljanjem iste radne operacije. Stoga se
modeli jednostavne potencijske regresije esto primijenjuju pri ugovaranju dinamike
izvoenja radova ili isporuke serije odreenih proizvoda (npr. eljeznikih vagona, aviona,
brodova i sl.).
Primjer 2. Na uzorku od ukupno 11 afrikih antilopa (gazela) ispituje se ovisnost izmeu
duljine i srednjega promjera tzv. ramenih kostiju. Dobiveni podaci prikazani su u donjoj
tablici.
srednji promjer
[mm]
duljina
[mm]
17.6 159.9
26 206.9
31.9 236.8
38.9 269.9
45.8 300.6
51.2 323.6
58.1 351.7
64.7 377.6
66.7 384.1
80.8 437.2
82.9 444.7
a) Ovisnost duljine ramenih kosti o njihovu srednjem promjeru grafiki prikaimo
odgovarajuim grafikonom uz kojega navedimo sve potrebne oznake.
b) Odredimo jednadbu modela jednostavne potencijske regresije koji najbolje opisuje
promatranu ovisnost. Navedimo sve parametre toga modela i objasnimo njihovo znaenje.
c) Procijenimo reprezentativnost dobivenoga regresijskoga modela na temelju koeficijenta
determinacije.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 192
d) Na temelju rezultata b) podzadatka procijenimo duljinu ramenih kostiju iji je srednji
promjer 84 mm.
e) Na temelju rezultata b) podzadatka procijenimo srednji promjer ramenih kostiju ija je
duljina 40 cm.
Ovisnost duljine ramenih kostiju o njihovu srednjem promjeru grafiki je prikazana donjim
dijagramom rasipanja:
Jednadba modela jednostavne potencijske regresije, zajedno s pripadnom krivuljom,
navedena je na donjoj slici:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 193
Najvaniji parametri dobivenoga modela jednostavne potencijske regresije su:
B = 24.13 Procijenjena duljina ramenih kostiju iji je srednji promjer 1 mm iznosi 24.13
mm. (Interpretacija ovoga parametra ne odgovara realnoj situaciji jer su druga istraivanja
pokazala da je najmanja zabiljeena duljina ramenih kostiju priblino 140 mm = 14 cm.)
A = 0.6595 (uzimamo p = 1) Ako se srednji promjer ramenih kostiju povea za 1%,
oekivano relativno prosjeno poveanje duljine ramenih kostiju iznosi 0.6595%.
Koeficijent determinacije dobivenoga modela jednostavne potencijske regresije iznosi R
2
= 1,
to ukazuje na injenicu da se dobivenim regresijskim modelom potpuno moe objasniti
ovisnost duljine ramenih kostiju antilope o njihovu srednjem promjeru. Taj je rezultat
posljedica zaokruivanja izrauna koeficijenta determinacije na 4 decimalna mjesta. Izrauna
li se R
2
na 10 decimalnih mjesta, dobiva se R
2
= 0.9999874242. U svakom sluaju, rije je o
vrlo reprezentativnom modelu jednostavne regresije.
Procijenjenu duljinu ramenih kostiju iji je srednji promjer 84 mm dobit emo tako da u
jednadbu dobivenoga modela jednostavne potencijske regresije
Y
= 24.13 x
0.6595
uvrstimo x = 84:
Y
= 24.13 84
0.6595
448.4 mm.
Stoga traena procijenjena duljina ramenih kostiju iznosi 448.4 mm.
Srednji promjer ramenih kostiju ija je duljina 40 cm (= 400 mm) procijenit emo tako da iz
dobivene jednadbe modela jednostavne potencijske regresije izrazimo x:
2000
1319
24.13
y
X
| |
=
|
\
pa u dobivenu jednakost uvrstimo y = 400:
2000
1319
400
24.13
X
| |
=
|
\
70.7.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 194
Stoga traeni procijenjeni srednji promjer ramenih kostiju iznosi 70.7 mm.
afrika antilopa (gazela)
4.4. Primjer modela viestruke (multiple) regresije: model viestruke linearne
regresije
U ovoj se toki ukratko opisuje najjednostavniji primjer modela viestruke ili multiple
regresije, a to je model viestruke linearne regresije. Podsjetimo da openito modeli
viestruke regresije imaju jednu zavisnu i barem dvije nezavisne varijable. U sluajevima u
kojima se pojavljuju najmanje tri nezavisne varijable nemogue je dati grafiki prikaz. No, i u
takvim se sluajevima mogu raunati odgovarajui analogoni koeficijenata linearne
korelacije, koeficijenata determinacije itd., te dati interpretacije parametara dobivenoga
modela viestruke regresije. Reeno emo pokazati na primjeru modela viestruke linearne
regresije.
Opi oblik modela viestruke linearne regresije je:
Y = A
1
X
1
+ A
2
X
2
+ + A
n
X
n
+ B + e,
a odgovarajua jednadba toga modela je
Y
= A
1
x
1
+ A
2
x
2
+ + A
n
x
n
+ B.
U objema jednakostima su, analogno kao i u modelu jednostavne linearne regresije, A
1
, A
2
,
, A
n
regresijski koeficijenti modela, B slobodni lan, a e stohastika (sluajna) varijabla
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 195
koja ''mjeri'' pogreku procjene. Za svaki i = 1, 2, , n interpretacija regresijskoga
koeficijenta A
i
glasi:
A
i
je procijenjena (oekivana) prosjena promjena vrijednosti varijable X
i
u sluaju kada se
vrijednost te varijable povea za 1 jedinicu mjere, a vrijednosti svih ostalih varijabli ostanu
nepromijenjene.
Navedena se interpretacija moe poopiti za bilo koji realan broj k R:
k A
i
je procijenjena (oekivana) prosjena promjena vrijednosti varijable X
i
u sluaju kad se
vrijednost te varijable promijeni za k jedinica mjere, a vrijednosti svih ostalih varijabli ostanu
nepromijenjene.
Slobodni lan B je manje vaan parametar modela, ali radi potpunosti navodimo i njegovu
interpretaciju:
B je procijenjena (oekivana) vrijednost zavisne varijable Y u sluaju kad su vrijednosti svih
nezavisnih varijabli X
1
, , X
n
jednake nuli. (Ova interpretacija, naroito u ekonomiji, vrlo
esto ne odgovara realnoj situaciji.)
Primjer 1. (izbori za kanadski parlament) Ispituje se ovisnost ukupnoga postotka dobivenih
glasova (a time i mandata) relativnoga pobjednika na svakim pojedinim parlamentarnim
izborima o postotcima glasova dobivenih u etiri kanadske regije: R
1
, R
2
, R
3
i R
4
. Dobiveni
podaci su prikazani u sljedeoj tablici.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 196
izborna
godina
postotak na
dravnoj razini
postotak u
regiji
R
1
postotak u
regiji
R
2
postotak u
regiji
R
3
postotak u
regiji
R
4
1949. 73 74 78 58 61
1953. 64 34 78 35 38
1957. 42 64 52 29 32
1958. 79 76 73 95 82
1962. 44 55 49 88 27
1963. 49 61 62 6 32
1965. 50 45 69 2 32
1968. 59 22 74 25 70
1972. 41 31 56 7 17
1974. 54 41 71 11 35
1979. 48 56 58 78 68
1980. 52 63 74 4 0
1984. 75 78 74 80 68
1988. 57 34 63 67 38
1993. 60 97 67 39 19
1997. 52 34 72 17 18
2000. 57,5 60 77 17 15
2004. 43,8 69 53 11 22
a) Odredimo jednadbu modela viestruke linearne regresije i objasnimo znaenje parametara
dobivenoga modela.
b) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije, te
statistiku znaajnost pojedinih regresorskih varijabli i cijeloga modela (uz razinu
pouzdanosti od 95%).
c) Relevantne predizborne ankete (provedene od strane neovisnih agencija) pokazuju da e
stranka S u regiji R
1
osvojiti 51% glasova, u regiji R
2
67% glasova, u regiji R
3
12% glasova i u
regiji R
4
15% glasova. Na temelju rezultata a) podzadatka utvrdimo moe li ta stranka
raunati na relativnu izbornu pobjedu.
d) Na temelju rezultata a) podzadatka procijenimo najmanji postotak glasova koji stranka S
treba dobiti u njoj tradicionalno sklonoj regiji R
2
tako da bude relativni pobjednik izbora ako
se na temelju predizbornih anketa procjenjuje da e ta stranka u regiji R
1
osvojiti 55%
glasova, u regiji R
3
38% glasova, a u regiji R
4
41% glasova.
Za dobivanje i analizu modela viestruke linearne regresije u MS Excelu koristimo proceduru
Regression u okviru alata Analiza podataka (Data Analysis). Primjenom te procedure
dobivamo sljedee vrijednosti:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 197
koeficijent viestruke linearne korelacije (Multiple R): 0.96556752, otkuda slijedi da postoji
jaka linearna veza izmeu postotka na dravnoj razini, kao zavisne varijable, i postotaka na
regionalnoj razini, kao nezavisnih varijabli;
koeficijent determinacije: 0.932320637, otkuda slijedi da je dobiveni model viestruke
linearne regresije reprezentativan (objanjava priblino 93.25% ovisnosti zavisne varijable o
svim etirima nezavisnim varijablama);
p vrijednost koeficijenta viestruke linearne korelacije (p vrijednost modela viestruke
linearne regresije): 1,76513E-07 = 0.000000176512 dobiveni koeficijent viestruke
linearne korelacije i dobiveni model viestruke linearne regresije su statistiki znaajni;
slobodni lan: -17.3211733 (teoretski, to je ukupan postotak mandata na dravnoj razini u
sluaju da pobjednika stranka niti u jednoj regiji ne osvoji niti jedan glas, ali takva
interpretacija ne odgovara realnoj situaciji)
koeficijent uz varijablu Postotak u regiji R
1
: 0.129717918 Ako se postotak dobivenih
glasova u regiji R
1
povea za 1, oekivano prosjeno poveanje postotka dobivenih glasova
na dravnoj razini iznosi (priblino) 0.13;
p vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
1
: 0.011263866 uz
razinu pozdanosti od 95%, postoji statistiki znaajan utjecaj postotka glasova dobivenih u
regiji R
1
na ukupan postotak dobivenih glasova na dravnoj razini;
koeficijent uz varijablu Postotak u regiji R
2
: 0.857302 Ako se postotak dobivenih glasova u
regiji R
2
povea za 1, oekivano prosjeno poveanje postotka dobivenih glasova na dravnoj
razini iznosi (priblino) 0.86;
p vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
2
: 3.96069E-07 =
0,000000396069 uz razinu pozdanosti od 95%, postoji statistiki znaajan utjecaj postotka
glasova dobivenih u regiji R
2
na ukupan postotak dobivenih glasova na dravnoj razini;
koeficijent uz varijablu Postotak u regiji R
3
: 0.117393926 Ako se postotak dobivenih
glasova u regiji R
3
povea za 1, oekivano prosjeno poveanje postotka dobivenih glasova
na dravnoj razini iznosi (priblino) 0.12;
p vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
3
: 0.00900155 uz
razinu pozdanosti od 95%, postoji statistiki znaajan utjecaj postotka glasova dobivenih u
regiji R
3
na ukupan postotak dobivenih glasova na dravnoj razini;
koeficijent uz varijablu Postotak u regiji R
4
: 0.112526063 Ako se postotak dobivenih
glasova u regiji R
4
povea za 1, oekivano prosjeno poveanje postotka dobivenih glasova
na dravnoj razini iznosi (priblino) 0.11;
p vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
4
: 0.049511477 uz
razinu pozdanosti od 95%, postoji statistiki znaajan utjecaj postotka glasova dobivenih u
regiji R
4
na ukupan postotak dobivenih glasova na dravnoj razini;
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 198
Primijetimo da prema stroem kriteriju (uz razinu pouzdanosti od 99%) utjecaj postotka
glasova dobivenih u regijama R
1
i R
4
ne bi bio statistiki znaajan
Za svaki i = 1, 2, 3, 4 oznaimo s x
i
postotak glasova koje je pobjednika stranka dobila u
regiji R
i
. Tada jednadba modela viestruke linearne regresije koji opisuje promatranu
ovisnost glasi:
Y
= 0.129717918 x
1
+ 0.857302 x
2
+ 0.117393926 x
3
+ 0.112526063 x
4
17.3211733.
Procjenu moe li stranka koja u regiji R
1
osvoji 51% glasova, u regiji R
2
67% glasova, u regiji
R
3
12% glasova i u regiji R
4
15% glasova raunati na relativnu izbornu pobjedu napravit emo
tako da u gornju jednadbu uvrstimo x
1
= 67, x
2
= 52, x
3
= 12 i x
4
= 15:
Y
= 49.83029292.
Budui da procijenjeni rezultat nije strogo vei od 50 [%], stranka ne bi trebala raunati na
relativnu pobjedu na parlamentarnim izborima.
Najmanji postotak glasova koji stranka S treba dobiti u njoj tradicionalno sklonoj regiji R
2
tako da bude relativni pobjednik izbora u drugom podsluaju procijenit emo tako da rijeimo
nejednadbu
Y
50,
tj. tako da po x
2
rijeimo nejednadbu
0.129717918 55 + 0.857302 x
2
+ 0.117393926 38 + 0.112526063 41 17.3211733 50
Odavde je
x
2
59.62,
pa se moe zakljuiti da bi stranka S u njoj tradicionalno sklonoj regiji R
2
trebala dobiti
najmanje 60% ukupnih glasova biraa u toj regiji tako da moe raunati na relativnu pobjedu
na parlamentarnim izborima.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 199
5. INDIVIDUALNI BROJANI POKAZATELJI
RAZVOJA VREMENSKOGA NIZA
Vrijednosti neke pojave u vremenu obino odreujemo i usporeujemo u odreenim
vremenskim razdobljima. Vremensko razdoblje u kojemu smo posljednji put odredili
vrijednost neke pojave naziva se tekue ili izvjetajno razdoblje, a sama odreena vrijednost
tekua vrijednost te pojave. Sva razdoblja prije tekuega u kojima smo odreivali vrijednost
promatrane pojave nazivaju se prethodna razdoblja. Od svih njih najznaajnije je neposredno
prethodno razdoblje: to je, zapravo, vremensko razdoblje u kojemu smo pretposljednji put
odredili vrijednost promatrane pojave.
Primjer 1. Promatramo ukupan broj sklopljenih i razvedenih brakova u Republici Hrvatskoj u
razdoblju od 2002. do 2006. godine.
godina
brakovi
sklopljeni razvedeni
2002. 22 806 4 496
2003. 22 337 4 934
2004. 22 700 4 985
2005. 22 138 4 883
2006. 22 092 2 651
izvor: Mjeseno statistiko izvjee 3/08, Dravni zavod za statistiku, Zagreb, 2008.
U ovome je primjeru tekue ili izvjetajno razdoblje 2006. godina jer je, prema navedenoj
tablici, u toj godini posljednji put izvreno brojanje sklopljenih, odnosno razvedenih brakova.
Prethodna razdoblja su 2002., 2003., 2004. i 2005. godina, a neposredno prethodno razdoblje
je 2005. godina.
Primjer 2. Promatramo kretanje prosjene mjesene isplaene neto-plae po jednom
zaposleniku u svim pravnim osobama u Republici Hrvatskoj koje se bave financijskim
posredovanjem za razdoblje od sijenja 2007. godine do sijenja 2008. godine.
godina mjesec prosjena neto-plaa [kn]
2007.
sijeanj 6.460,00
veljaa 6.604,00
rujan 6.567,00
listopad 6.569,00
studeni 8.228,00
prosinac 6.709,00
2008. sijeanj 7.152,00
izvor: Mjeseno statistiko izvjee 3/08, Dravni zavod za statistiku, Zagreb, 2008.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 200
U ovome je primjeru tekue ili izvjetajno razdoblje sijeanj 2008. godine. Prethodna
razdoblja su sijeanj, veljaa, rujan, listopad, studeni i prosinac 2007. godine. Neposredno
prethodno razdoblje je prosinac 2007. godine. Uoimo da je razdoblje neposredno prethodno
mjesecu rujnu 2007. godine mjesec veljaa 2007. godine, a ne mjesec kolovoz 2007. godine.
No, to ne znai da se u razdoblju od oujka do kolovoza 2007. godine nije pratilo kretanje
promatrane prosjene neto-plae, nego iskljuivo da ti podaci nisu navedeni u tablici.
Nerijetko se vrijednosti promatrane pojave iz razliitih razloga
114
usporeuju s jednom te
istom vrijednou pojave odreenom u nekomu razdoblju. Ta, jedna te ista vrijednost naziva
se bazna vrijednost, a razdoblje u kojemu je odreena bazno razdoblje.
Primjer 3. Promatramo prosjean godinji broj korisnika novane naknade na Hrvatskom
zavodu za zapoljavanje u razdoblju od 2003. do 2007. godine:
godina prosjean godinji broj
korisnika novane naknade
2003. 67 977
2004. 70 467
2005. 72 802
2006. 66 407
2007. 59 603
izvor: Mjeseno statistiko izvjee 3/08, Dravni zavod za statistiku, Zagreb, 2008.
Stanje u svakoj pojedinoj godini moemo usporediti sa stanjem u 2007. godini, pa npr.
moemo zakljuiti (kako?) da je u 2003. godini bilo za 35.6% vie korisnika novane naknade
nego u 2007. godini, u 2004. godini za 14% vie korisnika novane naknade nego u 2007.
godini itd. U ovome je primjeru bazno razdoblje 2007. godina, a bazna vrijednost 59 603
(vrijednost promatrane pojave u baznom razdoblju).
Uobiajeni grafiki prikaz vremenskoga niza jest linijski grafikon. Naslov takvoga grafikona
obino je izraz tipa ''Kretanje pojave X u razdoblju od do''. Pritom emo, radi
jednostavnosti, izraz tipa ''razdoblje od 2000. do 2007. godine'' , interpretirati kao ''vremensko
razdoblje od 01.01.2000. do 31.12.2007., tj. u to emo razdoblje ''ukljuiti'' cijelu 2000.
godinu i cijelu 2007. godinu
115
. Grafiki prikazi podataka iz Primjera 1. i Primjera 3. su
sljedee dvije slike.
114
Jedan od najeih razloga je politike prirode: npr. u predizbornoj kampanji trenutno vladajua stranka
obino usporeuje prosjene plae, cijene, vanjski dug itd. u svakoj godini obnaanja vlasti sa stanjem u godini
neposredno prije prolih parlamentarnih izbora na kojima je preuzela obnaanje vlasti.
115
Matematiki precizno, pod pojmom ''razdoblje izmeu trenutka X
1
i trenutka X
2
'' podrazumijevat emo
zatvoreni interval (segment) [X
1
, X
2
].
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 201
Budui da kretanje vrijednosti neke pojave pratimo u vremenu, promatranu pojavu moemo
shvatiti kao funkciju vremena, odnosno, sukladno razmatranjima iz 4. poglavlja, shvatiti
vrijeme kao nezavisnu varijablu (X), a promatranu pojavu kao zavisnu varijablu (Y).
Uobiajenoj oznaci nezavisne varijable (X) pridodat emo indeks t kako bismo naglasili da je
rije o posebnom tipu nezavisne varijable. Dakle, nezavisnu vremensku varijablu oznaavat
emo s X
t
.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 202
Radi jednostavnosti, promatrat emo sluajeve kada se vrijednosti neke pojave odreuju u
jednakim (pravilnim) vremenskim intervalima (npr. tono jednom mjeseno svakoga mjeseca,
tono jednom godinje svake godine itd.). Te vrijednosti poredat emo sukladno kronolokoj
skali modaliteta (vidjeti 1. poglavlje), tj. skup vrijednosti promatrane pojave emo kronoloki
urediti radi pojednostavljivanja daljnje statistike analize.
5.1. Definicija i vrste vremenskih nizova
(Konaan) Vremenski niz je niz od ukupno n N odreenih, kronoloki ureenih vrijednosti
neke pojave. Vrijednosti koje tvore vremenski niz obino nazivamo frekvencije
116
. Budui da
smo istakli kako emo kretanje neke pojave promatrati kao funkciju vremena, potrebno je
precizno definirati to e biti prirodno podruje definicije (domena), a to podruje vrijednosti
(kodomena) takvoga pridruivanja.
Smatramo intuitivno prihvatljivim pretpostaviti da vrijednost promatrane pojave ne ovisi o
broju vezanom uz razdoblje u kojemu je izmjerena vrijednost pojave
117
. Tako npr. u Primjeru
1. broj razvedenih brakova u 2003. godini (4 934) ne smatramo na bilo koji nain povezanim
s brojem 2002, broj sklopljenih brakova u 2004. godini (22 700) ne smatramo na bilo koji
nain povezanim s brojem 2004 itd. Stoga emo za prirodno podruje definicije (domenu)
neemo uzimati npr. skupove tipa {2002, 2003, 2004, 2005, 2006}. Kako bismo to vie
pojednostavnili statistiku analizu, poetnom razdoblju (odnosno, razdoblju u kojemu smo
prvi put odredili vrijednost promatrane pojave) dodijelit emo vrijednost vremenske varijable
X
t
= 0. Osnovni razlog takvom pridruivanju jest koritenje modela jednostavne linearne
regresije i jednostavne eksponencijalne regresije u analizi vremenskih nizova: ti modeli
pretpostavljaju da se vrijednost zavisne varijable Y moe izraunati u sluaju kad je vrijednost
nezavisne varijable jednaka nuli
118
. Stoga emo, slobodno govorei, vrijednosti vremenske
varijable poeti brojati od nule
119
. Preciznije, poetnom vremenskom razdoblju dodijelit emo
vrijednost vremenske varijable t = 0, njemu neposredno sljedeem vremenskom razdoblju
vrijednost t = 1, itd. Imamo li ukupno n vremenskih razdoblja u kojima smo odreivali
vrijednost neke pojave, posljednjem od njih a to je, zapravo, tekue razdoblje dodijelit
116
Navedeni je naziv svojevrstan vremenski analogon naziva apsolutna frekvencija kojega smo susreli u 2.
poglavlju.
117
Javno iznoenje navedene pretpostavke nau malu visoku kolu ozbiljno izlae estokim prosvjedima
numerologa, astrologa i njima slinih ''-loga'', ali pojednostavljuje daljnju statistiku analizu.
118
tovie, jedan od parametara svakoga od tih modela interpretira se upravo kao vrijednost odgovarajue
funkcije za x = 0.
119
Za sve vjernike: oprez, t = 0 ne znai da je prva vrijednost pojave izmjerena u godini Kristova roenja.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 203
emo vrijednost vremenske varijable t = n 1. Prema tome, prirodno podruje definicije
(domena) svake funkcije vremena koju budemo razmatrali bit e konaan skup {0, 1, ,
n 1}.
Podruje vrijednosti (kodomena) svake funkcije vremena bit e skup frekvencija. Radi
jednostavnosti, s Y
k
oznaavat emo frekvenciju pridruenu vrijednosti vremenske varijable
X
t
= k. Tako je npr. Y
0
vrijednost pojave pridruena vrijednosti vremenske varijable t = 0,
odnosno vrijednost pojave u poetnom razdoblju (jer je t = 0 vrijednost nezavisne varijable
dodijeljena poetnom vremenskom razdoblju) a Y
n 1
vrijednost pojave pridruena vrijednosti
vremenske varijable t = n 1, odnosno vrijednost pojave u tekuem razdoblju (jer je t = n 1
vrijednost vremenke varijable dodijeljena tekuem razdoblju). Ovakav dogovor svakako treba
imati na umu prigodom provedbe statistike analize.
U prvi mah nam se moda ini da smo pogrijeili kad smo rekli da emo kretanje pojave u
vremenu opisati kao funkciju vremena. Naime, nae dosadanje shvaanje pojma funkcije
pretpostavlja da, nakon definiranja prirodnoga podruja definicije (domene) i podruja
vrijednosti (kodomene), zadamo ''formulu'' (preciznije, analitiki izraz u zatvorenoj formi)
pomou koje se za svaku pojedinu vrijednost nezavisne varijable rauna pripadna vrijednost
zavisne varijable. Meutim, u matematici se funkcija moe potpuno definirati na tri naina:
ve opisanom ''formulom'', tablino i grafiki. Tablini i grafiki prikaz naroito su pogodni
naini zadavanja funkcije ukoliko je njezino prirodno podruje definicije (domena) relativno
''mali'' konaan skup, a u analizi vremenskih nizova imamo upravo takav sluaj. Stoga emo
spomenutu funkciju vremena uvijek najprije definirati tablino, a potom emo potpuno
analogno kao u regresijskoj analizi nastojati pronai najbolju ''formulu'', tj. analitiki izraz
kojim moemo definirati istu tu funkciju. Taj e izraz praktiki uvijek biti priblino toan jer
je korelacija vremena i promatrane pojave vrlo rijetko funkcijska. Iz toga se razloga statistiki
modeli koriteni u analizi vremenskih nizova mogu ubrojiti u regresijske modele, pa se
njihova reprezentativnost moe procjenjivati na isti nain kao i za sve druge regresijske
modele.
Zakljuno spomenimo da sve vremenske nizove moemo podijeliti u dvije skupine:
1.) intervalni vremenski niz to je niz frekvencija dobivenih mjerenjem u odreenomu
vremenskom intervalu (npr. broj noenja u svratitu ''Zlatna koko'' u krabutniku u
razdoblju od 2001. godine do 2007. godine, broj vozila na autocesti Zagreb Lipovac u
razdoblju od 08:00 do 20:00 sati itd.).
2. trenutani vremenski niz to je niz frekvencija dobivenih mjerenjem ili promatranjem u
odreenomu trenutku (npr. broj stanovnika mjesta Sveti Petar u umi u razdoblju od 1971.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 204
godine do 2001. godine stanje na dan 30.6., broj vozila na autocesti Zagreb Lipovac dana
15.svibnja 2008. u 12:00 sati itd.).
5.2. Pokazatelji pojedinanih apsolutnih promjena
Bilo koja razlika vrijednosti dviju frekvencija promatrane pojave naziva se apsolutna
promjena te pojave. Apsolutna promjena moe biti pozitivna ili negativna: ako je njezin
predznak +, govorimo o poveanju vrijednosti pojave, a ako je njezin predznak , govorimo o
smanjenju vrijednosti pojave.
Primjer 4. Godinama (x) iz Primjera 3. pridruimo vrijednosti vremenske varijable (t) prema
formuli: t = x 2003. Drugim rijeima, 2003. godini pridruimo t = 0, 2004. godini
pridruimo t = 1 itd. Izraunajmo razlike Y
0
Y
4
i Y
3
Y
1
i objasnimo njihovo znaenje.
Imamo redom:
Y
0
Y
4
= 67 977 59 603 = 8 374,
to znai da je 2003. godine prosjean godinji broj korisnika novane naknade bio za 8 374
vei nego 2007. godine (ili, ekvivalentno, da je 2007. godine prosjean godinji broj korisnika
novane naknade bio za 8 374 manji nego 2003. godine). Nadalje,
Y
3
Y
1
= 66 407 70 467 = 4 060,
to znai da je 2006. godine prosjean godinji broj korisnika novane naknade bio za 4 060
manji nego 2004. godine (ili, ekvivalentno, da je 2004. godine prosjean godinji broj
korisnika novane naknade bio za 4 060 vei nego 2006. godine).
U praksi se najee raunaju vrijednosti niza uzastopnih apsolutnih promjena (oznaka: Y
t
)
neke pojave. Te se vrijednosti dobiju tako da se od vrijednosti pojave u tekuemu razdoblju
oduzmemo vrijednost pojave u neposredno prethodnomu razdoblju, tj.
Y
t
= Y
t
Y
t 1
, za svaki t = 1, 2, 3, ..., n 1.
Primjer 5. Izraunajmo vrijednosti uzastopnih apsolutnih promjena prosjenoga broja
korisnika novane pomoi (podaci iz Primjera 3.). Dobivamo:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 205
godina t prosjean godinji broj
korisnika novane naknade
uzastopne apsolutne
promjene (Y
t
)
2003. 0 67 977 nepoznata
2004. 1 70 467 2 490
2005. 2 72 802 2 335
2006. 3 66 407 -6 395
2007. 4 59 603 -6 804
U presjeku drugoga retka i treega stupca gornje tablice upisali smo rije nepoznata jer se
vrijednost uzastopne apsolutne promjene prosjenoga godinjega broja korisnika novane
naknade za 2003. godinu dobije tako da se od prosjenoga godinjega broja korisnika novane
naknade u 2003. godini oduzme prosjean godinji broj korisnika novane naknade u 2002.
godini, a potonji podatak nemamo naveden u tablici. Ovo pravilo vrijedi pri svakom
raunanju apsolutnih promjena:
Pravilo 1. Vrijednost uzastopne apsolutne promjene za poetno razdoblje (t = 0) uvijek je
nepoznata. OPREZ! Pogreno je kao vrijednost uzastopne apsolutne promjene za
poetno razdoblje (t = 0) navesti broj 0 (nula) jer broj 0, kao pokazatelj apsolutne
promjene, znai jednakost vrijednosti pojave u odgovarajuim razdobljima, a ne da taj
pokazatelj ne moemo efektivno izraunati.
Iz dobivenoga stupca tablice vidimo npr. da je prosjean broj korisnika novane naknade u
2004. godini bio za 2 490 vei nego u 2003. godini, prosjean broj korisnika novane naknade
u 2006. godini bio je za 6 395 manji nego u 2005. godini itd.
Istaknimo i da se apsolutne promjene mogu raunati u odnosu na isto (bazno) vremensko
razdoblje. Odgovarajui se pokazatelji dobiju tako da se od frekvencije pojave u tekuemu
razdoblju oduzme frekvencija pojave u baznomu razdoblju (b):
*Y
t
= Y
t
Y
b
, za svaki t = 0, 1, , n 1.
Primjer 6. Izraunajmo pokazatelje apsolutnih promjena u odnosu na 2004. godinu za
podatke iz Primjera 3. Budui da je b = 1, tj. Y
b
= Y
1
= 70 467, dobivamo:
godina t prosjean godinji broj
korisnika novane naknade
pojedinane apsolutne
promjene u odnosu na
2004. godinu (*Y
t
)
2003. 0 67 977 -2 490
2004. 1 70 467 0
2005. 2 72 802 2 335
2006. 3 66 407 -4 060
2007. 4 59 603 -10 864
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 206
Iz posljednjega stupca dobivene tablice moemo zakljuiti npr. da je prosjean broj korisnika
novane pomoi u 2005. godini bio za 2 335 vei, a prosjean broj korisnika novane pomoi
u 2006. godini za 4 060 manji nego u 2004. godini.
5.3. Modeli trenda
Ukoliko postoji odreena pravilnost u promjenama vrijednosti promatrane pojave u
odreenom vremenskom razdoblju (tj. ukoliko vremenski niz ima tendenciju rasta ili pada),
kaemo da vremenski niz ima trend. Tendencija rasta ili pada se vrlo dobro moe ''oitati''
izraunavanjem vrijednosti uzastopnih apsolutnih apsolutnih promjena: ako je dobiveni niz
rastui, tj. ukoliko za svaki t = 1, 2, , n 2 vrijedi nejednakost
Y
t
Y
t + 1
,
kaemo da vremenski niz ima tendenciju rasta, a ukoliko vrijedi nejednakost
Y
t
Y
t + 1
,
kaemo da vremenski niz ima tendenciju pada. U takvim se sluajevima kretanje promatrane
pojave moe opisati pomou odgovarajuega modela trenda. Grubo govorei, modeli trenda,
zapravo, nisu nita drugo negoli ''obini'' regresijski modeli u kojima ''ulogu'' nezavisne
varijable X preuzima vremenska varijabla t.
Ukoliko se promatrana pojava mijenja za priblino jednake apsolutne iznose u svakoj jedinici
vremena, njezino kretanje moemo opisati modelom linearnoga trenda. Odgovarajua
jednadba modela linearnoga trenda i pripadni parametri isti su kao i kod modela jednostavne
linearne regresije, samo to se u sluaju modela linearnoga trenda vrijednost parametra A
interpretira kao oekivana prosjena promjena vrijednosti varijable Y u jedinici vremena.
Ukoliko se, pak, promatrana pojava ne mijenja linearno, nego sve bre (ili sporije) ovisno o
vrijednosti vremenske varijable, njezino kretanje moemo opisati modelom eksponencijalnoga
trenda. Odgovarajua jednadba i pripadni parametri toga modela trenda isti su kao i kod
modela jednostavne eksponencijalne regresije, samo to se u sluaju modela
eksponencijalnoga trenda vrijednost parametra A interpretira kao oekivana relativna
prosjena promjena vrijednosti varijable Y u jedinici vremena.
Reprezentativnost modela trenda obino se procjenjuje na temelju koeficijenta varijacije toga
modela, ali se za procjenu moe koristiti i koeficijent determinacije. Formule za izraun
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 207
navedenih pokazatelja jednake su odgovarajuim formulama iz podtoaka 4.2.3.3. i 4.2.3.4.
Kad god je to mogue, treba izraunati oba navedena pokazatelja.
Ilustrirajmo primjenu modela trenda na sljedeem primjeru:
Primjer 1. U donjoj je tablici prikazano kretanje prosjene cijene nafte u SAD u razdoblju od
1. travnja 2007. do 31. travnja 2008. godine.
mjesec i godina t prosjena cijena nafte
[USD/barel]
travanj 2007. 0 63,98
svibanj 2007. 1 63,45
lipanj 2007. 2 67,49
srpanj 2007. 3 74,12
kolovoz 2007. 4 72,36
rujan 2007. 5 79,91
listopad 2007. 6 85,80
studeni 2007. 7 94,77
prosinac 2008. 8 91,69
sijeanj 2008. 9 92,97
veljaa 2008. 10 95,39
oujak 2008. 11 105,46
travanj 2008. 12 112,58
Izvor: Energy Information Administration slubena energetska statistika Vlade SAD
a) Prikaimo kretanje prosjene cijene nafte u promatranom razdoblju linijskim grafikonom s
ishoditem u poetnoj godini razdoblja promatranja. Uz grafikon navedimo sve potrebne
oznake.
b) Odredimo jednadbu modela linearnoga, odnosno eksponencijalnoga trenda koji najbolje
opisuje kretanje promatrane pojave. Objasnimo znaenje parametara trenda i prikaimo
dobivene modele grafiki.
c) Na temelju koeficijenata determinacije procijenimo koji od navedenih modela trenda bolje
opisuje kretanje prosjene cijene nafte. Potom na temelju reprezentativnijega modela trenda
prognozirajmo kretanje prosjene cijene nafte u svakom pojedinom mjesecu do kraja 2008.
godine.
d) Ukoliko se kretanje prosjene cijene nafte nastavi prema modelu odabranom u c)
podzadatku, odredimo u kojem mjesecu moemo oekivati da cijena nafte prvi put dosegne
200 USD/barel.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 208
Kretanje prosjene cijene nafte na amerikom tritu u promatranom razdoblju grafiki je
prikazano sljedeim linijskim grafikonom:
Jednadbe modela linearnoga, odnosno eksponencijalnoga trenda zajedno s pripadajuim
krivuljama trenda i koeficijentima determinacije navedene su na sljedeoj slici:
Zasebno emo analizirati svaki model trenda:
model linearnoga trenda: njegovi parametri su:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 209
A = 3.9743 oekivano mjeseno prosjeno poveanje prosjene cijene nafte iznosi
priblino 4 USD po barelu;
B = 60.767 procijenjena prosjena cijena nafte u travnju 2007. godine iznosi
priblino 60,77 USD
model eksponencijalnoga trenda: njegovi parametri su:
A = e
0.0475
= 1.048646 100 (A 1) 4.865 oekivani prosjean mjeseni rast
prosjene cijene nafte iznosi 4.865%;
B = 62.614 procijenjena prosjena cijena nafte u travnju 2007. godine iznosi
priblino 62,61 USD
Koeficijent determinacije modela linearnoga trenda iznosi 0.9561, to znai da se 95.61%
periodinih promjena prosjene cijene nafte moe objasniti modelom linearnoga trenda. S
druge strane, koeficijent determinacije modela eksponencijalnoga trenda iznosi 0.9609, to
znai da se 96.09% periodinih promjena prosjene cijene nafte moe objasniti modelom
eksponencijalnoga trenda. Prema kriteriju koeficijenata determinacije, model
eksponencijalnoga trenda je reprezentativniji.
Prosjenu cijenu nafte u svakom pojedinom mjesecu preostalom do kraja 2008. godine
moemo prognozirati na dva naina:
1.) uvrtavanjem x = 13, x = 14, , x = 19 i x = 20 u svaku od dobivenih jednadbi;
2.) (u MS Excelu) koritenjem funkcije TREND za prognozu pomou modela linearnoga
trenda, odnosno GROWTH za prognozu pomou modela eksponencijalnoga trenda.
U oba sluaja dobivamo:
mjesec i
godina
t prognoza pomou modela
linearnoga trenda
prognoza pomou modela
eksponencijalnoga trenda
svibanj 2008. 13 112,43 USD 116,05 USD
lipanj 2008. 14 116,41 USD 121,69 USD
srpanj 2008. 15 120,38 USD 127,61 USD
kolovoz 2008. 16 124,36 USD 133,81 USD
rujan 2008. 17 128,33 USD 140,32 USD
listopad 2008. 18 132,30 USD 147,14 USD
studeni 2008. 19 136,28 USD 154,29 USD
prosinac 2008. 20 140,25 USD 161,79 USD
Da bismo procijenili kada e prosjena cijena nafte prvi puta dosegnuti 200 USD po barelu,
trebamo rijeiti jednadbu
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 210
62.614 1.048646
t
= 200
Njezino je rjeenje
120
:
ln200 ln62.614
ln1.048646
t
= 24.
Vrijednost vremenske varijable t = 24 odgovara travnju 2009. godine. Prema tome, ukoliko se
kretanje prosjene cijene nafte nastavi prema modelu eksponencijalnoga trenda, moe se
oekivati da e prosjena cijena nafte u travnju 2009. godine dosegnuti 200 USD/barel.
5.4. Osnovni brojani pokazatelji relativnih promjena
U praksi se esto pojavljuje problem analiziranja i usporedbe dinamike kretanja najmanje
dviju razliitih pojava. Vrijednosti tih pojava obino su iskazane u razliitim mjernim
jedinicama ili se, pak, znaajno razlikuju po svojoj veliini. Zbog toga se u takvim
sluajevima, umjesto apsolutnih promjena, izraunavaju i interpretiraju relativni pokazatelji
promjena tih pojava.
Jedna od najeih mjera relativnih promjena je koeficijent dinamike (oznaka: K
t
). Koeficijent
dinamike jednak je omjeru apsolutne promjene frekvencija dvaju uzastopnih razdoblja i
frekvencije pojave u kronoloki prvom od tih dvaju razdoblja:
1 1
1
t t
t
t t
Y Y
K
Y Y
= = za svaki t = 1, 2, , n 1.
Usko vezana uz koeficijent dinamike je pojedinana stopa promjene (oznaka: S
t
) neke pojave.
Ona iskazuje relativnu promjenu vrijednosti pojave u dvaju uzastopnim razdobljima, a dobije
se mnoenjem koeficijenta dinamike sa 100:
S
t
= K
t
100 =
1
100 1
t
t
Y
Y
| |
|
\
, za svaki t = 1, 2, , n 1.
120
Svima kojima rjeavanje eksponencijalno-logaritamskih jednadbi predstavlja teak i zahtjevan matematiki
problem preporuuje se da navedenu jednadbu rijee koritenjem procedure Traenje rjeenja (Goal Seek).
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 211
Pojedinana stopa promjene zapravo predstavlja postotak promjene frekvencije neke pojave u
tekuemu razdoblju u odnosu na prethodno razdoblje. Stoga se uz numeriku vrijednost
pojedinane stope promjene uvijek pie znak %.
Osim za dva uzastopna razdoblja, pojedinana stopa promjene moe se raunati i prigodom
usporeivanja vrijednosti neke pojave tijekom svakoga od n razdoblja s vrijednou te pojave
u proizvoljno odabranom, ali fiksiranom razdoblju. U takvim sluajevima pojedinanu stopu
promjene vrijednosti pojave u tekuemu razdoblju u odnosu na vrijednost te pojave u
(proizvoljnom, ali fiksiranom) baznom razdoblju dobivamo iz izraza:
*
100 1 100
t t
t
b b
Y Y
S
Y Y
| |
= =
|
\
, za svaki t = 0, 1, 2, , n 1.
Primjer 1. U sljedeoj su tablici prikazani podaci o kretanju broja osnovanih registriranih
pravnih osoba u Republici Hrvatskoj u proteklih godinu dana.
razdoblje broj osnovanih registriranih
pravnih osoba
1. kvartal 2007. 3 724
2. kvartal 2007. 3 567
3. kvartal 2007. 3 240
4. kvartal 2007. 3 500
1. kvartal 2008. 3 783
izvor: Broj i struktura poslovnih subjekata u Republici Hrvatskoj, priopenje br. 11.1.1/1,
Dravni zavod za statistiku, Zagreb, 9.5.2008.
Izraunajmo koeficijente dinamike promjene broja osnovanih registriranih pravnih osoba u
uzastopnim vremenskim razdobljima, te odgovarajue pojedinane stope promjene, pa
objasnimo znaenje dobivenih rezultata za 3. kvartal 2007. godine i 1. kvartal 2008. godine.
Potom usporedimo brojeve osnovanih registriranih pravnih osoba u svakom pojedinom
kvartalu s brojem osnovanih registriranih pravnih osoba u posljednjem kvartalu 2007. godine i
objasnimo znaenje pokazatelja koji odgovara 1. kvartalu 2007. godine.
Najprije izraunavamo koeficijente dinamike i njima odgovarajue stope promjene:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 212
razdoblje t broj osnovanih registriranih
pravnih osoba
K
t
S
t
1. kvartal 2007. 0 3 724 nepoznat nepoznata
2. kvartal 2007. 1 3 567 -0.04216 -4.2159 %
3. kvartal 2007. 2 3 240 -0.09167 -9.16737 %
4. kvartal 2007. 3 3 500 0.080247 8.024691 %
1. kvartal 2008. 4 3 783 0.080857 8.085714 %
U presjecima 2. retka i 3., odnosno 4. stupca upisali smo rijei nepoznat i nepoznata jer nam
za izraunavanje vrijednosti odgovarajuega pokazatelja nedostaju podaci iz 1. kvartalu
neposredno prethodnoga razdoblja, tj. iz 4. kvartala 2006. godine.
Iz dobivene tablice vidimo da je broj osnovanih registriranih pravnih osoba u 3. kvartalu
2007. godine bio za priblino 9.17% manji nego u 2. kvartalu iste godine, te da je broj
osnovanih registriranih pravnih osoba u 1. kvartalu 2008. godine bio za priblino 8.09% vei
nego u 4. kvartalu 2007. godine.
Sada izraunavamo pojedinane stope promjene uzimajui 4. kvartal 2007. godine kao bazno
razdoblje:
razdoblje t broj osnovanih registriranih
pravnih osoba
*
t
S
1. kvartal 2007. 0 3 724 6.4%
2. kvartal 2007. 1 3 567 1.91429%
3. kvartal 2007. 2 3 240 -7.42857%
4. kvartal 2007. 3 3 500 0%
1. kvartal 2008. 4 3 783 8.08571%
Pokazatelj koji odgovara 1. kvartalu 2007. godine jednak je 6.4%, to znai da je broj
osnovanih registriranih pravnih osoba u 1. kvartalu 2007. godine bio za 6.4% vei nego u
posljednjem kvartalu 2007. godine.
5.5. Individualni indeksi
Jedna od najee rabljenih relativnih promjena vrijednosti neke pojave su tzv. indeksi.
Pomou njih usporeujemo odnos stanja jedne ili vie pojava u razliitim vremenskim
razdobljima (''vremenskim tokama'') ili u istim vremenskim razdobljima, ali na razliitim
mjestima (tj. u razliitim gradovima, regijama, dravama, skupinama drava itd.)
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 213
Opa podjela razlikuje dvije vrste indeksa: individualne i skupne. Individualni indeksi prate
razvoj tono jedne pojave u vremenu ili prostoru, te se uobiajeno dijele na verine (lanane)
indekse i indekse na stalnoj bazi (bazne indekse). Za razliku od jednostavnih, skupni indeksi
prate razvoj barem dvije razliite pojave u vremenu ili prostoru.
U nastavku se ukratko opisuje svaka pojedina vrsta indeksa.
5.5.1. Verini (lanani) indeksi
Verini (lanani) indeks (oznaka: V
t
) predstavlja pokazatelj relativne promjene stanja neke
pojave u dvama uzastopnim vremenskim razdobljima. On je, dakle, pokazatelj relativne
promjene stanja neke pojave u tekuemu razdoblju u odnosu na tekuem razdoblju
neposredno prethodno razdoblje. Ukoliko kretanje pojave promatramo tijekom n razdoblja,
onda ukupno n 1 verinih indeksa raunamo pomou relacije:
V
t
=
1
t
t
Y
Y
100, za svaki t = 1, 2, , n 1,
ili, ekvivalentno, na temelju koeficijenata dinamike:
V
t
= (K
t
+ 1) 100, za svaki t = 1, 2, , n 1.
Svaki verini indeks zapravo predstavlja postotni udio vrijednosti promatrane pojave u
tekuemu razdoblju u odnosu na vrijednost te pojave u neposredno prethodnomu razdoblju.
Ako je V
t
= A, onda opa interpretacija toga indeksa glasi:
Na svakih 100 jedinica mjere promatrane pojave u razdoblju (t 1) dolazi A jedinica mjere te
pojave u razdoblju t.
Istaknimo da, kao i koeficijent dinamike, verini indeks nije definiran za poetno razdoblje
(t = 0), pa se u takvim sluajevima obino stavlja rije nepoznat.
121
121
Ova injenica znai da je pogreno kao verini indeks za poetno razdoblje definirati broj 0. U ovom bi
sluaju vrijednost 0 povlaila da znamo vrijednost promatrane pojave u razdoblju koje neposredno prethodi
poetnom razdoblju i da je ta vrijednost jednaka nuli. Oito, niti jedna niti druga posljedica nisu istinite.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 214
Umjesto iz koeficijenta dinamike, pojedinanu stopu promjene u uzastopnim vremenskim
razdobljima moemo izraunati i pomou odgovarajuega verinoga indeksa:
S
t
= V
t
100, za svaki t = 1, 2, , n 1.
Primjer 1. U sljedeoj su tablici navedeni podaci o ukupnom broju zaposlenih u
djelatnostima financijskoga posredovanja u svakom od mjeseci koji tvore 1. kvartal 2008.
godine.
mjesec ukupan broj zaposlenih
sijeanj 1 604
veljaa 1 636
oujak 1 621
izvor: Zaposleni u obrtu i u djelatnostima slobodnih profesija u prvom tromjesenju 2008.,
priopenje br. 9.2.2/1, Dravni zavod za statistiku, Zagreb, 12.5.2008.
Izraunajmo odgovarajue koeficijente dinamike, verine indekse i pojedinane stope
promjene, pa objasnimo znaenje vrijednosti dobivenih za oujak 2008.
Vrijednosti traenih relativnih pokazatelja navedene su u sljedeoj tablici:
mjesec t ukupan broj zaposlenih K
t
V
t
S
t
sijeanj 0 1 604 nepoznat nepoznat nepoznata
veljaa 1 1 636 0.01995 101.995 1.995012 %
oujak 2 1 621 -0.00917 99.08313 -0.91687 %
Iz dobivenih pokazatelja zakljuujemo da je na svakih 100 zaposlenih u djelatnostima
financijskoga posredovanja u oujku 2008. godine dolazilo priblino 102 zaposlena u veljai
iste godine, odnosno da je broj zaposlenih u djelatnostima financijskoga posredovanja u
oujku 2008. godine bio za priblino 0.92% manji nego u veljai iste godine.
Pomou svih n 1 verinih indeksa kojima mjerimo dinamiku promjene vrijednosti neke
pojave u n razdoblja, te zadane vrijednosti te pojave u bilo kojem od tih n razdoblja (oznaimo
ga s b) moemo izraunati vrijednosti pojave u svakom od preostalih n 1 razdoblja na
temelju sljedeih relacija:
1
1
100, za .
, za .
100
t
t
t
t t
t
Y
Y t b
V
V Y
Y b t
= <
= <
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 215
Ilustrirajmo taj postupak na primjeru.
Primjer 2. U sljedeoj su tablici navedeni verini indeksi promjene prosjene isplaene
mjesene neto-plae u razdoblju od 2003. do 2007. godine.
godina t V
t
2003. 0 nepoznat
2004. 1 105.9
2005. 2 105.9
2006. 3 105.2
2007. 4 105.2
izvor: Mjeseno statistiko izvjee 3/2008, Dravni zavod za statistiku, oujak, 2008.
Ako je prosjena mjesena isplaena neto-plaa u 2006. godini iznosila 4.603,00 kn,
odredimo prosjene mjesene isplaene neto-plae u svakoj od preostalih godina.
2006. godini odgovara vrijednost vremenske varijable t = 3, pa je Y
3
= 4.603,00. Za t < 3,
odnosno t = 0, 1, 2 dobivamo redom:
3
2
3
2
1
2
1
0
1
4.603, 00
100 100 4.375, 48
105.2
4.375, 48
100 100 4.131, 70
105.9
4.131, 70
100 100 3.901, 52
105.9
Y
Y
V
Y
Y
V
Y
Y
V
= =
= =
= =
dok za t > 3, odnosno t = 4 dobivamo:
4 3
4
105, 2 4.603, 00
4.842, 36
100 100
V Y
Y
= = .
Dobivene podatke moemo zapisati u obliku tablice:
godina t prosjena mjesena
isplaena netoplaa [kn]
V
t
2003. 0 3.901,52 nepoznat
2004. 1 4.131,70 105.9
2005. 2 4.375,46 105.9
2006. 3 4.603,00 105.2
2007. 4 4.842,36 105.2
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 216
Pri raunanju prosjenoga tempa promjene promatrane pojave rabimo geometrijsku sredinu
verinih indeksa (oznaka: G). Pojam geometrijske sredine ve smo upoznali u toki 3.1.2. pa
emo jo jednom navesti samo osnovnu formulu za njezino raunanje (u terminologiji
verinih indeksa):
1
1 2 1
...
=
n
n
V V V G .
Iz definicije verinih indeksa slijedi da njihovu geometrijsku sredinu moemo izraunati i
prema formuli:
100 1
0
1
=
n
n
Y
Y
G
Stoga moemo zakljuiti da za alternativno raunanje vrijednosti geometrijske sredine
verinih indeksa moramo znati samo prvi (Y
0
) i posljednji (Y
n1
) lan vremenskoga niza. To je
ujedno i najvei nedostatak geometrijske sredine (kao mjere prosjenoga tempa promjene) jer
ne uzima u obzir sve frekvencije vremenskoga niza (za razliku od, npr., ranije spomenutih
modela trenda), nego iskljuivo prvu i posljednju frekvenciju. Pomou spomenute
geometrijske sredine verinih indeksa rauna se i prosjena stopa promjene vrijednosti
promatrane pojave (oznaka: S ):
S = G 100.
Kao i svi drugi relativni pokazatelji, i prosjena stopa promjene iskazuje se u postotcima. Na
temelju nje se okvirno mogu procijeniti (prognozirati) frekvencije te pojave i u buduim
vremenskim razdobljima uz nunu pretpostavku da se dinamika pojave ne mijenja u odnosu
na dinamiku pojave u promatranomu razdoblju. Pri takvim se prognozama koristi relacija:
t
t
G
Y Y |
\
|
=
100
0
, za t = n, n + 1,
No, budui da prosjena stopa promjene ovisi iskljuivo o prvoj i posljednjoj frekvenciji u
vremenskom nizu, u praksi se navedene vrijednosti prognoziraju uglavnom na temelju nekoga
od modela trenda.
Primjer 3. Na temelju podataka iz Primjera 2. izraunajmo prosjenu godinju stopu
promjene prosjene mjesene isplaene neto-plae u razdoblju od 2003. do 2007. godine, pa
procijenimo prosjenu mjesenu isplaenu neto-plau u Republici Hrvatskoj za svaku od
godina u razdoblju od 2008. do 2010. godine.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 217
Geometrijska sredina verinih indeksa jednaka je
4
4 4
0
4.842, 36
100 100
3.901, 52
Y
G
Y
= = = 105.5494197.
Stoga je prosjena godinja stopa promjene
S = G 100 = 105.5494197 100 5.55%,
to znai da su u promatranom razdoblju prosjene mjesene isplaene netoplae rasle za
prosjeno 5.55% godinje. Budui da 2008. godini odgovara vrijednost vremenske varijable
t = 5, 2009. godini t = 9, a 2010. godini t = 10, prognozu prosjenih mjesenih isplaenih
neto-plaa za 2008., 2009. i 2010. godinu dajemo na temelju izraza:
5 5
5
0
6 6
6
0
7 7
7
0
105.5494197
3.901, 52 5.111, 08
100 100
105.5494197
3.901, 52 5.394, 71
100 100
105.5494197
3.901, 52 5.694, 09
100 100
G
Y Y
G
Y Y
G
Y Y
| | | |
= =
| |
\ \
| | | |
= =
| |
\ \
| | | |
= =
| |
\ \
Dakle, procijenjena prosjena mjesena isplaena neto-plaa u Republici Hrvatskoj za 2008.
godini iznosi 5.111,08 kn, u 2009. godini 5.394,71 kn, a u 2010. godini 5.694,09 kn (uz
smjelu pretpostavku da nee doi do znaajnije promjene dinamike kretanja plaa).
Spomenimo zakljuno da se verini indeksi grafiki uobiajeno prikazuju specifinim
linijskim grafikonom ili jednostavnim stupcima. Tako su npr. grafiki prikazi verinih indeksa
iz Primjera 3. sljedei grafikoni:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 218
5.5.2. Indeksi na stalnoj bazi (bazni indeksi)
Indeksi na stalnoj bazi (krae: bazni indeksi) pokazatelji su relativnih promjena u tekuemu
razdoblju u odnosu na neko proizvoljno, ali fiksirano bazno razdoblje. Oznaimo li to
razdoblje s b, onda za svako pojedino razdoblje t odgovarajui indeks I
t
na stalnoj bazi b
raunamo pomou relacije:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 219
100 =
b
t
t
Y
Y
I , za svaki t = 0, 1, 2, , n 1.
Iz navedene relacije proizlaze sljedea svojstva koja je vrlo korisno primijeniti pri provjeri
ispravnosti izrauna indeksa na stalnoj bazi:
Svojstvo 1. Za t = b vrijedi jednakost I
b
= 100.
Svojstvo 2. Pretpostavimo da je b n 1, tj. da posljednje od ukupno n razdoblja nije ujedno
i bazno razdoblje. Tada za t = b + 1 vrijedi jednakost:
I
t
= V
t
.
Ekvivalentno, indeks razdoblja t na stalnoj bazi b jednak je verinomu indeksu razdoblja t
ako i samo ako je t = b + 1.
Indeks na stalnoj bazi zapravo predstavlja postotni udio frekvencije promatrane pojave u
tekuemu razdoblju u odnosu na frekvenciju promatrane pojave u baznomu razdoblju. Stoga je
njegova opa interpretacija sljedea:
I
t
= A Na svakh 100 jedinica mjere pojave A u razdoblju b dolazi A jedinica mjere pojave
A u razdoblju B.
Kao i za verine indekse, i za indekse na stalnoj bazi moe se raunati odgovarajua
pojedinana stopa promjene (oznaka:
*
t
S ) u odnosu na bazno razdoblje b, i to prema formuli:
*
t
S = I
t
100 , za svaki t = 0, 1, 2, , n 1.
Primjer 4. U donjoj su tablici navedeni podaci o prosjenom godinjem broju ena
zaposlenih u pravnim osobama, obrtu i djelatnostima slobodnih profesija u Republici
Hrvatskoj za razdoblje od 1997. do 2006. godine.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 220
godina t prosjean broj zaposlenih ena
[000]
1997. 0 546
1998. 1 574
1999. 2 571
2000. 3 573
2001. 4 578
2002. 5 580
2003. 6 595
2004. 7 606
2005. 8 617
2006. 9 640
izvor: Statistiki ljetopis Republike Hrvatske za 2006. godinu,
Dravni zavod za statistiku, Zagreb, 2007.
Izraunajmo indekse na stalnoj bazi 2003 = 100 i odgovarajue pojedinane stope promjene,
pa objasnimo znaenje navedenih pokazatelja za 2000. i 2006. godinu. Potom dobivene bazne
indekse prikaimo grafiki jednostavnim stupcima.
Traeni indeksi na stalnoj bazi 2003 = 100 i njima odgovarajue stope promjene navedene su
u sljedeoj tablici:
godina t prosjean broj zaposlenih ena
[000]
I
t
*
t
S
1997. 0 546 91.76471 -8.23529
1998. 1 574 96.47059 -3.52941
1999. 2 571 95.96639 -4.03361
2000. 3 573 96.30252 -3.69748
2001. 4 578 97.14286 -2.85714
2002. 5 580 97.47899 -2.52101
2003. 6 595 100 0
2004. 7 606 101.8487 1.848739
2005. 8 617 103.6975 3.697479
2006. 9 640 107.563 7.563025
Iz dobivenih rezultata vidimo da na svakih 100 zaposlenih ena u 2003. godini dolazi
priblino 96 zaposlenih ena u 2000. godini, odnosno priblino 108 zaposlenih ena u 2006.
godini. Ekvivalentno reeno, prosjean broj zaposlenih ena u 2000. godini je za priblino
3.69% manji, a u 2006. godini za priblino 7.56% vei nego u 2003. godini.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 221
Indekse na stalnoj bazi obino grafiki prikazujemo jednostavnim stupcima. Grafiki prikaz
indeksa na stalnoj bazi 2003 = 100 je donja slika:
Vidjeli smo da sve frekvencije neke pojave moemo odrediti pomou verinih indeksa i bilo
koje unaprijed zadane frekvencije te pojave. Analogno, moemo ih odreivati i pomou svih
unaprijed zadanih indeksa na nekoj stalnoj bazi b i (barem) jedne unaprijed zadane
frekvencije te pojave. Ovisno o zadanoj frekvenciji, razlikujemo sljedea dva podsluaja:
1.) Ako je zadana frekvencija pojave u baznomu razdoblju b (tj. vrijednost Y
b
), tada
vrijednosti pojave u svakom od n razdoblja
122
dobivamo iz jednakosti:
100
t b
t
I Y
Y
= , za svaki t = 0, 1, 2, , n 1.
2.) Ako je zadana frekvencija pojave u nekom drugom razdoblju t
1
razliitomu od baznoga (tj.
ako je zadana frekvencija
1
t
Y , pri emu je t
1
b), tada najprije izraunamo frekvenciju
promatrane pojave u baznomu razdoblju b pomou relacije:
100
t
b
t
Y
Y
I
=
122
Navedena formula oito vrijedi i u sluaju t = b.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 222
(I
t
je indeks razdoblja t na stalnoj bazi b). Na taj nain ovaj podsluaj svodimo na podsluaj
1. pa za raunanje vrijednosti pojave u ostalim godinama primijenjujemo formulu navedenu u
tomu sluaju.
Napomenimo da i iz indeksa na stalnoj bazi neovisno o izboru stalne baze b moemo
izraunati prosjenu stopu promjene frekvencija neke pojave u promatranomu razdoblju, i to
prema formuli:
1
1
0
1 100
n
n
I
S
I
| |
=
|
|
\
.
Primjer 5. Zadani su indeksi na stalnoj bazi 2005 = 100 zaposlenih u pravnim osobama svih
oblika vlasnitva.
godina t indeks na stalnoj bazi
2005 = 100
1997. 0 89
1998. 1 96
1999. 2 95
2000. 3 95
2001. 4 95
2002. 5 95
2003. 6 98
2004. 7 99
2005. 8 100
2006. 9 104
Odredimo prosjean broj zaposlenih u pravnim osobama svih oblika vlasnitva u svakoj
pojedinoj godini ako je poznato da je prosjean broj zaposlenih u pravnim osobama svih
oblika vlasnitva u 1997. godini iznosio 995 000. Potom odredimo prosjenu godinju stopu
promjene broja zaposlenih i objasnimo znaenje dobivene vrijednosti.
Iz podataka Y
0
= 995 000, b = 8 (jer 2005. godini odgovara t = 8) i I
0
= 89 slijedi:
0
8
0
995000
100 100
89
b
Y
Y Y
I
= = = 1 117 978.
Dakle, prosjean broj zaposlenih u baznoj godini iznosi 1 117 978. Na temelju toga podatka
raunamo prosjean broj zaposlenih u svakoj od preostalih godina:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 223
1 8 1
1
8 2
2
3 4 5 2
8 6
6
8 7
7
8 9
9
1117978 96
1073258
100 100 100
1117978 95
1062079
100 100
1062079
1117978 98
1095618
100 100
1117978 99
1106798
100 100
1117978 104
1162697
100 100
b
Y I Y I
Y
Y I
Y
Y Y Y Y
Y I
Y
Y I
Y
Y I
Y
= = =
= =
= = =
= =
= =
= =
Dobivene podatke pregledno moemo zapisati u sljedeoj tablici:
godina t prosjean broj zaposlenih
[000 000]
1997. 0 0.95
1998. 1 1.073258
1999. 2 1.062079
2000. 3 1.062079
2001. 4 1.062079
2002. 5 1.062079
2003. 6 1.095618
2004. 7 1.106798
2005. 8 1.117978
2006. 9 1.162697
Prosjena godinja stopa promjene broja zaposlenih iznosi:
1 9
9
1 9
0 0
104
1 100 1 100 1 100 1.745668
89
n
n
I I
S
I I
| | | | | |
= = =
| | |
\ \ \
.
Prema tome, prosjean broj zaposlenih u pravnim osobama svih oblika vlasnitva u
promatranom se razdoblju poveavao za prosjeno 1.75% godinje. Primijetimo da dobiveni
pokazatelj relativno loe opisuje kretanje prosjenoga broja zaposlenih u promatranom
razdoblju jer se u podrazdoblju od 1999. do 2002. godine navedeni prosjean broj nije
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 224
mijenjao. Zbog toga je u takvim sluajevima za analizu promjena promatrane pojave
primjerenije rabiti modele trenda.
5.5.3. Pretvorba indeksa
Jedna od znaajnih prednosti individualnih indeksa jest mogunost pretvorbe
(preraunavanja) svake pojedine vrste indeksa u preostalu vrstu indeksa bez poznavanja
frekvencija koje tvore vremenski niz. Drugim rijeima, promjene promatrane pojave moemo
analizirati i bez poznavanja originalnih emipirijskih frekvencija te pojave.
Pretvorbe individualnih indeksa moemo podijeliti na tri tipa:
1.) pretvorba indeksa na stalnoj bazi b u indekse na stalnoj bazi b
1
b;
2.) pretvorba indeksa na stalnoj bazi b u verine indekse;
3.) pretvorba verinih indeksa u indekse na stalnoj bazi b.
Na po jednom primjeru opisat emo svaki pojedini tip.
Primjer 6. Indekse na stalnoj bazi 2005 = 100 navedene u Primjeru 5. pretvorimo u indekse
na stalnoj bazi 2000 = 100. U tu svrhu koristimo sljedeu formulu:
100
1
*
=
b
t
t
I
I
I , za svaki t = 0, 1, 2, , n 1,
pri emu su:
*
t
I indeks razdoblja t na ''novoj'' stalnoj bazi b
1
;
I
t
indeks razdoblja t na ''staroj'' stalnoj bazi b;
1
b
I indeks razdoblja b
1
na ''staroj'' stalnoj bazi b.
U ovome su primjeru b = 8 (jer 2005. godini odgovara t = 8) i b
1
= 3 (jer 2000. godini
odgovara t = 3). Tako dobivamo:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 225
* 0
0
3
* 1
1
3
* 2
2
3
* * *
4 5 2
* 6
6
3
* 7
7
3
* 8
8
3
*
9
89
100 100 93.68421
95
96
100 100 101.0526
95
95
100 100 100
95
100
98
100 100 = 103.1579
95
99
100 100 = 104.2105
95
100
100 100 105.2632
95
I
I
I
I
I
I
I
I
I
I I I
I
I
I
I
I
I
I
I
I
I
I
= =
= =
= = =
= = =
= =
= =
= = =
=
9
3
104
100 100 109.4737
95 I
= =
Dobivene rezultate pregledno moemo prikazati u sljedeoj tablici:
godina t indeks na stalnoj bazi
2000 = 100
1997. 0 94
1998. 1 101
1999. 2 100
2000. 3 100
2001. 4 100
2002. 5 100
2003. 6 103
2004. 7 104
2005. 8 105
2006. 9 109
Primjer 7. Indekse na stalnoj bazi 2005 = 100 navedene u Primjeru 5. pretvorimo u verine
indekse. U tu svrhu koristimo sljedeu jednadbu:
1
100
t
t
t
I
V
I
= , za svaki t = 1, 2, , n 1.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 226
Tako redom dobivamo:
1
1
0
2
2
1
3
3
2
4 5 3
6
6
5
7
7
6
8
8
7
9
9
8
96
100 100 118.5185
89
95
100 100 98.95833
96
95
100 100 100
95
100
98
100 100 103.1579
95
99
100 100 101.0204
98
100
100 100 101.0101
99
104
100
100
I
V
I
I
V
I
I
V
I
V V V
I
V
I
I
V
I
I
V
I
I
V
I
= =
= =
= = =
= = =
= =
= =
= =
= = 100 104 =
Dobivene rezultate pregledno moemo zapisati u sljedeoj tablici:
godina t verini indeks (V
t
)
1997. 0 nepoznat
1998. 1 119
1999. 2 99
2000. 3 100
2001. 4 100
2002. 5 100
2003. 6 103
2004. 7 101
2005. 8 101
2006. 9 104
Primjer 8. Zadani su verini indeksi prosjene isplaene neto-plae po zaposlenome u
svakom od mjeseci u 2007. godini:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 227
mjesec t verini indeks V
t
sijeanj 0 nepoznat
veljaa 1 96
oujak 2 98.9
travanj 3 98.1
svibanj 4 100.7
lipanj 5 100.1
srpanj 6 100.3
kolovoz 7 100.6
rujan 8 98.0
listopad 9 100.6
studeni 10 106.0
prosinac 11 102.4
izvor: Mjeseno statistiko izvjee 3/08, Dravni zavod za statistiku, Zagreb, travanj 2008.
Odredimo indekse na stalnoj bazi (rujan 2007. = 100), objasnimo znaenje indeksa
dobivenoga za prosinac 2007. godine i procijenimo prosjenu mjesenu stopu promjene
prosjene isplaene neto-plae. U ovom je sluaju b = 8 jer rujnu 2007. godine odgovara
vrijednost vremenske varijable t = 8. Indeks I
t
na stalnoj bazi (rujan 2007. = 100) raunamo
prema sljedeim jednakostima:
1
1
100 za ;
100 za ;
za .
100
t
t
t
t
t t
t
I t b
I
I t b
V
I V
I b t
= =
= <
= <
Prigodom pretvorbe, dakle, kreemo od baznoga indeksa I
8
. On je jednak I
8
= 100. Pomou
njega raunamo najprije vrijednosti indeksa I
7
, I
6
, I
5
, I
4
, I
2
, I
1
i I
0
koristei drugu od triju gore
navedenih jednakosti. Imamo redom:
8
7
8
7
6
7
6
5
6
100
100 100 102.04082
98.0
102.04082
100 100 101.43222
100.6
101.43222
100 100 101.12884
100.3
I
I
V
I
I
V
I
I
V
= =
= =
= =
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 228
5
4
5
4
3
4
3
2
3
2
1
2
1
0
1
101.12884
100 100 101.02781
100.1
101.02781
100 100 100.32553
100.7
100.32553
100 100 102.26863
98.1
102.26863
100 100 103.4061
98.9
103.4061
100 100 107.71469
96
I
I
V
I
I
V
I
I
V
I
I
V
I
I
V
= =
= =
= =
= =
= =
Vrijednosti indeksa I
9
, I
10
i I
11
raunamo pomou posljednje od triju navedenih formula:
8 9
9
9 10
10
10 11
11
100 100.6
100 100.6
100 100
100.6 106.0
100 106.636
100 100
106.636 102.4
109.19526
100 100
I V
I
I V
I
I V
I
= = =
= = =
= =
Dobivene rezultate pregledno moemo zapisati u sljedeoj tablici:
mjesec t indeks na stalnoj bazi I
t
(rujan = 100)
sijeanj 0 107.71
veljaa 1 103.41
oujak 2 102.27
travanj 3 100.33
svibanj 4 101.03
lipanj 5 101.13
srpanj 6 101.43
kolovoz 7 102.04
rujan 8 100
listopad 9 100.6
studeni 10 106.64
prosinac 11 109.2
Vrijednost indeksa za prosinac jednaka je (priblino) 109.2, to znai da na svakih 100 kn
prosjene isplaene netoplae u rujnu 2007. godine dolazi po 109.2 kn prosjene isplaene
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 229
netoplae u prosincu iste godine. Ekvivalentno moemo rei da je prosjena isplaena neto
plaa u prosincu 2007. godine bila za 9.2% vea nego u rujnu iste godine.
Prosjena mjesena promjena isplaene mjesene netoplae jednaka je:
1
1 2 1
100 ... 100 0.1242
n
n
S G V V V
= = ,
to znai da su se u promatranom razdoblju prosjene mjesene netoplae poveavale za
priblino 0.1242% mjeseno.
5.6. Skupni indeksi
Kako je istaknuto u toki 5.5., individualnim (verinim ili baznim) indeksima prati se
dinamika kretanja neke pojave iskazane jednim statistikim nizom. Meutim, esto je
potrebno pratiti kretanje barem dvije pojave koje, prema nekom kriteriju, pripadaju istoj
skupini. Tako se npr. moe pratiti kretanje proizvodnje svih vrsta proizvoda neke tvornice,
kretanje prometa svih trgovina nekoga trgovakoga lanca, kretanje cijena na malo osnovnih
ivotnih potreptina itd. Takve se pojave predoavaju barem dvama statistikim nizovima, a
prate se tzv. skupnim indeksima.
Problem raunanja skupnih indeksa ne moe se postaviti jednoznano, tj. nema jedinstvenoga
analitikog izraza koji bi posluio za raunanje svih skupnih indeksa. U praksi se najee
koriste Laspeyresov
123
i Paascheov
124
oblik skupnih indeksa. Prije nego li objasnimo
spomenute indekse, uvedimo neke dogovorne oznake.
Razdoblje u kojem iskazujemo dinamiku promjene pojave nazivamo tekue ili izvjetajno
razdoblje, a razdoblje u odnosu na koje se iskazuje dinamika pojava naziva se bazno
razdoblje. Sukladno tome, definiramo sljedee veliine:
p
0
:= cijena u baznomu razdoblju;
p
1
:= cijena u tekuemu razdoblju;
q
0
:= koliina u baznomu razdoblju;
q
1
:= koliina u tekuemu razdoblju.
123
Ernst Louis tienne Laspeyres (1834. 1913.), njemaki ekonomist i statistiar.
124
Hermann Paasche (1851. 1925.), njemaki ekonomist i statistiar.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 230
Slova p i q su prva slova engleskih rijei price = cijena i quantity = koliina. Brojani indeks
0 (napisan u subskriptu) uvijek oznaava pojavu u baznomu razdoblju, dok brojani indeks 1
uvijek oznaava pojavu u tekuemu razdoblju.
Istaknimo jo da se vrijednost neke robe u odreenomu razdoblju definira kao umnoak
iznosa koliine te robe i njezine cijene po jedinici mjere koliine u istom razdoblju. Ako je
npr. cijena 1 kg kruha jednaka 5 kn, onda je vrijednost 2 kg kruha jednaka:
2 kg 5
kg
kn
= 10 kn.
(jer je jedinica mjere koliine 1 kg). Vrijednost neke robe obino se iskazuje u istoj jedinici
mjere kao i odgovarajua cijena te robe (po jedinici koliine)
5.6.1. Skupni indeksi koliina
5.6.1.1. Laspeyresov skupni indeks koliina
Laspeyresov skupni indeks koliina (oznaka: q
01
(p
0
)) je pokazatelj relativne promjene ukupnih
koliina promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne
koliine te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene cijene iz baznoga
razdoblja. (Dakle, fiksirana veliina pri izraunu ovoga skupnog indeksa jest p
0
.)
Praktino najjednostavniji za izraun je tzv. agregatni Laspeyresov skupni indeks koliina
definiran formulom:
1 0
1
01 0
0 0
1
( ) 100
n
i i
i
n
i i
i
q p
q p
q p
=
=
U brojniku navedenoga izraza nalaze se hipotetske vrijednosti odreenih koliina robe
proizvedenih u tekuem razdoblju, ali raunate prema cijenama iz baznoga razdoblja. U
nazivniku navedenoga izraza nalaze se stvarne vrijednosti koliina iste robe (proizvedenih u
baznom razdoblju) raunate prema cijenama iz baznoga razdoblja. Budui da i u brojniku i u
nazivniku imamo iste cijene, razlika izmeu brojnika i nazivnika moe biti iskljuivo
posljedica promjene proizvedenih koliina robe, a ni u kojem sluaju posljedica promjene
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 231
cijena te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
proizvedenih koliina.
Analogno kao i individualne indekse, i Laspeyresov skupni indeks koliina najlake
interpretiramo rabei odgovarajuu stopu promjene:
01
0 01 0
( ) ( ) 100
q
S p q p = [%]
5.6.1.2. Paascheov skupni indeks koliina
Paascheov skupni indeks koliina (oznaka: q
01
(p
1
)) je pokazatelj relativne promjene ukupnih
koliina promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne
koliine te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene cijene iz
tekuega razdoblja. (Dakle, fiksirana veliina pri raunanju ovoga skupnog indeksa jest p
1
.)
Praktino najjednostavniji za izraun je tzv. agregatni Paascheov skupni indeks koliina
definiran formulom:
1 1
1
01 1
0 1
1
( ) 100
n
i i
i
n
i i
i
q p
q p
q p
=
=
.
U brojniku navedenoga izraza nalaze se stvarne vrijednosti odreenih koliina robe
proizvedenih u tekuem razdoblju i raunate prema cijenama iz toga razdoblja. U nazivniku
navedenoga izraza nalaze se hipotetske vrijednosti koliina iste robe proizvedenih u baznom
razdoblju, ali raunate prema cijenama iz tekuega razdoblja. Budui da i u brojniku i u
nazivniku imamo iste cijene, razlika izmeu brojnika i nazivnika moe biti iskljuivo
posljedica promjene proizvedenih koliina robe, a ni u kojem sluaju posljedica promjene
cijena te robe. Stoga i navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
proizvedenih koliina robe.
Analogno kao i Laspeyresov skupni indeks koliina, i Paascheov skupni indeks koliina
najlake interpretiramo rabei odgovarajuu stopu promjene:
01
1 01 1
( ) ( ) 100
q
S p q p = [%].
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 232
Primjer 9. Promatraju se prosjene prodajne cijene (PDV uraunat) i prodane koliine etiri
razliite vrste proizvoda u trgovini ''Sve po malo kuna'' u Frkljevcima tijekom listopada i
studenoga 2008. g. Podaci su navedeni u donjoj tablici.
vrsta
proizvoda
prosjena prodajna
cijena u listopadu
2008.
[kn/kg]
prodana koliina
u listopadu 2008.
[kg]
prosjena prodajna
cijena u studenom
2008.
[kn/kg]
prodana koliina
u studenom 2008.
[kg]
brano
T-850
2,19 190 2,39 200
smea
espresso
kava
89 50 88 54
sitna
morska
sol
3,05 170 2,99 150
bijeli
eer
12,10 190 12,20 180
Izraunajmo Laspeyresov i Paascheov skupni indeks koliina, pa objasnimo njihovo znaenje.
U ovome je primjeru bazno razdoblje listopad 2008., a tekue (izvjetajno) razdoblje studeni
2008. Stoga emo prosjenu prodajnu cijenu u listopadu oznaiti s p
0
, prodanu koliinu u
listopadu s q
0
, prosjenu prodajnu cijenu u studenom s p
1
, a prodanu koliinu u studenom s q
1
.
Laspeyresov skupni indeks koliina jednak je:
4
1 0
1
01 0 4
0 0
1
01 0
200 2.19 54 89 150 3.05 180 12.10 7879.50
( ) 100 100 100
190 2.19 50 89 170 3.05 190 12.10 7683.60
( ) 102.54959
i i
i
i i
i
q p
q p
q p
q p
=
=
+ + +
| |
= = =
|
+ + +
\
Pripadna stopa promjene iznosi
01
0 01 0
( ) ( ) 100
q
S p q p = = 102.54959 100 = 2.54959.
Zakljuujemo da su prodane koliine svih promatranih vrst proizvoda u studenom bile za
2.54959% vee od nego u listopadu raunajui uz neizmijenjene cijene iz listopada.
Paascheov skupni indeks koliina jednak je
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 233
4
1 1
1
01 1 4
0 1
1
01 1
200 2.39 54 88 150 2.99 180 12.20 7874.50
( ) 100 100 100
190 2.39 50 88 170 2.99 190 12.20 7680.60
( ) 102.52721
i i
i
i i
i
q p
q p
q p
q p
=
=
+ + +
| |
= = =
|
+ + +
\
Pripadna stopa promjene iznosi
01
1 01 1
( ) ( ) 100
q
S p q p = = 102.52721 100 = 2.52721.
Zakljuujemo da su prodane koliine svih promatranih vrst proizvoda u studenom bile za
2.54959% vee od nego u listopadu raunajui uz neizmijenjene cijene iz studenoga.
Dakle, za iste prodane koliine dobivaju se razliite vrijednosti skupnoga indeksa ako se u
izraun uzmu cijene iz razliitih razdoblja. Stoga skupni indeks nije jednoznana precizna
mjera relativnih promjena neke skupine pojava, nego iskljuivo mjera uz unaprijed zadane
pretpostavke. U ovom su primjeru izraunati skupni indeksi prodanih koliina promatranih
vrsta proizvoda izraunati uz pretpostavku da su odnosi vrijednosti pojedinih vrsta proizvoda
onakvi kakve izraavaju cijene u listopadu 2008.g., odnosno cijene u studenom 2008.g. Time
se ne umanjuje znaaj skupnih indeksa, nego se daje naglasak na obvezu njihova tumaenja
uz uvaavanje pretpostavki pod kojima su izraunati.
5.6.1.3. Fisherov skupni indeks koliina
U praksi se esto koristi i Fisherov
125
skupni indeks koliina ili idealni skupni indeks koliina
(oznaka: Q
01
) Taj je indeks, po definiciji, jednak geometrijskoj sredini Laspeyresova i
Paascheova skupnoga indeksa koliina, tj.
01 01 0 01 1
( ) ( ) Q q p q p = .
Fisherov skupni indeks koliina se najjednostavnije interpretira pomou pripadne stope
promjene. Ona se rauna pomou izraza:
125
Irving Fisher (1867. 1947.), ameriki ekonomist, jedan od tvoraca neoklasine ekonomije.,
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 234
01
01
100
Q
S Q = [%]
i predstavlja prosjenu relativnu promjenu koliina u tekuemu razdoblju u odnosu na
koliine u baznomu razdoblju.
Primjer 10. Izraunajmo Fisherov skupni indeks koliina na temelju podataka iz prethodnoga
primjera i objasnimo njegovo znaenje. Dobivamo:
01 01 0 01 1
7879.50 7874.50
( ) ( ) 100 102.5384
7683.60 7680.60
Q q p q p = = = ,
pa je pripadna stopa promjene
01
01
100
Q
S Q = = 102.5384 100 = 2.5384.
Zakljuujemo da su koliine svih promatranih vrst proizvoda u studenom 2008. bile za
prosjeno 2.5384% vee nego u listopadu 2008.
5.6.2. Skupni indeksi cijena
Skupni indeksi cijena mjere relativnu promjenu razine cijena za odreeni asortiman robe,
usluga itd. U praksi postoji vie razliitih vrsta skupnih indeksa cijena: skupni indeks cijena
na malo, skupni indeks cijena na veliko, skupni indeks izvoznih cijena, skupni indeks cijena u
turizmu itd. Odmah napomenimo da se niti jednim od tih indeksa ne mogu obuhvatiti cijene
svih roba i usluga, pa se time nameu nimalo trivijalni problemi izbora proizvoda i(li) usluga
koji e biti reprezentanti skupine za koju elimo izraunati skupne indekse cijena, problemi
izbora cijene (kada i gdje treba prikupiti podatke o cijenama odabranih proizvoda i(li) usluga)
itd. Sve to ukazuje na injenicu da, iako skupne indekse nije teko izraunati, treba biti vrlo
oprezan u njihovoj interpretaciji, a napose u poopavanju zakljuaka izvedenih pomou
odabranih reprezentanata na cijelu skupinu.
Dva najea skupna indeksa cijena su Laspeyresov skupni indeks cijena i Paascheov skupni
indeks cijena koje emo upoznati u nastavku.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 235
5.6.2.1. Laspeyresov skupni indeks cijena
Laspeyresov skupni indeks cijena (oznaka: p
01
(q
0
)) je pokazatelj relativne promjene ukupnih
cijena promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne cijene
te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene koliine iz baznoga
razdoblja. (Dakle, fiksirana veliina pri raunanju ovoga skupnog indeksa jest q
0
.)
Praktino najjednostavniji za izraun je tzv. agregatni Laspeyresov skupni indeks cijena
definiran formulom
1 0
1
01 0
0 0
1
( ) 100
n
i i
i
n
i i
i
p q
p q
p q
=
=
Uoimo da se u brojniku navedenoga izraza nalaze hipotetske vrijednosti odreenih koliina
robe proizvedenih u baznom razdoblju, ali raunate prema cijenama iz tekuega razdoblja. U
nazivniku navedenoga izraza nalaze se stvarne vrijednosti koliina iste robe (proizvedenih u
baznom razdoblju) raunate prema cijenama iz baznoga razdoblja. Budui da i u brojniku i u
nazivniku imamo iste koliine, razlika izmeu brojnika i nazivnika moe biti iskljuivo
posljedica promjene cijena promatrane robe, a ni u kojem sluaju posljedica promjene
koliina te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
promatranih cijena.
Analogno kao i skupne indekse koliina, i skupne indeks cijena najlake interpretiramo rabei
odgovarajue stope promjene. Za Laspeyresov skupni indeks cijena pripadajua stopa
promjene rauna se prema formuli:
01
0 01 0
( ) ( ) 100
p
S q p q = [%]
5.6.2.2. Paascheov skupni indeks cijena
Paascheov skupni indeks cijena (oznaka: p
01
(q
1
)) je pokazatelj relativne promjene ukupnih
cijena promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupne cijene
te skupine pojava u baznomu razdoblju raunajui uz neizmijenjene koliine iz tekuega
razdoblja. (Dakle, fiksirana veliina pri raunanju ovoga skupnoga indeksa jest q
1
.)
Praktino najjednostavniji za izraun je tzv. agregatni Paascheov skupni indeks cijena
definiran formulom:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 236
1 1
1
01 1
0 1
1
( ) 100
n
i i
i
n
i i
i
p q
p q
p q
=
=
Uoimo da se u brojniku navedenoga izraza nalaze stvarne vrijednosti odreenih koliina robe
proizvedenih u tekuem razdoblju raunate prema cijenama iz tekuega razdoblja. U
nazivniku navedenoga izraza nalaze se hipotetske vrijednosti koliina iste robe (proizvedenih
u tekuem razdoblju), ali raunate prema cijenama iz baznoga razdoblja. Budui da i u
brojniku i u nazivniku imamo iste koliine, razlika izmeu brojnika i nazivnika moe biti
iskljuivo posljedica promjene cijena promatrane robe, a ni u kojem sluaju posljedica
promjene koliina te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele
skupine promatranih cijena.
I Paascheov skupni indeks cijena najlake interpretiramo rabei odgovarajuu stopu promjene.
Ona se rauna prema formuli:
01
1 01 1
( ) ( ) 100
p
S q p q = [%]
Primjer 11. Za prosjene prodajne cijene (PDV uraunat) i prodane koliine etiri razliite
vrste proizvoda iz Primjera 9. izraunajmo Lasyperesov i Paascheov skupni indeks cijena, pa
objasnimo njihovo znaenje.
Podsjetimo da je bazno razdoblje listopad 2008., a tekue (izvjetajno) razdoblje studeni 2008.
Stoga prosjenu prodajnu cijenu u listopadu oznaavamo s p
0
, prodanu koliinu u listopadu s
q
0
, prosjenu prodajnu cijenu u studenom s p
1
, a prodanu koliinu u studenom s q
1
.
Laspeyresov skupni indeks cijena jednak je:
4
1 0
1
01 0 4
0 0
1
01 0
2.39 190 88 50 2.99 170 12.2 190 7680.40
( ) 100 100 100
2.19 190 89 50 3.05 170 12.1 190 7683.60
( ) 99.958353
i i
i
i i
i
p q
p q
p q
p q
=
=
+ + +
| |
= = =
|
+ + +
\
Pripadna stopa promjene iznosi
01
0 01 0
( ) ( ) 100
p
S q p q = = 99.958353 100 = -0.041647
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 237
Zakljuujemo da su prosjene prodajne cijene svih promatranih vrst proizvoda u studenom
bile za priblino 0.042% manje nego u listopadu raunajui uz neizmijenjene prodane
koliine iz listopada.
Paascheov skupni indeks cijena jednak je
4
1 1
1
01 1 4
0 1
1
01 1
2.39 200 88 54 2.99 150 12.2 180 7874.50
( ) 100 100 100
2.19 200 89 54 3.05 150 12.1 180 7879.50
( ) 99.936544
i i
i
i i
i
p q
p q
p q
p q
=
=
+ + +
| |
= = =
|
+ + +
\
Pripadna stopa promjene iznosi
01
1 01 1
( ) ( ) 100
p
S q p q = = 99.936544 100 = -0.063456
Dakle, prosjene prodajne cijene svih promatranih vrst proizvoda u studenome bile su za
priblino 0,063% manje nego u listopadu raunajui uz neizmijenjene prodane koliine iz
studenoga.
5.6.2.3. Fisherov skupni indeks cijena
Analogno Fisherovu skupnu indeksu koliina, definira se Fisherov skupni indeks cijena ili
idealni skupni indeks cijena (oznaka: P
01
) Taj je indeks, po definiciji, jednak geometrijskoj
sredini Laspeyresova i Paascheova skupnoga indeksa cijena, tj.
01 01 0 01 1
( ) ( ) P p q p q = .
Fisherov skupni indeks koliina se najjednostavnije interpretira pomou pripadne stope
promjene. Ona se rauna pomou izraza:
01
01
100
P
S P = [%]
i predstavlja prosjenu relativnu promjenu cijena u tekuemu razdoblju u odnosu na cijene u
baznomu razdoblju.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 238
Primjer 12. Izraunajmo Fisherov skupni indeks cijena na temelju podataka iz Primjera 9. i
objasnimo njegovo znaenje. Dobivamo:
01 01 0 01 1
7680.40 7874.50
( ) ( ) 100 99.94745
7683.60 7879.50
P p q p q = = = ,
pa je pripadna stopa promjene
01
01
100
P
S P = = 99.94745 100 = 0.52555.
Zakljuujemo da su cijene svih promatranih vrst proizvoda u studenom 2008. bile za
prosjeno 0.52555% manje nego u listopadu 2008.
5.6.3. Skupni indeksi vrijednosti
Skupni indeks vrijednosti (oznaka: V
01
) je pokazatelj relativne promjene ukupne vrijednosti
promatrane skupine od tono n pojava u tekuemu razdoblju u odnosu na ukupnu vrijednost te
skupine pojava u baznomu razdoblju. Rauna se prema formuli:
1 1
1
01
0 0
1
100
n
i i
i
n
i i
i
p q
V
p q
=
=
Kao i svi ostali indeksi, najlake ga je interpretirati pomou pripadajue stope promjene. Ona
se rauna prema formuli:
01
V
S = V
01
100 [%].
Napomenimo da se skupni indeks vrijednosti moe izraunati i kao umnoak Laspeyresova
indeksa cijena i Paascheova indeksa koliina podijeljenoga sa 100, odnosno Paascheova
indeksa cijena i Laspeyresova indeksa koliina podijeljenoga sa 100. Tonije, vrijede sljedee
jednakosti:
01 0 01 1 01 1 01 0
01
( ) ( ) ( ) ( )
100 100
p q q p p q q p
V
= =
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 239
Takoer, skupni indeks vrijednosti jednak je umnoku Fisherova skupnoga indeksa cijena i
Fisherova skupnoga indeksa koliina podijeljenoga sa 100, tj. vrijedi jednakost:
01 01
01
100
P Q
V
= .
Primjer 13. Za promatrane vrste proizvoda iz Primjera 9. izraunajmo skupni indeks
vrijednosti i objasnimo njegovo znaenje. Radi tonosti izrauna koristit emo originalnu
formulu za skupni indeks vrijednosti, a potom emo provjeriti dobiveni rezultat koristei
netom navedene jednakosti. Imamo redom:
4
1 1
1
01 4
0 0
1
01
2.39 200 88 54 2.99 150 12.2 180 7874.50
100 100 100
2.19 190 89 50 3.05 170 12.1 190 7683.60
102.484512
i i
i
i i
i
p q
V
p q
V
=
=
+ + +
| |
= = =
|
+ + +
\
Pripadna stopa promjene iznosi
01
V
S = V
01
100 = 102.484512 100 = 2.484512.
Zakljuujemo da je ukupna vrijednost promatrane skupine rob u studenom 2008. bila za
priblino 2.48% vea nego u listopadu 2008.
Izraun skupnoga indeksa vrijednosti pomou Laspeyresovih i Paascheovih, odnosno
Fisherovih indeksa daje sljedee rezultate:
01 0 01 1
01
( ) ( ) 99.958353 102.52721
102.48451
100 100
p q q p
V
= = =
01 1 01 0
01
( ) ( ) 99.936544 102.54959
102.48442
100 100
p q q p
V
= = =
01 01
01
99.94745 102.5384
100 100
P Q
V
= = = 102.48452
Za postizanje vee tonosti u izraunima odgovarajue skupne indekse trebali bismo
izraunati na vie decimalnih mjesta. Najtonija je svakako vrijednost dobivena iz originalne
formule za izraun skupnoga indeksa vrijednosti jer sadri najmanje podataka dobivenih
priblinim izraunima pa tu formulu treba primjenjivati kad god je to mogue.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 240
Primjer 14. U sljedeoj su tablici navedeni podaci o broju ostvarenih noenja i prosjenim
cijenama jednoga noenja u gradu dralovgradu u tri razliita sektora za 2007. i 2008. godinu.
vrsta
usluge
prosjena cijena jednoga
noenja u 2007. g.
[]
ostvareni broj
noenja u 2007. g.
[000]
prosjena cijena jednoga
noenja u 2008. g.
[]
ostvareni broj
noenja u 2008. g.
[000]
hoteli 80 32 90 30
kampovi 29 12 25 13
privatni
smjetaj
60 44 59 51
Odredimo:
a) Za koliko su se ukupno promijenile prosjene cijene jednoga noenja u 2008. godini u
odnosu na 2007. godinu raunajui uz neizmijenjen ostvaren broj noenja u 2007. godini?
b) Za koliko se ukupno promijenio ostvaren broj noenja u 2008. godini u odnosu na 2007.
godinu raunajui uz neizmijenjene prosjene cijene jednoga noenja u 2008. godini?
c) Za koliko su se prosjeno promijenile prosjene cijene jednoga noenja u 2008. godini u
odnosu na 2007. godinu?
d) Je li ostvarena prognoza gradonaelnika dralovgrada Mutimira Lupiglupostia da e
ukupna vrijednost svih noenja ostvarenih u 2008. godini biti za 10% vea nego u prethodnoj
godini? Objasnimo svoj odgovor.
Najprije primijetimo da je u ovome primjeru 2007. godina bazna godina, a 2008. godina
tekua ili izvjetajna godina. Stoga su veliine u drugomu stupcu cijene u baznoj godini, pa
emo ih oznaiti s p
0
. Na isti nain oznaavamo i ostale stupce: u treemu su stupcu
vrijednosti koliina u baznoj godini koje oznaavamo s q
0
, u etvrtomu stupcu vrijednosti
veliine p
1
, a u posljednjemu stupcu vrijednosti veliine q
1
. Stoga poetnu tablicu moemo
zamijeniti sljedeom:
vrsta usluge p
0
q
0
p
1
q
1
hoteli 80 32 90 30
kampovi 29 12 25 13
privatni smjetaj 60 44 59 51
a) U ovome je sluaju neizmijenjena veliina broj noenja u 2007. godini odnosno, sukladno
gornjim oznakama, veliina q
0
. Promatramo relativnu promjenu cijena uz pretpostavku o
neizmijenjenoj veliini q
0
, pa raunamo Laspeyresov skupni indeks cijena (p
01
(q
0
)):
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 241
3
1 0
1
01 0 3
0 0
1
90 32 25 12 59 44 5776
( ) 100 100 100 104.10959
80 32 29 12 60 44 5548
i i
i
i i
i
p q
p q
p q
=
=
+ +
| |
= = = =
|
+ +
\
Pripadna stopa promjene iznosi
01
0
( )
p
S q = p
01
(q
0
) 100 = 104.10959 100 = 4.10959.
Stoga zakljuujemo: Raunajui uz neizmijenjen ostvareni broj noenja u 2007. godini,
prosjene cijene jednoga noenja u 2008. godini bile su za priblino 4.11% nego u 2007.
godini.
b) U ovome je sluaju neizmijenjena veliina prosjena cijena jednoga noenja u 2008.
godini, tj., sukladno ranijim oznakama, veliina p
1
. Promatramo relativnu promjenu
ostvarenih noenja uz pretpostavku o fiksiranoj veliini p
1
, pa raunamo Paascheov skupni
indeks koliina (q
01
(p
1
)):
3
1 1
1
01 1 3
0 1
1
30 90 13 25 51 59 6034
( ) 100 100 100 104.46676
32 90 12 25 44 59 5776
i i
i
i i
i
q p
q p
q p
=
=
+ +
| |
= = = =
|
+ +
\
Pripadna stopa promjene iznosi
01
1
( )
q
S p = q
01
(p
1
) 100 = 4.46676.
Stoga zakljuujemo: Raunajui uz neizmijenjene prosjene cijene jednoga noenja u 2008.
godini, ostvareni broj noenja u 2008. godini bio je za 4.46676% vei nego u 2007. godini.
c) U ovome sluaju raunamo prosjenu promjenu cijena u tekuem razdoblju u odnosu na
cijene u baznom razdoblju. U tu emo svrhu izraunati Fisherov skupni indeks cijena, pa e
rjeenje biti tom indeksu pripadajua stopa promjene. Fisherov skupni indeks cijena jednak je:
01 01 0 01 1
01
90 32 25 12 59 44 90 30 25 13 59 51
( ) ( ) 100
80 32 29 12 60 44 80 30 29 13 60 51
103.7417
P p q p q
P
+ + + +
= =
+ + + +
=
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 242
a njemu pripadna stopa promjene
01
01
100
P
S P = = 103.7417 100 = 3.7417.
Dakle, prosjene cijene jednoga noenja u 2008. godini bile su za prosjeno 3.7417% vee
nego u 2007. godini.
d) U ovome sluaju usporeujemo stopu promjene koja odgovara skupnom indeksu
vrijednosti s oekivanom stopom promjene. Najprije raunamo skupni indeks vrijednosti:
3
1 1
1
01 3
0 0
1
90 30 25 13 59 51 6034
100 100 100 108.76
80 32 29 12 60 44 5548
i i
i
i i
i
p q
V
p q
=
=
+ +
| |
= = = =
|
+ +
\
,
pa je pripadna stopa promjene
01
V
S = V
01
100 = 108.76 100 = 8.76
Stoga moemo zakljuiti: Ukupna vrijednost noenja u 2008. godini je za 8.76% vea nego u
2007. godini. Dakle, gradonaelnikova prognoza se nije ostvarila
126
.
5.6.4. Neki posebni oblici skupnih indeksa i njihova primjena
U odreenim ekonomskim analizama esto se koriste razliiti oblici individualnih i skupnih
indeksa. Tako se npr. skupni indeks cijena moe raunati za cijene na malo, cijene na veliko,
cijene poljoprivrednih proizvoda, cijene tzv. "sindikalne koarice" itd. Pogledajmo to na
sljedeim primjerima.
5.6.4.1. Izraunavanje realnih plaa na osnovu skupnih indeksa trokova ivota
Jedan od najvanijih oblika skupnih indeksa cijena je indeks potroakih cijena
127
. Indeks
potroakih cijena odraava promjene na razini cijena dobara i usluga koje u tijeku vremena
126
Gradonaelnikova prognoza ne bi bila istinita niti da smo skupni indeks V
01
raunali kao kolinik umnoka
indeksa p
01
(q
0
) q
01
(p
1
) i broja 100. Provjerite to.
127
Sve do 2004. godine umjesto indeksa potroakih cijena raunao se tzv. indeks trokova ivota koji je imao
istu namjenu kao i indeks potroakih cijena. Od 2004. godine u statistikim se izvjeima primjenjuje indeks
potroakih cijena, a u svrhu usklaivanja hrvatskih statistikih izvjea sa svjetskim izvjeima i pokazateljima.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 243
nabavlja, koristi se njima ili plaa referentno stanovnitvo radi osobne potronje, te je
jedinstvena i opa mjera inflacije u Republici Hrvatskoj. On je samo mjera kretanja cijena
dobara i usluga osobne potronje, a ne stvarnih promjena razlike i strukture osobne potronje,
za koje se podaci prikupljaju posebnim anketama. Izraunava se i objavljuje na osnovi oko
590 reprezentativnih dobara i usluga. Svakog mjeseca prikupi se vie od 27 000 cijena na
unaprijed definiranu uzorku prodajnih mjesta na unaprijed definiranu uzorku prodajnih mjesta
na devet lokacija (gradova) u Republici Hrvatskoj (Zagreb, Slavonski Brod, Osijek, Sisak,
Rijeka, Pula, Split, Dubrovnik i Varadin), odabranih prema kriteriju broja stanovnika i
reprezentativnosti za pojedinu statistiku regiju. Za klasificiranje izdataka koristi se
Klasifikacija osobne potronje prema namjeni (COICOP) koja izdatke dijeli u sljedeih 12
osnovnih kategorija dobara i usluga:
- prehrana i bezalkoholna pia;
- alkoholna pia i duhan;
- odjea i obua;
- stanovanje, voda, energija, plin i druga goriva;
- pokustvo, oprema za kuu i redovito odravanje;
- zdravstvo;
- promet;
- komunikacije;
- rekreacija i kultura;
- obrazovanje;
- ugostiteljske usluge;
- ostala dobra i usluge
128
.
Indeks potroakih cijena slui ponajprije za mjerenje inflacije (porasta cijena) u privredi, a
moe se koristiti i u druge svrhe (npr. za ouvanje vrijednosti kod ugovora s indeksnim
klauzulama, deflacioniranje (uklanjanje utjecaja inflacije) odreenih vrijednosnih pokazatelja
itd.).
Pomou indeksa potroakih cijena mjeri se utjecaj potroakih cijena na nominalne plae.
Tako se dobiju realne plae ije kretanje slui za opis kretanja ivotnoga standarda
stanovnitva. Realne plae i pripane indekse realnih plaa kao pokazatelje njihove dinamike
kretanja izraunavamo prema formulama:
128
Definicije navedene u prvom dijelu ove toke preuzete su iz Statistikoga ljetopisa Republike Hrvatske za
2008. godinu, DZS, Zagreb, 2009.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 244
100
100
NP
RP
IPC
INP
IRP
IPC
=
=
pri emu su:
RP iznos realne plae;
NP iznos nominalne plae;
IPC indeks potroakih cijena na stalnoj bazi;
IRP indeks realne plae na stalnoj bazi;
INP indeks nominalne plae na stalnoj bazi.
Istaknimo da se svi ovdje navedeni indeksi na stalnoj bazi obavezno moraju odnositi na isto
bazno razdoblje (tj. moraju se odnositi na razdoblje u odnosu na ije potroake cijene
raunamo iznose realnih plaa).
Primjer 15. Prosjene mjesene neto-plae u Republici Hrvatskoj i verini indeksi
potroakih cijena za razdoblje od rujna 2008. do sijenja 2009. godine navedeni su u donjoj
tablici.
Razdoblje
Prosjena
mjesena
neto-plaa
[kn]
Verini indeks
potroakih
cijena
rujan 2008. 5.203
listopad 2008. 5.263 100.0879507
studeni 2008. 5.397 99.73637961
prosinac 2008. 5.410 99.38325991
sijeanj 2009. 5.307 101.2411348
Izraunajmo realne plae i pripadne indekse realnih plaa na stalnoj bazi prosinac 2008. =
100. Objasnimo vrijednosti izraunate za listopad 2008. godine i odredimo ukupnu relativnu
promjenu realnih plaa u promatranom razdoblju.
Verine indekse potroakih cijena najprije moramo pretvoriti u indekse potroakih cijena na
stalnoj bazi (uzimajui prosinac 2008. godine a bazno razdoblje, tj. b = prosinac 2008.).
Koristimo formule:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 245
1
1
100 za prosinac 2008.;
100 za prosinac 2008.;
za prosinac 2008. .
100
t
t
t
t
t t
t
I t
I
I t
V
I V
I t
= =
= <
= <
Tako najprije imamo:
I
prosinac
= 100,
pa
prosinac
prosinac
100
100 100 100.6206
99.38326
100, 6206
100 100 100.8865
99.73638
100.8865
100 100 100.7979
100.088
studeni
studeni
listopad
studeni
listopad
rujan
listopad
I
I
V
I
I
V
I
I
V
= =
= =
= =
,
dok za sijeanj 2009. dobivamo:
prosinac
100 101.2411
101.2411
100 100
sijeanj
sijeanj
I V
I
= = = .
(To smo mogli zakljuiti i bez raunanja. Zato?) Dobivene podatke pregledno zapiimo u
posljednji stupac sljedee tablice:
Razdoblje
Prosjena mjesena
neto-plaa [kn]
Verini indeks
potroakih cijena
Indeks potroakih cijena
(prosinac 2008. = 100)
rujan 2008. 5.203 100.7978724
listopad 2008. 5.263 100.0879507 100.8865248
studeni 2008. 5.397 99.73637961 100.6205674
prosinac 2008. 5.410 99.38325991 100
sijeanj 2009. 5.307 101.2411348 101.2411348
Realne plae (uz prosinac 2008. kao bazno razdoblje) raunamo prema formuli:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 246
prosjena mjesena neto-plaa
100
indeks potroakih cijena na stalnoj bazi (prosinac 2008. = 100)
RP = .
Tako redom imamo:
prosinac
5.203
100 5.161,82
100.7979
5.263
100 5.216, 75
100.8865
5.397
100 5.363, 72
100.6206
prosjena mjesena netoplaa za prosinac = 5.410
5.307
100 5.241
101.2411
rujan
listopad
studeni
sijeanj
RP
RP
RP
RP
RP
=
=
=
=
= , 94
Potom raunamo indeks realnih plaa (IRP) ponovno uzimajui prosinac 2008. godine kao
bazno razdoblje. Taj indeks moemo izraunati izravno iz gore navedenih realnih plaa kao:
realna plaa u tekuem razdoblju
100
realna plaa u prosincu 2008.
IRP =
pa dobivamo:
prosinac
5.161,82
100 95.41248
5.410
5.216, 75
100 96.42795
5.410
5.363, 72
100 99.14445
5.410
100
5.241, 94
100 96.89354
5.410
rujan
listopad
studeni
sijeanj
IRP
IRP
IRP
IRP
IRP
=
=
=
=
=
Sve dobivene podatke moemo pregledno zapisati tablino:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 247
Razdoblje
Prosjena
mjesena
neto-plaa
[kn]
Verini
indeks
potroakih
cijena
Iindeks potroakih
cijena
(prosinac 2008. =
100)
Realne plae
(bazno razdoblje:
prosinac 2008.)
Indeks realnih
plaa
(prosinac
2008. = 100)
rujan 2008. 5.203 100.7978724 5.161,82 95.41248245
listopad
2008.
5.263
100.0879507 100.8865248 5.216,75 96.42795188
studeni 2008. 5.397 99.73637961 100.6205674 5.363,71 99.14444616
prosinac
2008.
5.410
99.38325991 100 5.410 100
sijeanj
2009.
5.307
101.2411348 101.2411348 5.241,94 96.89353887
Iz tablice vidimo da su realne plae u listopadu 2008. godine, uz potroake cijene iz
prosinca 2008. godine, iznosile 5.216,75 kn. Pripadni indeks realnih plaa interpretiramo
pomou odgovarajue stope promjene:
S
t
= IRP 100.
Stoga imamo:
S
listopad
= IRP
listopad
100 = 96.42795188 100 = -3.57204812.
Zakljuujemo da su, uz potroake cijene iz prosinca 2008. godine, u listopadu 2008. godine
realne plae bile za priblino 3.57% manje nego u prosincu iste godine.
Ukupnu relativnu promjenu, tj. ukupan postotak promjene realnih plaa u promatranom
razdoblju moemo izraunati na dva razliita naina:
1.) odreivanjem omjera posljednje i prve vrijednosti realne plae uz potroake cijene iz
prosinca 2008. godine:
100 100
5.241, 94
100 100
5.161,82
1.552267
sijeanj
rujan
Y
P
Y
P
P
=
=
2.) odreivanjem omjera posljednjeg i prvog indeksa realnih plaa (uz prosinac 2008.
godine kao bazno razdoblje):
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 248
100 100
96.89354
100 100
95.41248
1.552267
sijeanj
rujan
IRP
P
IRP
P
P
=
=
Zakljuujemo da su se, uz potroake cijene iz prosinca 2008. godine, u promatranom
razdoblju realne plae ukupno poveale za priblino 1.55%.
Napomena: Apsolutna vrijednost realnih plaa ovisi o razdoblju za kojega su vezane
potroake cijene (tj. za razliita bazna razdoblja dobivamo razliite vrijednosti realnih plaa),
pa se prigodom njihova raunanja obvezatno mora navesti uz koje su bazno razdoblje vezane
potroake cijene (upravo kako smo to uinili u prethodnomu primjeru). No, prigodom
raunanja indeksa ili odgovarajuih stopa promjene nije bitno uz koje su razdoblje vezane
potroake cijene jer vrijednost indeksa (odnosno, stope promjene) ne ovisi o izboru razdoblja
za kojega veemo potroake cijene. U tome je prednost uporabe pokazatelja relativnih
promjena.
5.6.4.2. Vrijednost u stalnim cijenama i indeks fizikoga obujma
Jedna od vrlo estih pojava u ekonomskim analizama jest tzv. deflacija. Tim se postupkom
uklanja utjecaj promjena cijena na vrijednosno izraene pojave, a provodi se tako da se
nominalne vrijednosti (vrijednosti izraene u tekuim cijenama) podijele s odgovarajuim
skupnim indeksom cijena (kojega nazivamo deflator). Njegova obiljeja openito ovise o
strukturi pojave ije vrijednosti deflacioniramo. Potreba za deflacijom osobito se javlja pri
inflacijskim kretanjima u kojima promjene cijena onemoguuju uvid u stvarni razvoj
promatranih pojava (npr. koliina proizvoda, koliina usluga itd.). Deflacionirane vrijednosti
nazivamo i vrijednosti u stalnim cijenama, a openito ih odreujemo pomou formule
100
TC
SC
V
V
IC
=
gdje su:
V
SC
vrijednost iskazana u stalnim cijenama;
V
TC
vrijednosti iskazana u tekuim cijenama;
IC indeks cijena na stalnoj bazi.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 249
Tipini primjeri deflatora su ranije spomenuti indeks potroakih cijena i tzv. indeks fizikoga
obujma. Taj je indeks poseban oblik skupnoga indeksa koliina, a raunamo ga pomou
izraza:
( )
100
( )
SC t
t
SC b
V
IFO
V
= , za t = 0, 1, , n 1
gdje su:
(IFO)
t
indeks fizikoga obujma za razdoblje t;
(V
SC
)
t
vrijednost u stalnim cijenama za razdoblje t;
(V
SC
)
b
vrijednost u stalnim cijenama za bazno razdoblje b.
Indeks fizikoga obujma rabimo, primjerice, kada elimo usporeivati bruto domai proizvod
u odreenoj godini (iskazan u stalnim cijenama) s bruto domaim proizvodom u nekoj
odabranoj baznoj godini.
Pokaimo primjenu ovih vrsta indeksa na primjeru.
Primjer 16. U donjoj su tablici navedeni podaci o proizvodnji u tekuim cijenama, indeksu
cijena na stalnoj bazi 2005 = 100 i proizvodnji u stalnim cijenama iz 2005. godine.
Godina Verini
indeks
cijena
Proizvodnja u
tekuim
cijenama
[000 000 ]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u stalnim cijenama
iz 2005. godine
[000 000 ]
Indeks
fizikoga
obujma
(2005 = 100)
1997. 69.76990634 0,90296810
1998. 0.75 74.65379979
1999. 76.89341378 1,14444132
2000. 0.96 77.66234792
2001. 82.32208879 1,29977266
2002. 1.23 85.61497235
2003. 88.18342152 1,54224000
2004. 1.52 92.59259259
2005. 100 1,85000000
2006. 1,98 110
2007. 118,8 2,11279461
2008. 2,75 125.928
Dopunimo navedenu tablicu podacima koji nedostaju, pa potom pomou reprezentativnijega
od dvaju modela trenda (jednostavni linearni i jednostavni eksponencijalni model trenda)
prognozirajmo kretanje proizvodnje (iskazane u stalnim cijenama iz 2005. godine) u razdoblju
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 250
od 2009. do 2013. godine. Zakljuno, odredimo ukupnu relativnu promjenu i prosjenu
godinju relativnu promjenu cijena u promatranom razdoblju, te oekivanu ukupnu relativnu
promjenu i oekivanu prosjenu godinju relativnu promjenu proizvodnje (iskazane u stalnim
cijenama iz 2005. godine) u razdoblju od 2009. do 2013. godine.
Izraunajmo najprije verine indekse cijena koristei zadane indekse na stalnoj bazi 2005 =
100. Podsjetimo da se indeksi na stalnoj bazi pretvaraju u verine indekse pomou relacije:
1
100
t
t
t
I
V
I
= , za svaki t = 1, 2, , n 1.
Pritom 1997. godini odgovara vrijednost vremenske varijable t = 0, 1998. godini vrijednost
vremenske varijable t = 1 itd. Verini indeks cijena za 1997. godinu nije mogue izraunati,
pa emo u odgovarajui stupac tablice upisati rije nepoznat. Za ostale godine dobivamo:
1
1
0
2
2
1
3
3
2
74.65379979
100 100 107;
69.76990634
76.89341378
100 100 103;
74.65379979
77.66234792
100 100 101;
76.89341378
IC
V
IC
IC
V
IC
IC
V
IC
= = =
= = =
= = =
itd. Tako drugi stupac zadane tablice izgleda ovako:
Verini
indeks
cijena
nepoznat
107
103
101
106
104
103
105
108
110
108
106
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 251
Nepoznate proizvodnje u tekuim cijenama izraunat emo koristei relaciju
100
TC
SC
V
V
IC
=
iz koje je
100
SC
TC
V IC
V
= .
Tako je vrijednost proizvodnje u tekuim cijenama za 1997. godinu jednaka
0 0
0
( ) 0.90296810 69.76990634
( ) 0.63
100 100
SC
TC
V IC
V
= = = ,
vrijednost proizvodnje u tekuim cijenama za 1999. godinu
2 2
2
( ) 1.14444132 76.89341378
( ) 0.88
100 100
SC
TC
V IC
V
= = =
itd. Stoga trei stupac zadane tablice izgleda ovako:
Proizvodnja u
tekuim cijenama
[000 000 ]
0,63
0,75
0,88
0,96
1,07
1,23
1,36
1,52
1,85
1,98
2,51
2,75
Peti stupac tablice popunjavamo koristei definicijsku relaciju za vrijednost u stalnim
cijenama:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 252
100
TC
SC
V
V
IC
= .
Tako se dobiva:
1998
1998
1998
2000
2000
2000
2002
2002
2002
( ) 0.75
( ) 100 100 1.00463741;
74.65379979
( ) 0.96
( ) 100 100 1.23612024;
77.66234792
( ) 1.23
( ) 100 100 1.43666460;
85.61497235
TC
SC
TC
SC
TC
SC
V
V
IC
V
V
IC
V
V
IC
= = =
= = =
= = =
itd. Stoga peti stupac zadane tablice izgleda ovako:
Proizvodnja u stalnim cijenama
iz 2005. godine
[000 000 ]
0.90296810
1.00463741
1.14444132
1.23612024
1.29977266
1.43666460
1.54224000
1.64160000
1.85000000
1.80000000
2.11279461
2.18378756
Indeks fizikoga obujma izraunat emo koristei relaciju
( )
100
( )
SC t
SC b
V
IFO
V
= , za t = 0, 1, 2, , 10, 11 i b = 8,
jer 2005. godini odgovara vrijednost vremenske varijable t = 8. Zbog toga je:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 253
0
0
8
1
1
8
2
2
8
( ) 0.90296810
100 100 48.80908667;
( ) 1.85
( ) 1.00463741
100 100 54.30472482;
( ) 1.85
( ) 1.14444132
100 100 61.86169300;
( ) 1.85
SC
SC
SC
SC
SC
SC
V
IFO
V
V
IFO
V
V
IFO
V
= = =
= = =
= = =
itd. Prema tome, posljednji stupac zadane tablice izgleda ovako:
Indeks
fizikoga
obujma
(2005 = 100)
48.80908667
54.30472482
61.86169300
66.81731017
70.25798141
77.65754595
83.36432432
88.73513514
100
97.29729730
114.20511421
118.04257087
a cijela tablica ovako:
Godina Verini indeks
cijena
Proizvodnja u
tekuim cijenama
[000 000 ]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u
stalnim cijenama
iz 2005. godine
[000 000 ]
Indeks
fizikoga
obujma
(2005 = 100)
1997. nepoznat 0.63 69.76990634 0.90296810 48.80908667
1998. 107 0.75 74.65379979 1.00463741 54.30472482
1999. 103 0.88 76.89341378 1.14444132 61.861693
2000. 101 0.96 77.66234792 1.23612024 66.81731017
2001. 106 1.07 82.32208879 1.29977266 70.25798141
2002. 104 1.23 85.61497235 1.43666460 77.65754595
2003. 103 1.36 88.18342152 1.54224000 83.36432432
2004. 105 1.52 92.59259259 1.64160000 88.73513514
2005. 108 1.85 100 1.85000000 100
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 254
Godina Verini indeks
cijena
Proizvodnja u
tekuim cijenama
[000 000 ]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u
stalnim cijenama
iz 2005. godine
[000 000 ]
Indeks
fizikoga
obujma
(2005 = 100)
2006. 110 1.98 110 1.80000000 97.2972973
2007. 108 2.51 118.8 2.11279461 114.2051142
2008. 106 2.75 125.928 2.18378756 118.0425709
Iz navedenih podataka vidimo npr. da je 2001. godine proizvodnja iskazana u stalnim
cijenama iz 2005. godine bila za 100 70.25798141 = 29.74201859% manja nego u 2005.
godini, a 2007. godine za 114.20511421 100 = 14.20511421% vea nego u 2005. godini.
Kretanje proizvodnje u stalnim cijenama iz 2005. godine, kao i jednadbe modela
jednostavnoga linearnoga trenda i modela jednostavnoga eksponencijalnoga trenda s
odgovarajuim koeficijentima determinacije navedene su na donjoj slici:
Koeficijent determinacije modela jednostavnoga eksponencijalnoga trenda (R
2
= 0.986) je
vei od koeficijenta determinacije modela jednostavnoga linearnoga trenda (R
2
= 0.984), pa je
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 255
model jednostavnoga eksponencijalnoga trenda reprezentativniji. Koristei funkciju
GROWTH u MS Excelu prognoziramo vrijednosti proizvodnje u stalnim cijenama iz 2005.
godine u razdoblju od 2009. do 2013. godine:
godina t prognozirana proizvodnja
[000 000 ]
2009 12 2.42576156
2010 13 2.62304438
2011 14 2.83637186
2012 15 3.06704888
2013 16 3.31648645
(Ista se prognoza moe dobiti tako da se u jednadbu modela jednostavnoga
eksponencijalnoga trenda
0.0782
0.9492 0.9492 1.0813389048
x x
y e
= =
uvrtavaju redom vrijednosti x = 12, x = 13, , x = 16.)
Za izraun relativnih pokazatelja promjene cijen, odnosno proizvodnje bit e korisna
sljedea tri svojstva:
Svojstvo 1. Prosjena stopa promjene vrijednosti neke pojave (iskazana u postotcima) jednaka
je razlici geometrijske sredine verinih indeksa te pojave i broja 100.
Dokaz: Neka je Y
i
vrijednost promatrane pojave u razdoblju i, i = 0, 1, 2, , n 1. Oznaimo
sa S prosjenu stopu promjene vrijednosti te pojave (iskazanu u postotcima). Tada mora
vrijediti jednakost:
( )
1
1 0
1
n
n
Y Y S
= + ,
a odavde je
1
1
0
1
n
n
Y
S
Y
+ = .
Geometrijska sredina G svih n 1 verinih indeksa te pojave jednaka je:
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 256
1 1
1 3 2 1 1 1 2
1 1 1 1
1 1 1 0 1 2 3 2 0
100 100 ... 100
n n
n i n n n
n n n n
i
i i i n n
Y Y Y Y Y Y Y
G V
Y Y Y Y Y Y Y
= =
| |
= = = =
|
\
,
odnosno, uvaavajui prethodnu jednakost,
100 (1 ) G S = + .
Odavde slijedi
100
1 100
100 100
G G
S G
= = = [%],
to je i trebalo pokazati.
Iz navedenoga dokaza jo se jednom moe uoiti nedostatak geometrijske sredine (i iz nje
izvedene prosjene relativne stope promjene) kao pokazatelja za prognozu vrijednosti neke
pojave. U dokazu se nita ne govori o meuvrijednostima Y
1
, Y
2
, , Y
n 2
, ve se iskljuivo
zahtijeva da se podudaraju prva (nulta) i posljednja ((n 1)va) vrijednost pojave. Zbog toga
je za prognoziranje buduih vrijednosti te pojave bolje primijeniti ranije spomenute modele
trenda.
Svojstvo 2. Za svaki i = 0, 1, , n 1 neka su Y
i
vrijednosti neke pojave u razdoblju i, a I
i
pripadni indeksi na stalnoj proizvoljnoj, ali fiksiranoj bazi b, za bilo koji b {0, 1, , n 1}.
Tada je prosjena stopa S promjene vrijednosti te pojave (iskazana u postotcima) jednaka
1
1
0
100 1
n
n
I
S
I
| |
=
|
|
\
[%].
Dokaz: Prema prethodnom dokazu je
1
1
0
1
n
n
Y
S
Y
+ = ,
odnosno
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 257
1 1
1 1
0 0
1 100 1
n n
n n
Y Y
S
Y Y
| |
= =
|
|
\
[%].
Stoga je dovoljno dokazati da vrijedi jednakost:
1 1
0 0
n n
I Y
I Y
= ,
a ona izravno slijedi iz definicije indeksa na stalnoj bazi:
1
1 1
0
0 0
n
n b n
b
Y
I Y Y
Y
I Y
Y
= = .
Svojstvo 3. Neka je S prosjena stopa promjene neke pojave (iskazana u postotcima) u
nekom razdoblju. Tada je ukupna relativna promjena vrijednosti te pojave (iskazana u
postotcima) u promatranom razdoblju:
( )
1
1 1
n
p S
= + [%].
Dokaz: Prema dokazu Svojstva 1. vrijedi jednakost:
( )
1
1 0
1
n
n
Y Y S
= + .
Ukupna relativna stopa promjene iskazana u postotcima jednaka je:
1 0
0
100
n
Y Y
p
Y
= .
Iz tih dviju jednakosti slijedi:
( )
( )
1
1
0
0 0
1 0
0 0 0
1 1
1
100 100 100
n
n
n
Y S
Y S Y
Y Y
p
Y Y Y
(
+
+
(
= = = ,
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 258
odnosno
( )
1
1 1 100
n
p S
(
= +
(
,
to je i trebalo pokazati.
Na temelju prethodnih svojstava rjeavamo preostali dio zadataka iz Primjera 16. Ukupnu
relativnu promjenu i prosjenu godinju promjenu cijena u promatranom razdoblju izraunat
emo primjenom Svojstava 2. i 3. na indekse cijena na stalnoj bazi 2005 = 100. Tako je
najprije prosjena godinja promjena cijena u promatranom razdoblju jednaka
[ ]
12 1 11
11
12 1 11
0 0
125.928
100 1 100 1 100 1 5.044 %
69.76990634
c
I I
S
I I
| | | | | |
= = =
| | |
\ \ \
,
tj. cijene su rasle prema prosjenoj godinjoj stopi od priblino 5,044%. Ukupna relativna
promjena cijena je
( ) [ ]
12 1
1
5.0439829422782
1 1 100 1 1 100 71.8237 %
100
n
c
p S
(
| |
(
= + = +
(
|
(
\
(
,
tj. u promatranom se su razdoblju cijene poveale za ukupno priblino 71.8237%.
Oekivanu ukupnu relativnu promjenu i oekivanu prosjenu godinju promjenu proizvodnje
u stalnim cijenama iz 2005. godine za razdoblje od 2009. do 2013. godine izraunat emo
koristei Svojstvo 3. i formulu
1 1
1 1
0 0
1 100 1
n n
n n
Y Y
S
Y Y
| |
= =
|
|
\
[%].
Izraunajmo najprije oekivanu prosjenu godinju promjenu proizvodnje. Budui da imamo
ukupno 5 prognoziranih vrijednosti proizvodnje u stalnim cijenama iz 2005. godine, to je n =
= 5, pa je Y
n 1
= krajnja prognozirana vrijednost proizvodnje = 3.31648645 i Y
0
= poetna
prognozirana vrijednost proizvodnje = 2.42576156. Stoga je
5 1 4
3.31648645 3.31648645
100 1 100 1 8.13282
2.42576156 2.42576156
p S
| | | |
= =
| |
\ \
[%],
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 259
tj. proizvodnja u stalnim cijenama iz 2005. godine u razdoblju od 2009. do 2013. godine
oekivano e rasti po prosjenoj godinjoj stopi od priblino 8.13282%. Oekivano ukupno
poveanje proizvodnje u stalnim cijenama iz 2005. godine u razdoblju od 2009. do 2013.
godine dobit emo iz jednakosti:
( ) [ ]
5 1
1
8.13282
1 1 100 1 1 100 36.7194 %
100
n
p
p
p S
(
| |
(
= + = +
(
|
(
\
(
,
tj u promatranom e se razdoblju proizvodnja u stalnim cijenama iz 2005. godine oekivano
ukupno poveati za priblino 36.7194%.
Zakljuno napomenimo da bi sve gore izraunate relativne vrijednosti promjena cijena,
odnosno proizvodnje ostale nepromijenjene ukoliko bismo za bazno razdoblje uzeli bilo koju
drugu godinu promatranoga razdoblja. To, dakako, ne vrijedi za prognoziranu proizvodnju u
stalnim cijenama jer njezine vrijednosti izravno ovise o tome koju smo godinu odabrali za
baznu godinu (za drugu baznu godinu dobit emo druge vrijednosti proizvodnje u stalnim
cijenama iz te godine). Zbog toga se pri ekonomskim analizama u ovakvim sluajevima ee
primjenjuju relativni pokazatelji promjena vrijednosti neke pojave.
ELEKTROTEHNIKI ODJEL
Poslovna statistika
mr.sc. Bojan Kovai, predava 260
6. LITERATURA
1. M. Papi: ''Primijenjena statistika u MS Excelu'' (2. izdanje), VP ''Libertas''
Naklada ''Zoro'', Zagreb, 2008.
2. M. Vukievi, M. Papi: Matematiko-statistiki prirunik za poduzetnike, Golden-
marketing Tehnika knjiga, Zagreb, 2003.
3. I. oi: Primijenjena statistika, kolska knjiga, Zagreb, 2004.
4. V.Serdar, I. oi: Uvod u statistiku, kolska knjiga, Zagreb, 2000.
5. A. Rozga, B. Gri: Poslovna statistika, Veleuilite u Splitu
129
, Split, 1999.
6. Statistiki ljetopisi Republike Hrvatske i Mjesena statistika izvjea [objavljeni na
www.dzs.hr ], Dravni zavod za statistiku, Zagreb
7. ene i mukarci u Hrvatskoj (publikacija objavljena na www.dzs.hr), Dravni zavod
za statistiku, Zagreb, 2007.
8. Sveuilina anketa o kvaliteti nastave objavljena na www.unizg.hr, Sveuilite u
Zagrebu, Zagreb, 2008.
9. nastavni materijali iz kolegija Statistika objavljeni na www.efos-statistika.com,
Ekonomski fakultet Sveuilita u Osijeku, Osijek, 2009.
10. nastavni materijal doc.dr.sc. Snjeane Pivac iz kolegija Poslovna statistika objavljen
na www.efst.hr/nastava/44/12.Skupni_indeksi._Doc._dr._S._Pivac.pdf, Ekonomski
fakultet Sveuilita u Splitu, Split, 2009.
11. lanci objavljeni na Wikipedii:
http://en.wikipedia.org/wiki/Correlation,
http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient,
http://en.wikipedia.org/wiki/Regression_analysis,
http://en.wikipedia.org/wiki/Dollar_cost_averaging,
http://en.wikipedia.org/wiki/Trend_estimation
129
Dananji Sveuilini studijski centar za strune studije Sveuilita u Splitu.