P. 1
poslovna_statistika_-_skripta

poslovna_statistika_-_skripta

|Views: 306|Likes:
Published by Skola Menadzer

More info:

Published by: Skola Menadzer on Nov 02, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

04/21/2014

pdf

text

original

ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 1

POSLOVNA
STATISTIKA
interna skripta

pripremio:
mr.sc. Bojan Kovačić, predavač



















ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 2

SADRŽAJ

PREDGOVOR ....................................................................................................................5
0. REKLI SU O STATISTICI… ...................................................................................8
1. UVOD U STATISTIKU .............................................................................................8
1.1. Pojam statistike ............................................................................................................................ 8
1.2. Opisna i inferencijalna statistika .................................................................................................. 8
1.3. Statistička analiza, statistički skup i obilježja elemenata statističkog skupa .............................. 9
1.3.1. Skale obilježja ...................................................................................................................... 11
1.3.2. Vrste obilježja ...................................................................................................................... 14
2. FAZE STATISTIČKOGA ISTRAŽIVANJA ...................................................... 18
2.1. Određivanje cilja i razrada plana istraživanja ............................................................................ 18
2.2. Organizirano prikupljanje statističkih podataka ........................................................................ 19
2.3. Grupiranje statističkih podataka ................................................................................................ 21
2.3.1. Grupiranje kvalitativnih podataka ....................................................................................... 21
2.3.2. Grupiranje kvantitativnih podataka .................................................................................... 23
2.3.3. Kumulativni nizovi frekvencija ............................................................................................. 25
2.3.4. Dijagram ''stablo – list'' (stem – leaf) .................................................................................. 30
2.4. Tablični prikaz statističkih podataka .......................................................................................... 32
2.5. Grafički prikaz statističkih podataka .......................................................................................... 38
2.5.1. Površinski grafikoni .............................................................................................................. 39
2.5.2. Histogram ............................................................................................................................ 47
2.5.3. Linijski grafikoni ................................................................................................................... 54
2.5.4. Ostale vrste grafikona ............................................................................................................. 59
3. OSNOVNE KARAKTERISTIKE NUMERIČKIH NIZOVA ........................... 63
3.1. Srednje vrijednosti numeričkih nizova ........................................................................................ 63
3.1.1. Aritmetička sredina ............................................................................................................. 64
3.1.2. Geometrijska sredina ........................................................................................................... 75


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 3

3.1.3. Harmonijska sredina ............................................................................................................ 80
3.1.4. Kvantili ................................................................................................................................. 84
3.1.5. Mod ..................................................................................................................................... 92
3.2. Mjere raspršenja (disperzije) ...................................................................................................... 94
3.2.1. Raspon varijacije .................................................................................................................. 95
3.2.2. Interkvartil ........................................................................................................................... 97
3.2.3. Interpercentilni razmak ....................................................................................................... 98
3.2.4. Varijanca i standardna devijacija ........................................................................................ 99
3.2.5. Srednje apsolutno odstupanje ........................................................................................... 105
3.2.6. Koeficijent varijacije........................................................................................................... 108
3.2.7. Koeficijent kvartilne devijacije ........................................................................................... 111
3.3. Standardizirano obilježje .......................................................................................................... 115
3.4. Vrste razdioba (distribucija) ..................................................................................................... 119
3.4.1. Mjere asimetrije ................................................................................................................ 120
3.4.2. Mjere zaobljenosti ............................................................................................................. 124
3.5. Programska potpora deskriptivnoj statističkoj analizi ............................................................. 126
4. KORELACIJSKA I REGRESIJSKA ANALIZA ............................................. 127
4.1. Korelacijska analiza .................................................................................................................. 128
4.1.1. Spearmanov koeficijent korelacije ranga .......................................................................... 139
4.2. Regresijska analiza ................................................................................................................... 146
4.2.1. Model jednostavne linearne regresije ............................................................................... 148
4.2.2. Analiza varijance modela jednostavne linearne regresije ................................................. 164
4.2.3. Mjere reprezentativnosti modela jednostavne linearne regresije ..................................... 166
4.2.3.1. Varijanca regresijskoga modela ............................................................................................... 166
4.2.3.2. Standardna devijacija regresijskoga modela ........................................................................... 167
4.2.3.3. Koeficijent varijacije regresijskoga modela .............................................................................. 167
4.2.3.4 Koeficijent determinacije .......................................................................................................... 168
4.3. Primjeri nelinearnih modela jednostavne regresije .................................................................. 172
4.3.1. Model jednostavne eksponencijalne regresije ................................................................... 172


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 4

4.3.2. Model jednostavne logaritamske regresije ....................................................................... 181
4.3.3. Model jednostavne potencijske regresije (POWER) .......................................................... 186
4.4. Primjer modela višestruke (multiple) regresije: model višestruke linearne regresije ............... 194
5. INDIVIDUALNI BROJČANI POKAZATELJI RAZVOJA VREMENSKO-
GA NIZA ......................................................................................................................... 199
5.1. Definicija i vrste vremenskih nizova.......................................................................................... 202
5.2. Pokazatelji pojedinačnih apsolutnih promjena ........................................................................ 204
5.3. Modeli trenda .......................................................................................................................... 206
5.4. Osnovni brojčani pokazatelji relativnih promjena .................................................................... 210
5.5. Individualni indeksi ................................................................................................................... 212
5.5.1. Verižni (lančani) indeksi ..................................................................................................... 213
5.5.2. Indeksi na stalnoj bazi (bazni indeksi) ............................................................................... 218
5.5.3. Pretvorba indeksa .............................................................................................................. 224
5.6. Skupni indeksi ........................................................................................................................... 229
5.6.1. Skupni indeksi količina ....................................................................................................... 230
5.6.1.1. Laspeyresov skupni indeks količina .......................................................................................... 230
5.6.1.2. Paascheov skupni indeks količina............................................................................................. 231
5.6.1.3. Fisherov skupni indeks količina ................................................................................................ 233
5.6.2. Skupni indeksi cijena .......................................................................................................... 234
5.6.2.1. Laspeyresov skupni indeks cijena ............................................................................................. 235
5.6.2.2. Paascheov skupni indeks cijena .............................................................................................. 235
5.6.2.3. Fisherov skupni indeks cijena ................................................................................................... 237
5.6.3. Skupni indeksi vrijednosti .................................................................................................. 238
5.6.4. Neki posebni oblici skupnih indeksa i njihova primjena .................................................... 242
5.6.4.1. Izračunavanje realnih plaća na osnovu skupnih indeksa troškova života ................................ 242
5.6.4.2. Vrijednost u stalnim cijenama i indeks fizičkoga obujma ........................................................ 248
6. LITERATURA .......................................................................................................... 260




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 5

PREDGOVOR

Jedna od najprimjenjivanijih matematičkih disciplina u gotovo svim područjima čovjekova
djelovanja danas je nesumnjivo statistika. Bez te su discipline današnja znanost i cjelokupan
ljudski život praktički nezamislivi. Prikupljanje podataka, njihova obrada i analiza, te
izvođenje zaključaka na temelju tih postupaka provode se u tolikoj mjeri da su razvojem
moderne informatičke tehnologije usporedno razvijeni i ''specijalizirani'' računalni programi
namijenjeni potrebama statističke analize i statistike općenito. S druge strane, zbog svojega
raširenoga područja primjene, statistika je vrlo često potpuno neopravdano i neutemeljeno bila
meta različitih kritika koje su je nastojale obezvrijediti, prikazati njezina područja i metode
kao ''nešto zanimljivo samo statističarima'', a statističare kao neshvaćene asocijalne čudake
koji, umjesto druženja s tzv. normalnim ljudima i uživanja u svim ljepotama i čarima
ovozemaljskoga života, radije odabiru uživanje u hrpama i tonama podataka, tablicama,
grafovima i sličnim statističkim objektima.

Još od samoga početka svojega bavljenja statistikom u studentskim danima nastojao sam tu
matematičku disciplinu promatrati sa stajališta da je riječ o disciplini ništa manje vrijednoj i
ništa manje važnoj od algebre, analize, geometrije i inih matematičkih disciplina. Kasnije, kao
predavač statističkih kolegija na različitim visokim školama, s više ili manje uspjeha nastojao
sam približiti statistiku studentima i ukazati im na svu pogrešnost uobičajenih zabluda o
statistici. Kao rezultat takvoga pristupa razvile su se sljedeće temeljne postavke koje se
provlače kroz ova skripta:

1.) Statistika je sastavni dio matematike, unatoč činjenicama da je znatan dio stručnjaka
uporno pokušava ubrojiti u sastavnice ekonomske znanosti. Iako se statistika ponajviše
primjenjuje u ekonomiji, pa se na ekonomskim fakultetima zbog toga izučava kao posebno
područje, temelji statistike i statističkoga načina mišljenja su isključivo matematički.

2.) Nitko ne može zamijeniti istraživača prigodom interpretacije rezultata statističke analize.
Računala i ''specijalizirani'' računalni programi mogu vrlo brzo i točno izračunati sve željene
statističke pokazatelje, ali ne mogu dati njihovu univerzalnu interpretaciju jer ona ovisi o
svakom pojedinom razmatranom slučaju. Statističar mora znati uz koje se temeljne
pretpostavke izračunavaju pojedine statistički pokazatelji i provjeriti vrijede li te pretpostavke
u slučaju koji razmatra. Ukoliko ne vrijede, dobiveni statistički pokazatelj bit će točno
izračunat, ali neće biti reprezentativan, tj. neće dovoljno dobro opisivati podatke iz kojih je
izračunat.

3.) Ne postoje univerzalni statistički pokazatelji koji bi dovoljno reprezentativno opisivali
bilo koji statistički niz podataka. Ova zabluda naročito se odnosi na aritmetičku sredinu
(popularni ''prosjek'') koju se, zbog jednostavnosti njezina izračuna, uporno nastoji ''progurati''


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 6

kao univerzalni statistički pokazatelj prikladan za opis bilo kojega statističkoga niza.
Pojednostavljivanje ovdje uzrokuje nereprezentativnost dobivenoga statističkoga pokazatelja,
što u svojim kritikama često iskorištavaju protivnici statistike. Ispravan pristup ovoj
problematici je tipičan pristup problemima matematičkoga modeliranja: klasificirati
statističke probleme u tzv. klase dovoljno međusobno ''sličnih'' problema koji se mogu riješiti
uz iste polazne pretpostavke i istu, zadovoljavajuću reprezentativnost dobivenih rezultata.
Spomenuta klasifikacija nije nimalo jednostavna i predstavlja problem o kojemu se raspravlja
i dan-danas, ali takav je slučaj s apsolutnom većinom matematičkih problema.
Stoga se na samom početku pisanja ovih skripta pojavio sljedeći problem: kako na dovoljno
jednostavan i razumljiv način, ali uz uvažavanje svih gore navedenih postavki, napisati tekst
koji će istodobno biti i podloga za predavanja i nastavni materijal prema kojemu će studenti
moći pripremati ispit iz poslovne statistike? Navedeni je problem razlog što je ovaj tekst
nastajao tijekom mojih svakogodišnjih predavanja statistike u gotovo svim godinama 21.
stoljeća. Naime, odgovorno tvrdim da bilo koja skripta može biti nastavni materijal prema
kojemu će studenti moći pripremati ispit ako i samo ako je skripta bila efektivno korištena u
nastavi tijekom najmanje 5 godina. U tom su smislu i svi studenti – slušači statističkih
kolegija koje sam predavao koautori ovih skripta jer su mi njihova pitanja, konstruktivne
kritike i komentari pomogli uvidjeti na koje dijelove gradiva treba posebno obratiti pozornost
i dodatno ih pojasniti jer nisu sami po sebi dovoljno razumljivi.

Iako u nazivu skripta stoji Poslovna statistika, ova bi se skripta mogla zvati i Osnove
statistike. Gradivo koje je u njoj izloženo, naime, većina će statističara proglasiti upravo
''osnovama osnovnih osnova'' statistike. No, upravo te ''osnove osnovnih osnova'' danas tvore
područje koje se najčešće primjenjuje u različitim poslovnim analizama i, kao takvo, sasvim
je primjereno studentima stručnih studija. Stoga skripta mogu koristiti svi studenti stručnih
studija ekonomije, ali i neekonomskih studija poput fizioterapije, upravnoga prava itd., te svi
koji u svojim poslovima primjenjuju ma koji dio izloženoga gradiva.

Konceptualno je skripta podijeljena u pet poglavlja. U prva dva poglavlja obrađeni su osnovni
statistički pojmovi definirani s matematičkoga stajališta, te osnovne faze statističkoga
istraživanja. Posebna se pozornost posvećuje statističkim tablicama i grafikonima, kao i
njihovim interpretacijama. U trećem se poglavlju obrađuju u praksi najčešće korištene srednje
vrijednosti i mjere raspršenosti (disperzije) uz poseban naglasak na reprezentativnost svake
pojedine srednje vrijednosti. Četvrto je poglavlje posvećeno osnovama korelacijske i
regresijske analize, pri čemu se temeljne postavke i ideje uglavnom izlažu na problemima u
kojima se razmatraju točno dvije varijable. U petom, posljednjem poglavlju izlažu se osnove
analize vremenskih nizova i opisuju neke posebne vrste skupnih indeksa.

Kao dio osnovnoga teksta u svim je poglavljima naveden relativno velik broj detaljno
riješenih primjera od kojih je veći dio riješen ''klasično'' (bez korištenja bilo kojega od


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 7

''specijaliziranih'' računalnih programa), a manji dio uz korištenje MS Excela. Budući da je
riječ o nastavnom materijalu namijenjenom za predavanja, tehnike rješavanja statističkih
problema u MS Excelu ovdje se ne opisuju zasebno, a zainteresirani ih čitatelj može pronaći u
literaturi [1]. Uz gotovo sve izračunate statističke pokazatelje navedena je njihova
interpretacija, a gdje god je to bilo primjereno, komentirana je i reprezentativnost konkretnoga
pokazatelja.

Ugodna mi je dužnost da se na kraju ovoga predgovora iskreno zahvalim svima koji su na bilo
koji način pomogli u nastajanju ovih skripta. To se ponajprije odnosi na već spomenute
studente koji su svojim pitanjima, konstruktivnim kritikama i komentarima utjecali na završnu
verziju, odnosno kvalitetu skripta. U tom smislu unaprijed zahvaljujem i svima onima koji
budu pročitali skripta i ukazali na neku nenamjerno napravljenu tiskarsku pogrešku, te dali
konstruktivnu kritiku, primjedbu ili prijedlog za poboljšanje osnovnoga teksta.

U Zagrebu, početkom svibnja 2011.

Bojan Kovačić















ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 8

0. REKLI SU O STATISTICI
1


''Statistika je poput bikinija: otkriva ono sugestivno, a skriva ono vitalno.'' (Aaron Levenstein)
''Kad bi netko stao jednom nogom u kipuću vodu, a drugom nogom u hladnjak, statističar bi
rekao da se taj čovjek nalazi u prosječno ugodnoj temperaturi.'' (Walter Heller)
''Postoje tri vrste laži: laž, prokleta laž i statistika.'' (Mark Twain)
''Statistika je bajka razuma.'' (Martin Kessel)
''Statistika je skup točnih podataka koji daje pogrešan rezultat.'' (Anonimus)
''Statistika naša dika: štogod hoćeš, ona slika.'' (Vladimir Bulatović Vib)
''Ja jedem kupus, ti jedeš meso – u prosjeku jedemo sarmu.'' (Anonimus)


1. UVOD U STATISTIKU


1.1. Pojam statistike


Statistika je znanstvena disciplina koja na organiziran način pristupa prikupljanju, odabiru,
grupiranju, prezentaciji i analizi podataka, te interpretiranju rezultata provedene analize u
svrhu ostvaraja postavljenih istraživačkih ciljeva. Da bi se ostvarili svi prethodno navedeni
zadaci i ciljevi, statistika je razvila svoje vlastite metode i tehnike. One se danas primjenjuju u
vrlo različitim područjima: ekonomiji, zdravstvu, kulturi, politici, sportu, obrazovanju,
znanosti itd.


1.2. Opisna i inferencijalna statistika


Kao zasebna znanstvena disciplina, statistika se grubo može podijeliti na dva posebna dijela:
opisnu (deskriptivnu) i inferencijalnu statistiku. Potonji se često smatra dijelom tzv.
matematičke statistike.

Opisna (deskriptivna) statistika temelji se na konkretnim rezultatima dobivenima nekim
istraživanjima ili mjerenjima. U tim se istraživanjima skup svih promatranih objekata


1
Mnogobrojni slikovitiji komentari studenata koji su više-manje uspješno polagali statističke kolegije iz
ćudorednih razloga ovdje nisu navedeni.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 9

obuhvaća u cijelosti. Zadaća opisne statistike je "opisati'' dobivene rezultate, tj. srediti ih i
sažeti tako da budu što pregledniji, razumljiviji i pogodniji za interpretaciju, daljnju analizu i
primjenu.

Inferencijalna statistika temelji se na djelomičnu obuhvatu skupa svih promatranih objekata.
Rezultati se dobivaju ispitivanjem određenoga dijela (uzorka) promatranih objekata. Koristeći
metodu "od pojedinačnoga ka općemu" (tzv. induktivna metoda) izvode se zaključci o
karakteristikama (obilježjima) svih promatranih objekata. Pri izvedbi takvih zaključaka
postoji određeni rizik pogrešno izvedenih zaključaka. Rizik i nesigurnost u primjeni rezultata
dobivenih istraživanjem na temelju uzorka procjenjuje se na temelju načela teorije
vjerojatnosti.
U ovom ćemo se kolegiju baviti opisnom statistikom jer se taj dio statistike praktično najviše
primijenjuje u različitim poslovnim sustavima, procesima itd.


1.3. Statistička analiza, statistički skup i obilježja elemenata statističkog skupa


Statistička analiza bilo koje prirodne ili društvene pojave ili procesa nužno se temelji na
statističkim informacijama, metodama i tehnikama.

Statističkom analizom dobiva se uvid u strukturu pojava ili procesa u vremenu i prostoru, te
uvid u njihovu međusobnu povezanost. Predmet statističke analize različita su kvalitativna i
kvantitativna obilježja promatranih pojava ili procesa vezanih za promatrani skup objekata.

Statistički skup je osnovni pojam u statistici (kao, uostalom, i skup u matematici). Tvore ga
statističke jedinice ili elementi (osobe, poslovni subjekti, regije, države, predmeti itd.) koji
imaju barem jedno zajedničko svojstvo (obilježje ili varijabla
2
) koje od elementa do elementa
očituje statističku promjenjivost. Ukupan broj elemenata statističkoga skupa naziva se opseg
statističkoga skupa.
3
Prema opsegu, statističke skupove (kao i sve druge skupove) dijelimo na
konačne i beskonačne, a prema vrsti elemenata na stvarne (realne) i zamišljene
4
(hipotetične).
Stvarni statistički skupovi sastoje se od elemenata koji postoje u tekućem vremenu i prostoru,
a zamišljeni statistički skupovi sastoje se od elemenata generiranima različitim modelima


2
U opisnoj se statistici izraz varijabla obično poistovjećuje s izrazima obilježje i svojstvo, dok se u
matematičkoj statistici odnosi isključivo na numerička obilježja.
3
U teoriji skupova taj se broj, inače, naziva kardinalni broj skupa, dok se termin opseg više koristi u
geometrijskim razmatranjima.
4
Pritom izraz zamišljen ne znači stanje statističkoga skupa u kojemu svi njegovi elementi promišljaju npr. o
besmrtnosti komarca malaričara, nego nepostojanje u realnom svijetu.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 10

procesa ili pokusa. Poslovna statistika se u pravilu bavi realnim konačnim statističkim
skupovima.

Već je istaknuto da statistički skup tvore elementi koji imaju barem jedno zajedničko
svojstvo. Stoga za svaki element statističkoga skupa znamo odgovarajući podatak o tome
svojstvu. Skup svih takvih podataka naziva se osnovni skup ili populacija
5
. Poput
statističkoga, i osnovni skup može biti konačan ili beskonačan, te stvaran ili zamišljen.

Bilo koji neprazan podskup
6
statističkoga skupa i osnovnoga skupa naziva se uzorak. Dakle,
pod terminom uzorak podrazumijevamo i neki dio elemenata statističkoga skupa i
odgovarajuće podatke o tim elementima. U opisnoj se statistici nerijetko pojmovi
statističkoga skupa, osnovnoga skupa i uzorka poistovjećuju jer se statistička analiza provodi
na isti način neovisno o kojem od tih triju tipova skupa je riječ. Nasuprot tome, inferencijalna
statistika strogo razdvaja navedene pojmove jer provedba statističke analize ovisi o tome iz
kojega se od tih triju skupova uzimaju podaci koji se žele analizirati.

Statistički skup nužno mora biti precizno definiran kako bi se na temelju njegove definicije
moglo jasno i jednoznačno odrediti pripada li neki element tome skupu ili ne. Statistički skup
mora biti definiran pojmovno, prostorno i vremenski. Pojmovna definicija utvrđuje pripadnost
bilo kojega objekta navedenom skupu, prostorna definicija utvrđuje prostor kojemu pripadaju
svi elementi statističkoga skupa, a vremenska definicija utvđuje vremensko razdoblje ili
vremenski trenutak za koji su vezani svi elementi statističkoga skupa.

Primjer 1. Promatra se statistički skup koji tvore svi studenti 1. godine stručnoga studija
računovodstva i financija Visoke škole za financijski menadžment u Špičkovini na dan
01.03.2010. Definirajmo navedeni skup pojmovno, prostorno i vremenski:

• pojmovna definicija: studenti 1. godine stručnoga studija računovodstva i financija
• prostorna definicija: Visoka škola za financijski menadžment u Špičkovini
7

• vremenska definicija: 01.03.2010.


5
Izraz populacija obično se rabi isključivo u kontekstu vezanom za određeni skup živih bića (populacija ljudi,
čudnovatih kljunaša, krokodila itd.).
6
Iz teorije skupova je poznato da je jedan od podskupova svakoga skupa tzv. prazan skup (skup koji nema niti
jednoga jedinoga elementa). Prazni skupovi (pa, prema tome, i prazni uzorci) koriste se isključivo u
matematičkoj statistici.
7
Pri prostornom definiranju skupa obično se navodi i npr. naziv radne organizacije, visokoobrazovne ustanove
itd. iako bi možda prirodnije pripadali pojmovnoj definiciji. Također, iako u pravilu ne treba pretjerivati s
prostornim definiranjem, pa npr. reći: Visoka škola za financijski menadžment u Špičkovini, država: Republika
Hrvatska, kontinent: Europa, planet: Zemlja, galaksija: Milječna staza, nerijetko ipak treba istaknuti neke
dodatne prostorne pokazatelje (naročito ukoliko se npr. radi o radnicima na crno u gradu Ouagadougou).


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 11

Taj skup je zamišljen i konačan, a njegov opseg iznosi 100 [studenata]
8
. Primjer osnovnoga
skupa vezanoga za promatrani statistički skup jest skup svih zaključnih ocjena iz kolegija
Poslovna matematika, pri čemu s 0 možemo označiti činjenicu da student dosad nije uspio
položiti navedeni kolegij. Stoga osnovni skup tvore ukupno 100 zaključnih ocjena
9
. Jedan od
uzoraka toga skupa je npr. Top 20, tj. skup svih studenata koji su navedeni kolegij uspjeli
položiti sa zaključnom ocjenom izvrstan
10
.


1.3.1. Skale obilježja


Kako je istaknuto, obilježja (varijable) elemenata statističkog skupa su odgovarajuća svojstva
po kojima uspoređujemo te elemente. Svako obilježje se javlja u više pojavnih oblika
(modaliteta). Skup svih modaliteta nekoga obilježja naziva se skala
11
. Tako je npr. skala
modaliteta obilježja ''spol'' muški i ženski, skala modaliteta obilježja ''dan u tjednu''
ponedjeljak, utorak, srijeda, četvrtak, petak, subota i nedjelja, skala modaliteta ''mjesec u
godini'' siječanj, veljača, ožujak, travanj, svibanj, lipanj, srpanj, kolovoz, rujan, listopad,
studeni i prosinac itd. Prilikom podjele elemenata statističkoga skupa prema barem jednom
obilježju kad god je to moguće treba utvrditi skalu modaliteta. To se poglavito odnosi na
obilježja čiji se modaliteti ne iskazuju numeričkim vrijednostima (tzv. kvalitativna obilježja).

Skale obilježja mogu se podijeliti sukladno određenim metričkim svojstvima. Na temelju toga
razlikujemo nominalnu, redosljednu (ordinalnu ili rang), intervalnu i omjernu skalu.

Nominalna skala zadaje se u obliku skupa čiji su elementi nenumeričke vrijednosti: slovne
oznake, pridjevi, kategorije itd. Ti se elementi prigodom definiranja skale mogu navesti
proizvoljno odabranim redoslijedom. Nominalne skale dodatno se dijele na atributivne
(varijabilitet promatranoga obilježja iskazuje se opisno) i prostorne (varijabilitet
promatranoga obilježja iskazuje se zemljopisnim jedinicama). U nekim se slučajevima


8
Skup je zamišljen jer dotična visokoobrazovna ustanova (nažalost) još ne postoji.
9
Te ocjene, naravno, međusobno nisu u parovima različite jer ih ima svega 5 različitih: 0, 2, 3, 4 i 5. Koristeći
npr. Dirichletovo načelo može se pokazati da sigurno postoji barem 20 studenata koji imaju istu zaključnu
ocjenu iz Poslovne matematike.
10
Pritom odmah treba naglasiti da taj uzorak nije reprezentativan, tj. na temelju njega ne možemo izvući istinit
zaključak o uspjehu svih studenata na ispitima iz Gospodarske matematike.
11
Unatoč upornom zagovaranju glazbeno nadarenih statističara, sintagma ljestvica modaliteta (još) nije ušla u
svakodnevnu uporabu.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 12

nenumeričke oznake zamjenjuju numeričkima
12
, pri čemu navedene numeričke oznake služe
isključivo kao identifikatori, pa s njima nema smisla provoditi nikakve računske operacije.
Npr. zamijenimo li nenumerički modalitet muški numeričkim modalitetom 0, a nenumerički
modalitet ženski modalitetom 1, onda nema smisla zapisati niti računati npr. 0 + 1, 0 ⋅ 1 itd.
13

Istaknimo da nominalna skala ponajprije služi za razvrstavanje (kategorizaciju) elemenata
osnovnoga skupa u kategorije, a ukoliko je njihov broj vrlo velik, skala se utvrđuje dogovorno
i u takvim slučajevima govorimo o nomenklaturi. Tipični primjeri su različite nomenklature
djelatnosti, industrijskih proizvoda, usluga itd.

Redosljedna (ordinalna, rang) skala elementima statističkoga skupa pridružuje slovne
oznake, simbole ili brojeve prema intenzitetu mjerenoga svojstva, pa se elementi potom
klasificiraju i uređuju sukladno stupnju promatranoga svojstva. Poredak modaliteta ovdje nije
proizvoljan: modalitete obično navodimo od onoga koji označava najmanji stupanj svojstva
do onoga koji označava najveći stupanj svojstva ili obrnuto. Tipični primjeri redosljedne skale
su skala ocjena (1, 2, 3, 4, 5), skala stupnjeva stručne spreme, skala stupnjeva zadovoljstva
kvalitetom nastave iz kolegija ''Zabavljačke vještine'' itd. Iako ova skala ima bolja metrička
svojstva od nominalne, osnovni nedostatak joj je nemogućnost preciznoga utvrđivanja razlika
mjerenoga svojstva: npr. mi znamo da je ocjena 5 bolja od ocjene 2, ali ne možemo npr. reći
da je ocjena 5 za 3 bolja od ocjene 2.
14


Ukoliko elementima statističkoga skupa pridružujemo realne brojeve sukladno intenzitetu
promatranoga svojstva, dobit ćemo intervalnu skalu. Ona uvijek ima definiranu mjernu
jedinicu i dogovorno utvrđenu nulu, pa ima bolja metrička svojstva od prethodnih dviju skala
jer omogućuje i razvrstavanje i rangiranje i brojčano utvrđivanje razlika mjerenoga svojstva.
Naime, s podacima dobivenima mjerenjem na intervalnoj su skali suvislo definirane operacije
zbrajanja i oduzimanja
15
, pa tako jednake razlike brojeva na skali govore o jednakoj razlici
mjerenih svojstava. Npr. ako je temperatura zraka na Zavižanu -20°C, u Zagrebu 0°C, a u
Splitu 20°C, onda se može reći da je u Zagrebu za 20°C toplije nego na Zavižanu, a za 20°C
hladnije nego u Splitu. Također, dogovorno utvrđena nula znači da element statističkoga
skupa posjeduje određeno svojstvo i da je modalitet toga svojstva jednak nuli. Konkretno,


12
Takva je ''zamjena'' zapravo bijekcija sa skale nenumeričkih modaliteta u jednakobrojnu skalu numeričkih
modaliteta: svaki nenumerički modalitet zamjenjuje se točno jednim numeričkim modalitetom i nikoja dva
nenumerička modaliteta nisu zamijenjena istim numeričkim modalitetom.
13
Šovinisti (i šovinistice?) bi vjerojatno vrlo rado definirali operaciju množenja, a feministice (i feministi?)
operaciju zbrajanja ovakvih brojeva sukladno uobičajenoj aritmetici.
14
Tj., opet ne možemo definirati operacije zbrajanja i oduzimanja. Ovo se pravilo praktično zanemaruje
prigodom računanja prosječne ocjene, o čemu će biti govora u posebnom poglavlju.
15
Množenje i dijeljenje se ne definiraju zbog problema tipa: ''Temperatura zraka u Zagrebu je 0°C. Ako je na
Zavižanu 20 puta hladnije nego u Zagrebu, kolika je temperatura zraka na Zavižanu?''.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 13

činjenica da je temperatura zraka u Zagrebu 0°C znači da zrak u Zagrebu ima svoju
temperaturu i da je ta temperatura jednaka 0°C.
16


Skala s najboljim metričkim svojstvima je tzv. omjerna skala. Ona se dobije tako da se
elementima statističkoga skupa pridruže realni brojevi sukladno intenzitetu mjerenoga
svojstva, a, osim definirane mjerne jedinice, ima i nulu koja označava nepostojanje svojstva.
Zbog toga se na takvoj skali mogu definirati sve četiri osnovne računske operacije jer razlike i
omjeri vrijednosti imaju suvislo tumačenje. Npr. ako Blaženko na tekućem računu ima
10.000,00 kn, a Draženko 100.000,00 kn, onda Draženko na svojem tekućem računu ima 10
puta više novaca, odnosno za 90.000,00 kn više od Blaženka. Nadalje, ako Vlatka na svojem
deviznom računu ima 0,00 €, znači da je njezin devizni račun potpuno prazan, tj. da na njemu
(do daljnjega) nema novaca.

Poseban tip skale obilježja je kronološka skala. Ona obično sadrži vremenska razdoblja
poredana kronološki, tj. počevši od razdoblja koje je nastupilo najranije i završavajući s
razdobljem koje je nastupilo najkasnije. Modaliteti kronološke skale mogu se iskazivati
nazivima (npr. skala dana u tjednu, skala mjeseci u godini itd.) ili brojevima (npr. skala
minuta u pojedinom satu, skala sati u danu, skala datuma u pojedinom mjesecu, skala godina,
desetljeća, stoljeća itd.). Na tako formiranoj skali ima smisla definirati operacije zbrajanja i
oduzimanja, pri čemu se u nekim slučajevima uobičajene operacije zbrajanja i oduzimanja
realnih brojeva zamijenjuju operacijama zbrajanja i oduzimanja modulo n
17
, pri čemu je
obično n ∈ {7, 12, 24, 28, 29, 30, 31, 60}. Tipični primjeri kronoloških skala su: skala dana u
tjednu {ponedjeljak, utorak, srijeda, četvrtak, petak, subota, nedjelja}, skala godina u prvom
desetljeću ovoga tisućljeća {2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010}
itd.








16
Matematički nadareni statističari odmah će se sjetiti da se na isti način u matematici definiraju skupovi
površine nula: to su skupovi koji imaju površinu i ta površina je jednaka 0. Tipičan primjer takvoga skupa je
točka u bilo kojem euklidskom prostoru.
17
Zbrajanje modulo n (oznaka: +
n
) je binarna operacija definirana formulom: a +
n
b := (a + b) mod n = ostatak
pri dijeljenju zbroja a + b (dobivenoga uobičajenim zbrajanjem cijelih brojeva) brojem n. Npr. na skali sati u
danu je 17 +
24
8 = ostatak pri dijeljenju broja 17 + 8 s 24 = ostatak pri dijeljenju broja 25 s 12 = 1. Oduzimanje
modulo n (oznaka: –
n
) je binarna operacija na skali modaliteta definirana opisno s: a –
n
b = broj c takav da je b +
n

c = a. Npr. na skali sati u danu je 1 –
24
8 = 17 jer je, kako smo vidjeli, 17 +
24
8 = 1.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 14

1.3.2. Vrste obilježja


Sukladno navedenoj podjeli skala, opća podjela obilježja razlikuje kvalitativna, kvantitativna i
vremenska obilježja.

Kvalitativna obilježja su obilježja kod kojih su svojstva elemenata statističkoga skupa
iskazana određenim pridjevima ili atributima, kategorijama i sl. Ova obilježja mogu biti
nominalna i redosljedna (obilježja ranga).

Nominalna obilježja vezana su uz nominalnu skalu izražavanja modaliteta promatranoga
obilježja, a dodatno se dijele na atributivna i prostorna (geografska). Atributivna obilježja su
obilježja čiji modaliteti iskazuju svojstva elemenata statističkoga skupa. Tipični primjeri
takvih obilježja su: spol, boja kose, boja očiju, bračno stanje, tip osobnoga automobila, vrsta
trgovačkoga društva, horoskopski znak, politička stranka itd. Atributivno obilježje čija se
skala sastoji od točno dva modaliteta nazivamo alternativno obilježje. Tipični primjeri
takvoga obilježja su: spol (npr. na statističkomu skupu svih ljudi) sa skalom {muški, ženski}
18
;
način studiranja (npr. na statističkom skupu svih studenata Visoke škole za financijski
menadžment u Bedekovčini na dan 01.03.2008.) sa skalom {redovni, izvanredni} itd.

Primjer 2. Primjer alternativnoga statističkoga obilježja:

Razdioba svih studenata Visoke škole za financijski menadžment u Špičkovini koji su položili
kolegij Poslovna matematika putem kolokvija u akademskoj godini 2007/2008. prema spolu

spol broj
studenata
struktura
[%]
muški 10 27.03
ženski 27 72.97
ukupno 37 100.00
Izvor: osobna evidencija predmetnoga nastavnika, veljača 2008.

Zadatak 1. a) Definirajte statistički skup u gornjem primjeru pojmovno, prostorno i
vremenski, pa odredite njegov opseg.
b) Odredite osnovni skup i njegov opseg.



18
Novije sociološke analize u priznatim znanstvenim časopisima ''Glorija'', ''Tena'', ''Story'' itd. ozbiljno
ugrožavaju ovu tradicionalističko-konzervativnu podjelu svih ljudi prema spolu.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 15

Prostorno (geografsko) obilježje je nominalno obilježje čiji modaliteti odražavaju vezu
elemenata statističkoga skupa s određenim prostorom. Primjeri takvoga obilježja su: mjesto
rođenja, državljanstvo, prebivalište, boravište, sjedište tvrtke, država ili ekonomska unija
država s kojom se vrši određena trgovinska razmjena itd.

Redosljedna obilježja ili obilježja ranga vezana su uz ordinalnu skalu iskazivanja modaliteta.
Tipični primjeri obilježja ranga su ranije spomenuta ocjena, stručna kvalifikacija, stupanj
akademskoga obrazovanja, stupanj zadovoljstva kvalitetom nastave itd.

Primjer 3. Primjer redosljednoga statističkoga obilježja:

Razdioba svih studenata Visoke poslovne škole ''Mutimir Škegro'' iz Špičkovine u akademskoj
godini 2006/07. prema stupnju zadovoljstva radom studentske referade
(stanje na dan 30.09.2007.)

stupanj zadovoljstva broj studenata struktura [%]
vrlo nezadovoljan 15 9.32
nezadovoljan 32 19.88
uglavnom nezadovoljan 21 13.04
ni zadovoljan ni nezadovoljan 38 23.60
uglavnom zadovoljan 27 16.77
zadovoljan 17 10.56
vrlo zadovoljan 11 6.83
ukupno: 161 100.00
Izvor: Studentski zbor VPŠ ''Mutimir Škegro''

Kvantitativna obilježja su obilježja kod kojih se svojstva elemenata statističkoga skupa
izražavaju brojevima, a vezana su uz intervalnu i omjernu skalu iskazivanja modaliteta.
Kvantitativna obilježja često se nazivaju i numerička obilježja, a dodatno se dijele na
diskretna (diskontinuirana) i kontinuirana.

Diskretno (diskontinuirano) obilježje je obilježje čija je skala modaliteta konačan skup
(općenito, realnih) brojeva takav da između svakih dvaju modaliteta postoji razmak. Razmak
između dvaju modaliteta je, zapravo, apsolutna vrijednost
19
njihove razlike. Tipični primjeri
obilježja su broj soba u stanu, broj djece u obitelji, iznos ukupnih mjesečnih primanja itd.


19
Podsjetnik za nematematički nastrojene statističare: apsolutna vrijednost bilo kojega realnoga broja x
definirana je formulom
, za 0;
| | =
, za 0.
x x
x
x x
≥ ¦
´
− <
¹



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 16

Pritom modalitet diskretnoga obilježja ne mora biti nužno cjelobrojan. Postoje i
četveroipolsobni stanovi, iznos mjesečnih primanja može biti necjelobrojan, veličina obuće
može biti 48 i pol, ali neovisno o tome između bilo kojih dvaju različitih modaliteta uvijek
postoji spomenuti razmak.

Primjer 4. Primjer kvantitativnoga diskretnoga obilježja:

Razdioba svih zaposlenika u tvrtki ''Brodolomac d.d.'' iz Muća prema broju djece
(stanje na dan 31.12.2007.)

broj djece broj zaposlenih struktura [%]
0 175 15.31
1 244 21.35
2 438 38.32
3 194 16.97
4 i više 92 8.05
ukupno 1.143 100.00
Izvor: Služba ljudskih potencijala tvrtke ''Brodolomac''

Kontinuirano obilježje je obilježje čija je skala modaliteta (teoretski) beskonačan skup. Ta je
skala najčešće poluotvoreni interval 〈a, b]
20
ili konačna unija takvih poluotvorenih intervala.
Praktično, to znači da modalitet obilježja može biti bilo koja vrijednost unutar nekoga od
intervala koji tvore omjernu skalu. Tipični primjeri ovoga obilježja su visina, masa itd.

Primjer 5. Primjer kvantitativnoga kontinuiranoga obilježja:

Razdioba svih učenika 4.b razreda gimnazije ''Ljilja Kokić'' iz Kašine u šk.god. 2007/2008.
prema visini (stanje na dan 01.03.2008.)

visina [cm] broj učenika struktura [%]
(160) – 165 3 11.11
165 – 170 6 22.22
170 – 175 7 25.93
175 – 180 4 14.81
180 – 185 5 18.52
185 – (195) 2 7.41
ukupno: 27 100.00
Izvor: osobna evidencija učitelja tjelesne i zdravstvene kulture Jože Kotrmelca


20
Podsjetnik za nematematički nastrojene statističare: 〈a, b] je skup svih realnih brojeva koji su strogo veći od
realnoga broja a, a manji ili jednaki realnom broju b, tj. 〈a, b] = {x ∈ R: a < x ≤ b}.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 17

Zadatak 2. a) Definirajte statističke skupove u Primjerima 3. – 5. pojmovno, prostorno i
vremenski, pa odredite njihove opsege.
b) Odredite osnovne skupove u Primjerima 3. – 5. i njihove opsege.
c) Odredite skale modaliteta obilježja promatranih u Primjerima 3. – 5.

Pri razlikovanju diskretna i kontinuirana obilježja u nekim je slučajevima vrlo važno precizno
definirati promatrano kvantitativno obilježje. Npr. "starost (čovjeka, drveta, zgrade)" je
kvantitativno kontinuirano obilježje, no, ukoliko to obilježje predefiniramo kao "navršene
godine starosti", ono postaje kvantitativno diskretno obilježje (zašto?).

Poseban tip obilježja je vremensko obilježje. To je obilježje vezano uz kronološku skalu
modaliteta, odnosno odgovarajući kronološki uređaj. Sukladno njemu grupiramo elemente
osnovnoga skupa i dobivamo vremenski statistički niz. Vremenski niz može biti intervalan i
trenutačan ovisno o tome jesu li podaci iz osnovnoga skupa dobiveni neprekidnim praćenjem
i kumuliranjem promatrane pojave u odabranom vremenskom intervalu ili pak određivanjem
stanja pojave u odabranim vremenskim trenutcima.

Primjer 6. Primjer intervalnoga vremenskoga niza:

Razdioba ostvarenoga prometa u trgovini na malo u Kraljevini Dajdamdaš u razdoblju od
2002.-2006. prema godini

godina ostvareni promet
[000 000 USD]
2002. 9.45575824
2003. 11.79383472
2004. 18.51123944
2005. 25.55631827
2006. 30.10276687
Izvor: Statistički ljetopis Kraljevine Dajdamdaš za 2007. godinu

Primjer 7. Primjer trenutačnoga vremenskoga niza

Razdioba svih studenti koji su položili ispit iz Poslovne statistike na Veleučilištu u Brlog
Gradu na ispitnim rokovima u razdoblju od 01.09.2007. do 01.03.2008. prema datumu
polaganja ispita

datum broj studenata
01.09.2007. 2
20.09.2007. 1
04.10.2007. 26
12.02.2008. 0
29.02.2008. 1
Izvor: Studentska služba Veleučilišta u Brlog Gradu


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 18

2. FAZE STATISTIČKOGA ISTRAŽIVANJA


Statističko istraživanje općenito možemo podijeliti na sljedeće faze:

1. Određivanje cilja i razrada plana istraživanja;
2. Organizirano prikupljanje statističkih podataka;
3. Grupiranje i sređivanje statističkih podataka;
4. Tablični i grafički prikaz statističkih sređenih podataka;
5. Statistička analiza i interpretacija njezinih rezultata.

U ovom ćemo se kolegiju detaljno baviti fazama 3., 4. i 5., pa ćemo prve dvije faze ovdje
spomenuti samo okvirno.


2.1. Određivanje cilja i razrada plana istraživanja


Iako se vrlo često neopravdano zanemaruje, ova je faza zapravo jedna od najvažnijih faza
cjelokupnoga statističkog istraživanja. Naime, prije negoli se krene na prikupljanje podataka,
svakako treba jasno i precizno definirati što se želi postići statističkim istraživanjem jer već
dobro definiran cilj istraživanja može nametnuti prirodan izbor pogodnih metoda za
prikupljanje podataka. Ukoliko cilj istraživanja i plan istraživanja nisu dovoljno precizno
definirani, moguće je uzalud prikupiti veliki broj podataka koje potom nije moguće dostatno
kvalitetno podvrgnuti statističkoj analizi i interpretaciji.

Druga velika prednost preciznoga definiranja cilja i plana istraživanja je što znatno
pojednostavljuje i skraćuje cjelokupni postupak. Npr. pretpostavimo da želimo ispitati
zainteresiranost hrvatskih umirovljenika za aktivno sudjelovanje u tečaju osnova rada na
osobnim računalima. Iako npr. odlazak u Hrvatsku stranku umirovljenika i razgovor s
njezinim čelnicima može dati korisne podatke o cilju našega istraživanja, ta relativno jeftina i
kratkotrajna metoda nije dobra za postizanje željenoga cilja
21
jer stav čelnika stranke ne mora
održavati stav relativne većine hrvatskih umirovljenika. Teorijski najbolja metoda je postaviti
odgovarajuće anketno pitanje svakom pojedinom umirovljeniku, ali ta je metoda npr. zbog


21
Navedena metoda, međutim, može biti vrlo korisna za postavljanje hipoteze istraživanja. Hipoteza je temeljna
neprovjerena pretpostavka koju nastojimo potvrditi ili oboriti statističkim istraživanjem. U navedenom bi
primjeru (nakon obavljenih razgovora u HSU) postavljena hipoteza mogla glasiti: ''Većina hrvatskih
umirovljenika je zainteresirana za sudjelovanje u tečajevima osnova rada na osobnim računalima.''


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 19

svoje dugotrajnosti
22
uzrokovane znatnim brojem hrvatskih umirovljenika praktički potpuno
neprimjerena. Praktično najpogodnija metoda je izabrati dovoljno reprezentativan uzorak
23
i
(npr. telefonski) anketirati sve članove toga uzorka. Metodama izbora uzoraka i procjenjivanja
njihove reprezentativnosti bavi se posebna statistička disciplina teorija uzoraka. Detalje ovdje
izostavljamo.


2.2. Organizirano prikupljanje statističkih podataka


Statistički podaci obično se prikupljaju:

a) brojanjem (npr. iznos mjesečne plaće svakoga od djelatnika tvtke ''Drp–commerce'')
b) mjerenjem (npr. masa svake od natjecateljica za Miss Mliječne staze)
c) ocjenjivanjem (npr. stupanj zadovoljstva kvalitetom nastave iz Poslovne statistike);
d) evidentiranjem (npr. zaključne ocjene iz Poslovne statistike svih studenata Visoke
škole za financijski menadžment u Bedekovčini koji su položili taj kolegij u prošloj
akademskoj godini);
e) anketiranjem (intervjuiranjem) (npr. politička stranka za koju na predstojećim mjesnim
izborima namjerava glasovati svaki stanovnik Muća)

Rezultat organiziranoga prikupljanja statističkih podataka su tzv. ''sirovi'' (negrupirani,
neobrađeni) podaci. Iz njih se najjasnije vidi koji je element osnovnoga skupa pridružen
svakom pojedinom elementu statističkoga skupa. Uočimo da obrnuta tvrdnja nije točna jer bez
grupiranja i sređivanja podataka općenito ne možemo ''očitati'' kojim je sve elementima
statističkoga skupa pridružen svaki element osnovnoga skupa.

Najpoznatija, a možda i najprimjenjivanija metoda organiziranoga prikupljanja statističkih
podataka je anketiranje. Anketa predstavlja skup različitih postupaka kojima se pobuđuju,
prikupljaju i analiziraju izjave anonimnih ljudi
24
kako bi se dobili podaci o njihovu ponašanju,
stavu prema određenom problemu, mišljenju, interesima, preferencijama itd. Ti se podaci
dobivaju na temelju anketnih upitnika koji sadrže promišljeno odabrana pitanja koja trebaju


22
Drugi prirodan razlog je cijena praktične provedbe takve metode koja nerijetko predstavlja ozbiljnu prepreku
za kvalitetnu provedbu statističkoga istraživanja.
23
Vrlo česta pogreška statističkih istraživanja upravo je ''megalomanija'' odgovarajućih planova istraživanja jer
se istraživanje planira obaviti na prevelikom uzorku.
24
Psihološka istraživanja pokazuju da je uvjet anonimnosti sudionika ankete iznimno važan jer čak može utjecati
na iskrenost u davanju odgovora na anketna pitanja, a time i na realnost rezultata provedene ankete.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 20

biti jednostavna, jasna i nesugestivna. Ta se pitanja mogu postaviti pismeno i usmeno.
Usmeno postavljanje anketnih pitanja obično se naziva intervjuiranje
25
.

U nastavku navodimo primjer prvoga dobro strukturirane ankete za procjenu nastavnika i
kolegija koja se sukladno načelima Bolonjskoga procesa provodi na svim znanstveno-
nastavnim sastavnicama Sveučilišta u Zagrebu. Jedini možebitni nedostatak navedene ankete
je pretpostavka da svaki pojedini anketirani student poznaje temeljni postotni račun od sto, što
u praksi ne mora biti slučaj.




25
Moderna praksa nerijetko pokazuje da se postavljanje pitanja (unaprijed) u pismenoj formi i prepisivanje
njihovih odgovora također naziva intervju, napose ukoliko je riječ o medijski poznatim osobama (npr.
predsjednici država, premijeri vlada itd.). Sa statističkoga je stanovišta takvo izjednačavanje potpuno pogrešno.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 21

2.3. Grupiranje statističkih podataka


Nakon što su prikupljanjem (i odgovarajućim unosom) dobiveni ''sirovi'' statistički podatci,
vrlo često ih treba ''srediti'' tako da budu što pregledniji i lakši za daljnju statističku analizu
26
.
U tu se svrhu koristi grupiranje statističkih podataka. Osnovna ideja grupiranja je podijeliti
statistički skup na podskupove prema svim modalitetima koji tvore skalu obilježja, tj. za svaki
pojedini modalitet utvrditi (prebrojati) kolikom broju elemenata statističkoga skupa je
pridružen dotični modalitet. Pritom treba poštovati dva osnovna načela:

- isključivost: svaki element statističkoga skupa ne može istodobno biti u barem dva
različita podskupa;
- iscrpnost: svaki element statističkoga skupa mora biti obuhvaćen grupiranjem
podataka.
27


2.3.1. Grupiranje kvalitativnih podataka

Kako je već istaknuto, grupiranjem podataka za svaki pojedini modalitet utvrđujemo kolikom
je broju elemenata statističkoga skupa pridružen taj modalitet. Dobiveni broj obično se naziva
apsolutna frekvencija (učestalost). Neformalno, apsolutna frekvencija nekoga modaliteta
jednaka je ukupnom broju pojavljivanja toga modaliteta u osnovnom skupu
28
. Budući da je
svakom elementu statističkoga skupa nužno pridružen točno jedan modalitet, zbroj apsolutnih
frekvencija svih modaliteta mora biti jednak opsegu statističkoga skupa
29
.

Relativna frekvencija modaliteta jednaka je količniku odgovarajuće apsolutne frekvencije
toga modaliteta i opsega statističkoga skupa. Takav se račun provodi jer želimo vidjeti
kolikom dijelu statističkoga skupa je pridružen određeni modalitet. Iako je relativna


26
Izuzetak su slučajevi kad osnovni skup sadrži relativno malo (obično ≤ 30) podataka.
27
Budući da je preslikavanje f koje svakom elementu statističkoga skupa S pridružuje točno jedan element skale
modaliteta M funkcija, za svaki modalitet y ∈ M ima smisla definirati skup f

(y) = {x ∈ S: f(x) = y}. Navedeni
skup se naziva praslika modaliteta y. Stoga strogo formalno možemo reći da je grupiranje podataka particija
statističkoga skupa na međusobno disjunktne praslike pojedinih modaliteta.
28
Strogo formalno, apsolutna frekvencija modaliteta y je ukupan broj elemenata skupa f

(y), gdje je f funkcija iz
Bilješke 28. Autori koji poistovjećuju pojmove statistički skup i osnovni skup definiraju apsolutnu frekvenciju
kao ukupan broj pojavljivanja nekoga modaliteta u statističkom skupu. No, općenito je bolje i preciznije u
definiciji rabiti pojam osnovnoga skupa.
29
Aritmetika kardinalnih brojeva iz teorije skupova osigurava da navedeno svojstvo ne ovisi o tipu statističkoga
skupa (konačan ili beskonačan). Dakle, neovisno o tome je li statistički skup konačan ili beskonačan, zbroj
apsolutnih frekvencija svih modaliteta uvijek je jednak opsegu statističkoga skupa.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 22

frekvencija općenito neki nenegativan realan broj iz segmenta [0, 1], radi praktičnih ga je
potreba vrlo prikladno izraziti u proporcijama, postotcima ili promilima
30
.

Primjer 1. Promatramo statistički skup iz Primjera 1. u odjeljku 1.3. Ukupno 20 studenata
(elemenata promatranoga skupa) iz kolegija Poslovna matematika ima zaključnu ocjenu
izvrstan. Stoga je apsolutna frekvencija modaliteta izvrstan u odgovarajućem osnovnom
skupu jednaka 20. Budući da je opseg promatranoga statističkoga skupa 100, relativna
frekvencija modaliteta izvrstan jednaka je

20
100
= 0.2 = 20%.

Tako možemo zaključiti da iz kolegija Poslovna matematika 20% svih promatranih studenata
ima zaključnu ocjenu ''izvrstan''
31
.

Primjer 2. Istraživanjem potrošnje inozemnih putnika u Kraljevini Eldorado na uzorku od
ukupno 30 370 inozemnih putnika u razdoblju od lipnja do prosinca 2007. godine i
odgovarajućim grupiranjem podataka, između ostalih, dobiveni su sljedeći podaci:

vrsta prijelaza broj putnika struktura [%]
cestovni 25 924 85.36%
zračni 1 354 4.46%
željeznički 2 075 6.83%
pomorski 1 017 3.35%
ukupno: 30 370 100.00%

Apsolutna frekvencija modaliteta cestovni je 25 924, što znači da je ukupno 25 924 anketirana
inozemna putnika anketirano na cestovnim graničnim prijelazima. Odgovarajuća relativna
frekvencija je 85.36%, što znači da je 85.36% svih anketiranih inozemnih putnika anketirano
na cestovnim graničnim prijelazima. Za vježbu objasnite svaku od ostalih apsolutnih,
odnosno relativnih frekvencija.


30
Proporcija označava određeni dio jedinične veličine, a to je zapravo decimalan broj između 0 i 1. Kod
beskonačnih se statističkih skupova relativne frekvencije modaliteta ne određuju jer aritmetika beskonačnih
kardinalnih brojeva ne definira pojam dijeljenja kardinalnih brojeva. Stoga su relativne frekvencije praktično
vezane isključivo za realne konačne statističke skupove. Budući da se obično iskazuju u postotcima ili
promilima, za njihovo je računanje potrebno poznavati postotni račun od sto, odnosno promilni račun od tisuću.
31
Strogo formalno govoreći, interpretacija bi trebala glasiti: Ukupan broj studenata koji su dobili ocjenu
„izvrstan“ iznosi 20% od ukupnoga broja svih studenata. Zbog svakodnevnoga govora mi ćemo dozvoljavati i
navedenu interpretaciju.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 23

2.3.2. Grupiranje kvantitativnih podataka


Ukoliko se podaci koje grupiramo odnose na kvantitativno statističko obilježje, njihovim
grupiranjem dobivamo poseban tip grupiranih statističkih podataka. Riječ je o tzv. razdiobi
(distribuciji) frekvencija. U slučaju maloga broja modaliteta grupiranje ovakvih podataka
praktično se ne razlikuje od grupiranja kvalitativnih podataka. Međutim, u slučaju velikoga
broja modaliteta radi preglednosti ih je primjerenije grupirati u tzv. razrede. Definirajmo
ukratko osnovne pojmove.

Zatvoreni razred
32
je bilo koji poluzatvoreni podskup skupa realnih brojeva R oblika 〈a, b], a
otvoreni razred je bilo koji otvoreni podskup skupa realnih brojeva R oblika 〈a, +∞〉 ili
〈–∞, a〉
33
. Realan broj a nazivamo donja granica (zatvorenoga) razreda, a realan broj b
gornja granica (zatvorenoga) razreda. Realan broj h = b – a naziva se širina (veličina)
razreda i taj je broj praktično uvijek strogo pozitivan (tj. strogo veći od nule). Istaknimo još
da realan broj s =
1
2
⋅ (a + b) uobičajeno nazivamo razredna sredina
34
.

Primjer 3. Donja granica razreda 〈50, 100] jednaka je a = 50, dok je gornja granica jednaka
b = 100. Širina razreda jednaka je h = b – a = 100 – 50 = 50, a razredna sredina je broj
s =
1
2
(a + b) =
1
2
(50 + 100) = 75.

Ukupan broj (k) razreda u koje trebamo grupirati ukupno N različitih modaliteta
kvantitativnoga obilježja općenito nije unaprijed određen. U većini statističkih istraživanja i
izradama odgovarajućih računalnih programa primijenjuje se tzv. Sturgesovo
35
pravilo:

k ≈ 1 + log
2
N( ≈ 1 + 3.321928091 ⋅ log N( ≈ 1 + 1.442695 ⋅ ln N(.
36



32
Radi potreba daljnje statističke analize, mi ćemo pod pojmom razred podrazumijevati zatvoreni razred, te
prešutno pretpostavljati da za realne brojeve a i b vrijedi stroga nejednakost a < b.
33
Za matematički nenastrojene statističare: 〈a, +∞〉 je skup svih realnih brojeva koji su strogo veći od broja a:
〈a, +∞〉 = {x ∈ R: x > a}. 〈–∞, a〉 je skup svih realnih brojeva koji su strogo manji od broja a, tj.
〈–∞, a〉= {x ∈ R: x < a}.
34
Kasnije ćemo vidjeti da je razredna sredina zapravo aritmetička sredina donje i gornje granice razreda.
35
Herbert Sturges, američki statističar.
36
x( = najmanji cijeli broj veći ili jednak x. Npr. 3,14( = 4, –0,05( = 0 itd.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 24

Pojedine širine razreda također se ne zadaju unaprijed, nego općenito ovise o tipu razdiobe
podataka
37
. Najjednostavniji i praktično najprimjenjeniji slučaj je grupiranje podataka u
razrede jednakih širina, pri čemu prešutno pretpostavljamo da je razdioba podataka barem
približno simetrična. Tada izračunamo razliku najvećega i najmanjega modaliteta, pa tu
razliku podijelimo ukupnim brojem razreda i tako dobijemo traženu širinu razreda. Ovaj se
slučaj naročito primijenjuje kod tzv. pravih razreda (objašnjenje u nastavku teksta).

Ako razdioba podataka nije simetrična, primjereno je koristiti razrede manjih širina na
području u kojemu je ''gustoća'' podataka veća, a razrede većih širina na području s manjom
''gustoćom'' podataka.

Primjer 4. Mjerenjem visina (i iskazivanjem podataka u centimetrima) svih učenika 5., 6., 7.
i 8. razreda Osnovne škole ''Milivoj Glavović“ iz Brckovljana na dan 29.02.2008. dobiveno je
ukupno 506 podataka. Najmanji od njih je 151, najveći 193, a ukupan broj različitih
modaliteta je 38. Prema Sturgesovu pravilu podaci se mogu grupirati u ukupno
k ≈ 1 + log
2
38( = 6.213( = 7 razreda. Visine učenika su obično približno simetrično
raspoređene, pa je dobivene podatke primjereno grupirati u jednake razrede čija je širina
h =
193 151
6

= 7.

Uz grupiranje statističkih podataka često se javlja tzv. problem nominalnih razreda. Naime,
grupiranjem modaliteta kvantitativnoga obilježja u razrede dobivamo točno jedan od sljedećih
dvaju slučajeva:

1.) gornja granica svakoga pojedinoga razreda, osim posljednjega, jednaka je donjoj granici
neposredno sljedećega razreda;
2.) gornja granica svakoga pojedinoga razreda, osim posljednjega, nije jednaka donjoj granici
neposredno sljedećega razreda (tj. između dvaju uzastopnih razreda postoji razmak).

Prvi slučaj praktično primijenjujemo uvijek kad analiziramo modalitete kvantitativnoga
kontinuiranoga obilježja kojih teorijski može biti beskonačno mnogo. Granice tako dobivenih
razreda nazivamo prave granice i razredi s takvim granicama se najčešće koriste u statistici.



37
O tipovima razdiobe podataka bit će više riječi kasnije u poglavlju o mjerama asimetrije. Ovdje istaknimo
jedino da noviji statistički radovi predlažu da se širine razreda, umjesto izvedeno iz Sturgesova pravila, računaju
prema Freedman – Diaconisovoj formuli:
3
2 IQ
h
n

= , gdje je IQ interkvartil osnovnoga skupa. O interkvartilu
ćemo nešto više reći kasnije u poglavlju o mjerama raspršenja.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 25

Drugi slučaj se obično primijenjuje pri analizi modaliteta kvantitativnoga diskretnoga
obilježja kojih je obično konačno mnogo. Zbog toga između gornje granice jednoga razreda i
donje granice njemu neposredno sljedećega razreda postoji razmak (obično jednak 1). Takve
granice nazivaju se nominalne granice, a radi potreba daljnje statističke analize obično ih je
potrebno ''pretvoriti'' u prave. Najjednostavniji postupak pokazat ćemo na sljedećem primjeru.

Primjer 5. Pretpostavimo da smo grupiranjem podataka o iznosu mjesečnih plaća svih
zaposlenika knjigovodstvenoga servisa ''Knjiži kod mene'' iz Košara dobili sljedeću tablicu:

iznos mjesečne plaće [kn] broj zaposlenika
1600 – 1900 2
2000 – 2400 4
2500 – 2900 6
3000 – 3400 2
3500 – 8000 1

Sve navedene granice su očito nominalne granice. Razmaci između dvaju uzastopnih razreda
su jednaki i iznose 100. Pretvaranje u prave granice radimo tako da svaku pojedinu donju
nominalnu granicu umanjimo za polovinu razmaka, a svaku pojedinu gornju nominalnu
granicu uvećamo za polovicu razmaka. Budući da je polovina razmaka jednaka 50, dobivamo:

iznos mjesečne plaće [kn] broj zaposlenika
1550 – 1950 2
1950 – 2450 4
2450 – 2950 6
2950 – 3450 2
3450 – 8050 1


2.3.3. Kumulativni nizovi frekvencija


Ponekad je radi kvalitetnije statističke analize apsolutne i relativne frekvencije potrebno
grupirati u konačne nizove. To se poglavito radi ukoliko analiziramo kvalitativno redosljedno
obilježje čiji su modaliteti iskazani numeričkim vrijednostima (npr. ocjena na ispitu) ili bilo
koje kvantitativno obilježje. U praksi se najviše koriste dva tipa takvih nizova: kumulativni niz
''manje od'' i kumulativni niz ''veće od''. Objasnit ćemo ih na sljedećem primjeru.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 26

Primjer 6. Na 1. godini stručnoga studija smjehologije na Višoj uzaludnoj školi u Špičkovini
na dan 29.02.2008. bilo je ukupno 80 studenata. Svi oni su polagali pismeni ispit iz kolegija
''Zabavljačke vještine''. Rezultati pismenoga ispita dani su u sljedećoj tablici:

ocjena broj studenata
1 0
2 10
3 15
4 25
5 30
ukupno: 80

Za svaki pojedini modalitet definiramo kumulativnu apsolutnu frekvenciju ''manje od'' kao
ukupan broj elemenata osnovnoga skupa koji su ili strogo manji od dotičnoga modaliteta ili
jednaki tom modalitetu. Tako je kumulativna apsolutna frekvencija ''manje od'' modaliteta 1
jednaka 0 jer niti jedan student nije ocijenjen ocjenom 1. Kumulativna apsolutna frekvencija
''manje od'' modaliteta 2 jednaka je 10 (nema studenata koji su dobili ocjenu strogo manju od
2, ali postoji 10 studenata koji su ocijenjeni ocjenom 2), kumulativna apsolutna frekvencija
''manje od'' modaliteta 3 jednaka je 25 (ukupno 10 studenata je ocijenjeno ocjenom strogo
manjom od 3, a 15 studenata je ocijenjeno ocjenom 3), kumulativna apsolutna frekvencija
''manje od'' modaliteta 4 jednaka je 50 (25 studenata je ocijenjeno ocjenom strogo manjom od
4, a jednako toliko ih je ocijenjeno ocjenom 4) i kumulativna apsolutna frekvencija ''manje
od'' modaliteta 5 jednaka je 80 (svi studenti su ocijenjeni ocjenom jednakom ili manjom od 5).

ocjena broj studenata kumulativna apsolutna
frekvencija ''manje od''
1 0 0
2 10 10
3 15 25
4 25 50
5 30 80
ukupno: 80

Dobivene kumulativne apsolutne frekvencije objašnjavamo ovako: 10 studenata je na ispitu
ocijenjeno ocjenom 2 (niti jedna ocjena nije strogo manja od 2), 25 studenata je na ispitu
ocijenjeno ocjenom 2 ili ocjenom 3, 50 studenata je na ispitu ocijenjeno ocjenom 2, ocjenom 3
ili ocjenom 4, a 80 studenata je na ispitu ocijenjeno ocjenom 2, ocjenom 3, ocjenom 4 ili
ocjenom 5. Kraće i matematičkije, tu rečenicu možemo izreći ovako: 10 studenata je na ispitu
ocijenjeno ocjenom najviše jednakom 2, 25 studenata je na ispitu ocijenjeno ocjenom najviše


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 27

jednakom 3, 50 studenata je na ispitu ocijenjeno ocjenom najviše jednakom 4, a svi studenti
su na ispitu ocijenjeni ocjenom najviše jednakom 5.
38


Označimo li s f
x
apsolutnu frekvenciju, a s
x
c
<
kumulativnu apsolutnu frekvenciju ''manje od''
modaliteta x, nije teško vidjeti da vrijedi jednakost:

x y y x
y x y x
c f f f
<
≤ <
= = +
∑ ∑


koja nam omogućuje relativno brzo računanje svake pojedine kumulativne apsolutne
frekvencije. Računamo ih krećući se od najslabijega modaliteta prema najboljemu i za svaki
modalitet (osim prvoga, čija je kumulativna apsolutna frekvencija ''manje od'' jednaka
odgovarajućoj ''običnoj'' apsolutnoj frekvenciji) kumulativnu apsolutnu frekvenciju ''manje
od'' izračunamo tako da izračunatoj kumulativnoj apsolutnoj frekvenciji ''manje od''
prethodnoga modaliteta pribrojimo apsolutnu frekvenciju modaliteta čiju kumulativnu
frekvenciju ''manje od'' želimo izračunati. Kao provjera ispravnosti izračuna može nam
poslužiti i činjenica da kumulativna apsolutna frekvencija ''manje od'' najboljega (praktično,
posljednjega) modaliteta nužno mora biti jednaka opsegu statističkoga skupa.

Podijelimo li svaki član dobivenoga niza kumulativnih apsolutnih frekvencija s opsegom
promatranoga statističkoga skupa, dobit ćemo kumulativni niz relativnih frekvencija ''manje
od''. U promatranom primjeru taj je niz:

ocjena broj studenata kumulativna apsolutna
frekvencija ''manje od''
kumulativna relativna
frekvencija ''manje od'' [%]
1 0 0 0
2 10 10 12,5
3 15 25 31,25
4 25 50 62,5
5 30 80 100
ukupno: 80

Dobiveni kumulativni niz interpretiramo na sljedeći način: Niti jedan student na ispitu nije
ocijenjen ocjenom 1. 12,5% studenata je na ispitu ocijenjeno ocjenom najviše jednakom 2,
31,25% studenata je na ispitu ocijenjeno ocjenom najviše jednakom 3, 62,5% studenata je na


38
Mini-tečaj hrvatskoga jezika, lekcija 1: najviše jednak x je istoznačnica izraza manji ili jednak x, odnosno
izraza jednak x ili strogo manji od x.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 28

ispitu ocijenjeno ocjenom najviše jednakom 4, a svi studenti su na ispitu ocijenjeni ocjenom
najviše jednakom 5.

Na potpuno analogan način definiramo kumulativnu apsolutnu frekvenciju ''veće od'' svakoga
pojedinoga modaliteta To je ukupan broj elemenata osnovnoga skupa koji su ili strogo veći od
dotičnoga modaliteta ili jednaki tom modalitetu. Tako je kumulativna apsolutna frekvencija
''veće od'' modaliteta 1 jednaka 80 (svi studenti su ocijenjeni ocjenom 1 ili strogo većom od
1). Kumulativna apsolutna frekvencija ''veće od'' modaliteta 2 također je jednaka 80 jer su svi
studenti ocijenjeni ocjenom 2 ili strogo većom od 2. Kumulativna apsolutna frekvencija ''veće
od'' modaliteta 3 jednaka je 70 (15 studenata je ocijenjeno ocjenom 3, 25 studenata ocjenom
4, a 30 studenata ocjenom 5), kumulativna apsolutna frekvencija ''veće od'' modaliteta 4
jednaka je 55 (25 studenata ocijenjeno je ocjenom 4, a 30 studenata ocjenom 5) i kumulativna
apsolutna frekvencija ''veće od'' modaliteta 5 jednaka 30 (30 studenata ocijenjeno je ocjenom
5, a niti jedan student nije ocijenjen ocjenom strogo većom od 5).

ocjena broj studenata kumulativna frekvencija ''veće od''
1 0 80
2 10 80
3 15 70
4 25 55
5 30 30
ukupno: 80

Dobivene apsolutne frekvencije objašnjavamo ovako: Svi studenti su na ispitu ocijenjeni
ocjenom 2 ili većom od 2, 70 studenata je na ispitu ocijenjeno ocjenom 3 ili većom od 3, 55
studenata je na ispitu ocijenjeno ocjenom 4 ili većom od 4, a 30 studenata je na ispitu
ocijenjeno ocjenom 5. Kraće i matematičkije, tu rečenicu možemo izreći ovako: Svi studenti
su na ispitu ocijenjeni ocjenom najmanje jednakom 2, 70 studenata je na ispitu ocijenjeno
ocjenom najmanje jednakom 3, 55 studenata je na ispitu ocijenjeno ocjenom najmanje
jednakom 4, a 30 studenata je na ispitu ocijenjeno ocjenom 5.
39


Kod izračuna pojedinih kumulativnih apsolutnih frekvencija ''veće od'' korisno je primijetiti
da kumulativna apsolutna frekvencija ''veće od'' najslabijega (praktično, prvoga) modaliteta
nužno mora biti jednaka opsegu statističkoga skupa i ta nam činjenica može biti svojevrsna
provjera ispravnosti provedenih izračuna.



39
Mini-tečaj hrvatskoga jezika, lekcija 2: najmanje jednako x ili barem jednako x je istoznačnica izraza veći ili
jednak x, odnosno izraza jednak x ili strogo veći od x.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 29

Označimo li s f
x
apsolutnu frekvenciju, a s
x
c
>
kumulativnu apsolutnu frekvenciju ''veće od''
modaliteta x, nije teško vidjeti da vrijedi jednakost:

x y y x
y x y x
c f f f
>
≥ >
= = +
∑ ∑


koja nam omogućuje relativno brzo računanje svake pojedine kumulativne apsolutne
frekvencije ''veće od''. Računamo ih krećući se od najboljega modaliteta prema najlošijemu i
za svaki pojedini modalitet (osim najboljega čija je kumulativna apsolutna frekvencija ''veće
od'' jednaka odgovarajućoj ''običnoj'' apsolutnoj frekvenciji) kumulativnu apsolutnu
frekvenciju ''veće od'' izračunamo tako da izračunatoj kumulativnoj apsolutnoj frekvenciji
''veće od'' prethodnoga modaliteta pribrojimo apsolutnu frekvenciju modaliteta čiju
kumulativnu frekvenciju ''veće od'' želimo izračunati.

Kao i u slučaju kumulativnih frekvencija ''manje od'', svaku od dobivenih kumulativnih
frekvencija ''veće od'' možemo podijeliti s opsegom statističkoga skupa. Tako se dobije
kumulativni niz relativnih frekvencija ''veće od''. U promatranom primjeru taj je niz:

ocjena broj studenata kumulativna apsolutna
frekvencija ''veće od''
kumulativna relativna
frekvencija ''veće od'' [%]
1 0 80 100
2 10 80 100
3 15 70 87.5
4 25 55 68.75
5 30 30 37.5
ukupno: 80

Dobivene kumulativne relativne frekvencije objašnjavamo ovako: Svi studenti su na ispitu
ocijenjeni ocjenom najmanje jednakom 2, 87,5% studenata je na ispitu ocijenjeno ocjenom
najmanje jednakom 3, 68,75% studenata je na ispitu ocijenjeno ocjenom najmanje jednakom
4, a 37,5% studenata je na ispitu ocijenjeno ocjenom 5.











ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 30

2.3.4. Dijagram ''stablo – list'' (stem – leaf)


Jedan od načina sažetoga prikaza kvantitativnih statističkih podataka, osobito korišten u
statističkim računalnim programima, jest dijagram ''stablo – list''
40
. Ovaj način je osobito
prikladan ukoliko želimo vidjeti oblik i razdiobu podataka, a iz njega se vrlo lako mogu
izračunati medijan i mod
41
. Opišimo ukratko o čemu se radi.

Osnovna ideja ovakvoga tipa grupiranja podataka jest zapisati svaki numerički podatak u
obliku x.y, gdje je y bilo koja znamenka dekadskoga brojevnoga sustava, . decimalna točka, a
x ostatak numeričkoga podatka. U ovakvom zapisu y nazivamo list, a x stablo. Ukoliko
numerički podatak uopće nema znamenaka iza decimalne točke ili ima barem dvije znamenke
iza decimalne točke, list će biti posljednja znamenka broja, a stablo sve ostale znamenke broja
poredane redoslijedom u kojemu se pojavljuju u zapisu broja. U takvim slučajevima obavezno
moramo dati odgovarajuću ''uputu za uporabu'', tj. kako iz zapisa x.y pravilno očitati polaznu
numeričku vrijednost. Ilustrirajmo to na primjerima.

Primjer 7. a) Stablo numeričkoga podatka 2008.7 je broj 2008, a list broj 7. Ovdje nam ne
treba nikakva ''uputa za uporabu'' jer iz činjenica da je 2008 stablo, 7 list i izložene ideje
grupiranja podataka odmah dobivamo originalni podatak: 2008.7.

b) Prirodan broj 2008 nema niti jedne znamenke iza decimalne točke. U tom slučaju list je
posljednja znamenka toga broja, tj. 8, a stablo sve ostale znamenke broja u redoslijedu u
kojemu se pojavljuju u samom broju, tj. 200. No, kad bismo iz ovakvoga zapisa htjeli dobiti
originalni podatak, slijedeći osnovnu ideju dobili bismo broj 200.8, što je netočno. Stoga
ovdje moramo dati ''uputu za uporabu'', odnosno reći kako iz podatka x.y dobiti originalni
podatak. Ta je uputa ovdje jednostavna: pomnožiti zapis x.y s 10.

c) Decimalan broj 20.08 ima dvije znamenke iza decimalne točke. I u ovome je slučaju list
znamenka 8, a stablo 200. Međutim, iz ovakvoga zapisa slijedi da je originalan podatak 200.8,
što je netočno. Opet nedostaje ''uputa za uporabu'', a u ovom slučaju ona glasi: podijeliti zapis
x.y s 10.



40
Termini stablo (engl. tree) i list (engl. leaf) su dio osnovnih termina teorije grafova. Sukladno toj teoriji, ovaj
je dijagram zapravo unija stabala kojima su listovi znamenke jedinica prirodnih brojeva, a korijeni sve ostale
znamenke. Također, u duhu te teorije primjereniji prijevod naziva ovoga tipa dijagrama bio bi ''stabljika – list''.
41
Medijan i mod su srednje vrijednosti ili mjere centralne tendencije o kojima će detaljnije biti govora u
posebnom poglavlju.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 31

Nakon što smo svaki element osnovnoga skupa jedinstveno zapisali na gore navedeni način,
preostaje nam grupirati elemente osnovnoga skupa prema stablima: u istu grupu svrstat ćemo
sve elemente koji imaju isto stablo. Pritom ćemo stabla poredati prema uobičajenom uređaju u
skupu realnih brojeva, tj. od najmanjega do najvećega. Pokažimo to na primjerima.

Primjer 8. Svi studenti Visoke škole za financijski menadžment u Špičkovini koji su položili
kolegij Poslovna matematika putem dvaju kolokvija ostvarili su sljedeće brojeve bodova: 64,
67, 66, 95, 72, 90, 94, 95, 76, 86, 76, 55, 80, 58, 64, 68, 81, 72, 76, 87, 80, 93, 92, 63, 93, 99,
59, 78, 63, 72, 61, 69, 58, 82, 51, 70 i 90. Budući da je riječ o dvoznamenkastim prirodnim
brojevima, prva znamenka svakoga od tih brojeva bit će stablo, a druga list. Tako dobivamo
sljedeću tablicu:

stablo list
5 1,5,8,8,9
6 1,3,3,4,4,6,7,8,9
7 0,2,2,2,6,6,6,8
8 0,0,1,2,6,7
9 0,0,2,3,3,4,5,5,9
uputa za uporabu: pomnožiti stablo.list s 10

Iz ovako navedene tablice se pomoću ''upute za uporabu'' vrlo lako dobivaju polazni podaci.
Npr. u prvom retku tablice zapravo pišu decimalni brojevi 5.1, 5.5, 5.8, 5.8 i 5.9. ''Uputa za
uporabu'' kaže da se originalni podaci dobiju množenjem svakoga od tih brojeva s 10. Dakle,
originalni podaci su 51, 55, 58, 58 i 59. Na potpuno analogan način se iz ostalih redaka tablice
dobiju ostali elementi osnovnoga skupa.

Primjer 9. Zaključne cijene dionica (u €) mobilnoga operatera ''Bla–bla–mobile d.d.'' na
bečkoj burzi u 30 slučajno odabranih dana u razdoblju između 31.12.2006. i 31.12.2007.
iznosile su: 8.7, 6.9, 11.5, 13.6, 6.8, 11.7, 7.3, 7.4, 14.5, 11.9, 8.2, 12.2, 14.9, 8.1, 12.0, 10.6,
13.2, 13.5, 11.8, 13.4, 13.6, 12.2, 7.2, 13.9, 12.5, 8.8, 9.8, 13.3, 9.9 i 7.0. U ovome će slučaju
stablo svakoga podatka biti znamenke ispred decimalne točke, a list znamenka iza decimalne
točke. Tako dobivamo sljedeću tablicu:

stablo list
6 8,9
7 0,2,3,4
8 1,2,7,8
9 8,9
10 6
11 5,7,8,9
12 0,2,2,5
13 2,3,4,5,6,6,9
14 5,9


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 32

''Uputu za uporabu'' ovdje ne moramo navesti jer se originalni podaci dobivaju izravno bez
ikakvih dodatnih aritmetičkih operacija. Npr. iz prvoga retka odmah dobivamo podatke 6.8 i
6.9, iz drugoga 7.0,7.2,7.3 i 7.4 itd.

Primjer 10. Zaključne cijene dionica (u kn) tvrtke ''Stara TV' na frkljevačkoj burzi u veljači
2008. godine iznosile su: 59.52, 59.47, 59.51, 59.58, 59.57, 59.52, 59.49, 59.46, 59.43, 59.42,
59.39, 59.38, 59.37, 59.39, 59.4, 59.41, 59.43, 59.42, 59.44, 59.45, 59.48, 59.5, 59.53, 59.55,
59.58, 59.6, 59.62, 59.63 i 59.62. U ovome će slučaju list svakoga elementa osnovnoga skupa
biti znamenka na mjestu stotinki (druga znamenka iza decimalne točke), a stablo sve ostale
znamenke. Tako dobivamo sljedeću tablicu:

stablo list
593 7,8,9,9
594 0,1,2,2,3,3,4,5,6,7,8,9
595 0,1,2,2,3,5,7,8,8
596 0,2,2,3
uputa za uporabu: podijeliti stablo.list s 10

I ovdje pomoću ''upute za uporabu'' vrlo lako dobivamo polazne podatke. Npr. u prvom retku
tablice zapravo pišu decimalni brojevi 593.7, 593.8, 593.9 i 593.9. ''Uputa za uporabu'' kaže
da odgovarajuće originalne podatke dobivamo dijeljenjem svakoga od navedenih decimalnih
brojeva s 10, pa se tako dobiju podaci 59.37, 59.38, 59.39 i 59.39. Na potpuno analogan način
se iz ostalih redaka dobiju ostali elementi osnovnoga skupa.


2.4. Tablični prikaz statističkih podataka


Tablični prikaz statističkih podataka je treća faza obrade ''sirovih'' statističkih podataka. Cilj te
faze jest na jasan, cjelovit i pregledan način prezentirati rezultate prikupljanja i grupiranja
podataka. U ovoj ćemo točki ukratko spomenuti neke najvažnije vrste tablica. Pritom
istaknimo da svaka statistička tablica nužno mora imati sljedeće dijelove:

1.) naslov tablice;
2.) tekstualni dio tablice;
3.) numerički dio tablice;
4.) izvor podataka.

Točno jedan statistički niz nastao sređivanjem podataka prema modalitetima jednoga obilježja
tabelarno se pregledno prikazuje jednostavnom tablicom. Više statističkih nizova nastalih


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 33

sređivanjem podataka prema modalitetima jednoga obilježja pregledno prikazujemo skupnom
tablicom. Jednostavne i skupne tablice vrlo je jednostavno izraditi i u MS Wordu i MS
Excelu, ali se zbog potreba daljnje analize podataka preporučuje izraditi ih u MS Excelu.
Pogledajmo po jedan primjer svake od spomenutih vrsta tablica.

Primjer 1. Primjer jednostavne statističke tablice:

Razdioba svih zaposlenika tvrtke ''Lupeškić d.o.o.'' iz Zlobina na dan 10.03.2008. prema spolu

spol broj zaposlenika
muški 7
ženski 3
ukupno: 10
Izvor: služba kadrovskih potencijala tvrtke ''Lupeškić d.o.o.''

Primjer 2. Primjer skupne statističke tablice:

Razdioba registriranih cestovnih motornih i priključnih vozila u Republici Hrvatskoj na dan
31.12.2007. prema vrsti vlasnika

vrsta vozila fizičke osobe pravne osobe ukupno
autobusi 701 4 322 5 023
kombinirani automobili 6 316 4 592 10 908
mopedi 97 845 8 498 106 343
motocikli 52 104 4 191 56 295
osobna vozila 1 334 894 152 234 1 487 128
priključna vozila 19 792 15 118 34 910
vrsta vozila fizičke osobe pravne osobe ukupno
radni strojevi 2 587 4 407 6 994
teretna i radna vozila 70 888 94 347 165 235
traktori 101 854 4 190 106 044
Izvor: mjesečno statističko izvješće broj 1/2008 Državnoga zavoda za statistiku Republike Hrvatske

Statistički skup moguće je podijeliti i prema najmanje dvama različitim obilježjima, pa se i
tako dobiveni podaci mogu grupirati i sređivati. Dobiveni rezultati pregledno se prikazuju
kombiniranom ili kontingencijskom tablicom. Ukupan broj obilježja prema kojemu je
podijeljen skup naziva se dimenzija tablice, pa sukladno tome kombinirana tablica može biti
dvodimenzionalna, trodimenzionalna, četverodimenzionalna itd. Svaka takva tablica uvijek se
sastoji od predstupca, zaglavlja, polja tablice, marginalnoga retka (retka ukupno) i
marginalnoga stupca (stupca ukupno). Ukoliko je statistički skup podijeljen prema točno


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 34

dvama obilježjima, odgovarajuća kombinirana tablica je dvodimenzionalna, a njezin
marginalni redak i marginalni stupac sadrže odgovarajuće apsolutne ili relativne frekvencije
svakoga pojedinoga obilježja. Pogledajmo dva primjera tablica s apsolutnim frekvencijama.

Primjer 3. Primjer dvodimenzionalne kombinirane statističke tablice:

Razdioba svih studenata 1. godine stručnoga studija računovodstva i financija Veleučilišta u
Špičkovini na dan 10.03.2008. prema spolu i ruci kojom pišu

desna lijeva ukupno:
muški 12 5 17
ženski 17 6 23
ukupno: 29 11 40
izvor: studentska služba Veleučilišta u Špičkovini

Apsolutna frekvencija u retku i i stupcu j označava ukupan broj elemenata statističkoga skupa
koje istodobno imaju oblik obilježja 1 naveden u retku i i oblik obilježja 2 naveden u retku j.
Tako npr. apsolutna frekvencija 12 u presjeku drugoga retka i drugoga stupca znači da među
svim promatranim studentima ima točno 12 studenata muškoga spola koji pišu desnom rukom
(''dešnjaci''
42
), apsolutna frekvencija 6 u presjeku trećega retka i trećega stupca znači da među
svim promatranim studentima ima točno 12 studentica koji pišu lijevom rukom
(''ljevakinje''
43
) itd. Iz presjeka marginalnoga stupca i drugoga retka očitavamo da među svim
promatranim studentima ima točno 17 studenata muškoga spola, a iz presjeka marginalnoga
retka i trećega stupca očitavamo da među svim promatranim studentima ima točno 11
studenata koji pišu lijevom rukom. Za vježbu objasnite svaku od preostalih frekvencija
navedenih u tablici.

Primjer 4. Primjer četverodimenzionalne kombinirane statističke tablice:

Razdioba svih zaposlenika tvrtke ''Viktor Stečaj'' iz Plomina na dan 31.12.2006. prema spolu,
stupnju stručne spreme, navršenim godinama radnoga staža i iznosu prosječne mjesečne plaće





42
Uobičajeni izraz za muškarca koji piše desnom rukom. Taj izraz treba razlikovati od izraza desničar koji se
odnosi isključivo na političku orijentaciju. Također, muškarac koji piše lijevom rukom nije niti ljevičar niti
lijevak, nego ljevak.
43
Uobičajeni izraz za ženu koja piše lijevom rukom. Taj izraz treba razlikovati od izraza ljevičarka koji se
odnosi isključivo na političku orijentaciju.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 35

3000-4999 5000-6999 7000-9000
ukupno
srednja viša viša visoka visoka
0-9 M 3 1 1 0 0 5
Ž 3 1 0 2 1 7
10-19 M 3 1 3 3 3 13
Ž 0 0 4 0 2 6
20-30 M 3 0 2 0 0 5
Ž 3 0 0 0 1 4
ukupno 15 3 10 5 7 40
izvor: služba kadrovskih potencijala tvrtke ''Viktor Stečaj''

Ovdje prva apsolutna frekvencija, tj. 3, znači da među svim promatranim zaposlenicima
postoje točno 3 zaposlenika muškoga spola koji imaju srednju stručnu spremu, najviše 9
godina radnoga staža i prosječnu mjesečnu plaću između 3.000,00 kn i 5.000,00 (nećemo
cjepidlačiti) kn. Posljednja apsolutna frekvencija, tj. 1, znači da među svim promatranim
zaposlenicima postoji točno jedna zaposlenica (ženskoga spola) koja ima visoku stručnu
spremu, između 20 i 30 godina radnoga staža, te prosječnu mjesečnu plaću između 7.000,00 i
9.000,00 kn. Frekvencija 13 iz marginalnoga stupca znači da među svim zaposlenicima koji
imaju između 10 i 20 godina radnoga staža ima točno 13 zaposlenika muškoga spola, dok
frekvencija 10 iz marginalnoga retka znači da među svim zaposlenicima čija je prosječna
mjesečna plaća između 5.000,00 kn i 7.000,00 (opet ne cjepidlačimo) kn ima točno 10
zaposlenika koji imaju višu stručnu spremu itd. Iako te frekvencije nisu navedene, iz dobivene
kombinirane tablice vrlo lako možemo izračunati koliko je žena među svim promatranim
zaposlenicima, koliko ukupno zaposlenika ima visoku stručnu spremu i sl. Učinite to za
vježbu i objasnite značenje svih preostalih apsolutnih frekvencija navedenih u tablici.

Kako je istaknuto, osim apsolutnih, kombinirana tablice može sadržavati i relativne
frekvencije. Ovdje ćemo izdvojiti i na primjerima ilustrirati tri tipa takvih tablica: tablica
''kutno 100'', tablica ''vodoravno 100'' i tablica ''okomito 100''.

Tablica ''kutno 100'' dobije se iz kombinirane tablice koja sadrži apsolutne frekvencije tako da
se svaka apsolutna frekvencija podijeli s opsegom statističkoga skupa. Budući da je zbroj svih
apsolutnih frekvencija uvijek jednak opsegu statističkoga skupa, to zbroj svih relativnih
frekvencija mora biti jednak 1 (ili 100%, izrazimo li relativne frekvencije u postotcima). Taj
zbroj možemo izračunati na dva načina
44
:


44
Navedeni načini posljedica su svojstva komutativnosti i asocijativnosti zbrajanja realnih brojeva koja
zajednički kažu da zbroj proizvoljno (ali konačno) mnogo realnih brojeva ne ovisi o poretku tih brojeva, te da
unutar toga zbroja možemo postaviti parove zagrada na koja god mjesta želimo, pa posebno izračunati zbroj
unutar svakoga pojedinoga para zagrada.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 36

1.) zbrajajući relativne frekvencije u svakom pojedinom retku, pa potom zbrojiti sve dobivene
zbrojeve;
2.) zbrajajući relativne frekvencije u svakom pojedinom stupcu, pa potom zbrojiti sve
dobivene zbrojeve.

Primjer 5. Primjer tablice ''kutno 100'':

Struktura svih umrlih nasilnom smrću u Republici Hrvatskoj u 2005. godini prema spolu i
vrsti nasilne smrti


žene muškarci ukupno
nesretni slučaj 23.56% 43.40% 66.96%
samoubojstvo 7.75% 22.65% 30.40%
ubojstvo 0.87% 1.18% 2.05%
posljedice ratnih operacija 0.00% 0.17% 0.17%
nepoznata nasilna smrt 0.07% 0.35% 0.42%
ukupno 32.24% 67.76% 100,00%
Izvor: ''Žene i muškarci u Hrvatskoj'', Državni zavod za statistiku, 2007.

Iz ove tablice, primjerice, možemo očitati da su među svim umrlima nasilnom smrću u
Republici Hrvatskoj u 2005. godini njih 7.75% žene koje su izvršile samoubojstvo. Za vježbu
objasnite svaku od ostalih relativnih frekvencija.

Tablica ''vodoravno 100'' dobije se iz kombinirane tablice s apsolutnim frekvencijama tako da
svaki redak te tablice shvatimo kao tablični prikaz uzorka statističkoga skupa. Tada relativne
frekvencije računamo tako da u svakom pojedinom retku svaku od apsolutnih frekvencija
podijelimo s opsegom odgovarajućega uzorka.

Primjer 6. Primjer tablice ''vodoravno 100'':

Struktura stanovništva Republike Hrvatske (popis iz 2001. godine) prema spolu, razini
obrazovanja i navršenim godinama starosti









ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 37

osnovno ili
manje
srednje više ili
visoko
ukupno:
15 - 24 žene 41.00% 56.50% 2.50% 100.00%
muškarci 42.20% 56.30% 1.50% 100.00%
25 - 34 žene 18.30% 61.90% 19.80% 100.00%
muškarci 17.70% 68.60% 13.70% 100.00%
35 - 44 žene 27.40% 55.10% 17.50% 100.00%
muškarci 20.10% 64.00% 15.90% 100.00%
45 - 54 žene 41.60% 42.40% 16.00% 100.00%
muškarci 25.30% 57.60% 17.10% 100.00%
55 - 64 žene 65.70% 24.10% 10.20% 100.00%
muškarci 37.30% 46.20% 16.50% 100.00%
65 - 74 žene 81.70% 13.60% 4.70% 100.00%
muškarci 52.50% 34.90% 12.60% 100.00%
75 - 84 žene 86.30% 10.90% 2.80% 100.00%
muškarci 61.40% 25.20% 13.40% 100.00%
85 + žene 88.60% 9.00% 2.40% 100.00%
muškarci 68.50% 22.70% 8.80% 100.00%
izvor: ''Žene i muškarci u Hrvatskoj'', Državni zavod za statistiku, 2007.

Uočimo da ovdje zapravo imamo 16 uzoraka: prvi uzorak tvore sve žene koje su navršile
između 15 i 24 godine, drugi uzorak tvore svi muškarci koji su navršili između 15 i 24 godine,
treći uzorak tvore sve žene koje su navršile između 25 i 34 godine itd. Granice razreda u
ovom su primjeru nominalne, tj. riječ je o segmentima [15, 24], [25, 34] itd.

Tako, primjerice, relativna frekvencija 27.40% u drugom stupcu znači da među svim ženama
koje su navršile između 35 i 44 godine njih 27,4% ima osnovno obrazovanje ili manje, a
relativna frekvencija 1,50% u četvrtom stupcu znači da među svim muškarcima koji su
navršili između 15 i 24 godine njih 1,50% ima više ili visoko obrazovanje. Za vježbu objasnite
svaku od ostalih relativnih frekvencija.

Tablica ''okomito 100'' dobije se iz kombinirane tablice s apsolutnim frekvencijama tako da
svaki stupac te tablice shvatimo kao tablični prikaz uzorka statističkoga skupa. Tada relativne
frekvencije računamo tako da u svakom pojedinom stupcu svaku od apsolutnih frekvencija
podijelimo s opsegom odgovarajućega uzorka.

Primjer 7. Primjer tablice ''okomito 100'':

Struktura svih državljana Republike Hrvatske koji su titulu doktor znanosti stekli 2005.
godine prema spolu i području znanosti iz kojega su obranili doktorsku disertaciju



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 38

žene muškarci
prirodne znanosti 34.48% 10.90%
tehničke znanosti 8.62% 27.96%
biomedicina i zdravstvo 20.69% 24.64%
biotehničke znanosti 9.77% 9.48%
društvene znanosti 12.64% 12.32%
humanističke znanosti 13.79% 14.69%
ukupno: 100.00% 100.00%
izvor: ''Žene i muškarci u Republici Hrvatskoj'', Državni zavod za statistiku, 2007.

Uočimo da ovdje zapravo imamo dva uzorka: prvi uzorak tvore sve žene koje su titulu dr.sc.
stekle 2005. godine, a drugi uzorak tvore svi muškarci koji su titulu dr.sc. stekli 2005. godine.
Tako, primjerice, relativna frekvencija 20,69% navedena u drugom stupcu znači da je među
svim ženama koje su titulu dr.sc. stekle 2005. godine njih 20.69% tu titulu steklo na području
biomedicine i zdravstva, a relativna frekvencija 10.90% navedena u trećem stupcu znači da je
među svim muškarcima koji su titulu dr.sc. stekli 2005. godine njih 10.9% tu titulu steklo na
području prirodnih znanosti. Za vježbu objasnite svaku od ostalih relativnih frekvencija.


2.5. Grafički prikaz statističkih podataka


Grafički prikaz statističkih podataka je jedan od najvažnijih dijelova prezentacije rezultata
statističkoga istraživanja. Naime, kako je istaknuto u uvodu, statistika se, između ostaloga,
bavi i organiziranim načinima prezentacije rezultata statističkoga istraživanja. Psihologija
ljudskoga ponašanja pokazuje da se u gotovo svim vrstama tiskovina, javnih medija (osim
radija), izlaganja na različitim vrstama znanstvenih/stručnih skupova, ali i izlaganja na svim
vrstama nastave u različitim tipovima škola (osnovne, srednje, visoke, fakulteti, …) pozornost
slušatelja najprije i najvećim dijelom usmjerava na grafičke prikaze podataka. Stoga ćemo u
ovoj točki ukratko navesti osnovne i najčešće korištene statističke prikaze podataka
ilustrirajući ih na primjerima. Ipak, odmah istaknimo da tablice i grafički prikazi pružaju
isključivo prve informacije o promatranoj pojavi, a ni u kojemu slučaju nisu (potpuno)
dovoljne za statističku analizu i interpretaciju njezinih rezultata (5. faza statističkoga
istraživanja).

Grafičke prikaze ili, kraće, grafikone obično dijelimo u četiri osnovne skupine:
1.) površinski grafikoni;
2.) linijski grafikoni;
3.) točkasti grafikoni;
4.) kartogrami


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 39

Kako bi grafički prikaz imao svoj potpuni smisao, osobito treba istaknuti da uz svaki grafikon
obavezno treba navesti odgovarajuće oznake: naslov grafikona (najčešće: ''Razdioba…'',
''Struktura…'' itd.), nazive kategorija na koordinatnim osima (npr. godina, broj zaposlenika,
vrsta stručne spreme itd.), legendu (dio grafikona koji dodatno pojašnjava osobitosti
grafikona) itd. Bez spomenutih oznaka grafikon je nepotpun i ''nečitljiv'', pa ni u kojemu
slučaju ne može predstavljati dobar prikaz rezultata statističke analize.

Ukratko i uz odgovarajuće primjere opisat ćemo najčešće predstavnike svake pojedine vrste
grafikona.


2.5.1. Površinski grafikoni


Osnovna karakteristika ove vrste grafikona jest da se frekvencije podudaraju s površinama
geometrijskih likova (pravokutnik, krug). Drugim riječima, apsolutna (ili relativna)
frekvencija svakoga modaliteta jednaka je površini tom modalitetu odgovarajućega
pravokutnika ili dijela kruga. Budući da je površina pravokutnika jednaka umnošku njegove
duljine a i širine b, za širinu se najčešće uzima b = 1 jed., pa je u tom slučaju apsolutna
frekvencija identički jednaka duljini pravokutnika. U slučaju strukturnoga kruga i prikaza
relativnih frekvencija površina kružnoga isječka identički je jednaka relativnoj frekvenciji
tom isječku odgovarajućega modaliteta, a krug može imati bilo koji polumjer (a ne nužno
polumjer r = 1 jed.). Krug – kojega možemo zamišljati i kao kut od 360° – dijelimo na kružne
isječke čiji su središnji kutovi 360° ⋅ r
i
, gdje je r
i
relativna frekvencija i – toga modaliteta
iskazana kao proporcija (tj. kao decimalan broj). Npr. relativnoj frekvenciji 33.3333%
odgovara središnji kut 360° ⋅ 0,333333 = 120° itd.

Najčešći i praktično najviše korišteni tipovi površinskih grafikona su različite vrste stupaca
(jednostavni, položeni, dvostruki, višestruki, strukturni), strukturni krug, Paretov dijagram i
histogram. O histogramu ćemo nešto više reći u posebnoj podtočki, a ovdje samo istaknimo
da se nabrojene vrste stupaca, te strukturni krug najčešće koriste za grafički prikaz
kvalitativnih obilježja.

Primjer 1. Primjer jednostavnih stupaca:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 40



Uočimo odmah da svi stupci imaju jednaku širinu i ta je širina jedinična (tj. b = 1 jed.). Stoga
je površina svakoga pravokutnika identički jednaka duljini pravokutnika, što znači da je i
apsolutna frekvencija svakoga od pet modaliteta identički jednaka duljini pripadnoga
pravokutnika.
Iz zadanoga grafikona ne možemo očitati točne apsolutne frekvencije svakoga pojedinoga
modaliteta, ali možemo zaključiti da je najveći broj promatranih studenata na ispitu ocijenjen
ocjenom 3, a najmanji broj promatranih studenata ocijenjen ocjenom 5.

Primjer 2. Primjer položenih stupaca:




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 41

Položene stupce možemo shvatiti kao jednostavne stupce zarotirane za 90° ulijevo, pa potom
zrcaljene s obzirom na os modaliteta. (Na ovom načelu se konstruiraju položeni stupci u MS
Excelu.) Oni imaju potpuno ista svojstva kao i jednostavni stupci, a koriste se najčešće kod
obilježja s nomenklaturama.

Niti iz ovoga grafikona ne možemo ''očitati'' točnu apsolutnu frekvenciju svakoga pojedinoga
modaliteta (za dva modaliteta to možemo učiniti, ali za preostala tri ne), ali možemo zaključiti
da je najviše promatranih studenata završilo ekonomsku školu, a najmanje tehničku školu.

Primjer 3. Primjer dvostrukih stupaca:



Uočimo da se ovdje zapravo radi o podjeli statističkoga skupa (svi dosadašnji zastupnici u
Hrvatskom saboru) na 6 međusobno nedisjunktnih uzoraka (dio zastupnika je biran u barem
dva saziva Hrvatskoga sabora), pa je potom svaki od uzoraka podijeljen prema obilježju spol.
U ovom je slučaju tumač (legenda) prikazana sa strane neizostavan dio grafikona jer bez nje
ne bismo mogli točno znati (već samo prilično točno naslutiti) površine kojih pravokutnika
označavaju apsolutne frekvencije modaliteta muškarci, a koji modaliteta žene.
45


Iz zadanoga grafikona, primjerice, možemo zaključiti jedino da je u svim dosadašnjim
sazivima Hrvatskoga sabora ukupan broj saborskih zastupnika bio znatno veći od ukupnoga


45
Strogo precizno, u legendi bi trebali pisati točni nazivi modaliteta obilježja spol, tj. nazivi muški i ženski. No,
ponekad se radi lakše interpretacije grafikona ti modaliteti zamjenjuju imenicama muškarci i žene.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 42

broja saborskih zastupnica, ali ne možemo reći npr. za koliko posto veći, koliko puta veći itd.
Zbog toga su za daljnju analizu primjereniji strukturni stupci (vidjeti Primjer 6.)

Primjer 4. Primjer višestrukih stupaca:



Ovaj grafikon prikazuje podjelu istoga statističkoga skupa (svi zaposlenici tvrtke ''Ljubo
Jamio'' iz Muća na dan 10.03.2008.) prema trima različitim obilježjima: stupnju stručne
spreme, iznosu prosječne mjesečne plaće i navršenim godinama radnoga staža. Potonja dva
obilježja su kvantitativna, te su grupirana u razrede s nominalnim granicama (neprikladno za
daljnju statističku analizu, ali prikladno za grafički prikaz). I ovdje je tumač sa strane nužan
kako bismo znali koja se boja odnosi na svaku kategoriju. Svi stupci imaju širinu jednaku 1,
pa je, kao i kod jednostavnih stupaca, duljina pravokutnika jednaka apsolutnoj frekvenciji.

Iz prikazanoga grafikona možemo izvući razne zaključke, npr. da postoji 6 zaposlenika koji
imaju srednju stručnu spremu, najviše 9 godina radnoga staža i prosječnu mjesečnu plaću
između 3.000,00 i 4.999,00 kn, da od svih zaposlenika koji imaju visoku stručnu spremu, te
između 10 i 19 godina radnoga staža najviše njih ima plaću između 7.000,00 i 9.000,00 kn itd.
Za vježbu objasnite svaki prikazani stupac, te pokušajte izvući još neke zaključke iz ovoga
prikaza (npr. što sve možete reći o zaposlenicima koji imaju srednju stručnu spremu, što o
zaposlenicima čija je plaća između 5.000,00 i 6.999,00 kn itd.).

Primjer 5. Primjer strukturnoga kruga:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 43



Na ovom grafikonu površina svakoga pojedinoga kružnoga isječka odgovara relativnoj
frekvenciji modaliteta kojega predstavlja taj isječak. Kako je već istaknuto, duljina polumjera
kruga može biti bilo koji strogo pozitivan realan broj, a središnji kutovi odgovarajućih
isječaka dobiveni su množenjem broja 360 redom s brojevima 0.24, 0.16, 0.19, 0.13, 0.1 i
0.18, pa je tako površina narančastoga kružnoga isječka jednaka 24% površine cijeloga kruga,
površina tamnoplavoga kružnoga isječka jednaka 16% površine cijeloga kruga itd.
Napomenimo da neki programi (MS Excel) omogućuju dobivanje strukturnoga kruga na
osnovu jednostavne tablice s apsolutnim frekvencijama, pa se time izbjegava efektivno
računanje relativnih frekvencija.

Iz navedenoga strukturnoga kruga možemo ''očitati'' da među svim nastavnicima
Ekonomskoga fakulteta Sveučilišta u Banovoj Jaruzi ima 16% mlađih asistenata, 24%
redovnih profesora itd. Za vježbu objasnite značenje svake preostale relativne frekvencije.

Primjer 6. Primjer razdijeljenih stupaca (dobivenih iz odgovarajuće tablice ''okomito 100''):



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 44



Širina svakoga stupca jednaka je 1 jed., a duljina 100 jed., pa je njegova površina 100 kv. jed.
Ta je površina jednostavnim računom diobe podijeljena u omjeru relativnih frekvencija, pa se
za svaku pojedinu relativnu frekvenciju određuje pripadni dio površine pravokutnika. Pritom
poredak modaliteta nije bitan, tj. ako imamo ukupno n relativnih frekvencija, jedan
razdijeljeni stupac možemo ''nacrtati'' na n! = 1 ⋅ 2 ⋅ … ⋅ n načina. Radi lakše usporedbe, u
svakomu je razdijeljenom stupcu jednak redoslijed pojedinih modaliteta.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 45

Iz ovako prikazanih stupaca možemo izvući razne zaključke, npr. da među svim zaposlenim
ženama u Republici Hrvatskoj u 2006. godini najviše (točnije, 55.9%) njih je sa srednjim
obrazovanjem, a najmanje (točnije, 21.8%) s osnovnim ili manjim obrazovanjem, da među
svim nezaposlenim muškarcima u Republici Hrvatskoj u 2006. godini najviše (točnije, 62.7%)
njih je sa srednjim obrazovanjem, a najmanje (točnije, 6.4%) s višim ili visokim
obrazovanjem itd. Za vježbu, objasnite svaku pojedinu relativnu frekvenciju, pa iz
navedenoga grafikona pokušajte izvući još neke zaključke.

Primjer 7. Primjer položenih razdijeljenih stupaca (dobivenih iz odgovarajuće tablice
''vodoravno 100''):


Položeni razdijeljeni stupci su vrlo prikladni za prikaz strukture statističkoga skupa pri podjeli
prema kvalitativnom obilježju s nomenklaturom. Strogo formalno rečeno, dobivaju se
rotiranjem ''običnih'' razdijeljenih stupaca za 90° ulijevo, pa zrcaljenjem s obzirom na os
modaliteta. Širina svakoga pojedinoga pravokutnika jednaka je 1 jed., a duljina 100 jed., pa je
površina svakoga pravokutnika 100 kv. jed., a dijelovi koji odgovaraju pojedinim relativnim
frekvencijama dobivaju se pomoću dijeljenjem te površine jednostavnim računom diobe u
omjeru svih zadanih relativnih frekvencija.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 46

Ovakav se grafikon često konstruira tako da se odabere jedan modalitet (u ovom je slučaju to
modalitet žene), te se njegove relativne frekvencije u svakoj pojedinoj kategoriji tablice
''vodoravno 100'' poredaju od najveće do najmanje. U tome se poretku slažu i odgovarajući
stupci. Naravno, u slučajevima kad se u stupcima tablice ''vodoravno 100'' nalaze točno dva
modaliteta, takvo je slaganje stupaca ekvivalentno slaganju stupaca prema rastućem poretku
(od najmanje do najveće) relativnih frekvencija drugoga modaliteta. Odmah treba napomenuti
da se ovakva konstrukcija provodi isključivo radi lakše mogućnosti usporedbe relativnih
frekvencija istoga modaliteta u različitim kategorijama, ali ni u kojemu slučaju ne predstavlja
pravilo prema kojemu treba slagati stupce.

Iz zadanoga grafikona mogu se izvući razni zaključci, npr. da u privatnim kućanstvima sa
zaposlenim osobljem ima 14 puta više zaposlenih žena nego muškaraca, među svim
zaposlenicima u financijskom posredovanju njih 70% su žene itd. Za vježbu, objasnite
značenje svake pojedine relativne frekvencije, te pokušajte izvući još nekoliko zaključaka iz
prikazanoga grafikona.

Primjer 8. Primjer Paretova
46
dijagrama:




46
Vilfredo Federico Damaso Pareto, francuski sociolog, ekonomist i filozof, porijeklom Talijan.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 47

Za crtanje Paretova dijagrama treba poredati apsolutne frekvencije modaliteta u silaznom
poretku, tj. od najveće do najmanje, te izračunati relativne frekvencije i formirati odgovarajući
kumulativni niz relativnih frekvencija. Formiranje toga niza potpuno je jednako formiranju
kumulativnoga niza ''manje od'', ali zbog kvalitativnoga obilježja dan riječi ''manje od'' ovdje
treba izostaviti. Ovaj je dijagram svojevrsna ''kombinacija'' površinskoga grafikona
(jednostavnih stupaca) i linijskoga grafikona (kojim se prikazuje kumulativni niz relativnih
frekvencija), a specifičnost mu je što se na istom grafikonu primjenjuju dva tipa mjerila: prvo
mjerilo odnosi se na prikaz apsolutnih frekvencija jednostavnim stupcima, a drugo na prikaz
kumulativnih relativnih frekvencija. Istaknimo odmah da primjena dvaju ili više tipova
mjerila na istom grafikonu u pravilu nije dozvoljena.

Iz Paretova je dijagrama vrlo lako odrediti mod
47
kvalitativnoga niza, odnosno modalitet koji
se najčešće pojavljuje u osnovnom skupu. To je jednostavno modalitet koji odgovara prvom
stupcu u Paretovu grafikonu, a lako je vidjeti i postoji li još koji modalitet s istom apsolutnom
frekvencijom kao i prvi (prema načelima konstrukcije Paretova dijagrama, on se nužno mora
nalaziti neposredno iza prvoga modaliteta). U ovome je slučaju najčešći modalitet subota, pa
možemo zaključiti da se najviše promatranih prometnih nesreća dogodilo subotom, te da se
najmanje promatranih prometnih nesreća dogodilo sredinom tjedna (tj. utorkom, srijedom ili
četvrtkom) Također, iz linijskoga grafikona kumulativnih relativnih frekvencija možemo
''očitati'' da se 30% svih promatranih prometnih nesreća dogodilo subotom, polovica svih
prometnih nesreća petkom ili subotom itd.

Istaknimo da se Paretov dijagram u MS Excelu vrlo lako može dobiti primjenom procedure
Analiza podataka (Data Analysis), ali je nužan preduvjet za primjenu te procedure da
modaliteti obilježja budu numerički. Stoga, ukoliko je obilježje kvalitativno, a modaliteti
iskazani riječima, slovima itd., najprije treba provesti ''kodiranje'' modaliteta
48
(zamjenu riječi
brojevima), a nakon provedbe cijele procedure ''dekodirati'' brojeve, tj. vratiti originalne
modalitete.


2.5.2. Histogram


Histogram je posebna vrsta površinskoga stupčastoga grafikona koja se najčešće koristi za
prikaz modalitetâ kvantitativnih obilježja grupiranih u razrede. Osnovna ideja konstruiranja
histograma je potpuno jednaka ideji izloženoj kod opisa stupčastih grafikona navedenih u
točki 2.5.1.: apsolutne frekvencije modaliteta trebaju biti jednake površini tom modalitetu


47
O modu će više riječi biti u 3. poglavlju.
48
Usporediti s bilješkom br. 13.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 48

odgovarajućega pravokutnika. Kod kvalitativnih i negrupiranih kvantitativnih obilježja taj je
postupak bio relativno jednostavan: pretpostavili smo da su širine svih pravokutnika jednake 1
jed., pa je apsolutna frekvencija zbog toga bila jednaka duljini pravokutnika. No, kod
grupiranja kvantitativnih podataka u razrede cijela se priča malo komplicira. Radi
jednostavnosti, pretpostavit ćemo da histogramom želimo prikazati isključivo apsolutne
frekvencije jer za prikaz relativnih frekvencija obično koristimo strukturne stupce opisane u
prethodnoj točki.

Prvo ćemo opisati najlakši slučaj, a taj je kad su modaliteti kvantitativnoga obilježja grupirani
u prave razrede jednakih širina. Označimo navedenu jednaku širinu s d. To znači da će širina
svakoga pravokutnika čija će površina predstavljati apsolutnu frekvenciju razreda biti jednaka
d. Da bismo nacrtali pravokutnik, potreban nam je podatak o njegovoj duljini. Njegovu
duljinu a (za svaki pojedini razred) jednostavno dobijemo tako da apsolutnu frekvenciju
dotičnoga razreda podijelimo brojem d. To ujedno znači da nam duljina pravokutnika a
općenito više neće biti jednaka apsolutnoj frekvenciji (osim u slučaju d = 1), nego d puta
manja od nje. Zbog toga budite oprezni: kod histograma duljina pravokutnika općenito ne
mora biti jednaka apsolutnoj frekvenciji tom pravokutniku odgovarajućega razreda,
nego može biti nekoliko puta veća ili manja od nje (ovisno o tome je li 0 < d < 1 ili d > 1).
Istaknimo da se duljina a izračunata na opisani način naziva korigirana apsolutna frekvencija.
Primijetimo još jednu važnu činjenicu: budući da apsolutnu frekvenciju dijelimo strogo
pozitivnim realnim brojem, razred s najvećom apsolutnom frekvencijom imat će najveću
korigiranu apsolutnu frekvenciju. Drugim riječima, možemo uspoređivati korigirane
apsolutne frekvencije pojedinih razreda (ali ne i ''očitavati'' apsolutne frekvencije) kako smo
to činili dosad s apsolutnim frekvencijama.

Malo složeniji je slučaj kad su podaci grupirani u prave razrede različitih širina. Tada za svaki
pojedini razred moramo izračunati odgovarajuću širinu i taj će strogo pozitivan realan broj
ujedno biti širina pripadnoga pravokutnika. Potom računamo korigiranu apsolutnu frekvenciju
kao količnik apsolutne frekvencije i upravo izračunate širine pravokutnika. Iako se naizgled
čini da je ovaj slučaj samo poopćenje prethodnoga, to nije tako: naime, ovdje nema smisla
uspoređivati korigirane apsolutne frekvencije jer pravokutnici nemaju jednaku širinu. Drugim
riječima, ne vrijedi pravilo da najveća korigirana apsolutna frekvencija odgovara razredu koji
ima najveću apsolutnu frekvenciju. Stoga oprez: jedino što možemo napraviti jest
uspoređivati površine pravokutnika, a to već zahtijeva točno ''očitanje'' duljina stranica
svakoga pravokutnika, što uz nedovoljno ''gusto'' mjerilo na koordinatnim osima ne mora biti
moguće izvesti.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 49

Najsloženiji je slučaj kad su podaci grupirani u nominalne razrede (što se općenito događa
kod diskretnih obilježja) ili ako je barem jedan od razreda otvoren. Da bismo dobili
histogram, nominalne razrede najprije moramo pretvoriti u prave
49
, definirati nedostajuće
donje ili gornje granice, pa potom primijeniti postupak ili iz prvoga ili iz drugoga opisanoga
slučaja. Niti u ovom slučaju nema smisla uspoređivati korigirane apsolutne frekvencije jer
pravokutnici općenito ne moraju imati jednaku širinu.

U nastavku ćemo dati nekoliko primjera histograma dobivenih pomoću MS Excela, te ukazati
na posebnosti izradbe histograma pomoću ovoga programa.

Primjer 9. Primjer histograma (pravi razredi jednakih širina):

Pretpostavimo da smo brojeve bodova na 1. kolokviju iz kolegija Osnove računovodstva
održanom 22.11.2007. koje su postigli studenti 1. godine stručnoga studija računovodstva i
financija Visoke škole za financijski menadžment u Klokočevcu grupirali u sljedeće razrede:

broj
bodova
broj
studenata
0-10 15
10-20 14
20-30 20
30-40 17
40-50 7

Odmah vidimo da svaki razred ima širinu 10, što znači da je riječ o pravim razredima
jednakih širina. Izračunajmo korigirane apsolutne frekvencije podijelivši svaku pojedinu
apsolutnu frekvenciju s 10:
broj
bodova
korigirana
apsolutna
frekvencija
0-10 1,5
10-20 1,4
20-30 2
30-40 1,7
40-50 0,7

Tako histogram u ovom primjeru izgleda ovako:



49
Vidjeti Primjer 5. u točki 2.3.2.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 50



Uočimo odmah da natpis podataka na osi y nije Broj studenata (kao u slučaju jednostavnih
stupaca), nego Korigirana apsolutna frekvencija. Istaknimo još jednom da je broj studenata,
odnosno apsolutna frekvencija pojedinoga razreda jednaka površini tom razredu
odgovarajućega pravokutnika, pa nema nikakvoga smisla podatke na osi frekvencija nazvati
apsolutne frekvencije (to bi značilo da je 1.5 studenata na kolokviju ostvarilo najviše 10
bodova, što je besmisleno). Iako mjerilo na osi frekvencija nije dovoljno precizno za izračun
apsolutnih frekvencija svakoga pojedinoga razreda, ipak možemo zaključiti da je najviše
studenata (njih ukupno 2 ⋅ 10 = 20) na kolokviju ostvarilo između 20 i 30 bodova, a najmanje
studenata ostvarilo je između 40 i 50 bodova, što se potpuno slaže s podacima iz originalne
tablice.

Primjer 10. Primjer histograma (pravi razredi različitih širina):

Pretpostavimo da smo brojeve bodova na 1. kolokviju iz kolegija Osnove informatike
održanom 03.12.2007. koje su postigli studenti 1. godine stručnoga studija računovodstva i
financija Visoke škole za financijski menadžment u Klokočevcu grupirali u sljedeće razrede:

broj bodova broj studenata
0-20 10
20-25 16
25-30 18
30-35 22
35-45 7


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 51

Iako je riječ o pravim razredima, oni nisu jednakih širina. Širina prvoga razreda jednaka je 20,
širine triju srednjih razreda jednake su 5, dok je širina posljednjega razreda jednaka 10.
Računamo korigirane apsolutne frekvencije:

broj
bodova
korigirana
apsolutna frekvencija
0-20 0.5
20-25 3.2
25-30 3.6
30-35 4.4
35-45 0.7

pa pripadni histogram izgleda ovako:



Uočimo odmah da usporedba korigiranih apsolutnih frekvencija ovdje navodi na pogrešan
zaključak da je najmanje studenata na kolokviju ostvarilo najviše 20 bodova. Zbog
nedovoljno preciznoga mjerila ovdje ne možemo točno očitati korigirane frekvencije, pa je
jedan od zaključaka koji možemo izvesti na temelju ovoga grafikona npr. da je među svim
studentima koji su na kolokviju postigli između 20 i 35 bodova najviše onih koji su postigli
između 30 i 35 bodova. (Uspoređivali smo razrede istih širina za koje vrijedi pravilo da razred
s najvećom apsolutnom frekvencijom ima najveću korigiranu frekvenciju.)

Primjer 11. Primjer histograma (pravi razredi različitih širina):


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 52

Iz sljedećega histograma



usporedbom korigiranih apsolutnih frekvencija zaključujemo da je najviše promatranih
studenata na kolokviju ostvarilo između 30 i 35 bodova, a najmanje studenata između 50 i 80
bodova. Činjenično stanje, međutim, potpuno je drugačije jer je gornji histogram dobiven iz
sljedeće tablice:

broj bodova broj studenata
0-20 24
20-30 11
30-35 9
35-50 16
50-80 30

Iako se ovdje prirodno nameće zaključak da je uvijek najbolje grupirati podatke u razrede
jednakih širina jer je tada usporedba najlakša, takav pristup općenito nije uvijek primjeren, a
naročito ne u slučaju izrazito asimetričnih razdioba. Detalje ovdje izostavljamo.

Primjer 12. Primjer histograma (nepravi razredi različitih širina):



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 53

Zadana je razdioba rastavljenih brakova prema navršenim godinama života supruge u
Kraljevini Dajdamdaš 2006. godine:

navršene
godine života
do 23 24 – 32 33 - 39 40 - 44 45 - 49 50 - 59 60 i više
broj brakova 107 374 475 456 372 212 182
izvor: Statistički ljetopis Kraljevine Dajdamdaš za 2006. godinu

Odmah uočimo da su prvi i posljednji razred otvoreni, tj. prvi razred nema definiranu donju, a
posljednji razred gornju granicu. Procjena tih granica ovisi o svakom slučaju posebno. Ovdje
ćemo pretpostaviti da je donja granica prvoga razreda 16, a gornja granica posljednjega
razreda 80 godina. Tako dobivamo tablicu:


navršene
godine života
16 - 23 24 - 32 33 – 39 40 - 44 45 - 49 50 - 59 60 – 80
broj brakova 107 374 475 456 372 212 182

Razmaci između donje granice svakoga razreda (osim prvoga) i gornje granice tom razredu
neposredno prethodnoga razreda su jednaki i iznose 1. Stoga nominalne granice pretvaramo u
prave tako da svaku donju granicu smanjimo za polovicu razmaka, tj. za 0.5, a svaku gornju
uvećamo za polovicu razmaka (opet za 0.5). Tako dobivamo sljedeću tablicu:

godine života 15.5 – 23.5 23.5 – 32.5 32.5 – 39.5 39.5 – 44.5 44.5 – 49.5 49.5 – 59.5 59.5 – 80.5
broj brakova 107 374 475 456 372 212 182

Dalje postupamo kao i u prethodnom primjeru. Razredi nemaju jednake širine, pa je potrebno
izračunati korigirane apsolutne frekvencije za svaki pojedini razred. Dobivamo:

godine života 15.5 – 23.5 23.5 – 32.5 32.5 – 39.5 39.5 – 44.5 44.5 – 49.5 49.5 – 59.5 59.5 – 80.5
korigirana apsolutna
frekvencija
13.375 41.555556 67.85714 91.2 74.4 21.2 8.666666667

pa je odgovarajući histogram



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 54



Primijetimo ponovno da razred s najvećom/najmanjom apsolutnom frekvencijom nema
najveću/najmanju korigiranu apsolutnu frekvenciju, pa bismo samo na temelju grafikona
mogli donijeti pogrešan zaključak o najčešćoj dobi supruge. Za vježbu navedite najmanje
jedan točan zaključak koji možemo izvesti na temelju gornjega grafikona.


2.5.3. Linijski grafikoni


Linijski grafikoni pripadaju u tipove grafikona naročito pogodne za grafički prikaz
vremenskih nizova, poligona frekvencija i kumulante određene razdiobe (najčešće prema
nekom kvantitativnom obilježju), te za usporedbu najmanje dvaju nizova kvantitativnih
podataka. Po jednim primjerom ilustrirat ćemo svaku pojedinu podvrstu linijskih grafikona.

Primjer 13. Primjer linijskoga grafikona – grafički prikaz vremenskoga niza
50





50
Osnovama analize vremenskih nizova detaljnije ćemo se baviti kasnije.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 55

Srednji devizni tečaj eura Hrvatske narodne banke u 2007. godini (stanje potkraj mjeseca)



Međusobno spojene su točke A = (siječanj, 7.3734) i B = (veljača, 7.345292), B = (veljača,
7.345292) i C = (ožujak, 7.382466) itd. Iz grafikona možemo zaključiti da je najniži srednji
devizni tečaj eura bio potkraj mjeseca rujna, a najviši potkraj mjeseca ožujka, te da je tijekom
godine srednji devizni tečaj pokazivao tendenciju rasta u razdobljima veljača – ožujak, srpanj
– kolovoz, rujan – listopad i studeni – prosinac, dok je u ostalim vremenskim razdobljima
tečaj pokazivao tendenciju pada.

Primjer 14. Primjer linijskoga grafikona – usporedba dvaju vremenskih nizova

Na sljedećem grafikonu prikazana je grafička usporedba srednjih deviznih tečajeva dviju
inozemnih valuta (euro i američki dolar) Hrvatske narodne banke tijekom 2007. godine
(stanje potkraj razdoblja). Radi lakše usporedbe vrijednosti za pojedini mjesec, odgovarajuće
su točke spojene okomitom spojnicom. Iz grafikona zaključujemo da je tečaj američkoga
dolara gotovo tijekom cijele godine pokazivao tendenciju pada i bio bitno nestabilniji od
tečaja eura.
51



51
Nestabilnost tečaja dolara u odnosu na tečaj eura bila bi još izraženija kad bi se mjerilo na okomitoj osi
sljedećega grafikona podudaralo s mjerilom na okomitoj osi gornjega grafikona.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 56



Poseban primjer linijskoga grafikona je poligon
52
frekvencija. Riječ je o linijskom grafikonu
namijenjenu grafičkom prikazu razdiobe različitih vrsta frekvencija (dakle, riječ je o linijskom
analogonu histograma). Ukoliko modaliteti kvantitativnoga obilježja nisu grupirani u razrede,
poligon frekvencija dobiva se spajanjem točaka koje predstavljaju uređeni par modaliteta i
njegove apsolutne frekvencije. Ukoliko su ti modaliteti grupirani u razrede, poligon
frekvencija dobiva se tako da se, sukladno redoslijedu razreda na osi apscisa, spoje točke koje
predstavljaju uređeni par razredne sredine i apsolutne ili korigirane apsolutne frekvencije
dotičnoga razreda. Oblik poligona frekvencija ukazuje na način rasporeda podataka, a razlike
ordinata (tj. drugih koordinata) točaka o razlikama frekventiranosti oblika obilježja.

Primjer 15. Primjer poligona frekvencija (kvantitativno obilježje s negrupiranim
modalitetima)




52
Prema strogoj matematičkoj definiciji, poligon frekvencija je zapravo otvorena poligonalna crta. Da bi se
dobio zatvoreni poligon, treba spojiti prvu i posljednju ucrtanu točku. Iako matematički netočan, naziv poligon
(mnogokut) zadržao se kao dio uobičajenoga statističkoga nazivlja.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 57

Prikazani grafikon predstavlja svojevrstan linijski analogon jednostavnih (ili položenih)
stupaca. Budući da ne možemo točno očitati apsolutnu frekvenciju svakoga modaliteta,
možemo zaključiti npr. da najviše obitelji ima dvoje djece, a najmanje obitelji ima sedmero
djece. Razlike u frekventiranosti nisu odveć značajne jer krivulja nije zamjetno ''izbočena''.

Primjer 16. Primjer poligona frekvencija (kvantitativno obilježje s modalitetima grupiranim u
razrede s nominalnim granicama)




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 58

Na gornjoj su slici prikazana dva poligona relativnih frekvencija koja predočuju stope
aktivnosti pojedinih dobnih razreda, i to posebno za žene, a posebno za muškarce. Ovaj je
grafikon zapravo svojerstan linijski analogon strukturnih stupaca. Iz njega, primjerice,
možemo očitati da za oba spola nominalni razred [30, 34] ima najveću stopu aktivnosti (tj.
postotni udio radne snage u odnosu na radno sposobno stanovništvo je najveći za promatrani
razred), a otvoreni razred [65, +∞〉 najmanju stopu aktivnosti. Pokušajte navesti još neke
zaključke koji se mogu izvesti iz navedenoga grafikona.

Primjer 17. Primjer poligona frekvencija (kvantitativno obilježje čiji su modaliteti grupirani
u prave razrede)



Razredi u koje su grupirani iznosi prosječne mjesečne plaće su 〈1000, 2000], 〈2000, 3000],
〈3000, 4000] itd., a odgovarajuće razredne sredine su 1500, 2500, 3500 itd. Da se (zajedno osi
apscisa) dobije zatvorena poligonalna crta, ''umjetno'' su dodani razredi 〈0, 1000] i 〈10000,
11000] čija je apsolutna frekvencija 0. Možemo zaključiti da najviše zaposlenika promatrane
tvrtke ima plaću između 1.000,00 i 2.000,00 kn, a najmanje između 9.000,00 i 10.000,00 kn.
Uočimo da bi najprimjereniji površinski analogon prikazanoga linijskoga grafikona bio
Paretov dijagram (apsolutne frekvencije su poredane od najveće do najmanje) iako bi se
promatrana razdioba mogla prikazati i histogramom.

Kumulativni niz apsolutnih (ili relativnih) frekvencija ''manje od'' uobičajeno se grafički
prikazuje linijskim grafikonom tzv. kumulantom. Praktično crtanje kumulante u pravokutnom
koordinatnom sustavu u ravnini ovisi o tipu obilježja (diskretno ili kontinuirano), a mi ćemo
ga ilustrirati na razdiobi iz Primjera 16.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 59

Primjer 18. Primjer kumulante (kvantitativno obilježje čiji su modaliteti grupirani u prave
razrede)



Kumulanta se crta tako da se donjoj granici prvoga razreda (u našem je slučaju to 1000)
pridruži frekvencija 0 (na taj smo način dobili točku (1000, 0)). Potom se svakoj od gornjih
granica razreda (to su 2000, 3000, 4000, …, 10000) pridruži odgovarajuća kumulativna
apsolutna frekvencija ''manje od'', te se sve tako dobivene točke spoje glatkom
53
krivuljom.
Napomenimo da se, iako teorijski ima smisla, kumulanta niza ''veće od'' u praksi vrlo rijetko
koristi, pa je iz tih razloga ovdje i ne navodimo.


2.5.4. Ostale vrste grafikona


Budući da ćemo se u ovom kolegiju susretati isključivo s površinskim i linijskim grafikonima,
ostale vrste grafikona dajemo samo pregledno bez detaljnijih opisa i analiza.

Primjer 19. Primjer točkastoga grafikona – dijagram točaka (razdioba statističkoga skupa
prema jednom obilježju)



53
U matematici se pod pojmom glatka krivulja podrazumijeva graf bilo koje neprekidno diferencijabilne
funkcije. Grubo govoreći, riječ je o grafu koji ne sadrži niti jedan ''šiljak''. Primjer grafa koji sadrži ''šiljke'' je
bilo koji poligon frekvencija.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 60



Iznad svakoga pojedinoga modaliteta broj točaka označava odgovarajuću apsolutnu
frekvenciju. Ovdje prikazani dijagram točaka označava razdiobu rezultata ukupno 50
slučajnih pokusa
54
izbor jedne dekadske znamenke, a iz njega je lako očitati mod dobivenoga
statističkoga niza, tj. najčešću znamenku koja se pojavila kao rezultat slučajnoga pokusa. U
promatranom slučaju imamo dvije takve znamenke: 7 i 9.
55


Primjer 20. Primjer točkastoga grafikona – dijagram točaka (razdioba statističkoga skupa
prema trima obilježjima)



54
Slučajni pokus je jedan od osnovnih pojmova teorije vjerojatnosti, a time i matematičke statistike.
55
Razdiobu u kojoj imamo točno dvije najčešće vrijednosti nazivamo bimodalna razdioba. Iako ovaj primjer to
ne daje naslutiti, zakon velikih brojeva (jedan od najznačajnijih poučaka teorije vjerojatnosti) tvrdi da će u
slučaju vrlo velikoga broja provedenih slučajnih pokusa (pod istim uvjetima) dobivene apsolutne frekvencije
znamenaka biti približno jednake, tj. u dobivenom statističkom nizu svaka od znamenaka pojavit će se
(približno) jednako često.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 61



Na istom grafikonu prikazana je podjela svog radno aktivnog stanovništva određene regije
prema trima obilježjima: vrsta posla kojim se bave, prosječna plaća i prosječan broj tjednih
radnih sati. Uočimo da dva kvantitativna obilježja nemaju istu mjernu jedinicu, no, ta se
činjenica kod točkastih grafikona može zanemariti (kod površinskih i linijskih se ta činjenica
ne smije zanemariti). Iz prikazanoga grafikona se može zaključiti da su menadžeri najbolje
plaćeni, ali i da najviše rade, dok su težaci najslabije plaćeni za svoj rad unatoč većem broju
tjednih radnih sati. Također, može se zaključiti da je varijabilitet prosječnih plaća manji od
varijabiliteta prosječnih tjednih radnih sati, tj. promatrano stanovništvo se više razlikuje
prema tjednom radnom vremenu, nego prema prosječnim plaćama.
56


Primjer 21. Primjer točkastoga grafikona – dijagram rasipanja (dijagram raspršenja, oblak
raspršenja)




56
Navedena usporedba varijabiliteta obično se utvrđuje na temelju koeficijenata varijacije o kojima ćemo više
reći u 4. poglavlju.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 62

O dijagramu rasipanja više ćemo govoriti u poglavlju 4. Ovdje istaknimo samo da se ovakva
vrsta grafikona uobičajeno koristi prigodom utvrđivanja korelacije dvaju kvantitativnih
obilježja, tj. prigodom ispitivanja postoji li statistički značajna veza među promatranim
kvantitativnim obilježjima (definiranih na istom statističkom skupu, odnosno uzorku toga
skupa). Točke se ne spajaju nikakvim krivuljama, nego se iz njihova položaja i oblika
točastoga grafikona nastoje izvući zaključci o jačini i smjeru veze među promatranim
obilježjima. Ovdje se već na prvi pogled zbog ''raspršenosti'' točaka po grafikonu može
naslutiti da na promatranom uzorku ne postoji statistički značajna veza između iznosa
mjesečnoga džeparca učenika i njihove tjelesne mase.

Primjer 22. Primjer dijagrama točaka – struktura sadašnjega saziva Hrvatskoga sabora



Primjer 23. Primjer kartograma
57
– statistička karta



57
Najpoznatiji tipovi kartograma su piktogram i statistička karta, no, oni se koriste isključivo u zemljopisu za
grafički prikaz nominalnih prostornih obilježja, pa detalje ovdje izostavljamo.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 63


3. OSNOVNE KARAKTERISTIKE
NUMERIČKIH NIZOVA


3.1. Srednje vrijednosti numeričkih nizova

U praksi se vrlo često javlja problem kvalitetnoga reprezentiranja velikih nizova podataka
kvalitativnih ili kvantitativnih obilježja vezanih za relativno velike statističke skupove (npr.
cjelokupno stanovništvo nekoga grada/županije/države). I dok je u slučaju kvalitativnih
obilježja najbolji mogući rezultat tablični ili grafički prikaz podataka, za kvantitativna se
obilježja uvode posebni numerički pokazatelji, i to su tzv. srednje vrijednosti.

Srednja vrijednost
58
je općenito neka realna konstanta čiji je cilj na što reprezentativniji način
predočiti niz varijabilnih podataka numeričkog niza. U pravilu je riječ o vrijednosti oko koje
se ''gomila'' većina podataka numeričkog niza, pa se zato naziva i mjera središnje (centralne)
tendencije. Što je više podataka ''nagomilano'' oko pojedine srednje vrijednosti, njezina će
reprezentativnost biti bolja.


58
U svakodnevnom se životu pojam srednje vrijednosti vrlo često pogrešno zamjenjuje s pojmom prosjeka,
odnosno prosječne vrijednosti. Pod pojmom prosjek zapravo se podrazumijeva aritmetička sredina.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 64

Osnovne vrste srednjih vrijednosti su aritmetička sredina, geometrijska sredina, harmonijska
sredina, medijan i mod. Vrlo je važno istaknuti da je primjena svake pojedine vrste srednje
vrijednosti određena karakterom (svojstvima) promatranoga kvantitativnoga obilježja, pa ne
postoji ''univerzalna'' srednja vrijednost koja će dovoljno reprezentativno opisati bilo koji
numerički niz podataka. U praksi se ovo pravilo često vrlo neopravdano zanemaruje, pa se za
spomenutu ''univerzalnu'' srednju vrijednost, zbog relativno jednostavnoga načina izračuna,
uzima aritmetička sredina. Takav je pristup potpuno pogrešan jer, kako ćemo vidjeti, postoje
brojni primjeri numeričkih nizova takvi da aritmetička sredina nije dovoljno dobar
reprezentant svakoga od tih nizova.
59


U izračunu pojedine srednje vrijednosti mogu se pojaviti svi članovi numeričkoga niza ili
samo dio tih članova. Sukladno tome, srednje vrijednosti dijelimo na potpune i položajne
srednje vrijednosti.

U potpune srednje vrijednosti ubrajamo aritmetičku sredinu, geometrijsku sredinu i
harmonijsku sredinu. U izračunu tih vrijednosti koriste se svi elementi numeričkoga niza. U
položajne srednje vrijednosti ubrajamo medijan i mod. Njihova je vrijednost određena
položajem unutar numeričkog niza, pa u njihovu izračunu ne sudjeluju svi elementi
numeričkoga niza.

Zaključno uvodno istaknimo da svaku od navedenih srednjih vrijednosti možemo računati iz
negrupiranih (''sirovih'') i grupiranih podataka. Zajednička karakteristika svih takvih izračuna
jest da su vrijednosti dobivene izračunom iz grupiranih podataka nepreciznije od vrijednosti
dobivenih izračunom iz negrupiranih podataka, naročito ako su podaci grupirani u razrede
relativno velikih širina.

3.1.1. Aritmetička sredina


Aritmetička sredina (oznake: , X x , E(x)) je najraširenija i najčešće korištena srednja
vrijednost, a prilično je upitno proglašavati je i najvažnijom srednjom vrijednošću.
Definiramo li total kao zbroj svih elemenata konačnoga
60
numeričkoga niza, onda se
aritmetička sredina definira kao jednaki dio totala po jednom elementu niza. To praktično


59
Jedan tipičan primjer takvoga niza je niz mjesečnih plaća svih zaposlenika na (ne)određeno vrijeme u našoj
zemlji.
60
Ovdje namjerno naglašavamo riječ konačan jer se u matematici niz (u bilo kojem skupu S) definira kao
funkcija sa skupa prirodnih brojeva N u skup S. Sukladno tome, niz može biti konačan (ako je prirodno područje
definicije odgovarajuće funkcije konačan podskup skupa N) i beskonačan (ako je prirodno područje definicije
odgovarajuće funkcije cijeli skup N). U deskriptivnoj se statistici promatraju isključivo konačni nizovi, dok se
beskonačni nizovi promatraju u matematičkoj statistici.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 65

znači da se aritmetička sredina dobije tako da se total podijeli s ukupnim brojem elemenata
numeričkoga niza.

Postoji nekoliko različitih vrsta aritmetičkih sredina. Najpoznatija i najraširenija je
jednostavna aritmetička sredina. Za njezino je izračunavanje potrebno zadati konačan niz
negrupiranih numeričkih podataka x
1
, x
2
, …, x
n
. Tada se jednostavna aritmetička sredina
računa pomoću formule:

1 2 i 1
...
n
i
n
x
x x x
X
n n
=
+ + +
= =

.

Primjer 1. Zadan je numerički niz Smiljkovih mjesečnih neto–plaća (iskazanih u kn) u
prošloj (2007.) godini:

1.810,25; 1.810,25; 1.810.25; 1.850,5; 1.850,5; 1.850,5; 1.862,4; 1.862,4; 1.862,4; 1.875,8;
1.875,8; 1.875,8

Izračunajmo Smiljkovu prosječnu mjesečnu neto-plaću u prošloj godini:


1.810, 25 +1.810, 25 + 1.810.25 + 1.850, 5 + 1.850, 5 + 1.850, 5 + 1.862, 4 + 1.862, 4 + 1.862, 4
12
1.875, 8 + 1.875, 8 + 1.875, 8
1.849, 7375 1.849, 74
12
X = +
+ = ≈

Dakle, Smiljkova prosječna mjesečna neto–plaća u prošloj (2007.) godini iznosi približno
1.849,74 kn. Uporabljujući ovakvu rečenicu mi niz od ukupno 12 numeričkih vrijednosti
zamjenjujemo jednom jedinom vrijednošću: 1.849,74 kn. Stoga se prirodno postavlja pitanje
''uspješnosti'' takve zamjene, odnosno, preciznije, opisuje li dobivena vrijednost dovoljno
dobro niz podataka kojega zamjenjuje. Odgovor ćemo moći djelomično dati nakon
iskazivanja općih svojstava bilo koje aritmetičke sredine, a potpuno nakon definiranja mjera
raspršenja (disperzije) u sljedećem poglavlju.

Ukoliko se aritmetička sredina računa iz grupiranih podataka, govorimo o vaganoj ili
ponderiranoj aritmetičkoj sredini. Pri izračunu vagane aritmetičke sredine razlikujemo
slučajeve kad modaliteti kvantitativnoga obilježja nisu grupirani u razrede i kad su modaliteti
kvantitativnoga obilježja grupirani u razrede.
U prvom slučaju zapravo se radi o ''skrivenoj'' jednostavnoj aritmetičkoj sredini jer grupiranje
podataka isključivo prema modalitetima nije ništa drugo nego ''skraćeni'' (tablični) zapis


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 66

numeričkoga niza. Formalno, ako su x
1
, x
2
, …, x
k
međusobno različiti modaliteti
kvantitativnoga obilježja, a f
1
, f
2
, …, f
k
njima odgovarajuće apsolutne frekvencije, onda se
vagana aritmetička sredina računa pomoću izraza

1 1 2 2 1
1 2
1
...
...
k
i i
k k i
k
k
i
i
f x
f x f x f x
X
f f f
f
=
=
+ + +
= =
+ + +




Često se kaže da u izrazima ovoga oblika apsolutne frekvencije imaju ulogu pondera ili težine
pojedinoga modaliteta, pa otuda i naziv odgovarajuće aritmetičke sredine.

Primjer 2. Zadana je razdioba svih studenata 1. godine studija smjehologije na Višoj
uzaludnoj školi u Špičkovini (akademska godina 2007/2008.) prema broju položenih
jednosemestralnih kolegija:

broj položenih jednosemestralnih kolegija broj studenata
0 7
1 12
2 17
3 25
4 21
5 18
ukupno: 100
izvor: studentska služba Više uzaludne škole u Špičkovini

Navedena tablica zapravo zamjenjuje niz od 100 numeričkih podataka koji se sastoji od 7
nula, 12 jedinica, 17 dvojki, 25 trojki, 21 četvorke i 18 petica. Budući da nam je bitno lakše
umjesto ukupno 99 operacija zbrajanja izvršiti 6 operacija množenja i 4 operacije zbrajanja,
prosječan broj položenih jednosemestralnih ispita računamo kao vaganu aritmetičku sredinu:

6
1
6
1
7 0 12 1 17 2 25 3 21 4 18 5 295
2.95
100 100
i i
i
i
i
f x
X
f
=
=
⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
= = = =


.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 67

Dobiveni rezultat obično interpretiramo ovako: Prosječan broj položenih jednosemestralnih
kolegija po jednom studentu približno iznosi 3.
61
Ovdje treba pripaziti i na red riječi u
rečenici: prilog prosječno uvijek dolazi neposredno ispred veličine na koju se odnosi. Stoga je
pogrešno reći: Svi promatrani studenti prosječno su položili 3 jednosemestralna kolegija ili
Prosječan promatrani student položio je 3 jednosemestralna kolegija jer sintagma prosječno
položiti obično znači položiti s ocjenom dobar(3), a sintagma prosječan student obično znači
student čiji je prosjek ocjena približno 3,00. Odmah primijetimo da je točno 3
jednosemestralna kolegija uistinu položilo točno 25 studenata, a ne svih 100, pa je u ovakvim
slučajevima nužno izračunati dodatne pokazatelje reprezentativnosti aritmetičke sredine.

Zadatak 1. a) Definirajte statistički skup iz prethodnoga primjera pojmovno, prostorno i
vremenski, pa odredite njegov opseg i odgovarajući osnovni skup.

b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja
pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje
odgovore.

Aritmetička sredina može se računati i ukoliko su, umjesto, apsolutnih zadane odgovarajuće
(''obične'') relativne frekvencije. Radi jednostavnosti, pretpostavimo da su relativne
frekvencije iskazane u postotcima. Formalno, ako su x
1
, x
2
, …, x
k
međusobno različiti
modaliteti kvantitativnoga obilježja, a p
1
, p
2
, …, p
k
njima odgovarajuće relativne frekvencije
iskazane u postotcima
62
, onda se vagana aritmetička sredina računa pomoću izraza

1 1 2 2
1
...
k
k k i i
i
X p x p x p x p x
=
= + + + =

.
63


Ilustrirajmo primjenu ove formule na sljedećem primjeru.

Primjer 3. Podaci o broju djece u svakoj obitelji iz mjesta Svinjarevci u veljači 2008. godine
obrađeni su i grafički prikazani strukturnim krugom.



61
Strogo formalna interpretacija, sukladno definiciji aritmetičke sredine, glasi: Svaki od promatranih studenata
položio je prosječno 3 jednosemestralna kolegija. No, u interpretacijama se obično primjenjuje zamjena izraza
''svaki element nekoga skupa X ima svojstvo S'' izrazom ''svi elementi skupa X imaju svojstvo S''.
62
Relativne frekvencije p
1
, …, p
k
ovdje su razlomci s nazivnikom 100, ali mogu biti iskazane i kao proporcije
(decimalni zapisi omjera apsolutne frekvencije modaliteta i totala).
63
Čitatelji upoznati s osnovama diskretne teorije vjerojatnosti odmah će uočiti da je navedeni izraz zapravo
definicija matematičkoga očekivanja diskretne slučajne varijable koja poprima vrijednosti x
1
, x
2
, …, x
n
.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 68



Na temelju navedenih podataka možemo izračunati prosječan broj djece po jednoj obitelji iz
promatranoga mjesta:

7
1
16 0 18 1 28 2 23 3 9 4 4 5 2 6 211
2.11
100 100 100
i i
i
p x
X
=
⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
= = = =



Dobiveni rezultat možemo objasniti ovako: Prosječan broj djece po jednoj (promatranoj)
obitelji jednak je 2. Opet treba pripaziti i na red riječi u rečenici jer je pogrešno reći npr.
Prosječna (promatrana) obitelj ima dvoje djece (kako to često čine u javnim medijima!).

Zadatak 2. a) Definirajte statistički skup u prethodnom primjeru pojmovno, prostorno i
vremenski, pa odredite pripadni osnovni skup.

b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja
pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje
odgovore.

Spomenimo još da vagana aritmetička sredina dobivena iz relativnih frekvencija teorijski
mora biti identički jednaka jednostavnoj aritmetičkoj sredini, ali da praktično dolazi do više-
manje značajnih odstupanja nastalih uslijed približnih izračuna relativnih frekvencija. Što je
približni izračun relativnih frekvencija točniji, spomenuto odstupanje bit će manje, pa se u


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 69

ovakvim slučajevima preporučuje izračunavati relativne frekvencije na najmanje 5 decimalnih
mjesta.

U slučajevima poput netom razmotrenih, dakle, jednostavna aritmetička sredina identički
mora biti jednaka vaganoj aritmetičkoj sredini. No, ukoliko podatke grupiramo u razrede,
dolazi do razlika koje, u pravilu, ovise o veličini (širini) pojedinih razreda, a ne o ukupnom
broju razreda. Objasnimo nastajanje tih razlika na konkretnom primjeru.

Primjer 4. Zadana je razdioba svih nezaposlenih državljana Republike Ljenčarije u veljači
2008. godine prema dobi

navršene godine starosti broj nezaposlenih [000]
15 – 24 25.2
25 – 49 75.8
50 – 64 19.2
≥ 65 0.6
izvor: mjesečno statističko izvješće Državnoga zavoda za statistiku Republike Ljenčarije, ožujak 2008.

Da bismo mogli izračunati aritmetičku sredinu i u ovom slučaju, zadane nominalne granice
razreda trebamo pretvoriti u prave, te procijeniti gornju granicu posljednjega (otvorenoga)
razreda. Procijenit ćemo da spomenuta gornja granica jednaka 70. U slučaju obilježja
navršene godine starosti prave granice se dobiju izjednačavanjem gornje granice prethodnoga
razreda s donjom granicom tekućega razreda :

navršene godine starosti broj nezaposlenih [000]
15 – 25 25.2
25 – 50 75.8
50 – 65 19.2
65 – (70) 0.6

Prigodom računanja aritmetičke sredine iz podataka grupiranih u prave razrede, ulogu
ponderâ (težinâ) i dalje imaju apsolutne frekvencije, ali ''uloge'' modaliteta x
1
, x
2
, …, x
k

preuzimaju razredne sredine. Točnije, za svaki pojedini razred trebamo izračunati njegovu
razredu sredinu, pa dobivenoj vrijednosti kao ponder pridružiti odgovarajujuću apsolutnu
frekvenciju. Upravo na ovom mjestu nastaju spomenute razlike između jednostavne i vagane
aritmetičke sredine: različite podatke grupirane u isti razred zamjenjujemo istim podatkom, tj.
razrednom sredinom. Konkretno, razredna sredina prvoga razreda je

1
15 25
20
2
s
+
= = ,


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 70

pa u daljnjem izračunu niz od 25 200 podataka iz prvoga razreda među kojima sigurno ima
međusobno različitih (jer inače grupiranje u razrede nema smisla) zamjenjujemo nizom od
25 200 međusobno jednakih podataka i svaki od tih novih podataka jednak je razrednoj
sredini prvoga razreda, tj. 20. Budući da takvu zamjenu ne provodimo kod izračuna
jednostavne aritmetičke sredine, nego pri njezinu izračunu rabimo originalne podatke, vagana
aritmetička sredina izračunata iz podataka grupiranih u razrede je u pravilu lošiji reprezentant
promatranoga statističkoga skupa od jednostavne aritmetičke sredine.
64


Izračunom razrednih sredina dobivamo:

navršene godine starosti razredna sredina broj nezaposlenih [000]
15 – 25 20 25.2
25 – 50 37.5 75.8
50 – 65 57.5 19.2
65 – (70) 67.5 0.6

pa je vagana aritmetička sredina izračunata iz podataka grupiranih u razrede
65
:

4
1
4
1
25.2 20 75.8 37.5 19.2 57.5 0.6 67.5 4491
37.177
25.2 75.8 19.2 0.6 120.8
i i
i
i
i
f s
X
f
=
=

⋅ + ⋅ + ⋅ + ⋅
= = = ≈
+ + +




Dobiveni rezultat možemo interpretirati ovako: Procijenjeni prosjek navršenih godina starosti
promatranih državljana približno je jednak 37 (pogrešno je reći npr. Prosječan nezaposleni
državljanin Republike Ljenčarije ima navršenih 37 godina ili neku sličnu ''mudroliju''). Ovdje
obavezno moramo navesti riječ procijenjena jer smo navedeni rezultat dobili koristeći
procjenu gornje granice posljednjega razreda, te zamijenivši originalne podatke razrednim
sredinama (u svakom od tih slučajeva smo napravili određenu pogrešku, pa ne možemo
govoriti o stvarnoj, nego isključivo o procijenjenoj aritmetičkoj sredini).



64
Iznimka''koja potvrđuje pravilo'' su nizovi podataka s ekstremno velikim ili ekstremno malim vrijednostima.
Grupiranjem takvih nizova u razrede i zamjenom originalnih podataka razrednom sredinom moguće je znatno
smanjiti razliku između pojedinih ekstremno velikih vrijednosti i ostalih vrijednosti skupa, a time i donekle
poboljšati reprezentativnost aritmetičke sredine.
65
Prigodom izračuna aritmetičke sredine ''mjernu jedinicu'' apsolutnih frekvencija (000) možemo zanemariti, tj.
ne moramo računati s tisućama. Razlog tome je što se ista jedinica pojavljuje i u brojniku i u nazivniku
odgovarajućega razlomka, pa prigodom dijeljenja dolazi do njezinoga kraćenja.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 71

Zadatak 3. a) Definirajte statistički skup iz prethodnoga primjera pojmovno, prostorno i
vremenski, pa odredite njegov opseg.
b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja
pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje
odgovore.
c) U koliko su razreda podijeljeni dobiveni podaci? Za svaki od njih odredite donju granicu,
gornju granicu i veličinu.

Za izračunavanje aritmetičke sredine iz grupiranih podataka, umjesto apsolutnih, možemo
koristiti i relativne frekvencije. Radi jednostavnosti pretpostavit ćemo da su relativne
frekvencije već iskazane u postotcima. U takvom slučaju razredne sredine imaju ulogu
modaliteta, a relativne frekvencije ulogu pondera (težina). Njihov je zbroj jednak 100, pa će
se u nazivniku odgovarajućega razlomka naći broj 100. Ilustrirajmo to primjerom.

Primjer 5. Zadana je struktura žena – ovisnica o drogama liječenih u zdravstvenim
ustanovama u Republici Hrvatskoj tijekom 2005. godine prema navršenim godinama starosti:

navršene godine starosti struktura [%]
≤ 14 0.5
15 – 19 12.1
20 – 24 27.0
25 – 29 25.8
30 – 34 14.4
35 – 39 18.0
≥ 40
2.2
ukupno: 100
izvor: ''Žene i muškarci u Republici Hrvatskoj u 2007. godini“, Državni zavod za statistiku, 2008.

Procijenimo prosječnu navršenu dob svih promatranih žena. Kao donju granicu prvoga
razreda uzmimo 10, a kao gornju granicu posljednjega razreda uzmimo 60. Nominalne
granice pretvorimo u prave izjednačavanjem gornje granice prethodnoga razreda s donjom
granicom tekućega razreda:

navršene godine starosti struktura [%]
(10) – 15 0.5
15 – 20 12.1
20 – 25 27.0
25 – 30 25.8
30 – 35 14.4
35 – 40 18.0
40 – (60) 2.2
ukupno: 100


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 72

Kako smo već istakli, u ovakvim slučajevima razredne sredine shvaćamo kao modalitete, a
relativne frekvencije (iskazane u postotcima) kao pondere (težine). Zbroj svih relativnih
frekvencija uvijek je jednak 100, pa prije izračuna procijenjene aritmetičke sredine najprije
moramo izračunati odgovarajuće razredne sredine (s
i
):


navršene godine starosti razredna sredina struktura [%]
(10) – 15 12.5 0.5
15 – 20 17.5 12.1
20 – 25 22.5 27.0
25 – 30 27.5 25.8
30 – 35 32.5 14.4
35 – 40 37.5 18.0
40 – (60) 50 2.2
ukupno: 100

Procijenjena aritmetička sredina izračunata iz grupiranih podataka je:

7
1
0.5 12.5 12.1 17.5 27 22.5 25.8 27.5 14.4 32.5 18 37.5 2.2 50
100 100
2788
27.88
100
i i
i
p s
X
=

⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
= = =
= =



Dobiveni rezultat možemo interpretirati ovako: Procijenjena prosječna dob svih promatranih
žena je približno jednaka 28 godina (pogrešno je npr. reći: Prosječna žena – ovisnica o
drogama ima navršenu dob od 28 godina i sl.).

Naposljetku, u praksi se često javlja slučaj kad treba izračunati ''prosjek prosjeka'', tj.
aritmetičku sredinu aritmetičkih sredina. U takvim slučajevima treba poznavati apsolutne ili
relativne frekvencije odgovarajućih modaliteta
66
. Ulogu pondera (težina) u ovom slučaju
imaju zadane aritmetičke sredine. Pokažimo to na primjeru:

Primjer 6. Zadani su podaci o ukupnom broju zaposlenih u Republici Hrvatskoj u području
financijskoga posredovanja na dan 31.3.2006. i njihovim prosječnim mjesečnim neto–
plaćama u razdoblju od 01.01.2006. do 31.3.2006.


66
Zadavanje navedenih vrijednosti je nužan uvjet za izračun prosječne vrijednosti svih podataka. Bez
poznavanja navedenih vrijednosti izračun aritmetičke sredine aritmetičkih sredina je praktički besmislen.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 73

vrsta djelatnosti broj zaposlenih prosječna mjesečna
neto – plaća [kn]
financijsko posredovanje
osim osiguranja i mirovinskih
fondova

25 310

6.616,00
osiguranje i mirovinski fondovi
osim obveznoga osiguranja
6 077 6.505,00
pomoćne djelatnosti u
financijskom posredovanju
1 763 4.444,00
ukupno: 33 150
izvor: Statistički ljetopis Republike Hrvatske za 2006. godinu, Državni zavod za statistiku, Zagreb, 2007.

Procijenimo prosječnu mjesečnu neto–plaću svih promatranih zaposlenika u navedenom
razdoblju. Trebamo, dakle, izračunati aritmetičku sredinu aritmetičkih sredina neto–plaća.
Brojevi zaposlenih su apsolutne frekvencije i one imaju uobičajenu ulogu pondera (težine),
dok iznosi prosječnih neto–plaća imaju ulogu modaliteta. Stoga je aritmetička sredina
aritmetičkih sredina neto–plaća jednaka

3
1
3
1
25310 6.616, 00 6077 6.505, 00 1763 4.444, 00 214.816.617, 00
6.480,14
25310 6077 1763 33150
i i
i
i
i
f x
X
f
=
=

⋅ + ⋅ + ⋅
= = = ≈
+ +




Prema tome, procijenjena prosječna mjesečna neto – plaća svih promatranih zaposlenika u
navedenom razdoblju iznosi 6.480,14 kn. Riječ procijenjena ovdje navodimo zato jer ne
znamo metodologiju izračuna zadanih prosječnih mjesečnih neto–plaća: moguće je da su one
izračunate iz originalnih podataka, ali je isto tako moguće da su izračunate i iz podataka
grupiranih u razrede. Stoga je u interpretaciji primjereno koristiti riječ procijenjena neovisno
o tome što je moguće da je dobivena vrijednost ujedno i stvarna prosječna mjesečna neto-
plaća promatranih zaposlenika.

Zadatak 4. a) Definirajte statistički skup iz prethodnoga primjera pojmovno, prostorno i
vremenski, pa odredite njegov opseg.
b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja
pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje
odgovore.

Primjer 7. (problem školskih ocjena) Kako smo već ranije istakli, školske ocjene su primjer
kvalitativnoga redosljednoga obilježja i vezane su uz redosljednu skalu izražavanja
modaliteta, pa se nad njima ne mogu provoditi osnovne računske operacije. No, u praksi se u


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 74

brojnim slučajevima određuje prosječna ocjena ili prosjek ocjena (kao zbroj svih ocjena
podijeljen s njihovim ukupnim brojem) iako ta veličina, prema dosad iskazanoj statističkoj
teoriji, uopće nema smisla. U čemu se zapravo sastoji ovaj prividni paradoks?
Prigodom određivanja (pogrešno: računanja!) prosječne ocjene
67
mi zapravo kodiramo svaku
pojedinu ocjenu, tj. svakoj ocjeni bijektivno pridružujemo točno jedan prirodan broj: ocjeni
''nedovoljan'' pridružujemo prirodan broj 1, ocjeni ''dovoljan'' prirodan broj 2, ocjeni ''dobar''
prirodan broj 3, ocjeni ''vrlo dobar'' prirodan broj 4 i ocjeni ''izvrstan'' prirodan broj 5. Na taj
način kvalitativni niz ocjena bijektivno preslikavamo u numerički niz prirodnih brojeva, pa –
budući da je na skupu prirodnih brojeva definirana operacija zbrajanja – možemo računati
aritmetičku sredinu dobivenoga numeričkoga niza i zaokružiti je na najbliži prirodan broj.
Jedno od osnovnih svojstava aritmetičke sredine
68
je da se ona nalazi između najmanje i
najveće vrijednosti u numeričkom nizu, a to u ovom slučaju znači da je riječ o jednom od
prirodnih brojeva između 1 i 5. Dekodiranjem dobivenoga prirodnoga broja, tj. ''očitavanjem''
kojoj je ocjeni pridružen taj prirodan broj, dobivamo spomenutu prosječnu ocjenu.

Opisani postupak kodiranja i dekodiranja je vrlo čest u statistici, a primjenjuje se u
slučajevima kad je niz kvalitativnih podataka potrebno (dovoljno reprezentativno) opisati
točno jednim podatkom. Alternativni načini opisivanja takvih podataka u slučaju redosljednih
obilježja mogu biti i određivanje moda ili medijana
69
.
Na kraju ove točke navodimo osnovna svojstva aritmetičke sredine koja uvelike mogu
koristiti pri gruboj procjeni
70
je li izračunata aritmetička sredina dobar reprezentant
numeričkoga niza.

Svojstvo 1. Svaka razdioba u kojoj su vrijednosti obilježja pridružene elementima skupa na
temelju intervalne ili omjerne skale ima aritmetičku sredinu.
Svojstvo 2. (potpunost) Pri izračunu aritmetičke sredine niza numeričkih podataka
obuhvaćene su sve vrijednosti numeričkoga niza.
Svojstvo 3. (jedinstvenost) Svaki numerički niz ima točno jednu aritmetičku sredinu.
Svojstvo 4. Aritmetička sredina može poslužiti za usporedbu dvaju ili više numeričkih nizova
nastalih grupiranjem prema istom kvantitativnom obilježju.
Svojstvo 5. Aritmetička sredina se uvijek nalazi između najmanje (x
min
) i najveće (x
max
)
vrijednosti numeričkoga niza, tj. vrijede nejednakosti:


67
Napomenimo da se prosječna ocjena praktično ne računa ukoliko je barem jedan element odgovarajućega
kvalitativnoga niza jednak ''nedovoljan''. To osobito znaju učenici koji muče muku s ''ispravljanjem ocjena''.
68
Vidjeti svojstvo 5. na sljedećoj stranici.
69
Navedeni se načini u školstvu ipak ne primjenjuju unatoč činjenici da bi cjelokupna učenička populacija
nesumnjivo zdušno podržala da zaključna ocjena iz nekoga predmeta bude mod niza pozitivnih ocjena pojedinih
područja iz dotičnoga predmeta.
70
Statističke pokazatelje ''finijih'' procjena reprezentativnosti aritmetičke sredine navodimo u sljedećem
poglavlju.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 75

x
min
≤ X ≤ x
max
.

Svojstvo 6. Aritmetička je sredina jedina srednja vrijednost takva da je zbroj odstupanja svih
elemenata numeričkoga niza od nje uvijek jednak nuli.
71
Točnije, vrijede sljedeće jednakosti:

1
( ) 0
n
i
i
x X
=
− =


1
( ) 0
n
i i
i
f x X
=
⋅ − =



Svojstvo 7. (svojstvo minimuma zbroja kvadrata) Neka je x
1
, x
2
, …, x
k
zadani numerički niz
podataka. Tada realna funkcija f(x) =
2
1
( )
n
i
i
x x
=


poprima minimalnu vrijednost za x = X ,
tj. navedeni zbroj kvadrata poprima minimalnu vrijednost
72
kad je vrijednost varijable x
jednaka aritmetičkoj sredini elemenata zadanoga niza.
Svojstvo 8. Aritmetička sredina nije dobar reprezentant numeričkoga niza ukoliko u
numeričkom nizu postoje ekstremno male ili velike vrijednosti promatranoga kvantitativnoga
obilježja. (Ovo se svojstvo vrlo neopravdano zanemaruje pri izračunu prosječne (mjesečne,
godišnje) plaće svih registriranih djelatnika neke zemlje.)
Svojstvo 9. Aritmetička sredina izračunata na temelju razdiobe frekvencija u kojoj su
modaliteti obilježja predstavljeni razredima uvijek sadrži pogrešku budući da izračunata
razredna sredina, korištena za izračun vagane aritmetičke sredine, predstavlja samo približnu
zamjenu stvarne razredne sredine
73
nekoga razreda.
Svojstvo 10. Problem reprezentativnosti aritmetičke sredine dodatno je izražen u slučaju kada
razdioba frekvencija sadrži barem jedan otvoren razred, a osobito kada nije moguće
objektivno procijeniti nepoznate granice otvorenih razreda.


3.1.2. Geometrijska sredina


Neka je x
1
, x
2
, …, x
n
konačan numerički niz takav da za svaki i = 1, 2, …, n vrijedi x
i
> 0.
Geometrijska sredina (oznaka: G) je srednja vrijednost koja se dobije kao n-ti korijen iz


71
Iz samoga iskaza svojstva vidljivo je da se ono ne odnosi na aritmetičku sredinu izračunatu iz podataka
grupiranih u razrede, nego isključivo na jednostavnu aritmetičku sredinu ili aritmetičku sredinu izračunatu iz
podataka grupiranih prema modalitetima (za koju smo već utvrdili da je zapravo identički jednaka jednostavnoj
aritmetičkoj sredini).
72
Dijeljenjem navedene minimalne vrijednosti ukupnim brojem elemenata numeričkoga niza dobiva se
varijanca niza i ona se često neprecizno objašnjava kao prosječno kvadratno odstupanje od aritmetičke sredine.
O varijanci ćemo više reći u sljedećem poglavlju.
73
Stvarna razredna sredina je aritmetička sredina svih numeričkih podataka koji pripadaju dotičnom razredu.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 76

umnoška svih članova niza. Ukoliko je barem jedan član numeričkoga niza najviše jednak
nuli, geometrijska se sredina takvoga niza ne definira.

Za negrupirane podatke geometrijsku sredinu računamo prema formuli:

1 2
.....
n
n
G x x x = ⋅ ⋅ ⋅ .

Primjer 1. Geometrijska sredina niza 1, 2, 3, 4, 5 jednaka je

5
1 2 3 4 5 G = ⋅ ⋅ ⋅ ⋅ ≈ 2.605171085.

Pretpostavimo sada da su podaci grupirani, tj. da imamo ukupno n različitih modaliteta x
1
, x
2
,
…, x
n
. Za svaki i = 1, 2, …, n označimo s f
i
apsolutnu frekvenciju modaliteta x
i
. Tada je
vagana (ponderirana) geometrijska sredina izračunata iz grupiranih podataka dana izrazom

1 2 1
1
1 2
1
.....
n
n
i
i
n i i
i
n f
f
f f f f
n i
i
G x x x x
=
=
=


= ⋅ ⋅ ⋅ =

.

Primjer 2. Zadana je razdioba studenata 1. godine stručnoga studija računovodstva i financija
na Veleučilištu u Piškorevcima dana 20.3.2008. prema broju članova domaćinstva u kojemu
žive.

broj članova domaćinstva broj studenata
2 25
3 20
4 30
5 15
6 10
ukupno: 100

Geometrijska sredina zadane razdiobe jednaka je

100 25 20 30 15 10
2 3 4 5 6 G = ⋅ ⋅ ⋅ ⋅ ≈ 3.419482401.

U promatranim primjerima osnovni je problem bio što dobiveni rezultat nismo mogli
uobičajeno interpretirati. Drugim riječima, mogli smo reći da je prosječna vrijednost svih
članova niza u Primjeru 1. približno jednaka 2.6, a prosječan broj članova domaćinstva po
jednom studentu iz Primjera 2. približno jednak 3, ali te bismo interpretacije uobičajeno


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 77

shvaćali kao interpretacije aritmetičke sredine zbog već istaknutoga uobičajenoga
poistovjećivanja pojma prosjek s aritmetičkom sredinom. Stoga se nameće pitanje u kojim
situacijama geometrijsku sredinu možemo točno interpretirati kao prosječnu vrijednost neke
pojave. Tipična takva situacija je računanje prosječne promjene cijena u nekom promatranom
razdoblju
74
. Točnije, promatramo sljedeći opći problem:

Problem: Neka se pojava (npr. cijena, mjesečna plaća, broj stanovnika) tijekom razdoblja od
ukupno n vremenskih jedinica promijenila ukupno m puta. Označimo te promjene s p
1
, p
2
, …,
p
m
i pretpostavimo da su iskazane u postotcima. Odredimo prosječnu promjenu p promatrane
pojave u jednoj vremenskoj jedinici.

Odgovor: Neka je C
0
početna vrijednost pojave, a C
n
njezina vrijednost na kraju razdoblja od
n vremenskih jedinica. Koristeći formulu za sukcesivnu promjenu osnovne svote
75
dobivamo
da istodobno moraju vrijediti sljedeće jednakosti:

0
1 2
0
1
100
1 1 ... 1
100 100 100
n
n
m
n
p
C C
p p p
C C
| |
= ⋅ +
|
\ ¹
| | | | | |
= ⋅ + ⋅ + ⋅ ⋅ +
| | |
\ ¹ \ ¹ \ ¹


Lijeve strane tih jednakosti su jednake, pa takve moraju biti i desne strane. Njihovim
izjednačavanjem i sređivanjem dobivenoga izraza dobiva se

1 2
100 1 1 ... 1 1
100 100 100
m
n
p p p
p
(
| | | | | |
= ⋅ + ⋅ + ⋅ ⋅ + −
(
| | |
\ ¹ \ ¹ \ ¹
(
¸ ¸
.

U slučaju kad je ukupan broj promjena (m) jednak ukupnom broju razdoblja (n) gornju
jednakost možemo zapisati u obliku

1 2
(100 ) (100 ) ... (100 ) 100
n
n
p p p p = + ⋅ + ⋅ ⋅ + − ,

pa je u takvim slučajevima prosječna promjena pojave u jedinici vremena jednaka razlici
geometrijske sredine niza 100 + p
1
, 100 + p
2
, …, 100 + p
n
i broja 100.
76



74
Takva situacija pripada u analizu vremenskih nizova, o čemu ćemo više reći u posebnom poglavlju.
75
Preporučuje se ponoviti gradivo postotnoga računa od sto iz kolegija Gospodarska matematika.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 78

Ilustrirajmo netom provedeno razmatranje na primjerima.

Primjer 3. Cijena loživoga ulja se u minula dva mjeseca mijenjala točno četiri puta: najprije
je povećana za 0.5%, potom je povećana za daljnjih 0.7%, pa je snižena za 0.2% i naposljetku
povećana za još 1.5%. Odredimo prosječnu mjesečnu promjenu cijene loživoga ulja.
Jedinično vremensko razdoblje je 1 mjesec, pa je ukupan broj jediničnih razdoblja n = 2, a
ukupan broj promjena cijena m = 4. Te promjene iznose redom p
1
= +0.5, p
2
= +0.7, p
3
= –0.2
i p
4
= +1.5. (Predznak + označava da je riječ o povećanju cijene, a predznak – označava da je
riječ o sniženju cijene.) Tražena prosječna promjena jednaka je

1 2 3 4
100 1 1 1 1 1
100 100 100 100
0.5 0.7 0.2 1.5
= 100 1 1 1 1 1
100 100 100 100
1.250239
p p p p
p
(
| | | | | | | |
= ⋅ + ⋅ + ⋅ + ⋅ + − =
(
| | | |
\ ¹ \ ¹ \ ¹ \ ¹
(
¸ ¸
(

| | | | | | | |
⋅ + ⋅ + ⋅ + ⋅ + −
(
| | | |
\ ¹ \ ¹ \ ¹ \ ¹
(
¸ ¸



Uočimo da je, zbog relativno male razlike između navedenih numeričkih vrijednosti,
navedena prosječna promjena približno jednaka

1 2 3 4 1
0.5 0.7 ( 0.2) 1.5
1.25
2 2
m
i
i
p
p p p p
p
n
=
+ + + + + − +
≈ = = =

77
,

ali ne i aritmetičkoj sredini svih četiriju promjena koja iznosi

0.5 0.7 ( 0.2) 1.5
4
a
p
+ + − +
= = 0.625.

No, u slučajevima kad između numeričkih vrijednosti promjena postoje veće razlike, razlika
između aritmetičke i geometrijske sredine je bitno izraženija, kako pokazuje sljedeći primjer.



76
Brojevi 100 + p
1
, …, 100 + p
n
u praksi se nazivaju verižni (lančani) indeksi. O njima ćemo nešto više reći u
točki 5.5.1.
77
Navedeni približni izraz, naravno, nije aritmetička sredina promatranih promjena jer zbroj svih članova
numeričkoga niza ne dijelimo ukupnim brojem tih članova.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 79

Primjer 4. Cijena četvornoga metra (''kvadrata'') zemljišta u Lokvama u protekle je dvije
godine najprije udvostručena, a potom povećana za još 20%. Odredimo prosječnu godišnju
promjenu cijene četvornoga metra toga zemljišta. Iz navedenih podataka vidimo da su
numeričke vrijednosti promjena p
1
= +100 i p
2
= +20. Ukoliko bismo traženu prosječnu
godišnju promjenu računali kao jednostavnu aritmetičku sredinu (što je i formalno ispravno
jer imamo dvije promjene u dvije godine), dobili bismo:

100 20
60
2
a
p
+
= = ,

pa bismo zaključili da se promatrana cijena povećavala za prosječno 60% godišnje. No,
izračunom pomoću navedene formule za prosječnu promjenu dobivamo:

(100 100) (100 20) 100 54.91933 p = + ⋅ + − ≈ ,

pa zaključujemo da se promatrana cijena povećavala za prosječno (približno) 55% godišnje.
Provjerimo dobivena razmatranja uzimajući da je početna cijena četvornoga metra zemljišta
100,00 €. Tada je cijena nakon prvoga povećanja 200,00 €, a nakon drugoga 240,00 €.
Ukoliko cijenu od 100,00 € povećavamo dva puta po 60%, dobit ćemo najprije 160,00 €, a
potom 256,00 €, što je za 16 € (ili 6.67%) više od stvarne krajnje cijene zemljišta. No, ukoliko
cijenu od 100,00 € povećavamo dva puta po 54.91933% dobit ćemo najprije 154,92 €, a
potom cijenu od 240,00 €, što je i stvarna krajnja cijena.
Netom provedena razmatranja u praksi treba provoditi vrlo oprezno jer je njihov temeljni
nedostatak činjenica da prigodom izračuna prosječne promjene zapravo uzimaju u obzir
jedino početnu i konačnu vrijednost pojave, ali ne i njezine međuvrijednosti, što ponekad
može dovesti do potpuno pogrešnih zaključaka. Pogledajmo to na primjeru.

Primjer 5. Cijena automobila ''Ficho'' u protekle se dvije godine mijenjala dva puta: najprije
je udvostručena, a potom ''prepolovljena'' (snižena za 50%). Početna cijena je tada očito
jednaka krajnjoj, pa uvrštavanjem p
1
= +100, p
2
= –50 u formulu za prosječnu promjenu
cijene dobivamo da je ta promjena jednaka

(100 100) (100 50) 100 p = + ⋅ − − = 0,

otkuda slijedi da se u prosjeku cijena automobila godišnje nije mijenjala (pogrešno je reći:
prosječna cijena automobila se godišnje nije mijenjala!). Taj zaključak, međutim, očito
nedovoljno reprezentativno opisuje navedeno kretanje cijena automobila jer smo u
promatrane dvije godine imali ukupno dvije različite promjene: jedno povećanje i jedno
sniženje. Aritmetička sredina je još lošiji pokazatelj:


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 80

100 ( 50)
25
2
a
p
+ −
= = ,

pa bismo zaključili da se cijena automobila prosječno povećavala za 25% godišnje, što je u
suprotnosti s točnom činjenicom da je početna cijena automobila jednaka njegovoj krajnjoj
cijeni. Stoga sve vrste sredina treba primjenjivati oprezno i uz dodatne statističke analize, a
nikako ''šablonski'' i prema nekom automatizmu.


3.1.3. Harmonijska sredina


Neka je x
1
, x
2
, …, x
n
konačan numerički niz podataka takav da za svaki i = 1, 2, …, n vrijedi
nejednakost x
i
> 0. Harmonijska sredina (oznaka: H) navedenoga numeričkoga niza definira
se kao recipročna vrijednost aritmetičke sredine recipročnih vrijednosti svih elemenata
niza.
78
. Za numeričke nizove kojima je barem jedan član najviše jednak nuli harmonijska
sredina se ne definira.

Sukladno navedenoj definiciji, harmonijska sredina negrupiranih numeričkih podataka računa
se iz izraza:

1 2 1
1 1 1 1
...
n
n i i
n n
H
x x x x
=
= =
+ + +

.

Primjer 1. Odredimo harmonijsku sredinu niza 2, 3, 6. Ona je jednaka

3
3
1 1 1
2 3 6
H = =
+ +
.

Pretpostavimo sada da su podaci grupirani, tj. da imamo ukupno n različitih modaliteta x
1
, x
2
,
…, x
n
. Za svaki i = 1, 2, …, n označimo s f
i
apsolutnu frekvenciju modaliteta x
i
. Tada je
vagana (ponderirana) harmonijska sredina izračunata iz grupiranih podataka dana izrazom



78
Iako se od čitanja naglas ove definicije može zapetljati jezik, navedena je definicija uistinu jedina potpuno
ispravna definicija harmonijske sredine.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 81

1 2 1
1 2
1 1 2
...
...
n
i
n i
n
n i
i n i
f
f f f
H
f f f f
x x x x
=
=
+ + +
= =
+ + +


.

Primjer 2. Odredimo harmonijsku sredinu za razdiobu iz Primjera 2. u točki 3.1.2.:

broj članova domaćinstva broj studenata
2 25
3 20
4 30
5 15
6 10
ukupno: 100

Ona je jednaka

5
1
5
1
100 150
3.19149
25 20 30 15 10
47
2 3 4 5 6
i
i
i
i i
f
H
f
x
=
=
= = = ≈
+ + + +


.

Kao ni u slučaju geometrijske sredine, ni ovdje interpretacije Prosječna vrijednost svih
članova niza 2, 3, 6 jednaka je 3 i Prosječan broj članova domaćinstva po jednom studentu
približno je jednak 3 ne zvuče kao prirodne interpretacije harmonijske sredine.
79
Zbog toga
hamonijsku sredinu koristimo prigodom rješavanja problema u kojima se pojavljuju obrnuto
razmjerne veličine. U nastavku dajemo dva primjera takvih problema.

Primjer 1. Četiri radnika rade istovrstan posao, ali različitim brzinama. U četiri sata prvi je
radnik izradio 48 komada proizvoda, drugi 80 komada, treći 96 komada, a četvrti 120
komada. Odredimo prosječno vrijeme izrade jednoga proizvoda za sve radnike zajedno, te
prosječan broj izrađenih proizvoda po jednoj osmosatnoj radnoj smjeni.



79
Prilikom čitanja ovih dviju interpretacija, ali bez naznake o kojoj se srednjoj vrijednosti radi, svaki
nestatistički nastrojen homo sapiens odmah bi pomislio da je riječ o interpretaciji aritmetičke sredine.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 82

Za izradu jednoga proizvoda prvi radnik utroši t
1
=
4 1
48 12
= sati, drugi t
2
=
4 1
80 20
= sati, treći
t
3
=
4 1
96 24
= sati, a četvrti t
4
=
4 1
120 30
= sati. Mi tražimo vrijeme t za koje će četvorica
radnika proizvesti ukupno 4 proizvoda. Za navedeno vrijeme t prvi će radnik proizvesti
ukupno
1
12
t
proizvoda, drugi
1
20
t
proizvoda, treći
1
24
t
proizvoda, a četvrti
1
30
t
proizvoda, pa
će sva četvorica u vremenu t proizvesti ukupno
1
12
t
+
1
20
t
+
1
24
t
+
1
30
t
=
t ⋅
1 1 1 1
1 1 1 1
12 20 24 30
| |
|
+ + +
|
|
\ ¹
proizvoda. Taj broj treba biti jednak 4, pa dobivamo jednadžbu

t ⋅
1 1 1 1
1 1 1 1
12 20 24 30
| |
|
+ + +
|
|
\ ¹
= 4

iz koje je

4
1 1 1 1
1 1 1 1
12 20 24 30
t =
+ + +
.

Prema definiciji harmonijske sredine, odavde izravno slijedi da je traženo prosječno vrijeme
izrade jednoga proizvoda za sva četiri radnika zajedno jednako harmonijskoj sredini niza t
1
,
t
2
, t
3
, t
4,
tj. niza
1 1 1 1
, , ,
12 20 24 30
:

1
4 4 4 2
1 1 1 1 1 12 20 24 30 86 43
1 1 1 1
12 20 24 30
n
i i
n
H
t
=
= = = = =
+ + +
+ + +

radna sata.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 83

Provjerimo dobiveni rezultat. Za
2
43
sata prvi će radnik proizvesti prosječno
2
24
43
1
43
12
=
proizvoda, drugi prosječno
2
40
43
1
43
20
= proizvoda, treći prosječno
2
48
43
1
43
24
= proizvoda, a četvrti
prosječno
2
60
43
1
43
30
= proizvoda. Stoga će sva četvorica radnika za
2
43
sata proizvesti prosječno
24 40 48 60 172
4
43 43 43 43 43
+ + + = = proizvoda. Odatle izravno slijedi da će za 8 radnih sati
promatrana četvorica radnika proizvesti prosječno
8
2
43
= 172 proizvoda.

Primjer 2. U donjoj su tablici navedeni podaci o prosječnoj prodajnoj cijeni udžbenika iz
Poslovne statistike autora Statha Isticka tijekom 2007. godine, te strukturi vrijednosti prodaje
u trima prodajnim područjima

prodajno
područje
prosječna prodajna cijena
[kn]
struktura vrijednosti
prodaje [%]
sjever 290,00 25
središnja regija 300,00 35
jug 295,00 40

Odredimo prosječnu prodajnu cijenu za sva tri prodajna područja zajedno. Podsjetimo se,
vrijednost prodaje jednaka je umnošku ukupnoga broja prodanih proizvoda i cijene jednoga
proizvoda, dok je prosječna prodajna cijena jednaka količniku vrijednosti prodaje i ukupnoga
broja prodanih proizvoda. Budući da su postoci vrijednosti prodaje upravno razmjerni
vrijednostima prodaje svakoga pojedinoga područja, traženu prosječnu prodajnu cijenu
izračunat ćemo kao vaganu harmonijsku sredinu shvaćajući prosječne prodajne cijene kao
modalitete, a strukture vrijednosti prodaje kao pondere (težine):



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 84

3
1
3
1
25 35 40
295, 45
25 35 40
290 300 295
i
i
i
i i
p
H
p
x
=
=
+ +
= = ≈
+ +


kn.

Zaključno istaknimo da među trima sredinama numeričkoga niza vrijedi poznata A – G – H
nejednakost, tj. ako su A, G i H redom aritmetička, geometrijska i harmonijska sredina istoga
numeričkoga niza, onda vrijedi nejednakost

H ≤ G ≤ A.

Znakovi jednakosti vrijede ako i samo ako je odgovarajući numerički niz konstantan, tj. ako
je a
k
= c, za neki strogo pozitivan realan broj c ∈ 〈0, +∞〉 i za svaki k = 1, 2, …, n.


3.1.4. Kvantili


Neka je x
1
, x
2
, …, x
m
niz modaliteta kvantitativnoga ili kvalitativnoga redosljednoga obilježja.
Svaki takav niz možemo urediti tako da podatke ili poredamo po veličini (od najmanjega do
najvećega ili obrnuto) ako je riječ o modalitetima kvantitativnoga obilježja ili poredamo
prema stupnjevima intenziteta mjerenoga svojstva ako je riječ o modalitetima kvalitativnoga
redosljednoga obilježja. Na taj način dobivamo uređeni niz podataka.

Primjer 1. a) Niz kvantitativnih modaliteta 10, 7, 14, 5, 20, 8 možemo zapisati kao uređeni
niz 5, 7, 8, 10, 14, 20 ili kao uređeni niz 20, 14, 10, 8, 7, 5.
b) Niz kvalitativnih redosljednih modaliteta SSS, VSS, VŠS, VSS, SSS, VŠS, VŠS, VSS,
SSS možemo zapisati kao uređeni niz SSS, SSS, SSS, VŠS, VŠS, VŠS, VSS. VSS, VSS ili
kao uređeni niz VSS, VSS, VSS, VŠS, VŠS, VŠS, SSS, SSS, SSS.

U daljnjem, radi određenosti, pretpostavljamo da je konačan niz kvantitativnih, odnosno
kvalitativnih redosljednih modaliteta uređen uzlazno, tj. od najmanjega (najlošijega) prema
najvećemu (najboljemu), te promatramo isključivo tako uređene konačne nizove. Problem
koji ćemo razmatrati jest:

Problem 1: Zadani uređeni konačan niz podijeliti na jednakobrojne dijelove zadržavajući
pritom svojstvo uređenosti niza. Formalnije i preciznije, uređeni skup S = (x
1
, x
2
, …, x
m
)
podijeliti na n uređenih podskupova S
1
, S
2
, …, S
n
tako da vrijede sljedeća svojstva:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 85

1.) card(S
1
) = card(S
2
) = … = card(S
n
), tj. svi podskupovi S
1
, S
2
, …, S
n
imaju jednako mnogo
elemenata;

2.) za svaki i = 2, …, n svaki element skupova S
1
, … S
i

– 1
nije veći od svakoga elementa
skupa S
i
ili, ekvivalentno, za svaki x ∈
1
1
i
k
k
S

=

i svaki y ∈ S
i
vrijedi nejednakost x ≤ y;
3.) svaka dva uzastopna člana niza S
1
, S
2
, …, S
n
imaju najviše jedan zajednički element, dok
nesusjedni članovi niza nemaju niti jedan zajednički element;
4.)
1
n
i
i
S
=

= S
1
∪ S
2
∪ … ∪ S
n
= S, tj. unija
80
svih uređenih podskupova treba biti jednaka
polaznom uređenom skupu.

Odmah primijetimo da u postavci navedenoga problema nema uobičajenoga zahtjeva da
skupovi na koje dijelimo polazni uređeni skup nemaju niti jedan zajednički element, tj. da su
međusobno disjunktni. Taj zahtjev je namjerno izostavljen jer dozvoljavamo mogućnost da se
isti član niza pojavi u dva uzastopna podskupa. Formalno se ne navodi niti bilo kakva veza
između brojeva m i n, no, može se pokazati da iz uvjeta 1.), 3.) i 4.) slijedi nejednakost n ≤ m.
Ona se intuitivno može objasniti kao činjenica da uređeni skup od m elemenata možemo
podijeliti na najviše m dijelova tako da svi dijelovi imaju jednako mnogo elemenata.

Primjer 2. Sukladno gore navedenim uvjetima, podijelimo uređeni niz 1, 2, 3, 4 na dva
jednakobrojna dijela. Tražimo dva uređena podskupa S
1
i S
2
uređenoga skupa S = (1, 2, 3, 4)
takva da svaki element skupa S
1
nije veći od svakoga elementa skupa S
2
, da skupovi S
1
i S
2

imaju najviše jedan zajednički element, te da njihova unija daje skup S. Lako se vidi da je
jedina mogućnost takve podjele S
1
= (1, 2) i S
2
= (3, 4).

Primjer 3. Sukladno uvjetima problema, uređeni niz iz Primjera 1. podijelimo na tri
jednakobrojna dijela. Sada tražimo tri uređena podskupa S
1
, S
2
i S
3
takva da svaki element
skupa S
1
nije veći od svakoga elementa skupa S
2
i svaki element skupa S
2
nije veći od svakoga
elementa skupa S
3
, te da unija svih triju uređenih skupova daje skup S. Nije teško vidjeti da je
jedina mogućnost takve podjele S
1
= (1, 2), S
2
= (2, 3) i S
3
= (3, 4). Uočimo da skupovi S
1
i S
2

imaju zajednički element 2, skupovi S
2
i S
3
zajednički element 3, dok skupovi S
1
i S
3
nemaju
zajedničkih elemenata.



80
Navedenu uniju dobijemo tako da svaki od podskupova najprije shvatimo kao ''običan'' skup, napravimo
uobičajenu operaciju unije skupova uz dozvoljeno ponavljanje elemenata, a potom uredimo dobiveni skup.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 86

Primjer 4. Sukladno uvjetima problema, uređeni niz 1, 2, 3 podijelimo na dva jednakobrojna
dijela. U ovom se slučaju dobiva S
1
= (1, 2) i S
2
= (2, 3). Uočimo da skupovi S
1
i S
2
imaju
zajednički element 2.

Netom razmatrani problem poopćuje se u matematičkoj statistici, i to prigodom proučavanja
svojstava kumulativne funkcije distribucije slučajne varijable
81
. Ondje se Problem 1. svodi na
to da se za zadanu slučajnu varijablu X i zadani realan broj p ∈ 〈0, 1〉 odredi vrijednost x
takva da je vjerojatnost da je vrijednost slučajne varijable X strogo manja od x jednaka
najviše p, a vjerojatnost da je vrijednost slučajne varijable X strogo veća od x jednaka najviše
1 – p. Može se pokazati da tražena vrijednost x uistinu postoji i da je jedinstvena, te se ona
naziva p–kvantil. Kvantili su vrlo značajni i u deskriptivnoj statistici, ali njihov osnovni
nedostatak je nemogućnost točne interpretacije: deskriptivna statistika ''ne poznaje'' termin
slučajna varijabla, pa se gornja, točna definicija p – kvantila mora preinačiti, čime se gubi na
preciznosti (i istinitosti) interpretacije. Približni deskriptivni ''ekvivalent'' p – kvantila je tzv.
(per)centil i njega opisujemo u nastavku.

Percentili ili centili su položajne vrijednosti koje uređeni niz dijele na ukupno 100
jednakobrojnih dijelova. Ima ih ukupno 100 – 1 = 99 i označavaju se s P
1
, P
2
, P
3
, …, P
98
, P
99
.
Približna formula za izračun k – toga percentila P
k
za uređeni niz x
1
, x
2
, …, x
m
dana je s:

P
k
= x
c + 1
+ d ⋅ (x
c + 2
– x
c + 1
), za k = 1, 2, …, 98, 99,

gdje je c cijeli, a d decimalni dio broja
100
k
⋅ (m – 1).
82
(Približna i matematički neprecizna!)
Interpretacija k – toga percentila P
k
obično je jedna od sljedećih interpretacija:

– prvih k% članova niza ima vrijednost manju ili jednaku P
k
,
– (100 – k)% članova niza ima vrijednost veću ili jednaku P
k
.

Nerijetko se (opet približno točno i matematički neprecizno) kaže i da k – ti percentil P
k

odvaja k% najmanjih članova niza, odnosno (100 – k)% najvećih članova niza.




81
U matematičkoj je statistici slučajna varijabla bilo koja realna funkcija čije je područje definicije određeni
vjerojatnosni prostor. Ovdje je spominjemo isključivo u kontekstu definiranja kvantila.
82
Upravo navedenu formulu koristi MS Excel prigodom izračuna vrijednosti pojedinih percentila.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 87

Primjer 5. Prikupljanjem podataka o navršenim godinama radnoga staža za ukupno 60
zaposlenika tvrtke ''Mućkalić – commerce d.o.o'' iz Klokočevca i odgovarajućim izračunom
dobivena je vrijednost

P
5
= 7.25

Dobivenu vrijednost možemo interpretirati na jedan od sljedećih dvaju načina:

– 5% promatranih zaposlenika ima najviše 7.25 godina navršenoga radnoga staža;
– 95% promatranih zaposlenika ima barem 7.25 godina navršenoga radnoga staža.

Budući da znamo ukupan broj zaposlenih (60), navedene interpretacije zapravo znače da:

- približno 3 zaposlenika promatrane tvrtke imaju najviše 7 godina navršenoga radnoga
staža;
- približno 57 zaposlenika ima barem 8 godina navršenoga radnoga staža.

Odmah istaknimo da ovdje prilog ''približno'' ne znači da npr. točno 3.14 zaposlenika ima
najviše 7 godina navršenoga staža (pa smo taj broj zaokružili na najbliži cijeli broj). Greška je
bitno veća: moguće je da točno 2 zaposlenika ili točno 4 zaposlenika promatrane tvrtke imaju
najviše 7 godina navršenoga radnoga staža. Zbog toga je u ovakvim interpretacijama bolje
izbjegavati navođenje konkretnih apsolutnih frekvencija.

Primjer 6. Prikupljanjem podataka o visinama (iskazanima kao cijeli broj cm) za ukupno 30
učenika 8.a razreda Osnovne škole ''Štefica Šniclek'' iz Careva Sela i odgovarajućim
izračunom dobivena je vrijednost

P
30
= 170.66

Dobivenu vrijednost možemo interpretirati na jedan od sljedećih dvaju načina:
– 30% promatranih učenika visoko je najviše 170.66 cm;
– 70% promatranih zaposlenika visoko je barem 170.66 cm.

U ovom je slučaju obilježje ''visina'' kvantitativno diskretno obilježje (jer zanemarujemo
milimetre, mikrometre itd.), pa navedene interpretacije možemo preformulirati ovako:

– 30% promatranih učenika visoko je najviše 170 cm;
– 70% promatranih zaposlenika visoko je barem 171 cm.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 88

Kao i u Primjeru 5., budući da znamo ukupan broj učenika, navedene interpretacije zapravo
znače da je približno 9 promatranih učenika visoko najviše 170 cm, dok visina svakoga od
preostalih 21 učenika iznosi barem 171 cm. Međutim, moguće je i da točno 10 promatranih
učenika bude visoko najviše 170 cm, pa je opet primjerenije izostaviti interpretaciju s
apsolutnim frekvencijama.

U praksi se vrlo često koriste dvije posebne vrste percentila: decili i kvartili. Decili su
vrijednosti koje uređeni niz modaliteta dijele na 10 jednakobrojnih dijelova. Ima ih ukupno
10 – 1 = 9 i označavaju se s D
1
, D
2
, …, D
9
. Nije teško vidjeti da za svaki i = 1, 2, …, 8, 9
vrijedi jednakost

D
i
= P
10 ⋅ i

koja, zapravo, tvrdi da je i – ti decil identički jednak (10 ⋅ i) – tom percentilu. Ovo vrlo
korisno svojstvo omogućuje da se interpretacija svakoga decila poistovjeti s interpretacijom
njemu odgovarajućega percentila.

Primjer 7. Prikupljanjem podataka o ostvarenom uspjehu (1 – nedovoljan, 2 – dovoljan, …, 5
– izvrstan) svih studenata 1. godine stručnoga studija računovodstva i financija Veleučilišta u
Špičkovini akademske godine 2006/2007. koji su kolegij Poslovna statistika polagali putem
dvaju kolokvija i odgovarajućim izračunom dobivena je vrijednost

D
4
= 1.25

Riječ je o 4. decilu, a toj vrijednosti odgovara 10 ⋅ 4 = 40. percentil. Stoga dobivenu
vrijednost možemo teorijski interpretirati na jedan od sljedećih dvaju načina:

– 40% promatranih studenata dobilo je ocjenu najviše 1.25;
– 60% promatranih studenata dobilo je ocjenu barem 1.25.

Budući da da dobivanje ocjene 1 znači da kolokviji nisu položeni, navedene interpretacije
možemo preformulirati u sljedeće:

– 40% promatranih studenata nije položilo kolegij Poslovna statistika putem kolokvija;
– 60% promatranih studenata je položilo kolegij Poslovna statistika putem kolokvija.

Primjer 8. Prikupljanjem podataka o stupnju stručne spreme (uz uobičajeno rangiranje
stupnjeva stručnih sprema) za svakoga zaposlenika tvrtke ''Pijetlović d.o.o.'' i odgovarajućim
izračunom dobivena je vrijednost


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 89

D
8
= VŠS.

Riječ je o 8. decilu, a toj vrijednosti odgovara 10 ⋅ 8 = 80. percentil. Stoga dobivenu
vrijednost možemo teorijski interpretirati na jedan od sljedećih dvaju načina:

– 80% promatranih zaposlenika ima višu stručnu spremu ili stručnu spremu manju od
više stručne spreme;
– 20% promatranih zaposlenika ima višu stručnu spremu ili stručnu spremu veću od više
stručne spreme.

Budući da je jedino visoka stručna sprema veća od više stručne spreme, drugu interpretaciju
možemo pojednostavniti ovako: 20% promatranih zaposlenika ima višu ili visoku stručnu
spremu. U ovom je slučaju ta interpretacija jednostavnija i razumljivija od prve.

Uočimo da se u Primjerima 3. i 4. radilo o određivanju percentila za niz modaliteta
kvalitativnoga redosljednoga obilježja.

Još jedna od spomenutih posebnih vrsta percentila su kvartili. Kvartili su položajne
vrijednosti koje uređeni numerički niz dijele na ukupno 4 jednakobrojna dijela. Ima ih ukupno
4 – 1 = 3, a imaju svoja posebna imena i oznake:

– prvi ili donji kvartil (oznaka: Q
1
);
– drugi kvartil ili medijan (oznake: Q
2
, M
e
);
– treći ili gornji kvartil (oznaka: Q
3
)

Nije teško vidjeti da za svaki i = 1, 2, 3 vrijedi jednakost

Q
i
= P
25 ⋅ i

koja, zapravo, tvrdi da je i – ti kvartil identički jednak (25 ⋅ i) – tom percentilu. Ovo vrlo
korisno svojstvo omogućuje da se interpretacija svakoga kvartila poistovjeti s interpretacijom
njemu odgovarajućega percentila. Istaknimo da se u slučajevima u kojima, zbog postojanja
ekstremno malih ili ekstremno velikih vrijednosti, aritmetička sredina nije reprezentativan
pokazatelj statističkoga niza kao ''zamjenski'' pokazatelji rabe upravo kvartili, a poglavito
medijan.

Primjer 9. Zadan je uređeni niz prosječnih mjesečnih plaća (iskazanima u kn) svih stalno
zaposlenih djelatnika poduzeća "Schwindl–trade d.o.o." iz Šuplje Lipe u razdoblju od
01.01.2007. – 31.12.2007.:


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 90

1.852,95; 1.884,76; 2.248,62; 2.417,25; 2.646,27; 2.718,12; 2.947,83; 3.085,45; 3.090,31;
50.000,64; 60.000,75

Odgovarajućim izračunima se dobiva:

– prvi ili donji kvartil: Q
1
= 2.332,935;
– medijan: Q
2
= 2.718,12;
– treći ili gornji kvartil: Q
3
= 3.087,88;
– jednostavna aritmetička sredina: X = 12.081,18 (kn)

Te vrijednosti možemo redom interpretirati na sljedeći način:

– 25% promatranih djelatnika ima prosječnu mjesečnu plaću manju od 2.332,94 kn;
– 50% promatranih djelatnika ima prosječnu mjesečnu plaću najviše 2.718,12 kn;
– 25% promatranih djelatnika ima prosječnu mjesečnu plaću veću od 3.087,88 kn;
– Prosječna mjesečna plaća svakoga djelatnika navedene tvrtke iznosi 12.081,18 kn.

Iz zadanoga uređenoga niza lako možemo vidjeti da točno 6 promatranih djelatnika ima
prosječnu mjesečnu plaću najviše 2.718,12 kn, dok 6 promatranih djelatnika ima prosječnu
mjesečnu plaću barem 2.718,12 kn. (1 djelatnik pripada objema kategorijama.) To znači da je
iznos 2.718,12 točno rješenje Problema 1. za navedeni niz plaća jer uistinu dijeli niz na dva
jednakobrojna dijela:

(1.852,95; 1.884,76; 2.248,62; 2.417,25; 2.646,27; 2.718,12) i (2.718,12; 2.947,83; 3.085,45;
3.090,31; 50.000,64; 60.000,75).

I sva tri kvartila su točno rješenje Problema 1. za navedeni niz plaća jer uistinu dijele niz na
četiri jednakobrojna dijela:

(1.852,95; 1.884,76; 2.248,62), (2.417,25; 2.646,27; 2.718,12), (2.718,12; 2.947,83; 3.085,45)
i (3.090,31; 50.000,64; 60.000,75).

Zbog postojanja ekstremno velikih vrijednosti (50.000,64 i 60.000,75) u navedenom nizu
plaća, očito je da su u ovom slučaju sva tri kvartila bitno reprezentativnije vrijednosti od
aritmetičke sredine. Stoga je u statističkoj analizi takvih nizova, kad god je to moguće,
primjerenije odrediti barem jedan kvartil (poželjno: sva tri), negoli aritmetičku sredinu.

Svi percentili, pa posebno i sva tri kvartila, mogu se određivati iz negrupiranih i grupiranih
podataka. Određivanje pomoću grupiranih podataka zasniva se deskriptivnom analogonu


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 91

funkcije distribucije, a to je kumulativni niz ''manje od'' kojega smo već upoznali. Na primjeru
ćemo pokazati kako se iz grupiranih podataka određuje medijan.

Može se dogoditi da kod parnoga broja elemenata niza prvi središnji element pripada jednoj, a
drugi središnji element drugoj frekvenciji kumulativnoga niza. U tom slučaju medijan
predstavlja aritmetičku sredinu dviju njima odgovarajućih vrijednosti diskretnoga obilježja.

Primjer 10. Zadana je razdioba svih studenata 1. godine studija smjehologije na Višoj
uzaludnoj školi u Špičkovini (akademska godina 2007/2008.) prema broju položenih
jednosemestralnih kolegija
83
:


broj položenih jednosemestralnih kolegija broj studenata
0 7
1 12
2 17
3 25
4 21
5 18
ukupno: 100
izvor: studentska služba Više uzaludne škole u Špičkovini

Odredimo medijan ovako grupiranoga niza podataka i objasnimo dobiveni rezultat. Na ranije
opisani način formiramo kumulativni niz apsolutnih frekvencija ''manje od'':

broj položenih jednosemestralnih
kolegija (x
i
)
broj studenata
(f
i
)
kumulativni niz apsolutnih
frekvencija "manje od"
0 7 7
1 12 19
2 17 36
3 25 61
4 21 82
5 18 100
ukupno: 100
Promatrani statistički niz je već uređen uzlazno. On ima ukupno 100 članova. Stoga se
njegovi središnji članovi nalaze na mjestima
100
2
i
100
2
+ 1, tj. na 50. i 51. mjestu. Iz stupca u


83
Usporediti s Primjer 2., točka 3.1.1. Aritmetička sredina.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 92

kojemu su navedene kumulativne frekvencije ''očitavamo'' da su na mjestima 37., 38., 39., …,
49., 50., 51., 52., …, 59., 60. i 61. uređenoga niza napisane ''trojke''. Prema tome, x
50
= x
51
=
= 3, pa je medijan jednak 3, što bi značilo da je 50% studenata položilo najviše 3 ispita, a
50% studenata položilo je najmanje 3 ispita. Ta je interpretacija potpuno točna: na prvih 50
mjesta imamo najprije 7 nula, pa 12 jedinica, pa 17 dvojki i 14 trojki, dok na preostalih 50
mjesta imamo 11 trojki, 21 četvorku i 18 petica.

Na sličan se način iz grupiranih podataka određuju i preostala dva kvartila. Detalje, kao i
način određivanja kvartila iz podataka grupiranih u razrede ovdje izostavljamo.

Na kraju ove točke dajemo pregled najvažnijih svojstava medijana kao svojevrsnoj položajnoj
alternativi aritmetičke sredine:

Svojstvo 1. (jedinstvenost medijana) U svakoj razdiobi prema kvantitativnomu ili
kvalitativnom redosljednom obilježju postoji točno jedan medijan.
Svojstvo 2. Medijan se nalazi između najmanje i najveće vrijednosti obilježja u razdiobi.
Svojstvo 3. Na vrijednost medijana ne utječu ekstremne vrijednosti obilježja u razdiobi.
Svojstvo 4. Medijan se bez teškoća može odrediti i u razdiobama kod kojih se pojavljuju
otvoreni razredi (osim ako je razred kojem pripada medijan otvoren).
Svojstvo 5. Medijan je srednja vrijednost osobito primjerena za opis izrazito asimetričnih
razdioba.


3.1.5. Mod


Pri analizi statističkih nizova vrlo često se najprije određuje najčešći modalitet koji se
pojavljuje u nizu (tj. modalitet s najvećom apsolutnom ili relativnom frekvencijom). Takav
modalitet naziva se mod, označava s M
o
i pripada u položajne srednje vijednosti. Već iz same
definicije moda očito je da se on može odrediti neovisno o tipu obilježja, tj. mod je jedina
srednja vrijednost koja se može odrediti i za kvalitativna i za kvantitativna obilježja. Dakako,
nužan uvjet za postojanje moda jest pojavljivanje barem dva jednaka modaliteta u
statističkom nizu.

Oprez: Klasična pogreška prigodom interpretacije modova jest interpretiranje najveće
apsolutne ili relativne frekvencije kao moda pripadnoga osnovnoga skupa. To nije točno:
mod je isključivo najčešći modalitet statističkoga obilježja, a određuje se pomoću najveće
apsolutne ili relativne frekvencije (za negrupirana obilježja ili obilježja grupirana prema
modalitetima).



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 93

Primjer 1. Promatramo skup svih automobila parkiranih u Ratkajevu prolazu 01.04.2008. u
16:30 sati i dijelimo njegove elemente prema obilježju marka automobila. Analizom
dobivenoga osnovnoga skupa utvrdili smo da je mod promatranoga obilježja BMW. Prema
tome, među svim promatranim automobilima ima najviše automobila marke BMW. Iako je
takva interpretacija potpuno točna, ona ne mora dobro opisivati pripadni osnovni skup. Npr.
ako promatrani statistički skup tvore 2 BMW-a, 1 ''Mercedes'', 1 ''Škoda Octavia'', 1 ''Opel
Corsa'', 1 ''Grand Cherokee'', 1 ''Yugo'' i 1 ''Fićo'', onda opis ''Među promatranim
automobilima ima najviše automobila marke BMW'' očito nedovoljno dobro opisuje
''šarolikost'' skupa promatranih automobila. No, ako promatrani statistički skup tvore 6 BMW-
a i dvije ''Opel Corse'', onda navedena interpretacija prilično dobro opisuje taj skup.

Primjer 2. Neto-plaće (iskazane u kn) svih djelatnika knjigovodstvenoga servisa ''Knjiži kod
mene'' iz Košara isplaćene u siječnju ove godine tvore niz 1.800,00; 1.800,00; 1.800,00;
1.800,64; 1.800,64; 1.820,25; 1820,25; 30.000,75. Mod promatranoga niza je 1.800,00, što
znači da je najčešća plaća promatranih djelatnika 1.800,00 kn. Ta vrijednost dobro opisuje
pripadni osnovni skup jer plaće 7 od ukupno 8 djelatnika odstupaju od moda za najviše
1,125%.

Primjer 3. Neto–plaće (iskazane u kn) svih djelatnica knjigovodstvenoga servisa ''Đ. & J.
d.o.o.“ iz Grudnjaka isplaćene u veljači ove godine tvore niz 1.800,00; 1.800,00; 4.928,50;
5.103,75; 5.224,47; 7.842,86; 7.915,92; 10.165,78 i 10.201,54. I u ovome je slučaju mod
promatranoga niza jednak 1.800,00 (interpretacija je ista kao i u Primjeru 2.), no, u ovom
slučaju on loše opisuje pripadni osnovni skup jer plaće 7 od ukupno 9 djelatnika odstupaju od
moda za barem 173,806%.

Jedno od osnovnih svojstava moda je da ne mora nužno biti jedinstven. Naime, može se
dogoditi da barem dva modaliteta imaju jednake apsolutne frekvencije, a da su apsolutne
frekvencije svih ostalih modaliteta strogo manje od njih. Stoga razlikujemo unimodalne
razdiobe (razdiobe koja imaju točno jedan mod), bimodalne razdiobe (razdiobe koja imaju
točno dva moda) i multimodalne razdiobe (razdiobe koje imaju barem tri moda).

Primjer 4. a) Uređeni niz 1, 2, 2, 3, 3, 4, 5 ima točno dva moda: 2 i 3. Stoga je taj niz
bimodalan.
b) Uređeni niz 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5 ima točno tri moda: 1, 2 i 3. Stoga je taj niz
multimodalan.
Uočimo da modovi dobro opisuju oba navedena niza jer je u svakom od njih više od polovice
elemenata niza jednako nekomu od modova.

Kao i sve ostale srednje vrijednosti, i modovi se mogu određivati iz negrupiranih i grupiranih
podataka, ali i iz grafičkih prikaza razdioba, poglavito Paretova grafikona koji kao prvu


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 94

kategoriju na osi Ox navodi upravo modalnu vrijednost. Iako se ova vrijednost vjerojatno
određuje najjednostavnije od svih srednjih vrijednosti, treba istaknuti da su slučajevi u kojima
mod dobro opisuje pripadni osnovni skup relativno rijetki. Također, jedan od ozbiljnijih
nedostataka većine računalnih statističkih potpora (npr. MS Excel) je nemogućnost ''ispisa''
svih modova pojedine razdiobe. Ukoliko uopće postoji mogućnost određivanja moda
primjenom neke funkcije, njezina izlazna vrijednost je prvi mod po veličini, tj. najmanji ili
najveći mod, pa time zapravo gubimo mogućnost utvrđivanja je li neki statistički niz
unimodalan, bimodalan ili multimodalan.

Sve navedeno samo potvrđuje da problem opisa osnovnoga skupa ili statističkoga niza
pomoću bilo koje od potpunih ili položajnih vrijednosti nije nimalo trivijalan i da obavezno
zahtijeva dodatnu statističku analizu reprezentativnosti određenih vrijednosti. O nekim
pokazateljima reprezentativnosti govorimo u sljedećoj točki.


3.2. Mjere raspršenja (disperzije)


Izračun neke od potpunih ili položajnih srednjih vrijednosti predstavlja tek jedan korak u
statističkoj analizi nekoga obilježja. Sljedeći je korak analiza reprezentativnosti izračunate
srednje vrijednosti, odnosno, pojednostavljeno rečeno, određivanje pokazatelja koliko
izračunata srednja vrijednost dobro opisuje elemente osnovnoga skupa. Ti pokazatelji gotovo
su jednako važni kao i izračunate srednje vrijednosti. Ilustrirajmo to na primjeru.

Primjer 1. Tvrtka ''Super Silva d.o.o.'' iz Duhova zapošljava ukupno 10 stalno zaposlenih
djelatnika. Troje djelatnika ima prosječnu mjesečnu neto–plaću 7.800,00 kn, četvero
prosječnu mjesečnu neto-plaću 8.000,00 kn, a troje prosječnu mjesečnu neto–plaću 8.200,00
kn. Stoga prosječna mjesečna neto–plaća po zaposleniku u toj tvrtki iznosi 8.000,00 kn.
Tvrtka ''Super Silvio d.o.o.'' iz Duhića također zapošljava ukupno 10 stalno zaposlenih
djelatnika. 9 djelatnika ima prosječnu mjesečnu neto–plaću 3.000,00 kn, a jedan djelatnik
prosječnu mjesečnu neto–plaću 53.000,00 kn. Prosječna mjesečna neto–plaća po zaposleniku
u promatranoj tvrtki također iznosi 8.000,00 kn.
Isključivo na temelju izračunatih prosječnih mjesečnih neto–plaća, tj. bez poznavanja
originalnih podataka o prosječnim mjesečnim neto–plaćama nameće se zaključak da među
promatranim tvrtkama nema razlika u modalitetima obilježja ''prosječna mjesečna plaća'', što
je očito netočno.

Kako bi se moglo što bolje opisati stupanj varijabilnosti statističkih podataka, definiraju se
odgovarajući statistički pokazatelji pod zajedničkim imenom mjere raspršenja (stupnja
varijabilnosti; disperzije). Mjere raspršenja općenito mogu biti apsolutne i relativne.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 95

Apsolutne mjere raspršenja su raspon varijacije, interkvartil, interpercentilni razmak, srednje
apsolutno odstupanje i varijanca (odnosno, iz nje izvedena standardna devijacija).
Zajedničko obilježje svih navedenih mjera jest iskazivanje u jedinicama mjere obilježja
statističkog skupa (kn, €, kg, cm itd.)

Relativne mjere raspršenja obično se izražavaju u postocima, a dvije najčešće su koeficijent
kvartilne devijacije i koeficijent varijacije.

Odmah napomenimo da izbor mjere raspršenja u pravilu ovisi o mjernim svojstvima
statističkih varijabli, tj. ne postoji ''univerzalna'' mjera raspršenja koja bi se mogla primijeniti
u svim slučajevima. Ukoliko je promatrano obilježje kvantitativno, primjereno je izračunati i
interpretirati sve navedene mjere. Ukoliko je promatrano obilježje kvalitativno redosljedno, za
analizu raspršenja mogu se koristiti raspon varijacije, interkvartil i koeficijent kvartilne
devijacije. Grubu sliku (''prvi dojam'') o raspršenosti podataka u osnovnom skupu zorno može
predočiti i odgovarajući grafikon, a riječ je o dijagramu rasipanja ili dijagramu raspršenja
spomenutom u 2. poglavlju.

Navedene mjere raspršenja, dakle, shvaćamo kao svojevrsne mjere reprezentativnosti srednjih
vrijednosti. Manja mjera raspršenja znači bolju reprezentativnost srednje vrijednosti i
obrnuto
84
. Pomoću mjera raspršenja uspoređuju se razlike u varijablitetu barem dviju
razdioba, pri čemu vrijede sljedeća praktična pravila:

Pravilo 1. Ukoliko se radi o razdiobama prema istim obilježjima (s istom skalom modaliteta),
za usporedbu varijabiliteta koriste se apsolutne mjere raspršenja.

Pravilo 2. Ako se radi o razdiobama različitih obilježja ili istih obilježja s različitim skalama
modaliteta, za usporedbu varijabliteta koriste se relativne mjere raspršenja.

U nastavku se podrobnije opisuje svaka pojedina mjera raspršenja.


3.2.1. Raspon varijacije


Raspon varijacije (oznaka: R) je najjednostavnija mjera raspršenja definirana kao razlika
između najveće (M) i najmanje (m) vrijednosti kvantitativnoga (ili, eventualno, kvalitativnoga
redosljednoga) obilježja. Dakle,



84
Grubo možemo reći da su te dvije veličine obrnuto razmjerne, premda to matematički nije točno.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 96

R = M – m.


Najmanja moguća vrijednost raspona varijacije jednaka je nuli i nastupa u slučajevima kad je
odgovarajući niz vrijednosti kvantitativnoga obilježja konstantan. Najveća vrijednost raspona
varijacije ne može se općenito odrediti.

Primjer 2. Navršene godine radnoga staža svih 10 zaposlenika tvrtke ''Super Silva d.o.o.''
tvore niz: 20, 12, 7, 29, 32, 10, 18, 16, 8, 17. Najveća vrijednost u tome nizu je M = 32, a
najmanja m = 7. Stoga je raspon varijacije vrijednosti promatranoga obilježja

R = M – m = 32 – 7 = 25 (godina).

Primjer 3. Prosječne mjesečne neto–plaće (iskazane u kn) u razdoblju od 01.01.2008. do
31.03.2008. svih 6 zaposlenika knjigovodstvenoga servisa ''Knjiži kod mene'' iz Košara na dan
01.04.2008. tvore niz 2.528,42; 2.527,75; 25.000,64; 2.584,12; 2.598,02; 2.576,25. Najveća
vrijednost u tome nizu je M = 25.000,64, a najmanja m = 2.527,75. Stoga je raspon varijacije
promatranoga obilježja

R = M – m = 25.000,64 – 2.527,75 = 22.472,89 (kn).

Primjer 4. Zadana je razdioba svih nezaposlenih državljana Republike Ljenčarije u veljači
2008. godine prema navršenim godinama starosti:

navršene godine starosti broj nezaposlenih [000]
15 – 24 25,2
25 – 49 75,8
50 – 64 19,2
≥ 65 0,6
izvor: Mjesečno statističko izvješće Državnoga zavoda za statistiku Republike Ljenčarije, ožujak 2008.

Da bismo mogli odrediti raspon varijacije ovoga obilježja, za najmanju vrijednost (m)
uzimamo donju granicu prvoga razreda, a za najveću (M) gornju granicu posljednjega
razreda. Uočimo da je posljednji razred otvoren, pa njegovu gornju granicu moramo
procijeniti sami. Uzmemo li da je procijenjena gornja granica posljednjega razreda 70, slijedi
da je M = 70 i m = 15, pa je procijenjeni raspon varijacije promatranoga obilježja

R = M – m = 70 – 15 = 55 (godina).

Osnovna prednost raspona varijacije u praktičnoj primjeni je jednostavnost njegova izračuna,
odnosno interpretacije. Njegov osnovni nedostatak je korištenje točno dvaju elemenata


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 97

osnovnoga skupa (u slučaju negrupiranih podataka) ili razdiobe (u slučaju grupiranih
podataka) u njegovu izračunu. Stoga ga, kao reprezentativnu mjeru raspršenja, ima smisla
primijeniti u slučajevima kad promatrani niz podataka ne sadrži ekstremno velike ili
ekstremno male vrijednosti jer je u suprotnim slučajevima vrlo nepouzdan (npr. u Primjeru 3.
bi se moglo pogrešno zaključiti da promatrane prosječne mjesečne plaće jako variraju jer
odgovarajući niz sadrži ekstremno veliku vrijednost 25.000,64). Još općenitije govoreći,
raspon varijacije može se iskoristiti za ''grubi'' opis osnovnoga skupa ili statističkoga niza, ali
nije dovoljno precizna mjera za daljnju detaljnu analizu tih objekata.


3.2.2. Interkvartil


Interkvartil (oznaka: I
q
) je apsolutna mjera raspršenja definirana kao raspon varijacije
središnjih 50% elemenata uređenoga niza (kvantitativnih ili kvalitativnih redosljednih)
statističkih podataka. Ekvivalentno rečeno, interkvartil je, zapravo, jednak razlici trećega
(gornjega) i prvoga (donjega) kvartila:

I
q
= Q
3
– Q
1
.

Primjer 5. Prvi (donji) kvartil niza navršenih godina radnoga staža iz Primjera 2. jednak je
Q
1
= 10.5 (godina), a treći (gornji) kvartil istoga niza Q
3
= 19.5. Odatle slijedi da je
interkvartil jednak

I
q
= Q
3
– Q
1
= 19,5 – 10,5 = 9 (godina).

Dakle, raspon varijacije središnjih 50% navršenih godina radnoga staža iznosi 9 godina. Iz
dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima manje od 10,5 godina
radnoga staža, 25% promatranih zaposlenika ima više od 19,5 godina radnoga staža, a
navršene godine radnoga staža preostalih 50% promatranih zaposlenika su u rasponu od 9
godina.

Primjer 6. Prvi (donji) kvartil niza prosječnih mjesečnih neto–plaća iz Primjera 3. jednak je
Q
1
= 2.540,38 (kn), a treći (gornji) kvartil istoga niza Q
3
= 2.594,55 (kn). Odatle slijedi da je
interkvartil jednak

I
q
= Q
3
– Q
1
= 2.594,55 – 2.540,38 = 54,17 (kn).

Dakle, raspon varijacije središnjih 50% prosječnih mjesečnih neto–plaća iznosi 54,17 kn. Iz
dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima prosječnu mjesečnu neto–


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 98

plaću manju od 2.540,38 kn, 25% promatranih zaposlenika ima prosječnu mjesečnu neto–
plaću veću od 2.594,55 kn, a preostalih 50% promatranih zaposlenika ima prosječnu mjesečnu
neto–plaću u rasponu od 54,17 kn.
Osnovna prednost interkvartila u odnosu na raspon varijacije je zanemarivanje ekstremno
malih ili ekstremno velikih vrijednosti u statističkom nizu, čime se dobiva točniji opis većine
elemenata niza. No, kao i za raspon varijacije, za izračun interkvartila koriste se točno dvije
položajne vrijednosti u statističkom nizu, pa u izračunu interkvartila ne sudjeluju svi elementi
niza. Zbog toga se ta mjera raspršenja smatra nepotpunom.


3.2.3. Interpercentilni razmak


Interkvartil je poseban slučaj tzv. interpercentila. Za bilo koja dva prirodna broja k, l ∈ N
takva da vrijedi nejednakost 0 < k ≤ l < 100 interpercentil je razlika l – toga i k – toga
percentila:

l k
P P
I

= P
l
– P
k
.

Prema definiciji percentila vrijedi ekvivalencija

(k ≤ l ) ⇔ (P
k
≤ P
l
),

pa je bilo koji interpercentil uvijek nenegativan realan broj. Obično se interpretira kao raspon
varijacije središnjih
85
(l – k)% elemenata uređenoga statističkoga niza. Posebno, za k = 25 i
l = 75 dobivamo interkvartil, a ako su oba broja k i l djeljiva s 10, dobivamo tzv. interdecilni
razmak (razlika bilo kojih dvaju decila). Praktično se brojevi k i l obično biraju tako da vrijedi
jednakost

k + l = 100

jer se na taj način ''odvaja'' jednak postotak ''najlošijih'' i ''najboljih'' elemenata niza.



85
Izraz središnjih posljedica je činjenice da percentili P
k
i P
l
, zanemarujući ostalih 97 percentila, dijele uređeni
statistički niz na 3, općenito nejednaka, dijela: prvi (''donji'') dio tvori k% podataka manji ili jednak P
k
, drugi
(''središnji'') dio tvore podaci smješteni između P
k
i P
l
, a treći (''gornji'') dio tvori (100 – l)% podataka većih ili
jednakih P
l
.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 99

Primjer 7. U tvrtki ''Kamen Stečaj d.d.'' iz Brckovljana 10% svih zaposlenika ima prosječnu
mjesečnu neto–plaću manju od 1.900,00 kn, dok drugih 10% svih zaposlenika ima prosječnu
mjesečnu neto–plaću veću od 2.200,00 kn. Iz interpretacije navedenih vrijednosti slijedi:

P
10
= 1.900,00 i P
90
= 2.200,00,

pa je odgovarajući interpercentilni razmak

90 10
P P
I

= P
90
– P
10
= 2.200,00 – 1.900,00 = 300,00 (kn).

Dakle, raspon varijacije središnjih 90% – 10% = 80% prosječnih mjesečnih neto–plaća iznosi
300,00 kn. Primijetimo da je taj raspon ujedno i razlika 9. i 1. decila.

Primjer 8. U zaštitarskoj tvrtki ''Orlović d.o.o'' iz Donje Vrbe 15% svih zaposlenika nije više
od 185 cm, a 15% svih zaposlenika nije niže od 197 cm. Iz interpretacije navedenih percentila
slijedi
P
15
= 185 i P
85
= 197,

pa je odgovarajući interpercentilni razmak

85 15
P P
I

= P
85
– P
15
= 197 – 185 = 12 (cm).

Dakle, raspon varijacije središnjih 85% – 15% = 70% visina iznosi 12 cm.

Osnovna prednost interpercentila u odnosu na raspon varijacije je zanemarivanje obično
jednakoga postotka ekstremno malih i ekstremno velikih vrijednosti u statističkom nizu, čime
se dobiva točniji opis većine elemenata niza. No, kao i za raspon varijacije, za izračun
interpercentila koriste se točno dvije položajne vrijednosti u statističkom nizu, pa u njegovu
izračunu ne sudjeluju svi elementi niza. Zbog toga se ta mjera raspršenja smatra nepotpunom.


3.2.4. Varijanca i standardna devijacija


Varijanca i iz nje izvedena standardna devijacija obično se svrstava u red najvažnijih
pokazatelja varijabiliteta ili raspršenosti modaliteta kvantitativnih obilježja. Osnovni razlog je
činjenica da da je zbroj odstupanja svih vrijednosti kvantitativnoga obilježja od njihove
aritmetičke sredine uvijek jednak nuli, pa taj pokazatelj ne možemo koristiti za opis
varijabiliteta statističkoga niza. Drugi je razlog tome što u izračunu varijance, a samim tim i


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 100

standardne devijacije, koristimo sve elemente statističkoga niza, pa je možemo kategorizirati
kao potpunu mjerom raspršenja. Drugim riječima, varijanca i standardna devijacija mogu se
računati i iz ''sirovih'' (negrupiranih ili neuređenih) i iz grupiranih podataka.

Varijanca (oznaka: σ
2
(grčko slovo σ čitajte: sigma)) se definira kao aritmetička sredina
kvadrata odstupanja vrijednosti kvantitativnoga obilježja od aritmetičke sredine svih
vrijednosti. Nerijetko se varijanca – matematički netočno, ali intuitivno prihvatljivije –
definira kao prosječno kvadratno odstupanje vrijednosti kvantitativnoga obilježja od
aritmetičke sredine tih vrijednosti. Sukladno takvoj definiciji, formule za izračun varijance su:

a) za niz negrupiranih podataka x
1
, x
2
, …, x
n
čija je aritmetička sredina x :

( )
2
2
1
n
i
i
x x
n
σ
=

=

ili, ekvivalentno,
2
2
2
1
n
i
i
x
x
n
σ
=
= −

,

b) za podatke čija je aritmetička sredina x grupirane prema točno k različitih modaliteta tako
da za svaki i = 1, 2, …, k modalitet x
i
ima apsolutnu ili relativnu frekvenciju f
i
:

( )
2
2 1
1
k
i i
i
k
i
i
f x x
f
σ
=
=
⋅ −
=


ili, ekvivalentno,
2
2
2 1
1
k
i i
i
k
i
i
f x
x
f
σ
=
=

= −




c) za podatke grupirane u točno k razreda takvih da je za svaki i = 1, 2, …, k x
i
razredna
sredina, f
i
odgovarajuća apsolutna ili relativna frekvencija, a x aritmetička sredina svih
podataka:

( )
2
2 1
1
k
i i
i
k
i
i
f x x
f
σ
=
=
⋅ −
=


ili, ekvivalentno,
2
2
2 1
1
k
i i
i
k
i
i
f x
x
f
σ
=
=

= −


.

Primijetimo da je varijanca jednaka nuli ako i samo ako je pripadni statistički niz konstantan,
tj. ako postoji realan broj c ∈ R takav da za svaki k = 1, 2, …, n vrijedi x
k
= c. U tom je


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 101

slučaju i aritmetička sredina jednaka broju c. No, što promatrani niz sadrži više međusobno
različitih članova, tj. što je veći stupanj varijabilnosti niza, to su veća i odstupanja pojedinih
modaliteta kvantitativnoga obilježja od njihove aritmetičke sredine. Stoga možemo zaključiti
da je varijanca upravno razmjerna stupnju raspršenja statističkoga niza.

Budući je varijanca ''kvadratna'' mjera raspršenja, relativno teško ju je interpretirati. Pomoću
drugoga korijena iz varijance dolazimo do praktično najprimjenjenije potpune mjere
raspršenja: standardne devijacije. Standardna devijacija (oznaka: σ) je, po definiciji, drugi
korijen iz varijance. Takva formalna definicija obično se zamjenjuje matematički netočnom,
ali intuitivno prihvatljivijom definicijom prema kojoj je standardna devijacija prosječno
odstupanje vrijednosti kvantitativnoga obilježja od aritmetičke sredine tih vrijednosti ili, još
kraće i još nepreciznije, prosječno odstupanje od prosjeka. Istaknimo da je ''mjerna jedinica''
za standardnu devijaciju jednaka ''mjernoj jedinici'' odgovarajućega kvantitativnoga obilježja
(kn, €, kg, cm itd.).

Radi potpunosti, navodimo formule za izračun standardne devijacije:

a) za negrupirane podatke:

( )
2
1
n
i
i
x x
n
σ
=

=

ili
2
2
1
n
i
i
x
x
n
σ
=
= −



b) za podatke grupirane prema modalitetima ili u razrede:

( )
2
1
1
k
i i
i
k
i
i
f x x
f
σ
=
=
⋅ −
=


ili
2
2 1
1
k
i i
i
k
i
i
f x
x
f
σ
=
=

= −





Primjer 9. Odredimo varijancu i standardnu devijaciju niza navršenih godina radnoga staža iz
Primjera 2. Aritmetička sredina vrijednosti toga obilježja jednaka je:

20 12 7 29 32 10 18 16 8 17
16.9
10
x
+ + + + + + + + +
= = (godina),



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 102

pa je varijanca tih podataka:

10
2
2
2 1
2 2 2 2 2 2 2 2 2 2
2 2
2
10
20 12 7 29 32 10 18 16 8 17
16.9
10
63.49
i
i
x
x σ
σ
σ
=
= − =
+ + + + + + + + +
= −
=



Odavde slijedi da je standardna devijacija jednaka

2
63.49 σ σ = = =7.968 ≈ 8 godina.

Možemo, dakle, reći da je prosječno odstupanje pojedinačnih navršenih godina radnoga
staža od njihove aritmetičke sredine približno 8 godina.

Primjer 10. Promatramo statistički skup svih stanova u onim stambenim zgradama
(novogradnja i dogradnja) koje su 2006. godine dobile građevinsku dozvolu u Republici
Hrvatskoj. Promatrani skup dijelimo prema broju soba u stanu:

broj soba
(x
i
)
broj stanova
(f
i
)
1 3 256
2 7 428
3 7 244
4 4 414
5 1 794
6 997
7 266
8 118
ukupno: 25 517
izvor: Statistički ljetopis Republike Hrvatske za 2006. godinu,
Državni zavod za statistiku, 2007.

Odredimo prosječan broj soba po jednom stanu, te varijancu i standardnu devijaciju broja
soba. Prosječan broj soba po jednom stanu je vagana aritmetička sredina promatrane razdiobe:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 103

8
1
8
1
3256 1 7428 2 7244 3 4414 4 1794 5 997 6 266 7 118 8
25517
2.949
i i
i
i
i
f x
x
f
x
=
=
⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
= =
=




Dakle, prosječan broj soba po jednom stanu iznosi približno 3. Varijanca broja soba jednaka
je:

8
2
2
2 1
8
1
2 2 2 2
2
2 2 2 2
2
2
3256 1 7428 2 7244 3 4414 4
25517
1794 5 997 6 266 7 118 8
2.949328
25517
1.887192
i i
i
i
i
f x
x
f
σ
σ
σ
=
=

= −
⋅ + ⋅ + ⋅ + ⋅
= +
⋅ + ⋅ + ⋅ + ⋅
+ −
=




otkuda slijedi da je odgovarajuća standardna devijacija broja soba

2
1.887192 1.373751 σ σ = = = .

Dakle, možemo reći da prosječno odstupanje pojedinačnih brojeva soba od njihove
aritmetičke sredine iznosi približno 1,374.

Primjer 11. U donjoj je tablici prikazana razdioba svih počinitelja kaznenih djela u Republici
Hrvatskoj osuđenih na bezuvjetni zatvor u 2006. godini prema trajanju zatvorske kazne:











ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 104

trajanje kazne
[godina]
broj
počinitelja
0 – 1 2 535
1 – 2 658
2 – 3 232
3 – 5 164
5 – 10 102
10 – 15 29
15 11
20 3
20 – 40 8
ukupno: 3 742
izvor: Statistički ljetopis Republike Hrvatske za 2006. godinu,
Državni zavod za statistiku, 2007.

Odredimo prosječno trajanje kazne po jednom počinitelju, te varijancu i standardnu devijaciju
trajanja kazni. U tablici imamo ukupno 7 pravih razreda i dva modaliteta koja nisu grupirana
u razrede. Za svaki pojedini razred računamo razrednu sredinu, a potom i vaganu aritmetičku
sredinu:

trajanje kazne
[godina]
broj
počinitelja
(f
i
)
razredna
sredina
(x
i
)
f
i
⋅ x
i
f
i

2
i
x
0 – 1 2 535 0.5 1267.5 633.75
1 – 2 658 1.5 987 1480.5
2 – 3 232 2.5 580 1.450
3 – 5 164 4 656 2.624
5 – 10 102 7.5 765 5737.5
10 – 15 29 12.5 362.5 4531.25
15 11 15 165 2.475
20 3 20 60 1.200
20 – 40 8 30 240 7.200
ukupno: 3 742 5083 27.332

Vagana aritmetička sredina jednaka je:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 105

9
1
9
1
5083
1.358365
3742
i i
i
i
i
f x
x
f
=
=
= = =


,

pa prosječno trajanje kazne po jednom počinitelju iznosi približno 1.358365 godina, odnosno
1 godinu 4 mjeseca i 9 dana. Varijanca trajanja kazni iznosi:

9
2
2
2 2 1
9
1
27332
1.358365 5.458961
3742
i i
i
i
i
f x
x
f
σ
=
=

= − = − =


,

otkuda slijedi da je standardna devijacija trajanja kazni

2
5.458961 2.336442 σ σ = = = godina,

tj. prosječno odstupanje pojedinačnih trajanja kazni od njihove aritmetičke sredine iznosi
približno 2.336442 godina, odnosno 2 godine 4 mjeseca i 1 dan. Primijetimo da u
promatranom primjeru nešto više od 85% svih podataka pripada prvim dvama razredima, dok
svi ostali razredi obuhvaćaju nešto manje od 15% svih podataka. Na temelju aritmetičke
sredine i standardne devijacije ne možemo zaključiti npr. da postoji razred 20 – 40 kojemu
pripada 8 elemenata osnovnoga skupa, pa statistička analiza promatranoga obilježja mora
obuhvatiti i izračun dodatnih pokazatelja (npr. koeficijent varijacije o kojemu govorimo u
podtočki 3.2.6.).

3.2.5. Srednje apsolutno odstupanje

Već je istaknuto da je zbroj svih odstupanja pojedinih vrijednosti kvantitativnoga obilježja od
aritmetičke sredine jednak nuli. No, uzmemo li apsolutnu vrijednost svakoga odstupanja
(izračunamo odstupanje i zanemarimo njegov predznak), dobit ćemo nenegativne realne
brojeve. Njihov je zbroj biti jednak nuli ako i samo ako je niz vrijednosti kvantitativnoga
obilježja konstantan, a to općenito ne vrijedi (kvantitativna obilježja imaju najmanje dva
različita modaliteta). Stoga ima smisla definirati srednje apsolutno odstupanje (oznaka:
x
MAD , pri čemu kratica: MAD od engleskih riječi Mean Absolute Deviation) kao prosječno
apsolutno odstupanje od aritmetičke sredine.
x
MAD se izračunava prema sljedećim
formulama:


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 106

a) za niz negrupiranih modaliteta kvantitativnoga obilježja x
1
, x
2
, …, x
n
čija je aritmetička
sredina x :

1 2
1
...
n
n k
x
k
x x x x x x x x
MAD
n n
=
− + − + + − −
= =

;

b) za podatke čija je aritmetička sredina x grupirane prema točno k različitih modaliteta tako
da za svaki i = 1, 2, …, k modalitet x
i
ima apsolutnu ili relativnu frekvenciju f
i
:

1 1 2 2
1
1 2
1
...
...
n
k k
n n
k
n x
n
k
k
f x x
f x x f x x f x x
MAD
f f f
f
=
=
⋅ −
⋅ − + ⋅ − + + ⋅ −
= =
+ + +


;

c) za podatke grupirane u točno k razreda takvih da je za svaki i = 1, 2, …, k x
i
razredna
sredina, f
i
odgovarajuća apsolutna ili relativna frekvencija, a x aritmetička sredina svih
podataka:

1 1 2 2
1
1 2
1
...
...
n
k k
n n
k
n x
n
k
k
f x x
f x x f x x f x x
MAD
f f f
f
=
=
⋅ −
⋅ − + ⋅ − + + ⋅ −
= =
+ + +


.

Primjer 12. Odredimo srednje apsolutno odstupanje od aritmetičke sredine za niz navršenih
godina radnoga staža iz Primjera 2. U Primjeru 9. izračunali smo da je aritmetička sredina
toga niza x = 16.9 (godina), pa je srednje apsolutno odstupanje od aritmetičke sredine:

10
1
20 16.9 12 16.9 7 16.9 29 16.9 32 16.9 10 16.9
10 10
18 16.9 16 16.9 8 16.9 17 16.9
+
10
3.1 4.9 9.9 12.1 15.1 6.9 1.1 0.9 8.9 0.1
10
k
x
k
x
x x
MAD
MAD
=

− + − + − + − + − + −
= = +
− + − + − + −
+ − + − + + + − + + − + − +
=






ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 107

3.1 4.9 9.9 12.1 15.1 6.9 1.1 0.9 8.9 0.1
6.3
10
x
MAD
+ + + + + + + + +
= =

Dakle, prosječno apsolutno odstupanje od aritmetičke sredine iznosi 6.3 godina. Dobivena
vrijednost je strogo manja od standardne devijacije istoga niza (σ ≈ 8 godina).

Primjer 13. Odredimo srednje apsolutno odstupanje za vrijednosti obilježja iz Primjera 11:

trajanje kazne
[godina]
broj
počinitelja
razredna
sredina
(x
i
)
0 – 1 2 535 0.5
1 – 2 658 1.5
2 – 3 232 2.5
3 – 5 164 4
5 – 10 102 7.5
10 – 15 29 12.5
15 11 15
20 3 20
20 – 40 8 30
ukupno: 3 742

U tom smo primjeru izračunali vaganu aritmetičku sredinu:

x = 1.358365 (godina),

pa je traženo srednje apsolutno odstupanje

9
1
9
1
2535 0.5 1.358365 658 1.5 1.358365 232 2.5 1.358365
3742
164 4 1.358365 102 7.5 1.358365 29 12.5 1.358365
3742
k k
k
x
k
k
x
f x x
MAD
f
MAD
=
=
⋅ −
=
⋅ − + ⋅ − + ⋅ −
= +
⋅ − + ⋅ − + ⋅ − +
+





ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 108

11 15 1.358365 3 20 1.358365 8 30 1.358365
3742
1.163
x
MAD
⋅ − + ⋅ − + ⋅ −
+
=


Dakle, prosječno apsolutno odstupanje od aritmetičke sredine iznosi približno 1.63 godina.

Istaknimo da se prosječno apsolutno odstupanje može računati i u odnosu na medijan, pri
čemu su odgovarajuće formule potpuno analogne navedenima (aritmetička sredina se
zamijeni medijanom, a sve ostale veličine ostaju nepromijenjene). Može se pokazati i da je
prosječno apsolutno odstupanje od aritmetičke sredine ili medijana uvijek manje ili jednako
standardnoj devijaciji.

Zaključno istaknimo da dio novijih radova iz statistike preporučuje primjenu srednjih
apsolutnih odstupanja (od aritmetičke sredine ili medijana) umjesto ''tradicionalne'' standardne
devijacije jer je praksa pokazala da pogreške u mjerenju, neidealizirani uvjeti provedbe
slučajnih pokusa ili opažanja općenito itd. imaju manji utjecaj na prosječno apsolutno
odstupanje, nego na standardnu devijaciju. Drugim riječima, sve se više zagovara da se u
statističkoj analizi realnih procesa (koji se odvijaju u realnim, a ne idealnim uvjetima)
primjenjuje prosječno apsolutno odstupanje, tim više što se utvrdilo da primjena takvoga
odstupanja na različite vrste razdioba daje približno jednake ili čak bolje rezultate od
standardne devijacije.


3.2.6. Koeficijent varijacije


Već smo istakli da je standardna devijacija potpuna mjera raspršenja iskazana u jedinicama
promatranoga kvantitativnoga obilježja. Kao takva, standardna devijacija nije prikladna za
usporedbu varijabiliteta najmanje dvaju različitih tipova kvantitativnih obilježja prema
kojima se može podijeliti isti statistički skup. Promatramo li npr. skup svih natjecatelja u
izboru za ovogodišnjeg Mistera Svrzigaća i podijelimo li sve njegove elemente prema
obilježjima masa i visina, onda na temelju standardne devijacije ne možemo reći razlikuju li
se promatrani natjecatelji više prema masi ili prema visini. U takvim se slučajevima obavezno
primjenjuju relativne mjere raspršenja jer one ne ovise o ''mjernim jedinicama'' promatranih
obilježja. Dvije najčešće primjenjivane mjere su koeficijent varijacije i koeficijent kvartilne
devijacije, a koriste se ponajprije za usporedbu varijabiliteta dvaju razdioba.

Koeficijent varijacije (oznaka: V) definira se kao omjer standardne devijacije i aritmetičke
sredine iskazan u postotcima. Slobodno govoreći, možemo reći da je koeficijent varijacije


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 109

zapravo prosječno odstupanje vrijednosti kvantitativnoga obilježja od aritmetičke sredine
iskazano u postotcima. Sukladno netom navedenoj definiciji, koeficijent varijacije neovisno o
tome jesu li podaci grupirani ili nisu računamo prema formuli:

100 V
x
σ
= ⋅ .

Istaknimo da se koeficijent varijacije primijenjuje gotovo isključivo u statističkoj analizi
kvantitativnih obilježja vezanih za ordinalnu skalu (zbog dogovorno definirane nule nije
primjenjiv u obilježjima vezanima za intervalnu skalu). Njegovi osnovni nedostaci su loša
reprezentativnost u slučaju ekstremnih vrijednosti ili otvorenih razreda, te osjetljivost na male
promjene aritmetičke sredine u slučajevima kad je aritmetička sredina vrlo blizu nuli.

Iako ne postoji opći kriterij procjene varijabiliteta prema vrijednostima koeficijenta varijacije,
jedan od najčešće primjenjivanih je kriterij naveden u sljedećoj tablici. Naglasimo i činjenicu
da je najmanja moguća vrijednost koeficijenta varijacije jednaka nuli (i postiže se isključivo
za konstantne nizove podataka), dok najveća vrijednosti općenito nije određena. Praktične
primjene pokazuju da koeficijent varijacije relativno rijetko prelazi 100%.

V [%] varijabilitet
0 – 10 vrlo slab
10 - 30 relativno slab
30 - 50 umjeren
50 - 70 relativno jak
≥ 70 vrlo jak

Primjer 16. Za svih 11 nogometaša prve postave NK ''Akumulator'' iz Babine Grede na dan
01.04.2008. prikupljeni su podaci o masi i prosječnim mjesečnim neto–plaćama. Podaci su
prikazani u donjoj tablici.













ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 110

redni br.
nogometaša
masa
[kg]
prosječna mjesečna
neto–plaća [€]
1 79 1.190,00
2 89 1.195,00
3 82 1.196,00
4 78 1.185,00
5 91 1.183,00
6 84 1.198,00
7 83 1.197,00
8 86 1.191,00
9 90 1.189,00
10 78 1.300,00
11 81 1.400,00

Utvrdimo razlikuju li se promatrani nogometaši više prema masi ili prema prosječnim
mjesečnim neto-plaćama. U nizu masa i nizu prosječnih mjesečnih neto–plaća nema
ekstremno velikih vrijednosti, niti vrijednosti blizu nule, pa koeficijent varijacije obaju
obilježja računamo koristeći formule za jednostavnu aritmetičku sredinu i standardnu
devijaciju za negrupirani niz podataka. Dobiva se:

obilježje aritmetička
sredina
standardna
devijacija
koeficijent
varijacije
masa 83.72727 (kg) 4.51444 (kg) 5.391839%
prosječna neto–plaća 1.220,36 (€) 64,88 (€) 5.316734%

Budući da je koeficijent varijacije masa strogo veći od koeficijenta varijacije prosječnih neto–
plaća, zaključujemo da se promatrani nogometaši više razlikuju prema masama. Uočimo da su
varijabiliteti obaju promatranih obilježja vrlo slabi, pa praktično možemo zaključiti da nema
zamjetnih razlika između varijabiliteta promatranih obilježja.

Primjer 17. Utvrdimo varijabilitet navršenih godina starosti svih nezaposlenih osoba u
Republici Ljenčariji u veljači 2008. godine (Primjer 4. u podtočki 3.1.1.):

navršene godine starosti broj nezaposlenih [000]
15 – 25 25.2
25 – 50 75.8
50 – 65 19.2
65 – (70) 0.6

U navedenom smo primjeru izračunali:


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 111

37.177 x ≈ godina,

pa je standardna devijacija računata iz podataka grupiranih u razrede

σ = 11.48167 godina,

što znači da je koeficijent varijacije promatranoga obilježja

11.48167
100 100
37.17715
V
x
σ
= ⋅ = ⋅ = 30.88%.

U ovome je slučaju, dakle, varijabilitet ''na granici'' relativno slaboga i umjerenoga, a budući
da je aritmetička sredina računata iz grupiranih podataka nepreciznija od aritmetičke sredine
računate iz negrupiranih podataka i (obično) manja od nje, možemo zaključiti da je
varijabilitet vrijednosti promatranoga obilježja umjeren.


3.2.7. Koeficijent kvartilne devijacije


Kako je već istaknuto, koeficijent varijacije je loš pokazatelj varijabiliteta vrijednosti
promatranoga obilježja ukoliko promatrani niz vrijednosti obilježja sadrži ekstremno male ili
ekstremno velike vrijednosti. U takvim se slučajevima raspršenost vrijednosti obilježja obično
iskazuje interkvartilom (kao apsolutnom mjerom raspršenja), odnosno koeficijentom kvartilne
devijacije kao pripadnom relativnom mjerom raspršenja.

Koeficijent kvartilne devijacije (oznaka: V
q
) je, prema definiciji, omjer interkvartila i zbroja
prvoga i trećega kvartila:

3 1
3 1 3 1
q
q
I
Q Q
V
Q Q Q Q

= =
+ +


V
q
se interpretira kao intenzitet varijabiliteta središnje polovice (središnjih 50%) elemenata
uređenoga statističkoga niza, a može poprimiti točno sve vrijednosti iz segmenta [0, 1]. Što je
varijablitet središnje polovice niza manji, vrijednost V
q
je bliža 0, a što je varijablitet središnje
polovice veći, vrijednost V
q
je bliža 1. Iako ne postoji opći kritetij za utvrđivanje varijabiliteta
središnje polovice vrijednosti kvantitativnoga obilježja na temelju koeficijenta kvartilne
devijacije, jedan od najčešće primijenjenih kriterija naveden je u tablici.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 112

V
q
varijabilitet
0.0 - 0.1 vrlo slab
0.1 - 0.2 relativno slab
0.2 - 0.3 umjeren
0.3 - 0.5 relativno jak
0.5 – 1.0 vrlo jak

Izračun koeficijenta kvartilne devijacije iz obiju vrsta podataka pokazat ćemo na sljedećim
primjerima.

Primjer 18. Odredimo varijabilitet središnjih 50% prosječnih mjesečnih plaća (iskazanima u
kn) svih stalno zaposlenih djelatnika poduzeća "Schwindl–trade d.o.o." iz Šuplje Lipe u
razdoblju od 01.01.2007. – 31.12.2007. navedenih u Primjeru 9. U ovom slučaju statistički niz
sadrži dvije ekstremno velike vrijednosti (50.000,64 i 60.000,75), pa je za dobivanje slike o
varijabilitetu primjereno uporabiti koeficijent kvartilne devijacije.

U Primjeru 9. izračunali smo:

– prvi ili donji kvartil: Q
1
= 2.332,935;
– treći ili gornji kvartil: Q
3
= 3.087,88;

Stoga je koeficijent kvartilne devijacije promatranoga niza jednak

3 1
3 1
3.087, 88 2.332, 935
0.13927
3.087,88 2.332, 935
q
Q Q
V
Q Q
− −
= = =
+ +
.

Dakle, varijabilitet središnjih 50% prosječnih mjesečnih plaća je relativno slab.

Primjer 19. Zadana je razdioba svih honorarnih nastavnika Visoke škole za financijski
menadžment u Špičkovini u zimskom semestru akademske godine 2007/2008. prema
prosječnom mjesečnom neto–honoraru za sve održane oblike nastave:

prosječan mjesečni
neto–honorar (€)
broj
nastavnika
100,00 5
200,00 8
400,00 21
500,00 12
600,00 6
ukupno: 52


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 113

Odredimo koeficijent kvartilne devijacije i objasnimo njegovo značenje
86
. U ovom slučaju
prvi i treći kvartil određujemo iz grupiranih podataka, pri čemu smo podatke već zapisali u
obliku uređenoga niza. Ukupan broj podataka jednak je n = 52 i djeljiv je s 4, pa je približna
pozicija prvoga kvartila jednaka

k
1
=
1 52 1
13.25
4 4
n + +
= = .

Vrijednost prvoga kvartila iz grupiranih podataka određuje se iz izraza:

Q
1
= 13. vrijednost u nizu +
1
4
⋅ (14. vrijednost u nizu – 13. vrijednost u nizu) =
= 200,00 +
1
4
⋅ (400,00 – 200,00) = 250,00.

Analogno, približna pozicija trećega kvartila jednaka je

k
2
=
3 3
( 1) (52 1) 39.75
4 4
n ⋅ + = ⋅ + = ,

pa je vrijednost trećega kvartila:

Q
3
= 39. vrijednost u nizu +
3
4
⋅ (40. vrijednost u nizu – 39. vrijednost u nizu) =
= 500,00 +
3
4
⋅ (500,00 – 500,00) = 500,00.

Tako je koeficijent kvartilne devijacije jednak

3 1
3 1
500, 00 250, 00
0.33333
500, 00 250, 00
q
Q Q
V
Q Q
− −
= = =
+ +


i zaključujemo da je varijabilitet središnjih 50% prosječnih mjesečnih neto–honorara
relativno jak.


86
U ovome se primjeru isključivo radi ilustracije računanja koeficijenta kvartilne devijacije iz podataka
grupiranih prema modalitetima koriste relacije za izračun kvartila koje se mogu naći u knjizi I. Šošića
''Primijenjena statistika''.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 114

Primjer 20. Zadana je razdioba svih djelatnika Sveleučilišta u Gaćelezima na dan 22.3.2008.
prema iznosu primljene ''uskrsnice'':

iznos ''uskrsnice''
(€)
broj
djelatnika
351,00 – 500,00 48
501,00 – 650,00 189
651,00 – 800,00 88
801,00 – 950,00 47
951,00 – 1.100,00 28
ukupno: 400

Odredimo koeficijent kvartilne devijacije i objasnimo dobiveni rezultat.
87
Neprave razrede
najprije pretvorimo u prave i izračunajmo pripadne kumulativne apsolutne frekvencije ''manje
od''. Dobivamo:

iznos ''uskrsnice''
(€)
broj
djelatnika
kumulativna apsolutna
frekvencija ''manje od''
350,50 – 500,50 48 48
500,50 – 650,50 189 237
650,50 – 800,50 88 325
800,50 – 950,50 47 372
950,50 – 1.100,50 28 400
ukupno: 400

Četvrtina ukupnoga broja djelatnika jednaka je 100, a 100. element uređenoga niza nalazi se u
razredu 500,50 – 650,50. Donja granica toga razreda je g
1
= 500,50, odgovarajuća apsolutna
frekvencija f
1
= 189, kumulativna apsolutna frekvencija ''manje od'' prethodnoga razreda
jednaka je m
1
= 48, a širina uočenoga razreda je h
1
= 650,50 – 500,50 = 150. Stoga je prvi
kvartil jednak

Q
1
= g
1
+
1
1
4
n
m
f

⋅ h
1
= 500,50 +
400
48
4
150, 00
189

⋅ ≈ 541,77.



87
U ovome se primjeru isključivo radi ilustracije računanja koeficijenta kvartilne devijacije iz podataka
grupiranih u razrede koriste relacije za izračun kvartila koje se mogu naći u knjizi I. Šošića ''Primijenjena
statistika''.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 115

Nadalje, tri četvrtine ukupnoga broja djelatnika jednake su 300, a 300. element niza nalazi se
u rauzredu 650,50 – 800,50. Donja granica toga razreda je g
3
= 650,50, odgovarajuća
apsolutna frekvencija f
3
= 88, kumulativna apsolutna frekvencija ''manje od'' prethodnoga
razreda jednaka je m
2
= 237, a širina uočenoga razreda je h
3
= 850,50 – 650,50 = 15,00. Stoga
je treći kvartil jednak

Q
3
= g
3
+
2
3
3
4
n m
f
⋅ −
⋅ h
3
= 650,50 +
3
400 237
4
150, 00
88
⋅ −
⋅ ≈ 757,89.

Stoga je koeficijent kvartilne devijacije jednak

3 1
3 1
757,89 541, 77
0.1663
757,89 541, 77
q
Q Q
V
Q Q
− −
= = =
+ +
,

pa zaključujemo da je varijabilitet središnjih 50% iznosa ''uskrsnica'' relativno slab.


3.3. Standardizirano obilježje


U praksi se vrlo često postavljaju problemi usporedbe različitih nizova vrijednosti
kvantitativnih obilježja iskazanima u istim mjernicm jedinicama, ali s različitim stupnjem
varijabilnosti, problemi usporedbe raznorodnih numeričkih nizova, problemi usporedbe
relativnoga položaja barem dvaju podataka u istom numeričkom nizu itd. Tipični primjeri
takvih problema su:

Problem 1. Prosječna godišnja neto–plaća zaposlenika s visokom stručnom spremom u nekoj
tvrtki iznosi 62.000,00 kn uz standardnu devijaciju od 7.100,00 kn. Može li se reći da je
djelatnik koji ima visoku stručnu spremu i ukupnu godišnju neto–plaću 40.000,00 kn
diskriminiran?

Problem 2. Prosječan broj bodova na pismenom ispitu iz Gospodarske matematike održanom
25.02.2008. iznosi 55 uz standardnu devijaciju od 8 bodova. Prosječan broj bodova na
pismenom ispitu iz Osnova računovodstva održanom 21.02.2008. iznosi 65 uz standardnu
devijaciju 12 bodova. Ćiro je na pismenom ispitu iz Gospodarske matematike ostvario 62
boda, a na pismenom ispitu iz Osnova računovodstva 75 boda. Na kojemu je ispitu Ćiro
ostvario bolji uspjeh?



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 116

Ovakvi problemi rješavaju se izračunom vrijednosti tzv. standardiziranoga obilježja (oznaka:
z). Riječ je o linearnoj transformaciji vrijednosti kvantitativnoga obilježja definiranoj
formulom:

z =
1 x x x
x
σ σ σ

⋅ − = ,

gdje je uobičajeno x aritmetička sredina, a σ standardna devijacija vrijednosti varijable x.
Može se pokazati da je aritmetička sredina svakoga standardiziranoga obilježja jednaka nuli, a
odgovarajuća standardna devijacija jednaka 1. Kako bi se mogli donijeti zaključci o
raspršenosti elemenata polaznoga osnovnoga skupa, koristi se sljedeće

Pravilo 1. (Čebiševljevo
88
pravilo) Neka je X niz vrijednosti kvantitativnoga obilježja čija je
aritmetička sredina x , a standardna devijacija σ. Tada se za svaki prirodan broj k > 1 u
segmentu [ x – k ⋅ σ, x + k ⋅ σ] nalazi najmanje 100 ⋅
2
1
1
k
| |

|
\ ¹
% članova niza X.

Posljedice: U segmentu [ x – 2 ⋅ σ, x + 2 ⋅ σ] nalazi se najmanje 75% podataka, a u
segmentu [ x – 3 ⋅ σ, x + 3 ⋅ σ] nalazi se najmanje 89% podataka bilo kojega niza numeričkih
podataka.

Pokažimo na nekoliko primjera primjenu standardiziranoga obilježja i Čebiševljeva pravila.

Primjer 1. Riješimo Problem 1. Izračunajmo vrijednost standardizirana obilježja za
x = 40.000,00, x = 62.000,00 i σ = 7.100,00:

z =
40.000, 00 62.000, 00
3.0986
7.100, 00
x x
σ
− −
= = − ,

pa zaključujemo da ukupna godišnja plaća od 40.000,00 kn odstupa od prosječne godišnje
neto–plaće naniže za više od tri standardne devijacije. Prema Čebiševljevu pravilu, najmanje
89% elemenata niza odstupa od prosječne vrijednosti niza za najviše tri standardne devijacije.
To znači da najviše 100% – 89% = 11% elemenata niza odstupa od prosjeka za više od tri


88
Pafnutij Lavovič Čebišev (1821. – 1894.), ruski matematičar.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 117

standardne devijacije. Promatrani se djelatnik nalazi upravo u tih 11% elemenata, pa se može
reći da je diskriminiran.

Primjer 2. Riješimo Problem 2. Prosudba uspjeha na ispitima mora se temeljiti isključivo na
standardiziranom obilježju jer je ono neovisno o mjernim jedinicama, a eliminira i problem
različitih raspona varijacije.
Za prvi je pismeni ispit x
1
= 55 i σ
1
= 8, pa je vrijednost standardizirana obilježja Ćirina
uspjeha na tom ispitu

z
1
=
1
1
1
62 55
0.875
8
x x
σ
− −
= = .

Za drugi je pismeni ispit x
2
= 65 i σ
2
= 12, pa je vrijednost standardizirana obilježja Ćirina
uspjeha na tom ispitu

z
2
=
2
2
2
75 65
0.83333
12
x x
σ
− −
= = .

Budući da je vrijednost standardizirana obilježja za prvi pismeni ispit strogo veća od
vrijednosti standardizirana obilježja za drugi pismeni ispit, zaključujemo da je na pismenom
ispitu iz Gospodarske matematike Ćiro postigao nešto bolji uspjeh (odstupanje naviše iznosi
87,5% standardne devijacije).

Primjer 3. Tečaj dionica (u kn) portfolia zabilježen na Frkljevačkoj burzi u razdoblju od
01.03.2008. do 25.03.2008. bio je sljedeći:

126 128 133 128 123 130 122 125 129 133 127 126 130
129 133 123 122 121 126 134 128 126 128 135 135

Dva trgovca dionicama procjenjuju tečaj dionice u vremenu predviđenom za prodaju. Prvi
trgovac procjenjuje da će cijena biti 140 kn, a drugi da će cijena biti 139 kn. Pretpostavimo da
je kretanje tečaja dionice ''normalno''. Odredimo koji se trgovac izlaže većem riziku donošenja
pogrešne poslovne odluke o prodaji dionice. Najprije treba izračunati aritmetičku sredinu
(prosječni tečaj dionice) i standardnu devijaciju iz negrupiranih podataka. Dobiva se:

x = 128,00 kn, σ = 4,08 kn.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 118

Izračunajmo vrijednost standardiziranoga obilježja za svaku pojedinu procjenu i odrediti koja
od njih više odstupa od prosjeka:

z
1
=
1
140 128
2.94
4, 08
x x
σ
− −
= = ,
z
2
=
1
139 128
2.697
4, 08
x x
σ
− −
= = .

Prema tome, prvi trgovac se izlaže većem riziku donošenja pogrešne poslovne odluke o
prodaji dionice.

Primjer 4. 20 stručnjaka iz područja managementa i gospodarstva procjenjivalo je godišnju
stopu inflacije u Republici Niškoristiji za 2007. godinu:

3,52 3,73 4,05 4,12 4,25 3,85 3,68 3,74 4,19 4,42 4,28 4,36 4,09
3,92 3,67 4,26 4,35 3,59 3,97 4,32

Primjenom Čebiševljeva pravila za k = 2 odredimo prognostički interval stope inflacije.
Jednostavna aritmetička sredina procjenjenih vrijednosti godišnje stope inflacije iznosi 4.018,
a odgovarajuća standardna devijacija 0.280546. Prema tome, traženi prognostički interval
stope inflacije je [4.018 – 2 ⋅ 0.280546, 4.018 + 2 ⋅ 0.280546] = [3.457, 4.579].

Primjer 5. (problem skaliranja) Prijamnom ispitu za upis na Ekonomski fakultet Sveučilišta
u Banovoj Jaruzi pristupilo je ukupno 2000 kandidata. Prosječan broj bodova iz matematike
iznosio je 150 sa standardnom devijacijom 30 bodova. Povjerenstvo za provedbu
razredbenoga ispita odlučilo je skalirati rezultate tako da im aritmetička sredina bude 100, a
standardna devijacija 12. Odredimo broj bodova (na novoj skali) kandidata koji je na ispitu
osvojio točno 130 bodova.
Da bismo preračunali rezultate ispita u skladu s izmijenjenim parametrima, najprije ćemo
odrediti relativan položaj postignutoga rezultata od 130 bodova u prvotnom numeričkom nizu.
Taj se položaj svodi na izračun vrijednosti standardiziranoga obilježja za x = 130, 1 x = 150 i
σ
1
= 30, pa se dobije:

z
1
=
1
1
1
130 150
0.66666
30
x x
σ
− −
= = − .



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 119

Dakle, rezultat kandidata odstupa od prvotnoga prosjeka za 0.66666 prvotnih standardnih
devijacija naniže. Stoga i novi broj bodova mora odstupati od predefiniranoga prosjeka za
0.66666 predefiniranih standardnih devijacija naniže, pa je

x
2
= 2 x + z
1
⋅ σ
2
= 100 + (–0.66666) ⋅ 12 = 92.

Prema tome, kandidat će na novoj skali imati ukupno 92 boda.


3.4. Vrste razdioba (distribucija)


Razdiobe statističkih skupova prema kvantitativnim obilježjima grupiramo prema tome kako
su vrijednosti obilježja elemenata toga skupa raspoređene oko najvažnije srednje vrijednosti:
aritmetičke sredine. U skladu s tim razlikujemo tri osnovne vrste razdioba statističkoga skupa:

Ako su vrijednosti obilježja elemenata statističkoga skupa ravnomjerno raspoređene oko
aritmetičke sredine, govorimo o simetričnoj razdiobi (distribuciji). Kod simetrične razdiobe
sve tri srednje vrijednosti su jednake ( X = M
e
= M
o
).

Ako skup vrijednosti obilježja elemenata statističkoga skupa sadrži barem jednu ekstremno
veliku vrijednost, govorimo o pozitivno asimetričnoj razdiobi (distribuciji). Kod pozitivno
asimetrične razdiobe vrijede nejednakosti: X > M
e
> M
o
.

Ako skup vrijednosti obilježja elemenata statističkoga skupa sadrži barem jednu ekstremno
malu vrijednost, govorimo o negativno asimetričnoj razdiobi (distribuciji). Kod negativno
asimetrične razdiobe vrijede nejednakosti: X < M
e
< M
o
.

Gornje definicije zgodno je popratiti i grafički:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 120


3.4.1. Mjere asimetrije


Pri opisu razdiobe vrijednosti obilježja elemenata određenoga statističkoga skupa, osim
srednjih vrijednosti i mjera raspršenja, koristimo i mjere asimetrije. Tim mjerama nastoji se
jednim numeričkim pokazateljem opisati način rasporeda kvantitativnih podataka prema
aritmetičkoj sredini ili nekoj drugoj srednjoj vrijednosti. U praksi se najčešće koriste tri mjere
asimetrije:

1.) Pearsonova
89
mjera asimetrije (oznaka: S
k
) je mjera asimetrije definirana kao omjer
aritmetičke sredine x i medijana M
e,
odnosno moda M
o
, izražen u jedinicama standardne
devijacije σ:

3 ( )
;
σ
e o
k k
x M x M
S S
σ
⋅ − −
= =

Ova je mjera zapravo standardizirano odstupanje medijana ili moda od aritmetičke sredine.
Razlika aritmetičke sredine i medijana, odnosno moda podijeljena je sa standardnom
devijacijom radi uklanjanja utjecaja mjernih jedinica kvantitativnoga obilježja na vrijednost
pokazatelja.

Koeficijent S
k
90
može poprimiti točno sve vrijednosti iz segmenta [–3, 3]. Za simetričnu
razdiobu njegova je vrijednost S
k
= 0, za pozitivno asimetričnu S
k
> 0, a za negativno


89
Karl Pearson (1857. – 1936.), britanski statističar, jedan od najzaslužnijih za razvoj statistike kao zasebne
znanstvene discipline.
90
Oznaka S
k
potječe od engleske riječi skewness koja znači nagnutost.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 121

asimetričnu S
k
< 0. Što je apsolutna vrijednost od S
k
bliža 3, asimetričnost je izraženija. Ovaj
koeficijent u pravilu se računa za razdiobe prema kvantitativnim kontinuiranim varijablama.

2.) Bowleyeva
91
mjera asimetrije (oznaka: S
kQ
) računa se iz međusobnoga odnosa svih triju
kvartila: prvoga (Q
1
), trećega (Q
3
) i medijana (M
e
). Na temelju toga odnosa određuje se
asimetričnost središnje polovice (središnjih 50%) elemenata uređenoga statističkoga niza.
Računamo je prema formuli:

1 3
3 1
2
e
kQ
Q Q M
S
Q Q
+ − ⋅
=

.

Koeficijent S
kq
poprima točno sve vrijednosti iz segmenta [-1, 1]. Za simetričnu razdiobu je
S
kQ
= 0, za pozitivno asimetričnu S
kQ
> 0, a za negativno asimetričnu S
kQ
< 0. Što je apsolutna
vrijednost koeficijenta S
kQ
bliža 1, asimetričnost je izraženija.

3.) Koeficijent asimetrije (oznaka: α
3
) je potpuna i najčešće korištena mjera asimetrije
definirana formulom:

3
1
3
( )
α
n
k
x x
n
σ
=

=



gdje je n ukupan broj elemenata statističkoga niza (odnosno podataka u odgovarajućem
osnovnom skupu), x aritmetička sredina tih podataka, a σ njihova standardna devijacija.

Koeficijent α
3
poprima točno sve vrijednosti iz segmenta [-2, 2]. Za simetričnu razdiobu
vrijednost toga koeficijenta je α
3
= 0, za pozitivno asimetričnu α
3
> 0, a za negativno
asimetričnu α
3
< 0. Što je apsolutna vrijednost koeficijenta α
3
bliža 2, asimetričnost je
izraženija.

Valjda istaknuti da koeficijent asimetrije – kao potpuna mjera asimetrije – uvijek pruža
najvjerniju sliku o asimetriji, dok s ostalim dvama mjerama to nije slučaj. Sve tri mjere obično
se (ali ne i uvijek) podudaraju jedino u predznaku, a njihova izravna usporedba nije moguća
jer se odgovarajući izračuni temelje na različitim principima.


91
Arthur Lyon Bowley (1869. – 1957.), engleski ekonomist i statističar, zaslužan za razvoj teorije uzoraka.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 122

Primjer 1. Radi provjere deklarirane mase paketića bombona ''Kikić'' izabran je uzorak od
ukupno 25 različitih paketića. Mjerenjem mase (iskazane u gramima) dobiveni su sljedeći
rezultati:

101 103 98 99 100 102 96 102 101 105 93 98 98
94 96 101 102 97 97 100 93 104 102 91 104

Odredimo vrijednost svih triju pokazatelja asimetrije, objasnimo njihova značenja i prikažimo
dobivenu razdiobu linijskim grafikonom. Prikažemo li dobivene podatke tablično, dobivamo:

masa
(g)
broj
paketića
91 1
93 2
94 1
96 2
97 2
98 3
99 1
100 2
101 3
102 4
103 1
104 2
105 1
ukupno: 25

Odgovarajućim izračunima lagano se dobiva:

- aritmetička sredina: x = 99.08 (grama);
- medijan: M
e
= 100 (grama);
- mod: M
o
= 102 (grama);
- 1. ili donji kvartil: Q
1
= 97 (grama);
- 3. ili gornji kvartil: Q
3
= 102 (grama);
- standardna devijacija: σ = 3.69778312 (grama).

Za vježbu objasnite svaku od neposredno izračunatih vrijednosti. Prema tome, tražene
vrijednosti mjera asimetrije su:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 123

- Pearsonova mjera asimetrije (odstupanje medijana): S
k
= -0.746393153;
- Pearsonova mjera asimetrije (odstupanje moda): S
k
= -0.789662321;
- Bowleyeva mjera asimetrije: S
kQ
= –0.2;
- koeficijent asimetrije: α
3
= -0.471860569.

Pearsonove mjere asimetrije upućuju na zaključak da je promatrana razdioba srednje
negativno asimetrična (prevladavaju vrijednosti veće od aritmetičke sredine), Bowleyeva
mjera asimetrije upućuje na zaključak da je razdioba središnjih 50% paketića blago negativno
asimetrična, dok koeficijent asimetrije upućuje na zaključak da je promatrana razdioba
srednje negativno asimetrična. To se vidi i iz dobivene tablice jer postoji ukupno 13
vrijednosti strogo većih od aritmetičke sredine i 12 vrijednosti manjih od nje. Odgovarajući
prikaz linijskim grafikonom dan je na sljedećoj slici.




Primjer 2. Prema podacima Hrvatske elektroprivrede za 2006. godinu
92
, prosječna godišnja
potrošnja električne energije po potrošaču iznosi 2422.168207 kWh uz standardnu devijaciju
2383.869183 kWh. Pritom 25% svih potrošača godišnje potroši najviše 683.319 kWh,
polovica svih potrošača najviše 1766.895 kWh, a 25% svih potrošača barem 3370.143 kWh.
Odredimo vrijednosti odgovarajućih relativnih mjera raspršenja i mjera asimetrije, te
objasnimo dobivene rezultate. Iz zadanih podataka slijedi:


92
Podaci su preuzeti iz Statističkoga ljetopisa Republike Hrvatske za 2006. godinu.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 124

- aritmetička sredina: x = 2422.168207 (kWh);
- medijan: M
e
= 1766.895 (kWh);
- 1. ili donji kvartil: Q
1
= 683.319 (kWh);
- 3. ili gornji kvartil: Q
3
= 3370.143 (kWh);
- standardna devijacija: σ = 2383.869183 (kWh);

pa su tražene vrijednosti:

- koeficijent varijacije: V = 98.4188124%, što znači da je stupanj raspršenja
(varijabilitet) godišnje potrošnje električne energije vrlo jak;
- koeficijent kvartilne devijacije: V
q
= 66.2846722%, što znači da je stupanj raspršenja
(varijablitet) središnjih 50% potrošača električne energije vrlo jak;
- Pearsonova mjera asimetrije (odstupanje medijana): S
k
= 0.824634017, što znači da je
promatrana razdioba potrošača prema godišnjoj potrošnji električne energije srednje
pozitivno asimetrična;
- Bowleyeva mjera asimetrije: S
kQ
= 0.193414976, što znači da je razdioba središnjih
50% potrošača blago pozitivno asimetrična;
Koeficijent asimetrije ne možemo izračunati na temelju zadanih podataka. Spomenimo tek da
iz originalnih podataka navedenih u referenciranoj literaturi slijedi α
3
= 2.133, što znači da je
razdioba potrošača prema godišnjoj potrošnji električne energije vrlo pozitivno asimetrična,
tj. vrlo izraženo prevladavaju manje vrijednosti potrošnje električne energije.


3.4.2. Mjere zaobljenosti


Većina pojava u prirodi, raznim gospodarskim i tehničkim procesima i sl. raspoređena je u
skladu s tzv. normalnom razdiobom. Ova se razdioba vrlo precizno definira u matematičkoj
statistici i za to je potreban nešto složeniji aparat teorije vjerojatnosti. Ovdje ćemo samo
napomenuti da je riječ o potpuno simetričnoj unimodalnoj razdiobi takvoj da se otprilike svi
podaci (točnije, 99.73% njih) promatranoga obilježja nalaze u rasponu [ x – 3 ⋅ σ, x + 3 ⋅ σ],
gdje je x aritmetička sredina, a σ standardna devijacija razdiobe. Ova je činjenica nerijetko
vrlo korisna prigodom procjenjivanja je li neka razdioba (približno) normalna ili nije.

S obzirom na veliki značaj normalne razdiobe u statistici, definirane su posebne mjere kojima
se pojedine razdiobe uspoređuju s normalnom. To su tzv. mjere zaobljenosti i ima ih točno


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 125

dvije: koeficijent zaobljenosti (kurtosis
93
) i eksces
94
. Koeficijent zaobljenosti (kurtosis)
(oznaka: α
4
) je mjera zaobljenosti modalnoga vrha neke razdiobe, dok je eksces (oznaka: κ)
jednak razlici koeficijenta zaobljenosti i broja 3:

κ = α
4
– 3.

Od navedene dvije mjere jednostavnija je eksces jer eksces normalne razdiobe iznosi 0, pa je
na temelju te činjenice lako izvršiti usporedbu. Prema predznaku ekscesa razlikujemo tri vrste
razdioba:

– platikurtične čiji je eksces strogo manji od nule, tj. κ < 0;
– mezokurtične čiji je eksces jednak nuli, tj. κ = 0;
– leptikurtične čiji je eksces strogo veći od nule, tj. κ > 0.

Slobodnije govoreći, možemo reći da su platikurtične razdiobe ''plosnatije'', a leptikurtične
''šiljastije'' u odnosu na normalnu razdiobu. Usporedba nekih značajnijih vrsta razdioba s
normalnom razdiobom (krivulja nacrtana crnom bojom) navedena je na donjoj slici.






93
Riječ kurtosis na grčkom znači izbočenost.
94
Riječ eksces na latinskom znači prekoračenje ili pretjeranost.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 126

3.5. Programska potpora deskriptivnoj statističkoj analizi


Danas je u uporabi više različitih računalnih programa namijenjenih statističkim analizama.
Najpoznatiji od njih su SAS, SPSS i STATISTICA. U MS EXCEL-u potpunu statističku analizu
vrijednosti kvantitativnoga obilježja elemenata statističkoga skupa možemo dobiti rabeći alat
Descriptive Statistics smještenu u izborniku Alati (Tools), opcija: Analiza podataka (Data
Analysis). Taj je alat dio Analysis ToolPak alata za analizu, a stvara statistički izvještaj za
podatke u ulaznom rasponu i daje podatke o tendenciji gomilanja podataka oko aritmetičke
sredine i njihovoj promjenljivosti (varijabilitetu). Jedini potrebni ulazni podatak jest raspon
ćelija u kojima su smješteni negrupirani numerički podaci. Tzv. izlazni izvještaj (Summary
Statistics) obavljene statističke analize sadrži, između ostalih, i podatke o aritmetičkoj sredini,
medijanu, modu, standardnoj devijaciji, varijanci, koeficijentu asimetrije, najmanjoj i najvećoj
vrijednosti, opsegu i ukupnom zbroju svih članova promatranoga numeričkoga niza. Primjer
takvog izvještaja prikazan je u donjoj tablici.

Ocjene iz matematike

Mean 3.46666667
Standard Error 0.21298823
Median 3
Mode 2
Standard Deviation 1.16658456
Sample Variance 1.36091954
Kurtosis -1.4568278
Skewness 0.08605128
Range 3
Minimum 2
Maximum 5
Sum 104
Count 30







ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 127

4. KORELACIJSKA I REGRESIJSKA ANALIZA


U prethodnim smo se poglavljima bavili tzv. jednodimenzionalnom analizom
određenih pojava. Pri tome nismo vodili računa o uzrocima i posljedicama tih pojava,
odnosno o međusobnoj povezanosti dviju ili više pojava. U ovom ćemo poglavlju obratiti
pozornost upravo na takve slučajeve. Pri tome ćemo (radi analogije s matematikom) termin
obilježja (koji se obično rabi u kvalitativnim slučajevima) zamijeniti ekvivalentnim nazivom
varijabla (jer ćemo promatrati kvantitativna obilježja).

Veza između dviju varijabli općenito može biti funkcijska (deterministička) ili
statistička (slučajna, stohastička). U slučaju funkcijske povezanosti svakoj vrijednosti jedne
varijable odgovara točno određena i jedinstvena vrijednost druge varijable, dok u slučaju
statističke povezanosti određenoj vrijednosti jedne varijable mogu odgovarati barem dvije
vrijednosti druge varijable.

Primjer 1. Akcijska cijena jednoga automobila marke ''Ficho'' je 50.000,00 €. Neka nam n
označava broj kupljenih automobila, a C
n
ukupan iznos koji treba izdvojiti za kupnju tih
automobila. Tada je veza između varijabli n i C
n
funkcijska i može se opisati analitičkim
izrazom (zatvorenom formulom):

C
n
= 50.000,00 ⋅ n.

To znači da će svaki kupac koji kupi točno n automobila za njih morati izdvojiti točno
50.000,00 ⋅ n €. I u slučaju uvođenja dodatnih varijabli (npr. dodatni popust na gotovinsko
plaćanje) veza će i dalje ostati funkcijska.

Primjer 2. ''Čitlučka banka'' odobrava stambene kredite uz 5.99% složenih dekurzivnih
godišnjih kamata na 30 godina uz otplatu jednakim godišnjim postnumerando anuitetima.
Neka je C
0
iznos zajma koji se odobrava zajmoprimcu, a C
n
ukupan iznos koji u tih 30 godina
zajmoprimac treba vratiti banci. Tada je veza između varijabli C
0
i C
n
funkcijska i može se
opisati analitičkim izrazom (zatvorenom formulom):

C
n
= 2.17713578 ⋅ C
0
.

To znači da svaki zajmoprimac koji dobije zajam u iznosu od C
0
kn banci treba vratiti ukupno
2.17713578 ⋅ C
0
kn.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 128

Pojave koje istražuje statistika obično nisu tako ''čvrsto'' povezane kao varijable u prethodnim
primjerima. Tada govorimo o statističkoj ili stohastičkoj vezi među varijablama.

Primjer 3. Ekonomskim je analizama utvrđeno da postoji veza između izdvajanja za
marketing nekoga prehrambenoga proizvoda i ukupne vrijednosti prodanih komada toga
proizvoda. No, ne može se reći da npr. sve paštete za čiju je promidžbu utrošeno 100.000,00
kn imaju jednake ukupne vrijednosti prodanih komada.

Primjer 4. Ekonomskim je analizama utvrđeno da postoji veza između ukupnih prosječnih
mjesečnih primanja i prosječnih mjesečnih izdvajanja za prehranu. No, ne može se reći da
npr. svi ljudi koji mjesečno zarađuju prosječno 3.000,00 € imaju jednaka prosječna mjesečna
izdvajanja za prehranu.

Korelacijska analiza primjenom posebnih metoda i tehnika ispituje stupanj povezanosti
između barem dviju varijabli. Ukoliko se utvrdi određeni stupanj povezanosti između dviju
varijabli, regresijskom analizom razvija se odgovarajući analitički izraz ili algebarski model
te veze kako bi se moglo prognozirati očekivanu vrijednost jedne varijable za unaprijed
zadanu vrijednost druge varijable.


4.1. Korelacijska analiza


Korelacijska analiza povezanosti dviju varijabli obično se provodi u tri koraka:

1.) konstrukcija odgovarajućega grafičkog prikaza odnosa među varijablama (tzv. dijagram
rasipanja, dijagram raspršenja ili oblak raspršenja);
2.) određivanje brojčanoga pokazatelja jakosti i smjera veze među varijablama (koeficijent
korelacije);
3.) određivanje brojčanoga pokazatelja statističke značajnosti koeficijenta korelacije (tzv. p –
vrijednost).

Ukoliko se utvrđuje povezanost najmanje triju varijabli, prvi korak se vrlo često izostavlja jer
je prostorne analogone dijagrama rasipanja vrlo teško nacrtati čak i uz pomoć suvremenih
računalnih programa. Stoga se dijagram rasipanja obično crta isključivo kod utvrđivanja
povezanosti točno dviju varijabli.

Govorimo li o odnosu između dviju varijabli, obično razlikujemo nezavisnu varijablu (X) i
zavisnu varijablu (Y). Kako sugeriraju sami nazivi, nezavisna varijabla (X) je ''varijabla koja
utječe'' na drugu varijablu, a moguće utjecaje na nju samu zanemarujemo, dok je zavisna


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 129

varijabla (Y) ''varijabla na koju se utječe'', tj. varijabla čije vrijednosti zavise o vrijednostima
nezavisne varijable X. U praksi, međutim, nije uvijek točno određeno koja varijabla je
nezavisna, a koja zavisna. Npr. promatramo li varijable ocjena iz matematike i ocjena iz
statistike, onda ocjena iz statistike može zavisiti o ocjeni iz matematike (dobar matematičar
obično je i dobar statističar), ali i ocjena iz matematike može zavisiti i o ocjeni iz statistike
(ako netko na ispitu iz statistike dobije 5, to ga može motivirati da sjedne i nauči matematiku
barem za 4). U takvim slučajevima, dakle, ne možemo potpuno precizno utvrditi koja
varijabla je zavisna, a koja nezavisna. No, u slučajevima kada imamo varijable poput iznos
mjesečne plaće i iznos mjesečnoga izdvajanja za prehranu jasno je da iznos mjesečnoga
izdvajanja za prehranu ovisi o iznosu primljene mjesečne plaće, a da iznos primljene
mjesečne plaće ne ovisi o iznosu mjesečnoga izdvajanja za prehranu (osim ako je posao
djelatnika usko vezan za prehranu, kao što je npr. degustator).

Kako je već istaknuto, kad god je to moguće, odnos između zavisne i nezavisne varijable
najprije je zgodno predočiti grafički. U tu se svrhu rabi već spomenuti dijagram rasipanja.
Taj se dijagram konstruira tako da da točke s odgovarajućim vrijednostima varijabli X i Y
nanesemo u pravokutni koordinatni sustav u ravnini. Iz oblika dijagrama rasipanja može se
približno procijeniti postoji li uopće veza između dviju varijabli i, ako postoji, kojega je
oblika (pravocrtna (pravolinijska) ili krivocrtna (krivolinijska)).

Primjer 1. Primjeri potpune linearne (pravocrtne) veze između dviju varijabli:





ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 130



Primjer 2. Primjeri potpune nelinearne (krivocrtne) veze između dviju varijabli:




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 131



Primjer 3. Primjer postojanja statističke veze između dviju varijabli:



Primjer 4. Primjer slučajne (statistički beznačajne) veze između dviju varijabli:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 132



Ukoliko se nakon konstrukcije dijagrama rasipanja utvrđi postojanje veze među promatranim
varijablama, prelazi se na izračun odgovarajućega numeričkoga pokazatelja jakosti i smjera
utvrđene veze. Pritom određivanje smjera veze znači utvrđivanje uzrokuje li povećanje
vrijednosti jedne varijable povećanje ili smanjenje vrijednosti druge varijable. Ako povećanje
vrijednosti jedne varijable uzrokuje povećanje vrijednosti druge varijable, kažemo da je veza
među varijablama pozitivna. Uzrokuje li, pak, povećanje vrijednosti jedne varijable smanjenje
vrijednosti druge varijable, kažemo da je veza negativna. Treba napomenuti da je teorijski
veza među varijablama pozitivna (negativna) i ako smanjenje vrijednosti jedne varijable
uzrokuje smanjenje (povećanje) vrijednosti druge varijable, ali se taj kriterij praktično ne
koristi jer su vrijednosti na svakoj od osi u dijagramu rasipanja poredane uzlazno (od
najmanje do najveće), pa je praktičnije promatrati povećanje bilo koje vrijednosti umjesto
njezina smanjenja.

Najjednostavniji slučaj analitičkoga opisivanja veze među dvjema varijablama jest ukoliko iz
dijagrama rasipanja utvrdimo da je ta veza linearna. U takvim se slučajevima računa tzv.
Pearsonov
95
koeficijent jednostavne linearne korelacije (oznaka: r). Uz pretpostavku da
imamo ukupno n uređenih parova (x
i
, y
i
) vrijednosti varijabli X i Y, koeficijent r računamo
prema formuli:



95
Karl Pearson (1857. – 1936.), britanski statističar, jedan od najzaslužnijih za razvoj statistike kao zasebne
znanstvene discipline.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 133

1 1 1
2 2
2 2
1 1 1 1
1
1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
x y x y
n
r
x x y y
n n
= = =
= = = =
⋅ − ⋅ ⋅
=
| | | |
− ⋅ ⋅ − ⋅
| |
\ ¹ \ ¹
∑ ∑ ∑
∑ ∑ ∑ ∑


Može se pokazati da koeficijent r može poprimiti sve vrijednosti iz segmenta [–1, 1], pa je,
dakle, njegova najmanja vrijednost jednaka –1, a najveća –1. Korelacijska analiza zasebno
interpretira predznak Pearsonova koeficijenta jednostavne linearne korelacije, a zasebno
njegovu apsolutnu vrijednost.

Pozitivan koeficijent jednostavne linearne korelacije (onaj koji je strogo veći od 0, odnosno
onaj kojemu je predznak +) ukazuje da povećanje vrijednosti jedne varijable uzrokuje
povećanje vrijednosti druge varijable, ali i obrnuto: smanjenje vrijednosti jedne varijable
uzrokuje smanjenje vrijednosti druge varijable. Grubo bismo mogli reći da su promatrane
varijable upravno razmjerne, no, to ne bi bilo matematički korektno: upravna razmjernost
vrijednosti varijabli znači da ako se, za neki k ∈ 〈0, +∞〉, vrijednost jedne varijable poveća
(smanji) za k%, onda se i vrijednost druge varijable poveća (smanji) za k%. Kod linearne
ovisnosti, međutim, to općenito nije točno: ako se vrijednost jedne varijable poveća (smanji)
za k%, vrijednost druge varijable će se svakako povećati (smanjiti), ali ne nužno za k% (nego
najčešće za strogo manje od k%).

Negativan koeficijent jednostavne linearne korelacije ukazuje da povećanje vrijednosti jedne
varijable uzrokuje smanjenje vrijednosti druge varijable, ali i obrnuto: smanjenje vrijednosti
jedne varijable uzrokuje povećanje vrijednosti druge varijable. Kao i u slučaju pozitivnoga
koeficijenta, grubo bismo mogli reći da su promatrane varijable obrnuto razmjerne, no, to ne
bi bilo matematički korektno: obrnuta razmjernost vrijednosti varijabli znači da ako se, za
neki k ∈ R, vrijednost jedne varijable poveća (smanji) za k%, onda se vrijednost druge
varijable smanji (poveća) za k%. Kod linearne ovisnosti, međutim, to općenito nije točno: ako
se vrijednost jedne varijable poveća (smanji) za k%, vrijednost druge varijable će se smanjiti
(povećati), ali ne nužno za k% (nego najčešće za strogo više od k%).

Apsolutna vrijednost koeficijenta korelacije (oznaka:│r│) ukazuje na jakost linearne veze
među varijablama. Što je│r│bliže nuli, veza je slabija, a što je bliže jedinici, veza je jača.
Jedan od mogućih kriterija jakosti veze naveden je u donjoj tablici.






ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 134

koeficijent korelacije jakost veze među varijablama
1 potpuna
0.80 ≤ │r│ < 1 jaka
0.50 ≤ │r│ < 0.8 srednje jaka
0.20 ≤ │r│ < 0.5 slaba
0.0 < │r│ < 0.2 neznatna
0 potpuna odsutnost

Ovdje odmah treba istaknuti najčešću pogrešku koja se javlja prigodom uporabe Pearsonova
koeficijenta jednostavne linearne korelacije. Naime, u slučajevima kad je |r| ≈ 0, često se
pogrešno zaključuje da nema nikakve statističke veze među promatranim varijablama. Veza
među varijablama može biti i eksponencijalna, logaritamska, potencijska, polinomna (takva
da je stupanj odgovarajućega polinoma najmanje 2) itd., a ne samo linearna. Zbog toga
prigodom interpretacije ovoga koeficijenta uvijek treba imati na umu da on opisuje isključivo
smjer i jakost linearne veze među varijablama.

Posljednji korak korelacijske analize je procjenjivanje statističke značajnosti izračunatoga
koeficijenta korelacije. Grubo govoreći, takvom procjenom želimo utvrditi je li promjena
vrijednosti zavisne varijable doista uzrokovana utjecajem, odnosno promjenom vrijednosti
nezavisne varijable ili je do promjene vrijednosti zavisne varijable došlo slučajno stjecajem
drugih okolnosti (pod djelovanjem tzv. nekontroliranih uvjeta ili činitelja). U tu svrhu s p
označavamo vjerojatnost da je do promjene zavisne varijable došlo slučajno stjecajem drugih
okolnosti i taj broj nazivamo p – vrijednost. Broj p je neki element segmenta [0, 1] i za njega
određujemo gornju granicu do koje ćemo smatrati da je do promjene vrijednosti zavisne
varijable došlo slučajno. Obično se razlikuju dva kriterija:

- blaži kriterij: smatramo da je do promjene vrijednosti zavisne varijable došlo slučajno
ako i samo ako je p ≥ 0.05 i tada kažemo da smo procjenu izvršili uz razinu
pouzdanosti od 95%;
- stroži kriterij: smatramo da je do promjene vrijednosti zavisne varijable došlo slučajno
ako i samo ako je p ≥ 0.01 i tada kažemo da smo procjenu izvršili uz razinu
pouzdanosti od 99%.

Ekvivalentno, prema blažem kriteriju smatramo da je promjena vrijednosti zavisne varijable
doista uzrokovana promjenom vrijednosti nezavisne varijable, tj. da je veza promatranih
varijabli statistički značajna ako i samo ako je p < 0.05. U slučaju strožega kriterija
odgovarajući uvjet je p < 0.01.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 135

Budući da ćemo raditi uglavnom s ''malim'' uzorcima (koji imaju najviše 30 elemenata), p –
vrijednost koja odgovara Pearsonovu koeficijentu jednostavne linearne korelacije računat
ćemo koristeći tzv. Studentovu t– razdiobu
96
ili, kako se često naziva, ''razdiobu malih
uzoraka'' jer se u slučaju ''velikih“ uzoraka (koji imaju npr. 300 elemenata) praktički podudara
s normalnom razdiobom. Jedan od modificiranih algoritama za izračun p – vrijednosti
Pearsonova koeficijenta jednostavne linearne korelacije na temelju Studentove t – razdiobe u
MS Excelu može se formulirati ovako:

Korak 1. Izračunati Pearsonov koeficijent jednostavne linearne korelacije (r).
Korak 2. Izračunati vrijednost broja d := N – 2, gdje je N opseg uzorka (tj. ukupan broj
elemenata u uzorku). Vrijednost d obično se naziva broj stupnjeva slobode
97
.
Korak 3. Izračunati pripadnu t – vrijednost prema formuli

2
1
d
t r
r
= ⋅

.

Korak 4. Izračunati p – vrijednost kao vrijednost Studentove t – razdiobe s parametrima |t|, d i
2. (Broj 2 treba upisati jer kod korelacije uvijek promatramo dvosmjerne veze, tj. ne treba
unaprijed zadati koja varijabla je zavisna, a koja nezavisna. Ukoliko se to ipak učini, govori se
o jednosmjernoj vezi.) U MS Excelu ta se vrijednost dobiva primjenom funkcije TDIST.
Korak 5. Usporediti p – vrijednost ili s 0.01 (stroži kriterij) ili s 0.05 (blaži kriterij). Pearsonov
koeficijent jednostavne linearne korelacije je statistički značajan ako i samo ako je p < 0.01
(ili p < 0.05).

Pokažimo primjenu navedenih postupaka na primjerima.

Primjer 5. (preuzeto iz The World Almanac and The Book of Fact, 1975.) Ispituje se odnos
između visine i mase žena u dobi od 30 do 40 godina. Odabrano je ukupno 15 uzoraka žena
navedene dobi i dobiveni su sljedeći podaci:






96
Studentovu t-razdiobu je 1908. prvi otkrio engleski statističar William Sealy Gosset (1876. – 1937.), suradnik
Karla Pearsona. On je tada radio za pivovaru „Guiness“ koja je zahtijevala od njega da svoje radove objavljuje
pod pseudonimom, pa je Gosset objavio članak o novoj razdiobi u Pearsonovu časopisu ''Biometrics'' pod
pseudonimom Student. Taj se pseudonim i danas koristi u nazivu razdiobe.
97
Grubo govoreći, broj stupnjeva slobode može se definirati kao ukupan broj međusobno različitih ''slobodnih''
(nezavisnih) parametara čije vrijednosti treba zadati kako bi se potpuno odredila vrijednost neke veličine.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 136

uzorak prosječna visina
[m]
prosječna masa
[kg]
1 1.47 52.21
2 1.5 53.12
3 1.52 54.48
4 1.55 55.84
5 1.57 57.2
6 1.60 58.57
7 1.63 59.93
8 1.65 61.29
9 1.68 63.11
10 1.7 64.47
11 1.73 66.28
12 1.75 68.1
13 1.78 69.92
uzorak prosječna visina
[m]
prosječna masa
[kg]
14 1.8 72.19
15 1.83 74.46
ukupno:

24.76 931.17

Odredimo Pearsonov koeficijent jednostavne linearne korelacije i procijenimo njegovu
statističku značajnost uz razinu pouzdanosti od 95%. Radi određenosti, neka nezavisna
varijabla (X) bude varijabla prosječna visina, a zavisna varijabla (Y) varijabla prosječna
masa.
98
Izračunajmo najprije sve potrebne pomoćne numeričke podatke:












98
Suprotna bi pretpostavka (ovisnost visine o masi) bila daleko više motivirajuća npr. za liječenje od anoreksije i
bulimije.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 137

uzorak
prosječna
visina [m]
(X)
prosječna
masa [kg]
(Y)
x
i
⋅ y
i

x
i
2
y
i
2

1 1.47 52.21 76.7487 2.1609 2725.8841
2 1.5 53.12 79.68 2.25 2821.7344
3 1.52 54.48 82.8096 2.3104 2968.0704
4 1.55 55.84 86.552 2.4025 3118.1056
5 1.57 57.2 89.804 2.4649 3271.84
6 1.6 58.57 93.712 2.56 3430.4449
7 1.63 59.93 97.6859 2.6569 3591.6049
8 1.65 61.29 101.1285 2.7225 3756.4641
9 1.68 63.11 106.0248 2.8224 3982.8721
10 1.7 64.47 109.599 2.89 4156.3809
11 1.73 66.28 114.6644 2.9929 4393.0384
12 1.75 68.1 119.175 3.0625 4637.61
13 1.78 69.92 124.4576 3.1684 4888.8064
14 1.8 72.19 129.942 3.24 5211.3961
15 1.83 74.46 136.2618 3.3489 5544.2916
ukupno: 24.76 931.17 1548.245 41.053 58498.5439

Stoga je traženi Pearsonov koeficijent jednostavne linearne korelacije:


15 15 15
1 1 1
2 2
15 15 15 15
2 2
1 1 1 1
2 2
1
15
,
1 1
15 15
1
1548.245 24.76 931.17
15
1 1
41.053 24.76 58498.5439 931.17
15 15
i i i i
i i i
i i i i
i i i i
x y x y
r
x x y y
r
= = =
= = = =
⋅ − ⋅ ⋅
=
| | | |
− ⋅ ⋅ − ⋅
| |
\ ¹ \ ¹
− ⋅ ⋅
=
− ⋅ ⋅ − ⋅
∑ ∑ ∑
∑ ∑ ∑ ∑

r = 0,994583794

Prije interpretacije dobivenoga koeficijenta procijenimo njegovu statističku značajnost.
Izračunajmo najprije pripadnu t – vrijednost:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 138

2
15 2
0.994583794 34.5016057
1 0.994583794
d
t r
r

= ⋅ = ⋅ ≈

.

Pripadnu p – vrijednost izračunamo koristeći MS Excel. Dobivamo:

p = TDIST(34.5016057;15–2;2) ≈ 3.60352E-14 = 0.00000000000000360352.

Očito je p < 0,05, pa postoji statistički značajna linearna veza između prosječne visine i
prosječne mase na promatranim uzorcima žena. Iz vrijednosti Pearsonova koeficijenta
jednostavne linearne korelacije zaključujemo da je ta veza pozitivna i jaka, tj. da će povećanje
prosječne visine vrlo vjerojatno uzrokovati i povećanje prosječne mase (i obrnuto).

Primjer 6. U sljedećoj je tablici navedeno ukupno 10 parova vrijednosti nezavisne varijable X
i zavisne varijable Y.

I x
i
y
i
1 10 0.666654428469398
2 11,8 0.666664817791255
3 16 0.666666644193195
4 20 0.666666666329664
5 30 0.666666666666657
6 50 0.666666666666667
7 70 0.666666666666667
8 90 0.666666666666667
9 120 0.666666666666667
10 600 0.666666666666667

Odgovarajućim se izračunom dobiva da je vrijednost Pearsonova koeficijenta jednostavne
linearne korelacije

r = 0.208423,

pripadna t – vrijednost
t ≈ 0.602745504,

a toj vrijednosti odgovarajuća p – vrijednost


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 139

p ≈ 0.563369789.

Uz razinu pouzdanosti od 95%, može se zaključiti da ne postoji statistički značajna linearna
korelacija promatranih varijabli. No, zaključak da ne postoji bilo kakva korelacija
promatranih varijabli potpuno je pogrešan: veza promatranih varijabli, naime, zapravo je
potpuna, tj. funkcijska i dana je analitičkim izrazom:

y =
1.05
1
1.5
x
e
− ⋅
+
(primjer tzv. logističke funkcije).

Ovaj primjer još jednom ukazuje na činjenicu da se u primjeni Pearsonova koeficijenta
jednostavne linearne korelacije uporno mora naglašavati riječ linearne jer se radi o
pokazatelju isključivo linearne, a ne bilo kakve veze između promatranih varijabli.


4.1.1. Spearmanov
99
koeficijent korelacije ranga


Pearsonov se koeficijent jednostavne linearne korelacije u pravilu primjenjuje za utvrđivanje
stupnja linearne povezanosti između numeričkih varijabli čije jedinice odgovaraju intervalnoj
ili omjernoj skali. No, ukoliko imamo dvije varijable od kojih je barem jedna redosljedna
(varijabla ranga), ne moramo zahtijevati da određivanje stupnja linearne povezanosti, niti da
vrijednosti varijable (modaliteti) pripadaju intervalnoj ili omjernoj skali. U takvim
slučajevima za određivanje stupnja linearne veze obično se koristi Spearmanov koeficijent
korelacije ranga (oznaka: r
s
)

Spearmanov koeficijent korelacije ranga pripada u tzv. neparametarske mjere korelacije jer
njegovo izračunavanje ovisi o poretku vrijednosti modaliteta promatranih varijabli, a ne
izravno o samim vrijednostima varijabli. Pritom se ne pretpostavlja da vrijednosti varijable
pripadaju nekoj od uobičajenih razdioba (npr. normalnoj razdiobi), a već smo istakli da se ne
zahtijeva utvrđivanje linearne veze i pripadnost modaliteta intervalnoj ili omjernoj skali.
Napomenimo da se obično ne računa za pojave u bilo kakvom monotonom (rastućem ili
padajućem) odnosu.

Dakle, pretpostavljamo da modaliteti pripadaju ordinalnoj skali. Sukladno tome, modalitete
možemo rangirati, odnosno poredati od najslabijega prema najboljemu (uzlazno) ili od


99
Charles Edward Spearman (1863. – 1945.), engleski statističar i psiholog, jedan od začetnika ideje faktorske
analize varijance.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 140

najboljega prema najslabijemu (silazno). Dogovorno ćemo modalitete rangirati silazno od
najboljega prema najslabijemu tako da najbolji modalitet uvijek ima rang 1. Rang pojedinoga
modaliteta zapravo možemo shvatiti kao broj položaja (mjesta, pozicije) toga modaliteta u
''rang-listi''.

Oprez: Dogovorno modalitete rangiramo silazno, tj. najbolji modalitet uvijek dobiva rang 1.
No, ovisno o promatranom obilježju, povećanje ranga ne mora nužno značiti smanjenje
odgovarajuće vrijednosti modaliteta. Npr. rangiramo li neki uzorak studenata prema
trenutnom prosjeku ocjena, onda će student s najboljim prosjekom imati rang 1. Povećanje
ranga (s 1 na 2) u ovom slučaju znači uobičajeno smanjenje vrijednosti modaliteta. No,
rangiramo li isti uzorak studenata prema broju izostanaka s redovne nastave, onda će student s
najmanjim brojem izostanaka imati najbolji rang, tj. u ovome slučaju povećanje ranga povlači
povećanje vrijednosti modaliteta. Ovo obavezno treba imati na umu prigodom interpretacije
Spearmanova koeficijenta korelacije ranga.

Pri ovakvom rangiranju se prirodno pojavljuje problem određivanja ranga barem dvaju
jednakih modaliteta. U takvim slučajevima govorimo o tzv. vezanim rangovima. Npr. u nizu
ocjena 5, 4, 2, 2, 2 imamo 3 jednaka modaliteta (2), pa treba odrediti rang svakoga od njih.
Budući da su modaliteti međusobno jednaki, nema razloga preferirati bilo kojega od njih, pa
se utvrđuje tzv. zajednički rang kao aritmetička sredina trenutnih pozicija istih modaliteta.
Konkretno, vrijednost 5 ima rang 1 (najbolja ocjena), vrijednost 4 ima rang 2, a tri iste
vrijednosti 2 imaju zajednički rang
3 4 5
4
3
+ +
= jer se u trenutnom nizu nalaze na 3., 4. i 5.
mjestu.

Unatoč ovakvom načinu ''eliminiranja'' vezanih rangova, treba istaknuti da se u slučajevima
pojave nezanemarivoga broja vezanih rangova (u odnosu na ukupan broj parova vrijednosti
varijabli), umjesto Spearmanova, preporučuje računanje Pearsonova koeficijenta jednostavne
linearne korelacije. Pritom kao vrijednosti nezavisne, odnosno zavisne varijable treba uzeti
izračunate rangove modaliteta.

Nakon rangiranja modaliteta, Spearmanov koeficijent r
s
računa se prema formuli :

2
1
3
6
1
n
i
i
s
d
r
n n
=

= −



gdje su:

n – ukupan broj elemenata niza vrijednosti varijable X (ili varijable Y)



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 141

d
i
= r(x
i
) – r(y
i
) = razlika rangova odgovarajućega para vrijednosti varijable X i varijable Y ,
za svaki i = 1, 2, …, n.

Navedimo neka korisna svojstva vezana uz Spearmanov koeficijent korelacije ranga:

Svojstvo 1. Zbroj svih razlika rangova jednak je 0.
Svojstvo 2. Ako su u svakom paru rangovi jednaki, njihove su razlike jednake nuli. U tom je
slučaju vrijednost Spearmanova koeficijenta korelacije ranga jednaka r
s
= 1 i tada govorimo o
potpunoj (savršenoj) pozitivnoj korelaciji ranga.
Svojstvo 3. Ako je redoslijed rangova jedne varijable suprotan redoslijedu rangova druge
varijable, vrijednost Spearmanova koeficijenta korelacije ranga jednaka je r
s
= –1 i tada
govorimo o potpunoj (savršenoj) negativnoj korelaciji ranga.
Svojstvo 4. Kao kriterij jakosti veze među varijablama ranga koristi se kriterij naveden kod
Pearsonova koeficijenta jednostavne linearne korelacije.

Primjer 1. Na slučajno odabranom uzorku od 10 ljudi ispituje se veza kvocijenta inteligencije
i ukupnoga tjednoga vremena provedenoga u gledanju TV programa. Pritom se, kao radna
pretpostavka, uzima da je poželjno što manje vremena tjedno provoditi pred televizijskim
prijamnikom. Dobiveni podaci prikazani su u donjoj tablici.

količnik
inteligencije
(IQ)
vrijeme
provedeno u
gledanju TV
[sati/tjedan]
106 7
86 0
100 27
101 50
99 28
103 29
97 20
113 12
112 6
110 17

Ispitajmo vezu promatranih varijabli pomoću Spearmanova koeficijenta korelacije ranga.
Najprije rangirajmo modalitete. Kod varijable IQ logično je da osoba (iz promatranoga
uzorka) s najvećim količnikom inteligencije ima rang 1, a osoba s najmanjim koeficijentom


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 142

inteligencije rang 10. Ovdje, dakle, povećanje ranga znači smanjenje vrijednosti varijable,
odnosno smanjenje količnika inteligencije. Kod varijable vrijeme provedeno u gledanju TV
osobi koja tjedno najmanje vremena provede u gledanju televizijskih programa, u skladu s
polaznom temeljnom pretpostavkom, dodijelit ćemo rang 1, a osobi koja tjedno najviše
vremena provede u gledanju televizijskih programa rang 10. Tako dobivamo sljedeću tablicu:


količnik
inteligencije
(IQ)
(x
i
)
vrijeme
provedeno u
gledanju TV
[sati/tjedan]
(y
i
)




r(x
i
)




r(y
i
)




d
i





2
i
d
106 7 4 3 1 1
86 0 10 1 9 81
100 27 7 7 0 0
101 50 6 10 -4 16
99 28 8 8 0 0
103 29 5 9 -4 16
97 20 9 6 3 9
113 12 1 4 -3 9
112 6 2 2 0 0
110 17 3 5 -2 4
ukupno: 0 136

Prema tome, Spearmanov koeficijent korelacije ranga jednak je:

10
2
1
3
6
6 136
1 1
10 10 990
i
i
s
d
r
=


= − = −


≈ 0.175757576.

Dakle, na temelju promatranoga uzorka može se zaključiti da postoji neznatna pozitivna
korelacija količnika inteligencije i vremena provedenim u gledanju televizijskih programa.
Napomenimo da se može pokazati da je pripadna p – vrijednost strogo veća od 0.05, tj. da
izračunati Spearmanov koeficijent korelacije ranga nije statistički značajan pokazatelj.

Primjer 2. U donjoj su tablici navedeni ukupni bodovi na pismenim ispitima iz Gospodarske
matematike, odnosno Poslovne statistike za svakoga od 8 slučajno izabranih studenata


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 143

stručnoga studija računovodstva i financija Veleučilišta u Frkljevcima u akademskoj godini
2006/2007.

bodovi na ispitu iz
gospodarske matematike
bodovi na ispitu iz
poslovne statistike
45 50
20 10
50 50
0 20
100 90
50 50
30 40
80 100

Odredimo Spearmanov koeficijent korelacije ranga i objasnimo njegovo značenje. U ovom se
zadatku radi o slučaju gdje nije potpuno jasno koja je varijabla zavisna, a koja nezavisna. No,
kako ispitujemo isključivo stupanj veze među promatranim varijablama, ta činjenica nije
bitna. Stoga ćemo pretpostaviti da su bodovi na ispitu iz Gospodarske matematike nezavisna,
a bodovi na ispitu iz Poslovne statistike zavisna varijabla. Navedene su varijable očito
redosljedne, tj. student koji je na ispitu iz Gospodarske matematike postigao 100 bodova bolji
je od studenta koji je na istom ispitu postigao 50 bodova itd. U oba slučaja modalitete
obilježja poredat ćemo silazno jer student s najvećim brojem bodova treba ima najveći rang.
Tako dobivamo sljedeću tablicu:

bodovi na ispitu iz Gospodarske matematike
(x
i
)
bodovi na ispitu iz Poslovne statistike
(y
i
)
r(x
i
) r(y
i
) d
i
d
i
2
45 50 5 4 1 1
20 10 7 8 -1 1
50 50 3.5 4 -0.5 0.25
0 20 8 7 1 1
100 90 1 2 -1 1
50 50 3.5 4 -0.5 0.25
30 40 6 6 0 0
80 100 2 1 1 1
ukupno: 0 5.50

Uočimo da u vrijednostima varijable X imamo dvije međusobno jednake (50) koje dijele 3. i
4. mjesto. Stoga je njihov zajednički rang jednak
2
4 3 +
= 3.5. Analogno, u varijabli Y imamo


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 144

3 takve vrijednosti (ponovno 50) koje dijele 3., 4. i 5. mjesto. Stoga je njihov zajednički rang
jednak =
+ +
3
5 4 3
4. Tako je traženi Spearmanov koeficijent korelacije ranga jednak:

93 . 0
8 8
50 . 5 6
1
3



− =
s
r

Zaključujemo da postoji jaka pozitivna korelacija između bodova na ispitu iz matematike i
bodova na ispitu iz statistike. Iz dobivena koeficijenta zaključujemo da povećanje ranga broja
bodova iz Gospodarske matematike vrlo vjerojatno uzrokuje povećanje ranga broja bodova iz
Poslovne statistike. To znači da će student koji ostvari visoki rezultat u jednom ispitu vrlo
vjerojatno postići visoki rezultat i u drugom, i obrnuto. Može se pokazati da je pripadna p –
vrijednost strogo manja od 0,01, pa je dobiveni koeficijent statistički značajan.

Primjer 3. Mužjaci smeđokriloga brzana (Fregata maginificens) imaju crvenu grlenu vrećicu
koju u doba svadbenoga plesa
100
nadimaju kao svadbeno ruho (vidjeti sliku) i pomoću nje
proizvode poseban zvuk kojim privlače ženke. Proučavajući opisano ponašanje, grupa
ornitologa utvrdila je da ženke odabiru mužjake upravo na temelju veličine njihove grlene
vrećice, pa je provedeno dodatno istraživanje postoji li statistički značajna korelacija između
obujma grlene vrećice i frekvencije zvuka kojim mužjaci privlače ženke. U donjoj su tablici
navedeni prikupljeni podaci.



100
Svadbeni ples u biologiji je skupni naziv za sva ponašanja koja predstavljaju uvod u parenje životinja.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 145



mužjak smeđokriloga brzana








Korelacija promatranih varijabli utvrđena je na temelju Spearmanova koeficijenta korelacije
ranga: mužjak s najvećim obujmom grlene vrećice ima rang 1, a mužjak s najmanjim
obujmom rang 18, pri čemu mužjaci s obujmom grlene vrećice 5090 cm
3
imaju rang 6.5. Za
varijablu frekvencija zvuka primijenjen je suprotan kriterij: mužjak s najdubljom frekvencijom
zvuka ima rang 1, a mužjak s najvišom frekvencijom rang 18. Izračunom Spearmanova
koeficijenta korelacije ranga dobiva se:

r
s
= 0.763158.

Dakle, postoji srednje jaka pozitivna korelacija između obujma grlene vrećice smeđokriloga
brzana i frekvencije zvuka kojim vabi ženke. To znači da povećanje ranga obujma grlene
resice vjerojatno uzrokuje povećanje ranga frekvencije zvuka, odnosno da će mužjak s većim
obujmom grlene vrećice vrlo vjerojatno imati dublju frekvenciju zvuka kojim privlači ženke.
Napomenimo da je na temelju odgovarajućega statističkoga pokazatelja utvrđeno da je
dobiveni rezultat statistički značajan, tj. zaključak izveden iz promatranoga uzorka od 18
mužjaka može se primijeniti i na cjelokupnu populaciju smeđokriloga brzana, te da se
ovisnost frekvencije zvuka (zavisne varijable Y) o obujmu grlene vrećice (nezavisnoj varijabli
X) može relativno dobro opisati tzv. regresijskom jednadžbom:
obujam
grlene vrećice
[cm
3
]
frekvencija
zvuka
[Hz]
1760 529
2040 566
2440 473
2550 461
2730 465
2740 532
3010 484
3080 527
3370 488
3740 485
4910 478
5090 434
5090 468
5380 449
5850 425
6730 389
6990 421
7960 416


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 146

Y = 563.95 ⋅ e
–0,0005 ⋅ X
.

Zadatak za vježbu: Unesite podatke iz gornje tablice u radni list MS Excela, pa provjerite
valjanost izračuna Spearmanova koeficijenta korelacije ranga. Oprez: Rangove mužjaka s
obujmom grlene vrećice 5090 cm
3
morate upisati sami.


4.2. Regresijska analiza


Korelacijska je analiza vrlo često tek prvi korak u utvrđivanju međusobne ovisnosti dviju ili
više promatranih varijabli. Ukoliko se pomoću odgovarajućih statističkih pokazatelja utvrdi
da postoji statistički značajna veza među promatranim varijablama, sljedeći korak u
istraživanju te veze je tzv. regresijska
101
analiza.

Regresijsku su analizu u statistici prvi koristili matematičari Legendre
102
i Gauss koji su
početkom 19. stoljeća objavili radove o metodi najmanjih kvadrata. Međutim, sâm pojam
regresijska analiza u statistiku je uveo Sir Francis Galton
103
. On je 1886. u Glasniku
antropološkoga instituta u Londonu objavio rad u kojemu je promatrao ovisnost visine djece
o prosječnoj visini njihovih roditelja. U tom je istraživanju došao do zanimljiva zaključka:
ukoliko je prosječna visina obaju roditelja veća od medijana uređenoga niza svih prosječnih
visina roditelja, visina njihova djeteta će očekivano biti manja od prosječne visine obaju
roditelja (i obrnuto: ukoliko je prosječna visina obaju roditelja manja od medijana, visina
njihova djeteta očekivano će biti veća od prosječne visine od prosječne visine obaju roditelja).
Ovakvu je pojavu Galton nazivao efekt nazadovanja ili regresijski efekt. Zaslugom Karla
Pearsona, koji je poopćio Galtonova razmatranja na opće statističke modele, riječ regresija u
statistici je dobila današnje značenje iako, praktično, s tim značenjem nema gotovo nikakvih
dodirnih točaka.
Regresijska analiza ili, kraće, regresija općenito obuhvaća primjenu različitih metoda
ispitivanja ovisnosti zavisne varijable (Y) o barem jednoj nezavisnoj varijabli (X). Temeljni je
cilj provedbe takvih metoda vezu između promatranih varijabli izraziti ili opisati
odgovarajućim analitičkim izrazom (regresijskim modelom). Takav izraz omogućuje ne samo


101
Riječ regresija potječe od latinske riječi regressio = povratak, uzmak, odstupanje, nazadovanje. Objašnjenje
uporabe ovoga naziva u statistici slijedi u daljnjem tekstu.
102
Adrien-Marie Legendre (1752. – 1833.), francuski matematičar, bavio se matematičkom analizom, teorijom
brojeva i algebrom. Jedan od Mjesečevih kratera dobio je ime po njemu.
103
Francis Galton (1822. – 1911.), engleski znanstvenik, nećak Charlesa Darwina, začetnik moderne korelacijske
i statističke analize, mentor Karla Pearsona i Charlesa Edwarda Spearmana.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 147

objašnjavanje ovisnosti promatranih pojava, nego i procjenjivanje vrijednosti zavisne
varijable Y za određene vrijednosti barem jedne nezavisne varijable X.

Ovisno o broju zavisnih i nezavisnih varijabli koje se pojavljuju u odgovarajućem modelu,
regresija općenito može biti:

1.) jednostavna (u modelu se pojavljuje točno jedna zavisna i točno jedna nezavisna
varijabla);
2.) višestruka ili multipla (u modelu se pojavljuju točno jedna zavisna i barem dvije nezavisne
varijable).

U ovom ćemo se kolegiju baviti modelima jednostavne regresije, a od primjera modela
višestruke regresije kratko ćemo spomenuti samo najjednostavniji i najprimjenjivaniji model
višestruke linearne regresije.

Opći oblik modela jednostavne regresije jest:

Y = f(X) + e ili Y =
^
Y + e.

U ovakvom modelu varijabla e je tzv. stohastička (slučajna) varijabla koja, slobodno
govoreći, ''mjeri'' stupanj nesustavnih utjecaja na zavisnu varijablu Y. To je potpuno u skladu s
ranijom podjelom veza mođu varijablama na funkcijske i statističke: kod funkcijskih su veza
vrijednosti varijable u jednake nuli, dok su kod statističkih veza one različite od nule. Opisna
statistika – kojom se bavimo u ovom kolegiju – ne bavi se posebnom analizom stohastičke
varijable e, nego je smatra isključivo odstupanjima od funkcijskoga dijela regresijskoga
modela
104
.

O čemu se, zapravo, radi? Kad istražujemo ovisnosti pojedinih varijabli, statističkim
istraživanjem dobivamo određene podatke o vrijednostima tih varijabli. Npr. želimo li utvrditi
kako mjesečno izdvajanje za odjeću zaposlenika tvrtke ''Drpislavić d.o.o.'' iz Babine Grede
ovisi o njihovim mjesečnim primanjima, statističkim istraživanjem (npr. anketiranjem)
dobivamo podatke o mjesečnim primanjima i izdvajanja za odjeću svakoga od zaposlenika.
Te podatke sredimo i pregledno prikažemo tablično, kako smo to naučili u 2. poglavlju.
Označimo li s X nezavisnu varijablu mjesečna primanja, a s Y zavisnu varijablu izdvajanja za
odjeću, cilj nam je odrediti funkciju koja će svakoj vrijednosti varijable X pridružiti
statističkim istraživanjima dobivenu vrijednost varijable Y. Najčešće takva funkcija ne postoji
jer je veza među varijablama stohastička. Stoga želimo naći funkciju f(X) koja će što točnije


104
Otuda dolazi i oznaka e: engl. error = greška.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 148

vrijednostima varijable X pridruživati vrijednosti varijable Y. U svakom takvom pridruživanju
nužno će se javiti određena greška (tzv. rezidualno
105
odstupanje). Iako bi teorijski bilo
najbolje da svako pojedino rezidualno odstupanje bude što manje, to praktično nije moguće:
minimiziranje odstupanja nastaloga jednim pridruživanjem u pravilu uzrokuje povećanje
odstupanja nastaloga drugim pridruživanjem. Može se pokazati da je prosječna vrijednost svih
rezidualnih odstupanja jednaka nuli, što znači da – kao i kod uvođenja pojma standardne
devijacije (vidjeti poglavlje 3.) – nije moguće minimizirati prosječno rezidualno odstupanje.
Stoga je potrebno analizirati i minimizirati varijancu svih rezidualnih odstupanja (koja je
uvijek strogo veća od nule). Takvo razmatranje dovodi do definiranja pojmova varijanca
regresije i standardna devijacija regresije o kojima ćemo nešto više reći u točki 4.2.3.

Prema tome, dva su osnovna cilja koja se žele postići stvaranjem regresijskoga modela:

1) odrediti tip realne funkcije (linearna, kvadratna, eksponencijalna, logaritamska, …)
koja najbolje opisuje vezu između promatranih varijabli;
2) procijeniti osnovne parametre te funkcije tako da zbroj kvadrata svih rezidualnih
odstupanja bude što manji.

U nastavku ćemo dati kratak opis nekoliko takvih regresijskih modela.


4.2.1. Model jednostavne linearne regresije


Ukoliko iz dijagrama rasipanja uvidimo da ravnomjerno povećanje vrijednosti nezavisne
varijable X uzrokuje približno ravnomjerno povećanje (ili smanjenje) zavisne varijable Y,
regresijski model koji najbolje opisuje promatranu vezu varijabli X i Y jest model jednostavne
linearne regresije.

Opći oblik toga modela je:
Y = aX + b + e,

gdje su a, b ∈ R parametri modela, a e, kako je istaknuto u uvodu, stohastička (slučajna)
varijabla. Cilj nam je odrediti parametre a i b tako da varijanca svih rezidualnih odstupanja
bude minimalna. Budući da je graf svake linearne funkcije pravac, to praktično znači da
tražimo jednadžbu pravca koji će najbolje aproksimirati skup točaka dobiven konstrukcijom
dijagrama rasipanja.


105
Lat. residuum = ostatak; razlika


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 149

Svakim statističkim istraživanjem dobivamo ukupno n različitih uređenih parova vrijednosti
varijable X i vrijednosti varijable Y, tj. dobivamo uređene parove (x
1
, y
1
), (x
2
, y
2
), … (x
n
, y
n
).
Za svaki od tih parova vrijedi jednakost:

y
i
= a ⋅ x
i
+ b + e
i
, i = 1, 2, …, n,

pri čemu je e
i
rezidualno odstupanje, odnosno ''promašaj'' koji činimo zamijenimo li
statističkim istraživanjem dobivenu vrijednost y
i
računski dobivenom vrijednošću a ⋅ x
i
+ b.
106

Time, zapravo, dobivamo sustav od n linearnih jednadžbi s n + 2 nepoznanice: a, b, e
1
, e
2
, …,
e
n
. Taj sustav ima beskonačno mnogo realnih rješenja, ali točno jedno od njih zadovoljava
uvjet da varijanca svih rezidualnih odstupanja bude minimalna. Takvo se rješenje određuje
tzv. metodom najmanjih kvadrata.

Osnovna ideja metode najmanjih kvadrata je postići da zbroj kvadrata odstupanja empirijskih
vrijednosti zavisne varijable y
i
od očekivanih vrijednosti (oznaka: Ŷ
i
) te varijable bude
minimalan. Budući da se pri izvodu parametara koristi tzv. diferencijalni račun, u detalje
cijeloga postupka nećemo nulaziti, nego ćemo samo navesti rezultat:

1
2
2
1
,
n
i i
i
n
i
i
x y n x y
a b y a x
x n x
=
=
⋅ − ⋅ ⋅
= = − ⋅
− ⋅


,

pri čemu su x i y redom aritmetička sredina empirijskih vrijednosti varijable x, odnosno
varijable y. Tako smo, dakle, dobili model jednostavne linearne regresije:

y

= a ⋅ x + b.

(Oznaka y

sugerira da je riječ o vrijednosti koja se izračunava na temelju jednadžbe
regresijskoga modela, a ne o vrijednosti dobivenoj statističkim istraživanjem.) Navedimo
ukratko nazive i značenje dobivenih parametara.


106
Vrijednosti dobivene statističkim istraživanjem u nastavku ćemo zvati originalne ili empirijske vrijednosti, a
vrijednosti dobivene računski (pomoću regresijskoga modela) zvat ćemo očekivane, procijenjene ili regresijske
vrijednosti.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 150

Vrijednost b naziva se naziva se konstantni član
107
. Njegova teorijska interpretacija je
sljedeća: b je očekivana vrijednost zavisne varijable y kada je vrijednost nezavisne varijable x
jednaka nuli. To se lako vidi uvrštavanjem x = 0 u jednadžbu y

= a ⋅ x + b. Ovaj parametar
nema veliko praktično značenje jer nerijetko nema praktičnoga smisla (npr. u modelima koji
promaraju ovisnost izdvajanja za prehranu o ukupnim mjesečnim primanjima jer je u takvim
slučajevima praktično besmisleno procjenjivati iznos izdvajanja za prehranu osobe bez
ikakvih ukupnih mjesečnih primanja).

Vrijednost a naziva se regresijski koeficijent i to je ujedno najvažniji parametar dobivenoga
modela. Njegova teorijska interepretacija je sljedeća: vrijednost a je očekivana prosječna
promjena zavisne varijable y kada se nezavisna varijabla x poveća za jednu jedinicu mjere.
Strogo pozitivna vrijednost regresijskoga koeficijenta upućuje na to da jedinični porast
vrijednosti nezavisne varijable X uzrokuje porast vrijednosti zavisne varijable Y (ili, kako se
matematički netočno često ističe, da su varijable X i Y upravno razmjerne), a strogo negativna
vrijednost regresijskoga koeficijenta upućuje na to da jedinični porast vrijednosti nezavisne
varijable X uzrokuje smanjenje vrijednosti zavisne varijable Y (ili, kako se matematički
netočno često ističe, da su varijable X i Y obrnuto razmjerne).

Značenje regresijskoga koeficijenta nije isključivo u promjeni vrijednosti nezavisne varijable
za jednu jedinicu mjere, nego je ono puno veće. Naime, vrijede sljedeća svojstva:

Svojstvo 1. Ukoliko se vrijednost nezavisne varijable X promijeni (poveća ili smanji) za k
jedinica mjere, očekivana apsolutna prosječna promjena vrijednosti zavisne varijable Y iznosi
k ⋅ a (jedinica mjere).

Dokaz: Neka je x
1
početna vrijednost nezavisne varijable X. Tada je pripadna očekivana
vrijednost zavisne varijable Y jednaka

1
y

= a ⋅ x
1
+ b.

Ukoliko se vrijednost x
1
promijeni za k jedinica mjere, nova vrijednost varijable X je:

x
2
= x
1
+ k,



107
U osnovnoj i srednjoj školi tu vrijednost nerijetko (neprecizno!) nazivaju odsječak na osi y.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 151

pri čemu za k > 0 imamo povećanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje
vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je

2
y

= a ⋅ x
2
+ b = a ⋅ (x
1
+ k) + b = a ⋅ x
1
+ b + a ⋅ k =
1
y

+ a ⋅ k,

a odatle slijedi:

2
y


1
y

= a ⋅ k.

Dakle, apsolutna prosječna promjena vrijednosti zavisne varijable Y jednaka je a ⋅ k, što je i
trebalo pokazati.

Svojstvo 2. (česta zabluda) Ukoliko se vrijednost nezavisne varijable x promijeni (poveća ili
smanji) za k%, očekivana relativna prosječna promjena vrijednosti zavisne varijable y iznosi
k% ako i samo ako je b = 0. Drugim riječima, promatrane varijable su upravno ili obrnuto
razmjerne ako i samo ako je b = 0.

Dokaz: Neka je x
1
početna vrijednost zavisne varijable X. Tada je pripadna očekivana
vrijednost zavisne varijable Y jednaka

1
y

= a ⋅ x
1
+ b.

Ukoliko se vrijednost x
1
promijeni za k%, pri čemu je k realan broj takav da je k ≠0 (za k = 0
početna vrijednost varijable X se ne mijenja), nova vrijednost varijable X je:

x
2
= x
1
+
100
k
⋅ x
1
= (1 +
100
k
) ⋅ x
1
,

pri čemu za k > 0 imamo povećanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje
vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je:

2
y

= a ⋅ x
2
+ b = a ⋅ (1 +
100
k
) ⋅ x
1
+ b = a ⋅ x
1
+ b + a ⋅
100
k
⋅ x
1
=
1
y

+ a ⋅
100
k
⋅ x
1
.

Stoga je pripadna relativna prosječna promjena vrijednosti zavisne varijable Y jednaka:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 152

1 1 1 1 1
2 1
1
1 1 1
100 100 100
k k k
y a x y a x a x
y y
a x b
y y y
∧ ∧
∧ ∧
∧ ∧ ∧
+ ⋅ ⋅ − ⋅ ⋅ ⋅ ⋅

= = =
⋅ +
,

Ta će vrijednost biti jednaka k% ako i samo ako vrijedi jednakost:

2 1
1
100
y y k
y
∧ ∧


= ,

odnosno jednakost

1
1
100
100
k
a x
k
a x b
⋅ ⋅
=
⋅ +
.

Prema definiciji jednakosti dvaju razlomaka, gornja je jednakost ekvivalentna jednakosti

1 1
100 ( )
100
k
a x a x b k ⋅ ⋅ ⋅ = ⋅ + ⋅ ,

tj. jednakosti

a ⋅ k ⋅ x
1
= a ⋅ x
1
⋅ k + b ⋅ k,
a odavde je
b ⋅ k = 0.

Prema pretpostavci je k ≠ 0, pa dijeljenjem s k dobivamo

b = 0,

što je i trebalo pokazati.

Radi potpunosti, spomenimo da se grafički prikaz bilo kojega modela jednostavne regresije
naziva regresijska krivulja. Regresijske krivulje mogu biti pravci, grafovi eksponencijalne i
logaritamske funkcije, grafovi opće potencije itd. Grafički prikaz modela jednostavne linearne
regresije uvijek je pravac (jer je grafički prikaz bilo koje linearne funkcije pravac), i taj se


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 153

pravac naziva regresijski pravac. Njegova jednadžba u pravokutnom koordinatnom sustavu u
ravnini podudara se s jednadžbom regresijskoga modela, tj. ona glasi: y

= a ⋅ x + b.

Primjer 1. Menadžment tvornice prehrambenih proizvoda ''Mljac-mljac d.d.'' iz Zvečaja
razmatra vezu između opsega proizvodnje čokolade ''Fantazija'' i ukupne zarade dobivene
prodajom te čokolade u proteklih 8 mjeseci. Dobiveni podaci prikazani su u donjoj tablici.



proizvodnja čokolade
[000 kom.]
ukupna dobit
[000 kn]
20 220
25 280
32 520
28 500
40 1250
35 1000
36 980
30 600

Prikažimo dobivene podatke dijagramom rasipanja, izračunajmo Pearsonov koeficijent
jednostavne linearne korelacije i procijenimo njegovu statističku značajnost na razini
pouzdanosti od 95%. Potom procijenimo parametre modela jednostavne linearne regresije koji
najbolje opisuje ovisnost ukupne dobiti o količini proizvedene čokolade, te, na temelju njega,
ukupnu dobit ukoliko se proizvede 30 000 komada čokolade i ukupnu proizvodnju čokolade u
mjesecu u kojemu je ostvarena dobit od 800.000,00 kn.

Budući da ćemo u drugom dijelu zadatka promatrati ovisnost ukupne dobiti o količini
proizvedene čokolade, količina proizvedene čokolade bit će nam nezavisna varijabla X, a
ukupna zarada dobivena prodajom čokolade zavisna varijabla Y (za korelacijsku je analizu to
nebitno). Odgovarajući dijagram rasipanja je:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 154



Izračunima analognima onima iz točke 4.1 dobiva se vrijednost Pearsonova koeficijenta
jednostavne linearne korelacije:

r = 0.952039274,

a tom koeficijentu pripadna p – vrijednost jednaka je

p = 0.000265976 < 0.05.

Dakle, dobiveni koeficijent je statistički značajan, tj. postoji statistički značajna linearna veza
između proizvodnje čokolade i ukupne dobiti. Iz vrijednosti Pearsonova koeficijenta
jednostavne linearne korelacije može se zaključiti da je ta veza pozitivna i jaka, tj. da će
povećanje proizvodnje čokolade vrlo vjerojatno uzrokovati povećanje ukupne dobiti.

Regresijski pravac i njegova jednadžba, koja je ujedno i jednadžba odgovarajućega modela
jednostavne linearne regresije, prikazani su na donjoj slici.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 155



Osnovni parametri dobivenoga regresijskog modela jednostavne linearne regresije su:

a = 54.60276339,
b = –1010.284974

(Definiciju i značenje parametra R
2
navodimo u točki 4.2.3.) Značenje tih parametara je
sljedeće:

a = 54.60276339 ⇒ Ukoliko se proizvodnja poveća za 1000 čokolada, očekivano prosječno
povećanje ukupne dobiti iznosi 54.602,76 kn. (Oprez s mjernim jedinicama!)
b = –1010.284974 ⇒ Ukoliko tvornica ne proizvede niti jednu čokoladu, procjenjuje (ili
očekuje) se gubitak u iznosu od 1.010.284,97 kn. (Opet pripazite na mjerne jedinice!)

Teoretski gledano, na temelju dobivenoga regresijskoga koeficijenta a možemo procijeniti
prosječnu promjenu ukupne dobiti u slučaju bilo koje promjene vrijednosti proizvodnje. No,
zbog pouzdanosti regresijskoga modela vrijednost navedene promjene ne bi trebala biti strogo
veća od raspona varijacije uzorka nezavisne varijable X jer se procjenjivanjem vrijednosti
izvan segmenta određenoga najmanjom i najvećom vrijednosti nezavisne varijable X značajno
gubi na pouzdanosti procjene.

Npr. ukoliko se mjesečna proizvodnja poveća za 100 čokolada, očekivano prosječno
povećanje ukupne dobiti iznosit će 5.460,27 kn. Smanji li se mjesečna proizvodnja (npr. zbog
remonta strojeva) za 200 čokolada, očekivano prosječno smanjenje ukupne dobiti iznosit će


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 156

10.920,55 kn. Općenito, poveća (smanji) li se proizvodnja za k čokolada mjesečno, očekivano
prosječno povećanje (smanjenje) ukupne dobiti iznosit će k ⋅ a = 54,60276 ⋅ k kn.
Preostaje nam procijeniti ukupnu dobit ukoliko se mjesečno proizvede 30000 komada
čokolade. U tu ćemo svrhu u dobivenu jednadžbu modela jednostavne linearne regresije
uvrstiti x = 30, pa ćemo dobiti:

y

= 54.60276339 ⋅ 30 – 1010.284974 = 627.797927

Dakle, očekivana ukupna dobit iznosi 627.797,93 kn.

Dobiveni regresijski model, naravno, možemo iskoristiti i u obrnutom slučaju, tj. za
procjenjivanje vrijednosti nezavisne varijable x u slučajevima u kojima nam je zadana
vrijednost zavisne varijable y. Izrazimo li x iz jednadžbe modela jednostavne linearne
regresije, dobivamo:

1 b
x y
a a

= ⋅ − .

Ovdje oznaka x

sugerira da vrijednost varijable x procjenjujemo, a oznaka y da je vrijednost
varijable y unaprijed poznata. U konkretnom slučaju, u navedenu jednakost uvrstimo
a = 54.60276339, y = 800 i b = –1010.284974, pa dobivamo da je tražena procijenjena
mjesečna proizvodnja

1 –1010.284974
800 33.1537245
54.60276339 54.60276339
x

= ⋅ + ≈ .

Dakle, procijenjena proizvodnja u mjesecu u kojemu je ostvarena dobit od 800.000,00 kn
približno iznosi 33154 komada čokolade. (Oprez s interpretacijom: vrijednosti varijable
proizvodnja su nužno prirodni brojevi ili nula, pa ne možemo reći npr. da procijenjena
proizvodnja iznosi 33153.7 komada čokolade. Slično vrijedi i za vrijednosti varijable y koje
ima smisla računati na najviše 5 decimalnih mjesta jer 6. decimala označava tisućiti dio kune
koji u praksi ne postoji.)

Napomenimo da se u slučaju modela jednostavne linearne regresije p – vrijednost koja
odgovara nezavisnoj varijabli X i ukazuje na njezinu statističku značajnost podudara s p –
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije. U ovom slučaju to znači
da je nezavisna varijabla X statistički značajna, tj. da postoji statistički značajan utjecaj
proizvodnje čokolade na ukupnu dobit. Ovaj pokazatelj ujedno je i pokazatelj statističke


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 157

značajnosti cijeloga dobivenoga modela jednostavne linearne regresije, tj. dobiveni je model
također statistički značajan.

Primjer 2. U sljedećoj su tablici navedeni podaci o prosječnom broju zaposlenih tijekom
2007. godine i ukupnom godišnjem prometu za svaku od ukupno 12 prodavaonica tvrtke
''Zumkon d.o.o.'' iz Kukače.

prosječan broj zaposlenih ukupan godišnji promet
[000 €]
22 250
31 300
90 920
82 850
43 400
65 680
59 630
16 180
61 670
46 420
35 350
50 460

Odnos ukupnoga godišnjega prometa i prosječnoga broja zaposlenih prikažimo grafički
odgovarajućim dijagramom (uz kojega navedimo sve potrebne oznake), pa odredimo
Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu
statističku značajnost na razini pouzdanosti od 95%.
Potom procijenimo jednadžbu i parametre modela jednostavne linearne regresije koji najbolje
opisuje ovisnost ukupnoga godišnjega prometa o prosječnom broju zaposlenih, te utvrdimo
njihovu statističku značajnost na razini pouzdanosti od 95%.
Procijenimo i ukupan godišnji promet prodavaonice koja je u 2007. godini imala prosječno 40
zaposlenih, prosječan broj zaposlenih u prodavaonici koja je u 2007. godini ostvarila promet u
iznosu od pola milijuna eura, te promjenu ukupnoga godišnjega prometa ukoliko se prosječan
broj zaposlenih u jednoj prodavaonici smanji za 5.
Zbog drugoga dijela zadatka, prosječan broj zaposlenih u jednoj prodavaonici bit će nam
nezavisna varijabla X, a ukupan godišnji promet zavisna varijabla Y. Odgovarajući grafički
prikaz je dijagram raspršenja prikazan na donjoj slici.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 158



Izračunima analognima onima iz točke 4.1. dobiva se vrijednost Pearsonova koeficijenta
jednostavne linearne korelacije:

r = 0.991128384,

a tom koeficijentu odgovarajuća p – vrijednost iznosi

p = 4.26414E-10 = 0.0000000000426414 < 0.05.

Prema tome, dobiveni koeficijent statistički je značajan, tj. postoji statistički značajna
linearna veza između prosječnoga broja zaposlenih i ukupnoga godišnjega prometa. Iz
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zaključujemo da je ta veza
pozitivna i jaka, tj. da će povećanje prosječnoga broja zaposlenih vrlo vjerojatno uzrokovati i
povećanje ukupnoga godišnjega prometa.

Koristeći gornji dijagram, možemo odrediti jednadžbu modela jednostavne linearne regresije
koji najbolje opisuje promatranu ovisnost, te osnovne parametre toga modela. Zajedno s
odgovarajućim regresijskim pravcem, ti su podaci navedeni na sljedećoj slici.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 159




Iz dobivene jednadžbe modela jednostavne linearne regresije slijedi da su osnovni parametri
dobivenoga regresijskog modela:

a = 10.4023396,
b = –10.95031313

Njihova značenja su:

a = 10.4023396 ⇒ Ukoliko se prosječan broj zaposlenih poveća za 1, očekivano prosječno
povećanje ukupnoga godišnjega prometa iznosi 10.402,34 €. Odavde izravno slijedi da
ukoliko se prosječan broj zaposlenih smanji za 5, očekivano prosječno smanjenje ukupnoga
godišnjega prometa iznosi 5 ⋅ 10.402,34 = 52.011,70 €. Općenito, ukoliko se prosječan broj
zaposlenih poveća (smanji) za k, očekivano prosječno povećanje (smanjenje) ukupnoga
godišnjega prometa iznosi k ⋅ a ⋅ 1.000,00 = k ⋅ 10.4023396 ⋅ 1.000,00 = 10.402,3396 ⋅ k €.

b = –10.95031313 ⇒ U ovom slučaju vrijednost x = 0 znači da u prodavaonici tijekom cijele
godine nije radio niti jedan zaposlenik. Takva prodavaonica prirodno nije ostvarila nikakav
ukupni godišnji promet. Stoga konstantni član u ovom slučaju nema svojega značenja (ranije


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 160

je istaknuto da se u praksi nerijetko javljaju ovakvi slučajevi i da je zbog toga regresijski
koeficijent najvažniji parametar dobivenoga modela).

Analogno kao i u prethodnom primjeru, očekivani ukupan godišnji promet prodavaonice u
kojoj je prosječan godišnji broj zaposlenih jednak 40 dobijemo tako da u jednadžbu
regresijskoga modela uvrstimo x = 40. Dobiva se:

y

= 10.4023396 ⋅ 40 – 10.95031313 = 405.1432707

Dakle, traženi očekivani promet iznosi 405.143,27 €. S druge strane, prosječan godišnji broj
zaposlenih u prodavaonici čiji je ukupan godišnji promet iznosio pola milijuna eura procijenit
ćemo tako da u jednadžbu

1 b
x y
a a

= ⋅ −

uvrstimo a = 10.4023396, y = 500 i b = ––10.95031313. Dobivamo:

1 10.95031313
500 49.118788
10.4023396 10.4023396
x

= ⋅ + ≈ .

Dakle, traženi procijenjeni prosječan broj zaposlenih približno iznosi 49. (Opet oprez s
interpretacijom: brojimo ljude, pa dobiveni rezultat nužno mora biti prirodan broj ili nula.)

Iz p – vrijednosti izračunate za Pearsonov koeficijent jednostavne linearne korelacije slijedi
da su varijabla X i dobiveni model jednostavne linearne regresije statistički značajni. Drugim
riječima, postoji statistički značajan utjecaj prosječnoga broja zaposlenih na ukupan godišnji
promet u promatranim prodavaonicama.

Primjer 3. Za 10 odabranih pokrajina Kraljevine Bušbumbuj utvrđeni su narodni dohodak po
stanovniku (per capita) i stopa mortalileta dojenčadi u 2007. godini. Dobiveni su podaci
prikazani u sljedećoj tablici.

narodni dohodak po stanovniku
[000 USD]
stopa mortaliteta dojenčadi
[‰]
3,99 12
3,5 13
3,1 15
2,82 17
2 18
1,8 18
1,73 19


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 161

narodni dohodak po stanovniku
[000 USD]
stopa mortaliteta dojenčadi
[‰]
1,56 24
1 29
0,5 35

Odnos stope mortaliteta dojenčadi i narodnoga dohotka po stanovniku prikažimo grafički
odgovarajućim dijagramom (uz kojega navedimo sve potrebne oznake), pa odredimo
Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu
statističku značajnost uz razinu pouzdanosti od 95%.
Potom procijenimo jednadžbu i parametre modela jednostavne linearne regresije koji najbolje
opisuje ovisnost stope mortaliteta dojenčadi o narodnom dohotku po stanovniku, te statističku
značajnost regresijskih varijabli i dobivenoga modela jednostavne linearne regresije uz razinu
pouzdanosti od 95%.
Procijenimo i stopu mortaliteta dojenčadi pokrajine čiji je narodni dohodak po stanovniku u
2007. godini bio 2.500,00 USD, narodni dohodak po stanovniku u pokrajini koja je u 2007.
godini zabilježila stopu mortaliteta dojenčadi 20‰, te promjenu stope mortaliteta dojenčadi
ukoliko se narodni dohodak po stanovniku smanji za 800 USD.

Ponovo radi drugoga dijela zadatka, stopa mortaliteta dojenčadi bit će zavisna varijabla Y, a
narodni dohodak po stanovniku nezavisna varijabla X. Odgovarajući grafički prikaz odnosa
promatranih varijabli je dijagram rasipanja prikazan na sljedećoj slici.




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 162

Izračunima analognima onima iz točke 4.1. dobiva se vrijednost Pearsonova koeficijenta
jednostavne linearne korelacije:

r = -0.913291451,

a tom koeficijentu pripadna p – vrijednost iznosi

p = 0.000222487 < 0.05,

pa zaključujemo da je dobiveni koeficijent statistički značajan, tj. da postoji statistički
značajna linearna veza između narodnoga dohotka i stope mortaliteta dojenčadi. Iz
vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zaključujemo da je ta veza
negativna i jaka, tj. da će povećanje narodnoga dohotka vrlo vjerojatno uzrokovati smanjenje
stope mortaliteta dojenčadi.

Parametri modela jednostavne linearne regresije, kao i odgovarajući regresijski pravac
prikazani su na donjoj slici.



U ovome je slučaju, dakle,

a = –5.953418082;
b = 33.09751978.

Interpretacije tih parametara su:


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 163

a = –5.953418082 ⇒ Ukoliko se narodni dohodak po stanovniku poveća za 1.000,00 USD,
očekivano prosječno smanjenje stope mortaliteta dojenčadi iznosi približno 6‰. Odatle
izravno slijedi da ukoliko se narodni dohodak po stanovniku smanji za 800 USD, očekivano
prosječno povećanje stope mortaliteta dojenčadi iznosi približno 0.8 ⋅ 5.953418082 ≈
4.762734465‰, tj. približno 4.76‰. Općenito, ukoliko se narodni dohodak po stanovniku
poveća (smanji) za k USD, očekivano prosječno smanjenje (povećanje) stope mortaliteta
dojenčadi iznosi k ⋅ |a| ⋅
1
1000
= k ⋅ 5.953418082 ⋅
1
1000
= 0.005953418082 ⋅ k ‰.
b = 33.098 ⇒ I u ovom slučaju konstantni član nema značenja jer je praktički nemoguće da
cjelokupni narodni dohodak po stanovniku (varijabla X) iznosi 0,00 USD.

Preostaje procijeniti stopu mortaliteta dojenčadi pokrajine čiji je narodni dohodak po
stanovniku u 2007. godini bio 2.500,00 USD, te narodni dohodak po stanovniku u pokrajini
koja je u 2007. godini zabilježila stopu mortaliteta dojenčadi 20‰. U prvom slučaju u
dobivenu jednadžbu modela jednostavne linearne regresije uvrstimo x = 2.5, pa dobijemo:

y

= –5.953418082 ⋅ 2.5 + 33.09751978 = 18.21397458.

Dakle, tražena procijenjena stopa mortaliteta iznosi približno 18,214‰. U drugom slučaju, u
jednadžbu

1 b
x y
a a

= ⋅ −

uvrstimo a = –5.953418082, y = 20 i b = 33.098, pa dobivamo:

1 33.09751978
20 2.2
5.953418082 5.953418082
x

= − ⋅ + ≈

Dakle, traženi procijenjeni narodni dohodak po stanovniku iznosi približno 2.200,00 USD.

Zaključno istaknimo da iz p – vrijednosti izračunate za Pearsonov koeficijent jednostavne
linearne korelacije slijedi da su i regresorska varijabla X i dobiveni model jednostavne
linearne regresije statistički značajni, tj. da postoji statistički značajan utjecaj narodnoga
dohotka po stanovniku na stopu mortaliteta dojenčadi.





ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 164

4.2.2. Analiza varijance modela jednostavne linearne regresije


Nakon što smo odredili jednadžbu modela jednostavne linearne regresije nameće se pitanje
''kvalitete'' dobivenoga modela. Zapravo, promatramo u kojoj mjeri vrijednosti zavisne
varijable procijenjene dobivenim modelom odgovaraju empirijskim vrijednostima, tj. s
kolikom točnošću možemo procijeniti vrijednost zavisne varijable za određenu vrijednost
nezavisne varijable. Procjena reprezentativnosti modela temelji se na već spomenutoj analizi
varijance rezidualnih odstupanja empirijskih vrijednosti (y
i
) zavisne varijable od procijenjenih
vrijednosti (ŷ
i
) te varijable. Tu je analizu grafički zgodno prikazati donjom slikom.



Prigodom ocjenjivanja reprezentativnosti modela jednostavne linearne regresije koristi se tzv.
jednadžba analize varijance toga modela. Ona predstavlja temelj deskriptivne i inferencijalne
statističke analize reprezentativnosti regresijskoga modela, a glasi:

2 2 2
1 1 1
( ) ( ) ( )
n n n
i i i
i i i
y y y y y y
∧ ∧
= = =
− = − + −
∑ ∑ ∑
,

odnosno, u razvijenom obliku,

2 2
2 2
1 1 1 1 1 1
n n n n n n
i i i i i i i i
i i i i i i
y n y a y b x y n y y a y b x y
= = = = = =
| | | |
− ⋅ = ⋅ + ⋅ ⋅ − ⋅ + − ⋅ − ⋅ ⋅
| |
\ ¹ \ ¹
∑ ∑ ∑ ∑ ∑ ∑


Ova jednadžba je posljedica sljedećega netrivijalnoga svojstva modela jednostavne linearne
regresije:

Svojstvo 1. Neka su (x
i
, y
i
) empirijski dobivene vrijednosti nezavisne varijable X, odnosno
zavisne varijable Y, za svaki i = 1, 2, …, n. Nadalje, neka su
i
y

procijenjene vrijednosti
dobivene uvrštavanjem vrijednosti x
i
u jednadžbu modela jednostavne linearne regresije koji


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 165

najbolje opisuje ovisnost varijable Y o varijabli X, i to za svaki i = 1, 2, …, n. Tada je
aritmetička sredina svih procijenjenih vrijednosti jednaka aritmetičkoj sredini svih
empirijskih vrijednosti, tj. vrijedi jednakost:

1 1
n n
i i
i i
y y y

= =
= =
∑ ∑
.

Objasnimo pobliže svaki pojedini član u gornjoj jednadžbi:

ST :=
2
1
( )
n
i
i
y y
=


=
2
2
1
n
i
i
y n y
=
− ⋅

– ukupan zbroj kvadrata odstupanja svih empirijskih
vrijednosti zavisne varijable Y od aritmetičke sredine tih vrijednosti
108
;

SP =
2
1
( )
n
i
y y

=


=
2
1 1
n n
i i i
i i
a y b x y n y
= =
⋅ + ⋅ ⋅ − ⋅
∑ ∑
– ovaj se član naziva protumačeni dio
ukupnoga zbroja kvadrata odstupanja, a zapravo je riječ o ukupnom zbroju kvadrata
odstupanja svih procijenjenih vrijednosti zavisne varijable Y od aritmetičke sredine tih
vrijednosti
109
(zbog iskazanoga svojstva 1., ta aritmetička sredina jednaka je onoj koja se
pojavljuje u članu ST);

SR =
2
1
( )
n
i
i
y y

=


=
2
1 1 1
n n n
i i i i
i i i
y a y b x y
= = =
− ⋅ − ⋅ ⋅
∑ ∑ ∑
– ovaj se član naziva neprotumačeni dio
ukupnoga zbroja kvadrata odstupanja ili zbroj kvadrata rezidualnih odstupanja, a zapravo je
riječ o zbroju kvadrata odstupanja procijenjenih vrijednosti od odgovarajućih empirijskih
vrijednosti. Slobodno govoreći, ovaj član ''mjeri'' ukupnu pogrešku svih n procjenjivanja.

Budući da je prvi član jednak zbroju preostalih dvaju, praktično se obično računaju samo
protumačeni i neprotumačeni dio ukupnoga zbroja kvadrata odstupanja. Koristeći dobivene
rezultate računaju se tzv. mjere reprezentativnosti o kojima se govori u sljedećoj točki.






108
Podijeli li se navedeni član ukupnim brojem parova podataka (n), dobiva se varijanca empirijskih vrijednosti
varijable Y.
109
Podijeli li se navedeni član ukupnim brojem parova (n), dobiva se varijanca procijenjenih vrijednosti varijable
Y.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 166

4.2.3. Mjere reprezentativnosti modela jednostavne linearne regresije


Za ocjenu reprezentativnosti nekoga regresijskoga modela rabe se pokazatelji analogni
pokazateljima reprezentativnosti aritmetičke sredine u deskriptivnoj analizi. Te pokazatelje
nazivamo mjere reprezentativnosti regresijskoga modela, a dijelimo ih na apsolutne i
relativne.

U apsolutne mjere reprezentativnosti ubrajamo varijancu regresijskoga modela i iz nje
izvedenu standardnu devijaciju regresijskoga modela. U računanju ovih vrijednosti koriste se
svi empirijski i svi procijenjeni podaci.

U relativne mjere reprezentativnosti ubrajamo koeficijent varijacije regresijskoga modela i
koeficijent determinacije regresijskoga modela. Za usporedbu reprezentativnosti dvaju
različitih regresijskih modela najčešće se rabe upravo relativne mjere reprezentativnosti.

U nastavku ukratko opisujemo svaku od navedenih mjera reprezentativnosti.


4.2.3.1. Varijanca regresijskoga modela


Osnova za mjerenje reprezentativnosti regresijskoga modela je raspršenje (disperzija) oko
regresijskoga pravca koja se očituje na rezidualnim odstupanjima. Što su odstupanja
empirijskih vrijednosti zavisne varijable Y od odgovarajućih procijenjenih vrijednosti manja,
reprezentativnost regresijskoga modela je bolja. Već smo istaknuli da je aritmetička sredina
svih rezidualnih odstupanja uvijek jednaka nuli, pa se pri analizi raspršenja polazi od analize
kvadrata rezidualnih odstupanja, odnosno od analize njihove varijance. S tim u vezi definira
se pojam varijance regresijskoga modela.

Varijanca regresijskoga modela (oznaka:
2
y
σ

) je apsolutna mjera reprezentativnosti
regresijskoga modela. Ona se računa kao aritmetička sredina kvadrata svih rezidualnih
odstupanja, pa je, sukladno oznakama iz točke 4.2.2., jednaka

2 2
1 1 1
1
2 2
n n n
i i i i
y
i i i
SR
y a y b x y
n n
σ

= = =
| |
= = ⋅ − ⋅ − ⋅ ⋅
|
− −
\ ¹
∑ ∑ ∑


Istaknimo da se u inferencijalnoj statistici procjena ovoga pokazatelj računa kao omjer
veličine SR i broja (n – 2) koji, kako smo već vidjeli, označava ukupan broj stupnjeva


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 167

slobode. Takav način izračuna primijenjuju gotovo svi statistički računalni programi, pa je u
takvim slučajevima nužno naglasiti da je riječ o procjeni varijance regresije osnovnoga
skupa.


4.2.3.2. Standardna devijacija regresijskoga modela


Standardna devijacija regresijskoga modela (oznaka:
y
σ

) je apsolutna mjera
reprezentativnosti regresijskoga modela. Ona je, prema definiciji, drugi korijen iz varijance
regresijskoga modela. Nerijetko se, analogno standardnoj devijaciji cjelokupnoga osnovnoga
skupa, matematički netočno interpretira kao prosječno odstupanje originalnih od regresijskih
vrijednosti. Radi potpunosti, navodimo formulu prema kojoj se računa standardna devijacija
regresijskoga modela:

2
1 1 1
1
2 2
n n n
i i i i
y
i i i
SR
y a y b x y
n n
σ

= = =
| |
= = ⋅ − ⋅ − ⋅ ⋅
|
− −
\ ¹
∑ ∑ ∑
.

Napomenimo da se u inferencijalnoj statistici standardna devijacija definira na potpuno isti
način, ali je, zbog različitosti izračuna varijance, pripadna formula za izravni izračun
drugačija od gore navedene. U tom se slučaju govori o procjeni standardne devijacije
osnovnoga skupa.


4.2.3.3. Koeficijent varijacije regresijskoga modela


Koeficijent varijacije regresijskoga modela (oznaka:
y
V

) je relativna mjera reprezentativnosti
modela i predstavlja postotni udio standardne devijacije regresijskoga modela u odnosu na
aritmetičku sredinu svih empirijskih (ili, prema Svojstvu 1., procijenjenih) vrijednosti zavisne
varijable:

ˆ
ˆ
ˆ
100
y
y
V
y
σ
= ⋅

Ekvivalentno, možemo reći da koeficijent varijacije regresijskoga modela mjeri relativno
prosječno odstupanje empirijskih vrijednosti zavisne varijable Y od procijenjenih vrijednosti


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 168

te varijable i iskazuje rezultat u postotcima. Što je vrijednost koeficijenta
y
V

bliža nuli,
reprezentativnost regresijskoga modela je bolja.


4.2.3.4 Koeficijent determinacije regresijskoga modela


Koeficijent determinacije (oznaka: R
2
) je relativna mjera reprezentativnosti regresijskoga
modela. Definira se kao omjer protumačenoga dijela ukupnoga zbroja kvadrata odstupanja
(SP) i ukupnoga zbroja kvadrata odstupanja (ST), a može poprimiti sve vrijednosti iz
segmenta [0, 1]. Objašnjava se kao postotni udio modelom protumačenoga dijela zbroja
kvadrata svih odstupanja u odnosu na ukupan zbroj kvadrata svih odstupanja, a računa prema
formuli:

2
2
2 1 1 1
2
2 2
1 1
( )
( )
n n n
i i i
i i i
n n
i i
i i
y y a y b x y n y
SP
R
ST
y y y n y

= = =
= =
− ⋅ + ⋅ ⋅ − ⋅
= = =
− − ⋅
∑ ∑ ∑
∑ ∑


Što je njegova vrijednost bliža 1, reprezentativnost regresijskoga modela je bolja (donekle
suprotno od koeficijenta varijacije).

Napomenimo da su u slučaju jednostavne linearne regresije koeficijent determinacije i
Pearsonov koeficijent jednostavne linearne korelacije vezani relacijom:

2
R r ± = ,

pri čemu je predznak Pearsonova koeficijenta linearne korelacije jednak predznaku
regresijskoga koeficijenta a.

Koeficijent determinacije općenito se može objasniti i kao razmjer varijance zavisne varijable
objašnjen nezavisnom varijablom. Npr., utvrdimo li da je Pearsonov koeficijent linearne
korelacije između varijabli količnik inteligencije i prosječna ocjena na studiju iznosi r = 0.5,
onda je pripadna vrijednost koeficijenta determinacije modela jednostavne linearne regresije
kojim se najbolje može opisati promatrana veza jednaka

R
2
= 0.5
2
= 0.25,



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 169

što, slobodno govoreći, znači da se približno 25% uspjeha na studiju može objasniti
inteligencijom studenata.

Istaknimo da u MS EXCEL-u jednadžbu, te vrijednost koeficijenta determinacije bilo kojega
od ponuđenih regresijskih modela možemo dobiti uključivanjima podopcija Prikaži jednadžbu
na grafikonu i Prikaži R-kvadratnu vrijednost na grafikonu u podopciji Mogućnosti opcije
Dodaj crtu trenda.

Primjer 4. Na temelju podataka iz Primjera 1. izračunajmo koeficijent varijacije i koeficijent
determinacije dobivenoga modela jednostavne linearne regresije. Objasnimo značenje
dobivenih vrijednosti.

U Primjeru 1. dobivena je sljedeća jednadžba modela jednostavne linearne regresije:

y

= 54.603 ⋅ x – 1010.3.

Izračunajmo najprije vrijednost koeficijenta varijacije toga modela. Koristeći navedenu
jednadžbu najprije za svaku empirijsku vrijednost nezavisne varijable X računamo
odgovarajuću procijenjenu vrijednost zavisne varijable Y. Potom izračunamo kvadrat razlike
svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajuće procijenjene
vrijednosti te varijable, te zbrojimo dobivene rezultate. Tako dobivamo treći i četvrti stupac
sljedeće tablice:


proizvodnja
čokolade
[000 kom.]
(x
i
)
ukupna
dobit
[000 kn]
(y
i
)
procijenjena
ukupna dobit
[000 kn]
(
i
y

)

(y
i

i
y

)
2

20 220 81,76 19110.3
25 280 354,775 5591.301
32 520 736,996 47087.26
28 500 518,584 345.3651
40 1250 1.173,82 5803.392
35 1000 900,805 9839.648
36 980 955,408 604.7665
30 600 627,79 772.2841
ukupno: 5.350 5.349,938 89154.32



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 170

Tako je vrijednost koeficijenta varijacije jednaka:

ˆ
ˆ
ˆ
100
y
y
V
y
σ
= ⋅ =
1 1
89.154, 32
8
2 2 8 2
100 100 100
1 5350
n n
i i
i i
SR SR
n
n n
y y
n
= =
⋅ ⋅
− − −
⋅ = ⋅ = ⋅ ≈

∑ ∑
18.23%,

pa možemo reći da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca relativno
slab. Vrijednost koeficijenta determinacije već smo dobili u Primjeru 1. i ona iznosi
R
2
= 0.9064. To znači da je modelom jednostavne linearne regresije protumačeno 90.64%
ukupnih odstupanja, odnosno, da se 90.64% ovisnosti ukupne dobiti o proizvodnji čokolade
može objasniti modelom jednostavne linearne regresije. Prema obama pokazateljima,
možemo zaključiti da je model reprezentativan.

Primjer 5. Na temelju podataka iz Primjera 2. izračunajmo koeficijent varijacije i koeficijent
determinacije dobivenoga modela jednostavne linearne regresije. Objasnimo značenje
dobivenih vrijednosti.

U Primjeru 2. dobivena je sljedeća jednadžba modela jednostavne linearne regresije:

y

= 10.402 ⋅ x – 10.95.

Kao i u Primjeru 4., izračunajmo najprije vrijednost koeficijenta varijacije toga modela.
Koristeći navedenu jednadžbu najprije za svaku empirijsku vrijednost nezavisne varijable X
računamo odgovarajuću procijenjenu vrijednost zavisne varijable Y. Potom izračunamo
kvadrat razlike svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajuće
procijenjene vrijednosti te varijable, te zbrojimo dobivene rezultate. Tako dobivamo treći i
četvrti stupac sljedeće tablice:












ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 171

prosječan broj
zaposlenih
(x
i
)
ukupan godišnji
promet
[000 €]
(y
i
)
procijenjeni ukupan
godišnji promet
[000 €]
(
i
y

)

(y
i

i
y

)
2

22 250 217,894 1030.79524
31 300 311,512 132.52614
90 920 925,23 27.3529
82 850 842,014 63.7762
43 400 436,336 1320.3049
65 680 665,18 219.6324
59 630 602,768 741.58182
16 180 155,482 601.13232
61 670 623,572 2155.55918
46 420 467,542 2260.24176
35 350 353,12 9.7344
50 460 509,15 2415.7225
ukupno: 6110 6109,8 10978.35977

Tako je vrijednost koeficijenta varijacije jednaka:

ˆ
ˆ
ˆ
100
y
y
V
y
σ
= ⋅ =
1 1
10978.35977
12
2 2 12 2
100 100 100
1 6110
n n
i i
i i
SR SR
n
n n
y y
n
= =
⋅ ⋅
− − −
⋅ = ⋅ = ⋅ ≈

∑ ∑
6.507631929%,

pa možemo reći da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca vrlo slab,
odnosno da je model reprezentativan. Vrijednost koeficijenta determinacije već smo dobili u
Primjeru 2. i ona iznosi R
2
= 0.9823. Dakle, 98,23% veze između ukupnoga godišnjega
prometa i prosječnoga broja zaposlenika može se objasniti modelom jednostavne linearne
regresije.

Zadatak za vježbu: Izračunajte koeficijent varijacije i koeficijent determinacije modela
jednostavne linearne regresije iz Primjera 3. Objasnite značenje dobivenih vrijednosti.





ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 172

4.3. Primjeri nelinearnih modela jednostavne regresije


Odnos zavisne i nezavisne varijable često nije linearan (ravnomjerne promjene nezavisne
varijable ne uzrokuju ravnomjerne promjene zavisne varijable). U takvim je slučajevima
potrebno je pronaći neku drugu (nelinearnu) funkciju koja najbolje pokazuje ovisnost zavisne
o nezavisnoj varijabli. U nastavku se razmatraju modeli jednostruke regresije u kojima su te
funkcije eksponencijalna funkcija, logaritamska funkcija i opća potencija. Ti se modeli
odgovarajućim zamjenama varijabli uvijek mogu svesti na model jednostavne linearne
regresije, ali to nećemo učiniti budući da MS Excel omogućuje rad i s takvim vrstama modela
jednostavne regresije.

4.3.1. Model jednostavne eksponencijalne regresije


Standardni oblik regresijske jednadžbe modela jednostavne eksponencijalne regresije je:

Y

= B ⋅ A
X
pri čemu dodatno vrijede nejednakosti:

A, B > 0, A ≠ 1.

Ove nejednakosti su posljedice činjenice da eksponencijalna funkcija nije definirana za A ≤ 0,
te da za A = 1 dobivamo konstantnu funkciju Y

= B koja je, zapravo, poseban slučaj modela
jednostavne linearne regresije.

I za ovaj model navodimo interpretacije obaju njegovih parametara (A i B). Zbog nešto
kompliciranije interpretacije parametra A navodimo i odgovarajući matematički izvod te
interpretacije.

B → procijenjena (ili očekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 0. (U istinitost ove tvrdnje lako se možete uvjeriti uvrstite li X = 0 u
gornju jednadžbu modela jednostavne eksponencijalne regresije i primijenite činjenicu da za
svaki strogo pozitivan realan broj A vrijedi jednakost A
0
= 1.) Kao i kod modela jednostavne
linearne regresije, odmah treba napomenuti da interpretacija toga parametra nerijetko ne
odgovara realnoj situaciji. Zbog toga ovaj parametar nije od osobite važnosti u dodatnim
analizama.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 173

Interpretacija parametra A u ovom slučaju nije izravna kao kod modela jednostavne linearne
regresije, nego posredna. Naime, vrijedi sljedeće:

Svojstvo 1. Ako se vrijednost nezavisne varijable X promijeni za k jedinica mjere, onda će se
očekivana vrijednost zavisne varijable Y promijeniti za prosječno 100 ⋅ (A
k
– 1)%. Pritom
predznak broja k označava povećanje ili smanjenje vrijednosti nezavisne varijable X, a
predznak parametra A
k
– 1 označava prosječno povećanje ili smanjenje očekivane vrijednosti
zavisne varijable Y.

Dokaz: Neka je x
1
početna vrijednost nezavisne varijable x. Pripadna regresijska vrijednost
zavisne varijable y je:

1
1
x
y B A

= ⋅ .

Odmah primijetimo da je, zbog uvjeta A, B > 0, A ≠ 1, svaka očekivana vrijednost zavisne
varijable y strogo veća od nule (što slijedi i iz činjenice da je područje vrijednosti bilo koje
eksponencijalne funkcije skup R
+
= 〈0,+∞〉), pa posebno i različita od nule.

Ako se vrijednost x
1
promijeni za k jedinica mjere, nova vrijednost te varijable je:
x
2
= x
1
+ k.

(Pritom za k > 0 imamo povećanje vrijednosti varijable x
1
, a za k < 0 smanjenje njezine
vrijednosti.) Pripadna regresijska vrijednost zavisne varijable y je

2 1 1 1
2 1
( )
x x k x x k k k
y B A B A B A A A B A A y
∧ ∧
+
= ⋅ = ⋅ = ⋅ ⋅ = ⋅ ⋅ = ⋅ .

Stoga je relativna promjena vrijednosti zavisne varijable y jednaka:

2 1 1 1 1
1 1 1
( 1)
1
k k
k
y y A y y y A
y A
y y y
∧ ∧ ∧ ∧ ∧

∧ ∧ ∧
− ⋅ − ⋅ −
∆ = = = = − ,

odnosno, u postotcima,

100 ( 1) %
k
y A

( ∆ = ⋅ −
¸ ¸
,



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 174

što je i valjalo pokazati.

Dakle, kod modela jednostavne eksponencijalne regresije dodatno se računa i interpretira broj
S
k
= A
k
– 1. Posebno, za k = 1 vrijednost S
1
= 100 ⋅ (A – 1) uobičajeno se naziva prosječna
stopa promjene (očekivanih) vrijednosti zavisne varijable Y. Ako model jednostavne
eksponencijalne regresije reprezentativno opisuje vezu između zavisne i nezavisne varijable,
približno jednaka stopa promjene vrijedi i za empirijske vrijednosti zavisne varijable Y.

I za model jednostavne eksponencijalne regresije mogu se računati koeficijent varijacije i
koeficijent determinacije tako da se u formule navedene u točkama 4.2.3.3. i 4.2.3.4. umjesto
originalnih vrijednosti uvrštavaju logaritmi tih vrijednosti. Koeficijent determinacije može se
dobiti izravno pomoću MS Excela, dok koeficijent varijacije moramo izračunati ''klasično''.
Ilustrirajmo to na primjerima.

Primjer 1. Uprava tvornice zamjenskih dijelova za željeznička vozila ''Grudelj d.d.'' iz
Bibinja razmatra ovisnost ukupnih jediničnih troškova o opsegu proizvodnje jednoga od
zamjenskih dijelova. Istraživanjem dobiveni podaci navedeni su u sljedećoj tablici:

jedinični troškovi
[kn]
opseg proizvodnje
[000 kom.]
549 60
582 54
618 50
700 45
748 36
817 32
900 25
998 23
1.193 18
1.540 10

Prikažimo dobivene podatke odgovarajućim grafikonom (uz kojega navedimo sve potrebne
oznake), pa odredimo jednadžbu modela jednostavne eksponencijalne regresije koji najbolje
opisuje promatranu ovisnost i interpretirajmo parametre toga modela. Naposljetku,
procijenimo reprezentativnost dobivenoga modela pomoću koeficijenta determinacije, ukupne
jedinične troškove pri opsegu proizvodnje od 40 000 komada i opseg proizvodnje u slučaju
kad ukupni jedinični troškovi iznose 800,00 kn



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 175

Odgovarajući grafički prikaz empirijskih podataka je dijagram raspršenja prikazan na
sljedećoj slici:



Odgovarajuća jednadžba modela jednostavne eksponencijalne regresije, zajedno s pripadnom
krivuljom, dana je na sljedećoj slici:



Zapišimo je najprije u standardnom obliku Y

= B ⋅ A
X
. U ovome je slučaju B = 1624, dok je
vrijednost parametra A jednaka


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 176

A = e
–0,019
≈ 0.98118.
pa jednadžba modela jednostavne eksponencijalne regresije zapisana u standardnom obliku
glasi:

Y

= 1624 ⋅ 0.98118
X
.

Odgovarajuće interpretacije parametara su:

B = 1624 ⇔ očekivana vrijednost jediničnih troškova u slučaju kad nema proizvodnje iznosi
1.624,00 kn. (Ova interpretacija nema smisla jer se jedinični troškovi uvijek računaju u
odnosu na jedinicu proizvedenoga proizvoda, a ako nije proizveden niti jedan proizvod, nema
smisla govoriti o jediničnim troškovima.)

A = 0.98118 ⇔ ovu ćemo vrijednost najlakše interpretirati računajući prosječnu stopu
promjene:

S
1
= 100 ⋅ (A – 1) = 100 ⋅ (0.98118 – 1) = –1.882.

Dakle, ukoliko se opseg proizvodnje poveća za 1000 komada, jedinični troškovi će se
očekivano smanjiti za prosječno 1.882%. Odatle slijedi npr. da ukoliko se opseg proizvodnje
poveća za 100 komada, očekivano prosječno smanjenje jediničnih troškova iznosi

S
0.1
= 100 ⋅ (A
0.1
– 1) = 100 ⋅ (0.98118
0.1
– 1) = 0.18982%,

a ukoliko se opseg proizvodnje smanji za 200 komada, očekivano prosječno povećanje
jediničnih troškova iznosi

S
–0.2
= 100 ⋅ (A
–0.2
– 1) = 100 ⋅ (0.98118
–0.2
– 1) = 0.380723% itd.

Koeficijent determinacije dobivenoga modela je R
2
= 0.9466, što znači da se 94.66% ovisnosti
jediničnih troškova o opsegu proizvodnje može objasniti modelom jednostavne
eksponencijalne regresije. Budući da je navedeni koeficijent relativno blizu 1, možemo reći
da je dobiveni model reprezentativan.

Preostaje nam procijeniti po jednu vrijednost zavisne, odnosno nezavisne varijable.
Procijenjeni iznos ukupnih jediničnih troškova u slučaju kad opseg proizvodnje iznosi 40 000
komada dobit ćemo tako da u jednadžbu regresijskoga modela uvrstimo x = 40:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 177

Y

= 1624 ⋅ 0.98118
40
= 759.51.

Dakle, procijenjeni ukupni jedinični troškovi u slučaju kad opseg proizvodnje iznosi 40 000
komada iznose 759,51 kn.

Nadalje, iz dobivene jednadžbe regresijskoga modela slijedi

ln ln1624
ln0.98118
y
X


= ,

pa procijenjenu vrijednost opsega proizvodnje u slučaju kad ukupni jedinični troškovi iznose
800,00 kn dobivamo tako da u navedenu jednadžbu uvrstimo y = 800:

ln800 ln1624
37.265
ln0.98118
X


= ≈ .

Dakle, procijenjena vrijednost opsega proizvodnje u slučaju kad ukupni jedinični troškovi
iznose 800,00 kn jednaka je 37265 komada.

Primjer 2. Promatramo ovisnost temperature netom skuhane kave o vremenu proteklom
nakon ulijevanja kave u šalicu
110
. Podaci su dani u donjoj tablici.

vrijeme [min.]
temperatura [°C]
0 82
5 76
8 70
11 65
15 61
18 57
22 52
25 51
30 47
34 45
38 43
42 41
45 39
50 38



110
Preciznije rečeno, nakon ulijevanja kave iz džezve ili kavokuhala u šalicu.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 178

a) Ovisnost temperature kave o vremenu grafički prikažimo odgovarajućim grafikonom (uz
kojega navedimo sve potrebne oznake).
b) Odredimo jednadžbu modela jednostavne eksponencijalne regresije koji najbolje opisuje
promatranu ovisnost i objasnimo značenje parametara dobivenoga modela.
c) Na temelju koeficijenta determinacije procijenimo reprezentativnost modela.
d) Na temelju rezultata b) podzadatka procijenimo početnu temperaturu kave i odredimo
relativnu pogrešku u odnosu na empirijski dobivenu vrijednost.
e) Na temelju rezultata b) podzadatka procijenimo kolika će biti temperatura kave točno 1 sat
nakon ulijevanja u šalicu.
f) 1992. jedna od gošći restorana ''McDonald's'' tužila je restoran jer je slučajnim
prolijevanjem kave temperature 82°C po svojim rukama zaradila teške opekotine. Vještak na
suđenju tada je posvjedočio da tekućina temperature 82°C koja je u dodiru s ljudskom kožom
bila barem pet sekundi izaziva teške opekotine i ustvrdio da bi se takve posljedice izbjegle da
se kava poslužuje pri temperaturi ne većoj od 68°C. Žena je dobila spor i odštetu od
2.700.000,00 USD. Jedna od posljedica toga poznatoga sudskoga procesa bila je da većina
restorana u SAD danas poslužuje kavu čija je temperatura približno 68°C. Na temelju
rezultata b) podzadatka procijenimo koliko dugo treba čekati da se netom skuhana kava
ohladi na temperaturu od 68°C.
g) Pretpostavimo da temperatura sobe u kojoj se nalazi poslužena kava iznosi 23°C. Što se
može reći o temperaturi kave nakon točno 2 sata na temelju dobivenoga modela jednostavne
eksponencijalne regresije? Objasnimo svoj odgovor.

Ovisnost temperature kave o vremenu prikazana je donjim dijagramom rasipanja:




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 179

Jednadžba modela jednostavne eksponencijalne regresije, zajedno s pripadnom krivuljom,
prikazana je na donjoj slici:



Dobivenu jednadžbu najprije zapišimo u standardnom obliku Y

= B ⋅ A
X
. U ovome je slučaju
B = 78.159, dok je vrijednost parametra A jednaka

A = e
–0.016
≈ 0.98413.

Dakle, jednadžba dobivenoga modela jednostavne eksponencijalne regresije je

Y

= 78.159 ⋅ 0.98413
X
.

Parametre dobivenoga modela interpretiramo na sljedeći način:

B = 78.159 ⇔ procijenjena početna temperatura kave iznosi 78.159°C. Budući da empirijska
početna temperatura kave iznosi 82°C, relativna pogreška procjene početne temperature je:

p =
82 78.159
100
82

⋅ ≈ 4.68%.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 180

A = 0.98413 ⇔ izračunat ćemo očekivanu prosječnu stopu promjene temperature kave:

S
1
= 100 ⋅ (A – 1) = –1.5873.

Dakle, temperatura kave će se očekivano smanjiti za 1.5873% u jednoj minuti.

Temperaturu kave nakon jednoga sata (= 60 minuta) procijenit ćemo tako da u jednadžbu
modela jednostavne eksponencijalne regresije uvrstimo x = 60:

Y

= 78.159 ⋅ 0.98413
60
≈ 30°C,

dok ćemo vrijeme potrebno da se kava ohladi na temperaturu 68°C procijeniti tako da iz
jednadžbe

Y

= 78,159 ⋅ 0.98413
X


izrazimo nepoznaznicu X:

ln ln78.159
ln0.98413
Y
X


=

i u dobiveni izraz uvrstimo Y = 68:

ln68 ln78.159
ln0.98413
X


= ≈ 8,7 minuta = 8 minuta i 42 sekunde.

Temperatura kave bit će jednaka sobnoj temperaturi, odnosno 23°C, nakon

ln23 ln78.159
ln0.98413
X


= ≈ 76,5 minuta = 76 minuta i 30 sekundi.

Potom se kava prestaje hladiti i zadržava temperaturu okoline (sobe) od 23°C. Stoga će
stvarna temperatura kave za 120 minuta biti jednaka 23°C. Prognostička temperatura kave za
120 minuta je dvostruko manja:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 181

Y

= 78.159 ⋅ 0.98413
120
≈ 11.46°C.

Na ovom smo primjeru ukazali na tzv. problem ekstrapolacije u regresijskim modelima.
Grubo govoreći, regresijski model može davati dobre procjene za vrijednosti nezavisne
varijable X koje se nalaze unutar segmenta omeđenoga najmanjom i najvećom empirijskom
vrijednošću te varijable. (U promatranom primjeru riječ je o segmentu [0, 50].) Međutim, za
vrijednosti izvan toga segmenta kvaliteta procjene opada što je vrijednost udaljenija od donje
ili gornje granice segmenta. Npr. u promatranom bismo primjeru za x = 51 još mogli očekivati
relativno dobru procjenu temperature kave, ali x = 120 je vrijednost više nego dvostruko veća
od gornje granice segmenta [0, 50], pa se za tu vrijednost dobiva loša procjena odgovarajuće
vrijednosti zavisne varijable Y. Stoga, kad god je to moguće, treba izbjegavati procjenu
vrijednosti zavisne varijable za vrijednosti nezavisne varijable izvan segmenta omeđenoga
najmanjom i najvećom empirijski dobivenom vrijednošću.
111



4.3.2. Model jednostavne logaritamske regresije


Standardni oblik regresijske jednadžbe ovoga modela je:

Y

= A ⋅ ln x + B,

pri čemu vrijednosti nezavisne varijable X nužno moraju biti strogo pozitivne jer je prirodno
područje definicije bilo koje logaritamske
112
funkcije skup 〈0, +∞〉. Kao i kod svih prethodnih
modela, značaj parametara A i B u analizi regresijskoga modela nije jednak: parametar A je
bitno značajniji od parametra B. U nastavku navodimo njihove interpretacije u obliku dvaju
svojstava:

B → procijenjena (ili očekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 1 jedinici mjere. Ova se tvrdnja lako provjeri uvrštavanjem x = 1 u
jednadžbu regresijskoga modela i korištenjem činjenice da je ln 1 = 0.


111
U promatranom je primjeru opisani problem ekstrapolacije dodatno izražen zbog fizikalne neusklađenosti
dobivenoga modela s realnim stanjem: prema fizikalnim zakonima, kava se ne može ohladiti na temperaturu
manju od temperature okoline, a prema dobivenom regresijskom modelu, za velike vrijednosti nezavisne
varijable x temperatura kave bit će sve bliža 0°C zbog asimptotskoga približavanja odgovarajućega grafa osi Ox.
112
U ovome je slučaju riječ o tzv. prirodnom logaritmu: baza logaritma je broj e ≈2,7182818284590452353603.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 182

Interpretacija varijable A, kao i kod modela jednostavne eksponencijalne regresije, nije
izravna, nego ''zaobilazna'' (neizravna) i temelji se na sljedećem svojstvu:

Svojstvo 1. Neka je p > –100 proizvoljan, ali fiksiran realan broj. Ako se vrijednost nezavisne
varijable X promijeni za p%, procijenjena (ili očekivana) prosječna promjena vrijednosti
zavisne varijable Y iznosi A ⋅ ln 1
100
p | |
+
|
\ ¹
. Posebno, za p = 171.82818284590452353603
procijenjena prosječna promjena vrijednosti zavisne varijable Y iznosi točno A.

Uvjet p > –100 postavljen je zbog zahtjeva da vrijednost nezavisne varijable X mora biti
strogo pozitivna: smanjenje konkretne vrijednosti nezavisne varijable X za barem 100%
povlačilo bi da je nova vrijednost te varijable nepozitivna (strogo negativna ili nula), a takve
vrijednosti ne mogu biti obuhvaćene regresijskim modelom.

Dokaz: Analogno kao i kod modela jednostavne eksponencijalne regresije, neka je x
1
početna
vrijednost varijable X i neka je p postotak promjene te varijable. Ako je p > 0, riječ je o
povećanju vrijednosti x
1
za p%, a ako je p < 0, riječ je o smanjenju vrijednosti x
1
za p%.
Pripadna očekivana vrijednost zavisne varijable Y jednaka je:

1 1
ln y A x B

= ⋅ + .

Nakon promjene vrijednosti x
1
za p%, nova vrijednost te varijable je:

2 1 1 1
1
100 100
p p
x x x x
| |
= + ⋅ = + ⋅
|
\ ¹
.

Pripadna očekivana vrijednost zavisne varijable Y jednaka je

2 2 1 1 1
ln ln 1 ln 1 ln ln 1
100 100 100
p p p
y A x B A x B A A x B A y
∧ ∧
( | | | | | |
= ⋅ + = ⋅ + ⋅ + = ⋅ + + ⋅ + = ⋅ + +
| | | (
\ ¹ \ ¹ \ ¹ ¸ ¸
.
otkuda slijedi da je ukupna prosječna promjena vrijednosti zavisne varijable Y jednaka

2 1
ln 1
100
p
y y A
∧ ∧
| |
− = ⋅ +
|
\ ¹
,



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 183

što je i trebalo pokazati. Napomenimo da se pridjev prosječna navodi zbog izvoda formule za
procijenjenu vrijednost parametra A u kojemu se koriste prosjeci vrijednosti nezavisne i
zavisne varijable, pa je i sâm parametar A pokazatelj prosječne promjene.

Primjer 1. Prije točno 10 godina istodobno je posađeno ukupno 12 jednogodišnjih sadnica
određene vrste višnje. U trenutku sadnje prosječna visina jedne sadnice bila je 182.88 cm.
Podaci o prosječnoj visini stabala tijekom svake od minulih 10 godina navedeni su u donjoj
tablici. Promatra se ovisnost prosječne visine izraslih stabala o njihovoj starosti.

starost [god.] prosječna visina [cm]
1 182.88
2 289.56
3 396.24
4 457.2
5 502.92
6 533.4
starost [god.] prosječna visina [cm]
7 563.88
8 579.12
9 594.36
10 600.456
11 603.504

a) Prikažimo ovisnost prosječne visine stabala o njihovoj starosti odgovarajućim grafikonom
uz kojega navedimo sve potrebne oznake.
b) Odredimo jednadžbu modela jednostavne logaritamske regresije koji najbolje opisuje
promatranu ovisnost. Objasnimo značenje svih parametara dobivenoga modela.
c) Procijenimo reprezentativnost modela dobivenoga u rješenju b) podzadatka pomoću
koeficijenta determinacije.
d) Koristeći rezultat b) podzadatka procijenimo prosječnu visinu svih stabala četiri i pol
godine nakon sadnje.
e) Koristeći rezultat b) podzadatka procijenimo trenutak (računajući od trenutka sadnje) u
kojemu će prosječna visina svih stabala biti 3 metra.
f) Koristeći rezultat b) podzadatka procijenimo prosječnu visinu svih posađenih stabala točno
20 godina nakon sadnje i utvrdimo realističnost dobivene procjene.

Ovisnost prosječne visine svih stabala o njihovoj starosti grafički prikazujemo donjim
dijagramom rasipanja:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 184



Jednadžba modela jednostavne logaritamske regresije, zajedno s pripadnom krivuljom,
navedena je na donjoj slici:



Najvažniji parametri dobivenoga modela jednostavne logaritamske regresije su:

A = 186.18 ⇔ Ovaj ćemo parametar interpretirati pomoću p = 10. Dakle, ako se starost svih
sadnica poveća za 10%, procijenjeno (očekivano) povećanje njihove prosječne visine iznosi
186.18 ⋅ ln
10
1
100
| |
+
|
\ ¹
≈ 17.74485 cm.

B = 185.91 ⇔ Procijenjena (očekivana) prosječna visina svih jednogodišnjih sadnica u
trenutku sadnje iznosi 185.91 cm.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 185

Koeficijent determinacije dobivenoga modela iznosi R
2
= 0.9863, otkuda slijedi da je 98.63%
ovisnosti prosječne visine stabala o njihovoj starosti objašnjeno modelom jednostavne
logaritamske regresije, što znači da je model reprezentativan.

Četiri i pol godine nakon sadnje sva stabla bit će stara ukupno 1 + 4,5 = 5.5 godina, pa će
njihova procijenjena prosječna visina u tom trenutku biti

Y

= 186.18 ⋅ ln 5.5 + 185.91 ≈ 503.3 cm.

Trenutak u kojemu će prosječna visina svih stabala biti 3 metra (= 300 cm) odredit ćemo tako
da iz dobivene jednadžbe modela jednostavne logaritamske regresije

Y

= 186.18 ⋅ ln x + 185.91

izrazimo x:

185.91
186.18
y
X e


=

i u dobivenu formulu uvrstimo y = 300. Dobivamo:

300 185.91
186.18
X e


= ≈1.8455 godina = 1 godina 10 mjeseci i 5 dana.

Dakle, računajući od trenutka sadnje, procijenjeno vrijeme u kojemu će prosječna visina svih
stabala biti točno 3 metra iznosi 10 mjeseci i 5 dana.

Točno 20 godina nakon sadnje procijenjena prosječna visina svih stabala (čija će starost tada
biti 1 + 20 = 21 godinu) iznosi

Y

= 186.18 ⋅ ln 21 + 185.91 ≈ 752.74 cm.

Vrijednost x = 21 je gotovo dvostruko veća od gornje granice segmenta [1, 11] u kojemu smo
radili procjene parametara, pa ova procjena ne mora biti realistična. Ipak, u praksi se pokazalo
da stabla višnje prosječno narastu u rasponu od 4.5 do čak 9 metara. Stoga procijenjenu
vrijednost ne treba unaprijed odbaciti kao potpuno pogrešnu, tim više što logaritamska
funkcija za sve veće i veće vrijednosti nezavisne varijable x raste sve ''sporije''.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 186

4.3.3. Model jednostavne potencijske regresije (POWER)
113



Standardni oblik jednadžbe modela potencijske regresije je:

ˆ
A
Y B X = ⋅ .

Podsjetimo da se, za proizvoljan, ali fiksiran realan broj a ∈ R, funkcija f(x) = x
a
naziva opća
potencija. Njezino je prirodno područje definicije skup 〈0, +∞〉, pa – analogno kao i u modelu
jednostavne logaritamske regresije – vrijednosti nezavisne varijable X ne mogu biti
nepozitivni realni brojevi (strogo negativni realni brojevi i nula).

Za analizu regresijskoga modela ponovno je značajniji parametar A, ali – kao u svim
prethodnim modelima – navodimo interpretacije obaju parametara modela:

B → procijenjena (očekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne
varijable X jednaka 1 jedinici mjere. Ova je interpretacija jednaka interpretaciji istoga
regresijskoga parametra u modelu jednostavne logaritamske regresije, a lako se provjeri tako
da se u jednadžbu modela jednostavne potencijske regresije uvrsti x = 1 i primijeni činjenica
da za svaki realan broj a ∈ R vrijedi jednakost: 1
a
= 1.

Interpretacija parametra A se temelji na sljedećem svojstvu:

Svojstvo 1. Neka je p > –100 proizvoljan, ali fiksiran realan broj. Ako se vrijednost nezavisne
varijable X promijeni za p%, procijenjena (očekivana) promjena vrijednosti zavisne varijable
Y iznosi 100 1 1 %
100
A
p
¦ ¹ (
¦ ¦ | |
⋅ + −
( ´ `
|
\ ¹
(
¦ ¦ ¸ ¸ ¹ )
.

Dokaz: Analogno ranijim dokazima, neka je x
1
početna vrijednost nezavisne varijable X.
Pripadna očekivana vrijednost zavisne varijable Y jednaka je:



113
Engleska riječ power ima više značenja, a jedno od njih je i potencija. Stoga je naziv ovoga modela preveden
kao potencijski. Uobičajeni hrvatski prijevod naziva modela (dvostruko logaritamski) potječe od činjenice da se
u tzv. linearizaciji modela (svođenju modela odgovarajućim zamjenama na model jednostavne linearne
regresije) vrijednosti nezavisne i zavisne varijable pojavljuju kao logaritmandi.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 187

1 1
A
y B x

= ⋅ .

Ukoliko se vrijednost x
1
promijeni za p%, nova vrijednost nezavisne varijable bit će:

2 1 1 1
1
100 100
p p
x x x x
| |
= + ⋅ = + ⋅
|
\ ¹
.

Pripadna vrijednost zavisne varijable Y jednaka je

2 2 1 1 1
1 1 1
100 100 100
A A A
A A
p p p
y B x B x B x y
∧ ∧
( | | | | | |
= ⋅ = ⋅ + ⋅ = ⋅ + ⋅ = + ⋅
| | | (
\ ¹ \ ¹ \ ¹ ¸ ¸
,

Već smo utvrdili da je područje vrijednosti svake opće potencije skup svih strogo pozitivnih
realnih brojeva, što znači da su obje vrijednosti
1
y

i
2
y

strogo veće od nule, a samim tim i
različite od nule. Zbog toga je dobro definirana relativna promjena vrijednosti zavisne
varijable Y i ona je jednaka

1
1 1
2 1
1 1 1
1 1
1
100
100
1 1
100
A
A
A
p
p
y
y y
y y p
s
y y y

∧ ∧
∧ ∧
∧ ∧ ∧
(
| |
| |
⋅ + −
(
| + ⋅ −
|
\ ¹
− ( | |
\ ¹ ¸ ¸
= = = = + −
|
\ ¹
,

odnosno, iskazano u postotcima,

100 1 1 %
100
A
p
s
¦ ¹ (
¦ ¦ | |
= ⋅ + −
( ´ `
|
\ ¹
(
¦ ¦ ¸ ¸ ¹ )
,

što je i trebalo pokazati.

Koristeći razvoj u binomni red

2 3
( 1) ( 1) ( 2)
1 1 ...
100 100 2 10000 6 1000000
A
p p A A p A A A p
A
⋅ − ⋅ − ⋅ − | |
+ = + ⋅ + ⋅ + ⋅ +
|
\ ¹
,



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 188

pokazuje se da za relativno male vrijednosti broja p (npr. p ∈ [–1, 1]) i A > 0 vrijedi
aproksimacija:

1 1
100 100
A
p p
A
| |
+ ≈ + ⋅
|
\ ¹


Odavde slijedi sljedeće

Svojstvo 2. Ako se vrijednost nezavisne varijable X promijeni za p%, pri čemu je p relativno
mali realan broj i A > 0, procijenjena (očekivana) promjena vrijednosti zavisne varijable Y
iznosi (p ⋅ A)%. Posebno, za p = ±1 ta promjena iznosi ±A%.

Dakle, pri interpretaciji parametra A obično ćemo uzimati p = 1. Istaknimo da se u
ekonomskim analizama ovim regresijskim modelom omogućava tzv. mjerenje elastičnosti
zavisne varijable u odnosu na nezavisnu varijablu.

Ilustrirajmo primjenu modela jednostavne potencijske regresije na dvama primjerima.

Primjer 1. Tvornica željezničkih vagona “Šlamperajević” iz Piškorevaca razmatra ovisnost
utrošenih radnih sati neposrednih radnika na montaži vagona o ukupnom (kumulativnom)
broju montiranih vagona. Dobiveni podaci navedeni su u sljedećoj tablici.

ukupan (kumulativni) broj
montiranih vagona
rad neposrednih radnika
[000 sati/vagon]
10 59.2
20 48.7
30 46.3
40 42.1
50 40.2
60 37.9
70 36.9
80 35.7

a) Promatranu ovisnost grafički prikažimo odgovarajućim grafikonom uz kojega navedimo
sve potrebne oznake.
b) Odredimo jednadžbu modela jednostavne potencijske regresije koji najbolje opisuje
promatranu ovisnost i objasnimo značenje parametara dobivenoga modela.
c) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 189

d) Na temelju rezultata b) podzadatka procijenimo ukupno vrijeme rada neposrednih radnika
po jednom vagonu ako je montirano ukupno 45 vagona.
e) Na temelju rezultata b) podzadatka procijenimo ukupan (kumulativni) broj montiranih
vagona ako utrošeni radni sati neposrednih radnika iznose 41 000 radnih sati po vagonu.

Ovisnost utrošenih radnih sati neposrednih radnika na montaži o ukupnom (kumulativnom)
broju montiranih vagona grafički prikazujemo donjim dijagramom rasipanja:



Jednadžba modela jednostavne potencijske regresije, zajedno s pripadnom krivuljom,
navedena je na sljedećoj slici:





ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 190

Najvažniji parametri dobivenoga modela su:

B = 102.53 ⇔ Procijenjeni rad neposrednih radnika na montaži prvoga vagona iznosi
102 530 radnih sati.

A = –0.241 ⇔ (uzimamo p = 1) Ako se ukupan (kumulativni) broj montiranih vagona poveća
za 1%, utrošeni radni sati neposrednih radnika po jednom vagonu očekivano će se smanjiti za
0.241%.

Koeficijent determinacije dobivenoga regresijskoga modela je R
2
= 0.9938, što znači da se
99.38% ovisnosti rada neposrednih radnika o ukupnom (kumulativnom) broju montiranih
vagona može objasniti modelom jednostavne potencijske regresije, tj. dobiveni je model vrlo
reprezentativan.

Ukupno vrijeme rada neposrednih radnika na montaži ukupno 45 vagona procijenit ćemo tako
da u jednadžbu dobivenoga regresijskoga modela

Y

= 102.53 ⋅ x
–0.241


uvrstimo x = 45:

Y

= 102.53 ⋅ 45
–0.241
= 40.9663

Dakle, traženo procijenjeno vrijeme montaže po jednom vagonu iznosi 40 966.3 sati.

Ukupan (kumulativni) broj montiranih vagona u slučaju kad se za montažu jednoga vagona
utroši 41 000 radnih sati dobit ćemo tako da iz jednadžbe

Y

= 102.53 ⋅ x
–0.241

izrazimo x:

0.241
102.52
X
y

| |
=
|
\ ¹


i u dobivenu jednadžbu uvrstimo y = 41:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 191

1000
241
102.52
41
X

| |
= ≈
|
\ ¹
45.

Dakle, procijenjeni ukupan (kumulativni) broj montiranih vagona jednak je 45.

Napomenimo da realna funkcija dobivena kao jednadžba modela jednostavne potencijske
regresije pripada tipu tzv. funkcijâ učenja (engl. learning function), a temelji se na
pretpostavci da se utrošak radnih sati smanjuje s ponavljanjem iste radne operacije. Stoga se
modeli jednostavne potencijske regresije često primijenjuju pri ugovaranju dinamike
izvođenja radova ili isporuke serije određenih proizvoda (npr. željezničkih vagona, aviona,
brodova i sl.).

Primjer 2. Na uzorku od ukupno 11 afričkih antilopa (gazela) ispituje se ovisnost između
duljine i srednjega promjera tzv. ramenih kostiju. Dobiveni podaci prikazani su u donjoj
tablici.

srednji promjer
[mm]
duljina
[mm]
17.6 159.9
26 206.9
31.9 236.8
38.9 269.9
45.8 300.6
51.2 323.6
58.1 351.7
64.7 377.6
66.7 384.1
80.8 437.2
82.9 444.7

a) Ovisnost duljine ramenih kosti o njihovu srednjem promjeru grafički prikažimo
odgovarajućim grafikonom uz kojega navedimo sve potrebne oznake.
b) Odredimo jednadžbu modela jednostavne potencijske regresije koji najbolje opisuje
promatranu ovisnost. Navedimo sve parametre toga modela i objasnimo njihovo značenje.
c) Procijenimo reprezentativnost dobivenoga regresijskoga modela na temelju koeficijenta
determinacije.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 192

d) Na temelju rezultata b) podzadatka procijenimo duljinu ramenih kostiju čiji je srednji
promjer 84 mm.
e) Na temelju rezultata b) podzadatka procijenimo srednji promjer ramenih kostiju čija je
duljina 40 cm.
Ovisnost duljine ramenih kostiju o njihovu srednjem promjeru grafički je prikazana donjim
dijagramom rasipanja:



Jednadžba modela jednostavne potencijske regresije, zajedno s pripadnom krivuljom,
navedena je na donjoj slici:




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 193

Najvažniji parametri dobivenoga modela jednostavne potencijske regresije su:

B = 24.13 ⇔ Procijenjena duljina ramenih kostiju čiji je srednji promjer 1 mm iznosi 24.13
mm. (Interpretacija ovoga parametra ne odgovara realnoj situaciji jer su druga istraživanja
pokazala da je najmanja zabilježena duljina ramenih kostiju približno 140 mm = 14 cm.)

A = 0.6595 ⇔ (uzimamo p = 1) Ako se srednji promjer ramenih kostiju poveća za 1%,
očekivano relativno prosječno povećanje duljine ramenih kostiju iznosi 0.6595%.
Koeficijent determinacije dobivenoga modela jednostavne potencijske regresije iznosi R
2
= 1,
što ukazuje na činjenicu da se dobivenim regresijskim modelom potpuno može objasniti
ovisnost duljine ramenih kostiju antilope o njihovu srednjem promjeru. Taj je rezultat
posljedica zaokruživanja izračuna koeficijenta determinacije na 4 decimalna mjesta. Izračuna
li se R
2
na 10 decimalnih mjesta, dobiva se R
2
= 0.9999874242. U svakom slučaju, riječ je o
vrlo reprezentativnom modelu jednostavne regresije.

Procijenjenu duljinu ramenih kostiju čiji je srednji promjer 84 mm dobit ćemo tako da u
jednadžbu dobivenoga modela jednostavne potencijske regresije

Y

= 24.13 ⋅ x
0.6595


uvrstimo x = 84:

Y

= 24.13 ⋅ 84
0.6595
≈ 448.4 mm.

Stoga tražena procijenjena duljina ramenih kostiju iznosi 448.4 mm.

Srednji promjer ramenih kostiju čija je duljina 40 cm (= 400 mm) procijenit ćemo tako da iz
dobivene jednadžbe modela jednostavne potencijske regresije izrazimo x:

2000
1319
24.13
y
X

| |
=
|
\ ¹


pa u dobivenu jednakost uvrstimo y = 400:

2000
1319
400
24.13
X

| |
= ≈
|
\ ¹
70.7.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 194

Stoga traženi procijenjeni srednji promjer ramenih kostiju iznosi 70.7 mm.


afrička antilopa (gazela)


4.4. Primjer modela višestruke (multiple) regresije: model višestruke linearne
regresije


U ovoj se točki ukratko opisuje najjednostavniji primjer modela višestruke ili multiple
regresije, a to je model višestruke linearne regresije. Podsjetimo da općenito modeli
višestruke regresije imaju jednu zavisnu i barem dvije nezavisne varijable. U slučajevima u
kojima se pojavljuju najmanje tri nezavisne varijable nemoguće je dati grafički prikaz. No, i u
takvim se slučajevima mogu računati odgovarajući analogoni koeficijenata linearne
korelacije, koeficijenata determinacije itd., te dati interpretacije parametara dobivenoga
modela višestruke regresije. Rečeno ćemo pokazati na primjeru modela višestruke linearne
regresije.

Opći oblik modela višestruke linearne regresije je:

Y = A
1
⋅ X
1
+ A
2
⋅ X
2
+ … + A
n
⋅ X
n
+ B + e,

a odgovarajuća jednadžba toga modela je

Y

= A
1
⋅ x
1
+ A
2
⋅ x
2
+ … + A
n
⋅ x
n
+ B.

U objema jednakostima su, analogno kao i u modelu jednostavne linearne regresije, A
1
, A
2
,
…, A
n
regresijski koeficijenti modela, B slobodni član, a e stohastička (slučajna) varijabla


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 195

koja ''mjeri'' pogrešku procjene. Za svaki i = 1, 2, …, n interpretacija regresijskoga
koeficijenta A
i
glasi:

A
i
je procijenjena (očekivana) prosječna promjena vrijednosti varijable X
i
u slučaju kada se
vrijednost te varijable poveća za 1 jedinicu mjere, a vrijednosti svih ostalih varijabli ostanu
nepromijenjene.

Navedena se interpretacija može poopćiti za bilo koji realan broj k ∈ R:

k ⋅ A
i
je procijenjena (očekivana) prosječna promjena vrijednosti varijable X
i
u slučaju kad se
vrijednost te varijable promijeni za k jedinica mjere, a vrijednosti svih ostalih varijabli ostanu
nepromijenjene.

Slobodni član B je manje važan parametar modela, ali radi potpunosti navodimo i njegovu
interpretaciju:

B je procijenjena (očekivana) vrijednost zavisne varijable Y u slučaju kad su vrijednosti svih
nezavisnih varijabli X
1
, …, X
n
jednake nuli. (Ova interpretacija, naročito u ekonomiji, vrlo
često ne odgovara realnoj situaciji.)

Primjer 1. (izbori za kanadski parlament) Ispituje se ovisnost ukupnoga postotka dobivenih
glasova (a time i mandata) relativnoga pobjednika na svakim pojedinim parlamentarnim
izborima o postotcima glasova dobivenih u četiri kanadske regije: R
1
, R
2
, R
3
i R
4
. Dobiveni
podaci su prikazani u sljedećoj tablici.

















ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 196

izborna
godina
postotak na
državnoj razini
postotak u
regiji
R
1

postotak u
regiji
R
2

postotak u
regiji
R
3

postotak u
regiji
R
4
1949. 73 74 78 58 61
1953. 64 34 78 35 38
1957. 42 64 52 29 32
1958. 79 76 73 95 82
1962. 44 55 49 88 27
1963. 49 61 62 6 32
1965. 50 45 69 2 32
1968. 59 22 74 25 70
1972. 41 31 56 7 17
1974. 54 41 71 11 35
1979. 48 56 58 78 68
1980. 52 63 74 4 0
1984. 75 78 74 80 68
1988. 57 34 63 67 38
1993. 60 97 67 39 19
1997. 52 34 72 17 18
2000. 57,5 60 77 17 15
2004. 43,8 69 53 11 22

a) Odredimo jednadžbu modela višestruke linearne regresije i objasnimo značenje parametara
dobivenoga modela.
b) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije, te
statističku značajnost pojedinih regresorskih varijabli i cijeloga modela (uz razinu
pouzdanosti od 95%).
c) Relevantne predizborne ankete (provedene od strane neovisnih agencija) pokazuju da će
stranka S u regiji R
1
osvojiti 51% glasova, u regiji R
2
67% glasova, u regiji R
3
12% glasova i u
regiji R
4
15% glasova. Na temelju rezultata a) podzadatka utvrdimo može li ta stranka
računati na relativnu izbornu pobjedu.
d) Na temelju rezultata a) podzadatka procijenimo najmanji postotak glasova koji stranka S
treba dobiti u njoj tradicionalno sklonoj regiji R
2
tako da bude relativni pobjednik izbora ako
se na temelju predizbornih anketa procjenjuje da će ta stranka u regiji R
1
osvojiti 55%
glasova, u regiji R
3
38% glasova, a u regiji R
4
41% glasova.

Za dobivanje i analizu modela višestruke linearne regresije u MS Excelu koristimo proceduru
Regression u okviru alata Analiza podataka (Data Analysis). Primjenom te procedure
dobivamo sljedeće vrijednosti:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 197

koeficijent višestruke linearne korelacije (Multiple R): 0.96556752, otkuda slijedi da postoji
jaka linearna veza između postotka na državnoj razini, kao zavisne varijable, i postotaka na
regionalnoj razini, kao nezavisnih varijabli;
koeficijent determinacije: 0.932320637, otkuda slijedi da je dobiveni model višestruke
linearne regresije reprezentativan (objašnjava približno 93.25% ovisnosti zavisne varijable o
svim četirima nezavisnim varijablama);
p – vrijednost koeficijenta višestruke linearne korelacije (p – vrijednost modela višestruke
linearne regresije): 1,76513E-07 = 0.000000176512 ⇔ dobiveni koeficijent višestruke
linearne korelacije i dobiveni model višestruke linearne regresije su statistički značajni;
slobodni član: -17.3211733 (teoretski, to je ukupan postotak mandata na državnoj razini u
slučaju da pobjednička stranka niti u jednoj regiji ne osvoji niti jedan glas, ali takva
interpretacija ne odgovara realnoj situaciji)
koeficijent uz varijablu Postotak u regiji R
1
: 0.129717918 ⇔ Ako se postotak dobivenih
glasova u regiji R
1
poveća za 1, očekivano prosječno povećanje postotka dobivenih glasova
na državnoj razini iznosi (približno) 0.13;
p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
1
: 0.011263866 ⇔ uz
razinu pozdanosti od 95%, postoji statistički značajan utjecaj postotka glasova dobivenih u
regiji R
1
na ukupan postotak dobivenih glasova na državnoj razini;
koeficijent uz varijablu Postotak u regiji R
2
: 0.857302 ⇔ Ako se postotak dobivenih glasova u
regiji R
2
poveća za 1, očekivano prosječno povećanje postotka dobivenih glasova na državnoj
razini iznosi (približno) 0.86;
p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
2
: 3.96069E-07 =
0,000000396069 ⇔ uz razinu pozdanosti od 95%, postoji statistički značajan utjecaj postotka
glasova dobivenih u regiji R
2
na ukupan postotak dobivenih glasova na državnoj razini;
koeficijent uz varijablu Postotak u regiji R
3
: 0.117393926 ⇔ Ako se postotak dobivenih
glasova u regiji R
3
poveća za 1, očekivano prosječno povećanje postotka dobivenih glasova
na državnoj razini iznosi (približno) 0.12;
p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
3
: 0.00900155 ⇔ uz
razinu pozdanosti od 95%, postoji statistički značajan utjecaj postotka glasova dobivenih u
regiji R
3
na ukupan postotak dobivenih glasova na državnoj razini;
koeficijent uz varijablu Postotak u regiji R
4
: 0.112526063 ⇔ Ako se postotak dobivenih
glasova u regiji R
4
poveća za 1, očekivano prosječno povećanje postotka dobivenih glasova
na državnoj razini iznosi (približno) 0.11;
p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R
4
: 0.049511477 ⇔ uz
razinu pozdanosti od 95%, postoji statistički značajan utjecaj postotka glasova dobivenih u
regiji R
4
na ukupan postotak dobivenih glasova na državnoj razini;



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 198

Primijetimo da prema strožem kriteriju (uz razinu pouzdanosti od 99%) utjecaj postotka
glasova dobivenih u regijama R
1
i R
4
ne bi bio statistički značajan

Za svaki i = 1, 2, 3, 4 označimo s x
i
postotak glasova koje je pobjednička stranka dobila u
regiji R
i
. Tada jednadžba modela višestruke linearne regresije koji opisuje promatranu
ovisnost glasi:

Y

= 0.129717918 ⋅ x
1
+ 0.857302 ⋅ x
2
+ 0.117393926 ⋅ x
3
+ 0.112526063 ⋅ x
4
– 17.3211733.

Procjenu može li stranka koja u regiji R
1
osvoji 51% glasova, u regiji R
2
67% glasova, u regiji
R
3
12% glasova i u regiji R
4
15% glasova računati na relativnu izbornu pobjedu napravit ćemo
tako da u gornju jednadžbu uvrstimo x
1
= 67, x
2
= 52, x
3
= 12 i x
4
= 15:

Y

= 0.129717918 ⋅ 51 + 0.857302 ⋅ 67 + 0.117393926 ⋅ 12 + 0.112526063 ⋅ 15 – 17.3211733,
Y

= 49.83029292.

Budući da procijenjeni rezultat nije strogo veći od 50 [%], stranka ne bi trebala računati na
relativnu pobjedu na parlamentarnim izborima.
Najmanji postotak glasova koji stranka S treba dobiti u njoj tradicionalno sklonoj regiji R
2

tako da bude relativni pobjednik izbora u drugom podslučaju procijenit ćemo tako da riješimo
nejednadžbu

Y

≥ 50,

tj. tako da po x
2
riješimo nejednadžbu

0.129717918 ⋅ 55 + 0.857302 ⋅ x
2
+ 0.117393926 ⋅ 38 + 0.112526063 ⋅ 41 – 17.3211733 ≥ 50

Odavde je
x
2
≥ 59.62,

pa se može zaključiti da bi stranka S u njoj tradicionalno sklonoj regiji R
2
trebala dobiti
najmanje 60% ukupnih glasova birača u toj regiji tako da može računati na relativnu pobjedu
na parlamentarnim izborima.




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 199

5. INDIVIDUALNI BROJČANI POKAZATELJI
RAZVOJA VREMENSKOGA NIZA


Vrijednosti neke pojave u vremenu obično određujemo i uspoređujemo u određenim
vremenskim razdobljima. Vremensko razdoblje u kojemu smo posljednji put odredili
vrijednost neke pojave naziva se tekuće ili izvještajno razdoblje, a sama određena vrijednost
tekuća vrijednost te pojave. Sva razdoblja prije tekućega u kojima smo određivali vrijednost
promatrane pojave nazivaju se prethodna razdoblja. Od svih njih najznačajnije je neposredno
prethodno razdoblje: to je, zapravo, vremensko razdoblje u kojemu smo pretposljednji put
odredili vrijednost promatrane pojave.

Primjer 1. Promatramo ukupan broj sklopljenih i razvedenih brakova u Republici Hrvatskoj u
razdoblju od 2002. do 2006. godine.


godina
brakovi
sklopljeni razvedeni
2002. 22 806 4 496
2003. 22 337 4 934
2004. 22 700 4 985
2005. 22 138 4 883
2006. 22 092 2 651
izvor: Mjesečno statističko izvješće 3/08, Državni zavod za statistiku, Zagreb, 2008.

U ovome je primjeru tekuće ili izvještajno razdoblje 2006. godina jer je, prema navedenoj
tablici, u toj godini posljednji put izvršeno brojanje sklopljenih, odnosno razvedenih brakova.
Prethodna razdoblja su 2002., 2003., 2004. i 2005. godina, a neposredno prethodno razdoblje
je 2005. godina.

Primjer 2. Promatramo kretanje prosječne mjesečne isplaćene neto-plaće po jednom
zaposleniku u svim pravnim osobama u Republici Hrvatskoj koje se bave financijskim
posredovanjem za razdoblje od siječnja 2007. godine do siječnja 2008. godine.

godina mjesec prosječna neto-plaća [kn]



2007.
siječanj 6.460,00
veljača 6.604,00
rujan 6.567,00
listopad 6.569,00
studeni 8.228,00
prosinac 6.709,00
2008. siječanj 7.152,00
izvor: Mjesečno statističko izvješće 3/08, Državni zavod za statistiku, Zagreb, 2008.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 200

U ovome je primjeru tekuće ili izvještajno razdoblje siječanj 2008. godine. Prethodna
razdoblja su siječanj, veljača, rujan, listopad, studeni i prosinac 2007. godine. Neposredno
prethodno razdoblje je prosinac 2007. godine. Uočimo da je razdoblje neposredno prethodno
mjesecu rujnu 2007. godine mjesec veljača 2007. godine, a ne mjesec kolovoz 2007. godine.
No, to ne znači da se u razdoblju od ožujka do kolovoza 2007. godine nije pratilo kretanje
promatrane prosječne neto-plaće, nego isključivo da ti podaci nisu navedeni u tablici.
Nerijetko se vrijednosti promatrane pojave iz različitih razloga
114
uspoređuju s jednom te
istom vrijednošću pojave određenom u nekomu razdoblju. Ta, jedna te ista vrijednost naziva
se bazna vrijednost, a razdoblje u kojemu je određena bazno razdoblje.

Primjer 3. Promatramo prosječan godišnji broj korisnika novčane naknade na Hrvatskom
zavodu za zapošljavanje u razdoblju od 2003. do 2007. godine:

godina prosječan godišnji broj
korisnika novčane naknade
2003. 67 977
2004. 70 467
2005. 72 802
2006. 66 407
2007. 59 603
izvor: Mjesečno statističko izvješće 3/08, Državni zavod za statistiku, Zagreb, 2008.

Stanje u svakoj pojedinoj godini možemo usporediti sa stanjem u 2007. godini, pa npr.
možemo zaključiti (kako?) da je u 2003. godini bilo za 35.6% više korisnika novčane naknade
nego u 2007. godini, u 2004. godini za 14% više korisnika novčane naknade nego u 2007.
godini itd. U ovome je primjeru bazno razdoblje 2007. godina, a bazna vrijednost 59 603
(vrijednost promatrane pojave u baznom razdoblju).

Uobičajeni grafički prikaz vremenskoga niza jest linijski grafikon. Naslov takvoga grafikona
obično je izraz tipa ''Kretanje pojave X u razdoblju od… do…''. Pritom ćemo, radi
jednostavnosti, izraz tipa ''razdoblje od 2000. do 2007. godine'' , interpretirati kao ''vremensko
razdoblje od 01.01.2000. do 31.12.2007., tj. u to ćemo razdoblje ''uključiti'' cijelu 2000.
godinu i cijelu 2007. godinu
115
. Grafički prikazi podataka iz Primjera 1. i Primjera 3. su
sljedeće dvije slike.


114
Jedan od najčešćih razloga je političke prirode: npr. u predizbornoj kampanji trenutno vladajuća stranka
obično uspoređuje prosječne plaće, cijene, vanjski dug itd. u svakoj godini obnašanja vlasti sa stanjem u godini
neposredno prije prošlih parlamentarnih izbora na kojima je preuzela obnašanje vlasti.
115
Matematički precizno, pod pojmom ''razdoblje između trenutka X
1
i trenutka X
2
'' podrazumijevat ćemo
zatvoreni interval (segment) [X
1
, X
2
].


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 201





Budući da kretanje vrijednosti neke pojave pratimo u vremenu, promatranu pojavu možemo
shvatiti kao funkciju vremena, odnosno, sukladno razmatranjima iz 4. poglavlja, shvatiti
vrijeme kao nezavisnu varijablu (X), a promatranu pojavu kao zavisnu varijablu (Y).
Uobičajenoj oznaci nezavisne varijable (X) pridodat ćemo indeks t kako bismo naglasili da je
riječ o posebnom tipu nezavisne varijable. Dakle, nezavisnu vremensku varijablu označavat
ćemo s X
t
.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 202

Radi jednostavnosti, promatrat ćemo slučajeve kada se vrijednosti neke pojave određuju u
jednakim (pravilnim) vremenskim intervalima (npr. točno jednom mjesečno svakoga mjeseca,
točno jednom godišnje svake godine itd.). Te vrijednosti poredat ćemo sukladno kronološkoj
skali modaliteta (vidjeti 1. poglavlje), tj. skup vrijednosti promatrane pojave ćemo kronološki
urediti radi pojednostavljivanja daljnje statističke analize.


5.1. Definicija i vrste vremenskih nizova


(Konačan) Vremenski niz je niz od ukupno n ∈ N određenih, kronološki uređenih vrijednosti
neke pojave. Vrijednosti koje tvore vremenski niz obično nazivamo frekvencije
116
. Budući da
smo istakli kako ćemo kretanje neke pojave promatrati kao funkciju vremena, potrebno je
precizno definirati što će biti prirodno područje definicije (domena), a što područje vrijednosti
(kodomena) takvoga pridruživanja.

Smatramo intuitivno prihvatljivim pretpostaviti da vrijednost promatrane pojave ne ovisi o
broju vezanom uz razdoblje u kojemu je izmjerena vrijednost pojave
117
. Tako npr. u Primjeru
1. broj razvedenih brakova u 2003. godini (4 934) ne smatramo na bilo koji način povezanim
s brojem 2002, broj sklopljenih brakova u 2004. godini (22 700) ne smatramo na bilo koji
način povezanim s brojem 2004 itd. Stoga ćemo za prirodno područje definicije (domenu)
nećemo uzimati npr. skupove tipa {2002, 2003, 2004, 2005, 2006}. Kako bismo što više
pojednostavnili statističku analizu, početnom razdoblju (odnosno, razdoblju u kojemu smo
prvi put odredili vrijednost promatrane pojave) dodijelit ćemo vrijednost vremenske varijable
X
t
= 0. Osnovni razlog takvom pridruživanju jest korištenje modela jednostavne linearne
regresije i jednostavne eksponencijalne regresije u analizi vremenskih nizova: ti modeli
pretpostavljaju da se vrijednost zavisne varijable Y može izračunati u slučaju kad je vrijednost
nezavisne varijable jednaka nuli
118
. Stoga ćemo, slobodno govoreći, vrijednosti vremenske
varijable početi brojati od nule
119
. Preciznije, početnom vremenskom razdoblju dodijelit ćemo
vrijednost vremenske varijable t = 0, njemu neposredno sljedećem vremenskom razdoblju
vrijednost t = 1, itd. Imamo li ukupno n vremenskih razdoblja u kojima smo određivali
vrijednost neke pojave, posljednjem od njih – a to je, zapravo, tekuće razdoblje – dodijelit


116
Navedeni je naziv svojevrstan vremenski analogon naziva apsolutna frekvencija kojega smo susreli u 2.
poglavlju.
117
Javno iznošenje navedene pretpostavke našu malu visoku školu ozbiljno izlaže žestokim prosvjedima
numerologa, astrologa i njima sličnih ''-loga'', ali pojednostavljuje daljnju statističku analizu.
118
Štoviše, jedan od parametara svakoga od tih modela interpretira se upravo kao vrijednost odgovarajuće
funkcije za x = 0.
119
Za sve vjernike: oprez, t = 0 ne znači da je prva vrijednost pojave izmjerena u godini Kristova rođenja.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 203

ćemo vrijednost vremenske varijable t = n – 1. Prema tome, prirodno područje definicije
(domena) svake funkcije vremena koju budemo razmatrali bit će konačan skup {0, 1, …,
n – 1}.

Područje vrijednosti (kodomena) svake funkcije vremena bit će skup frekvencija. Radi
jednostavnosti, s Y
k
označavat ćemo frekvenciju pridruženu vrijednosti vremenske varijable
X
t
= k. Tako je npr. Y
0
vrijednost pojave pridružena vrijednosti vremenske varijable t = 0,
odnosno vrijednost pojave u početnom razdoblju (jer je t = 0 vrijednost nezavisne varijable
dodijeljena početnom vremenskom razdoblju) a Y
n – 1
vrijednost pojave pridružena vrijednosti
vremenske varijable t = n – 1, odnosno vrijednost pojave u tekućem razdoblju (jer je t = n – 1
vrijednost vremenke varijable dodijeljena tekućem razdoblju). Ovakav dogovor svakako treba
imati na umu prigodom provedbe statističke analize.

U prvi mah nam se možda čini da smo pogriješili kad smo rekli da ćemo kretanje pojave u
vremenu opisati kao funkciju vremena. Naime, naše dosadašnje shvaćanje pojma funkcije
pretpostavlja da, nakon definiranja prirodnoga područja definicije (domene) i područja
vrijednosti (kodomene), zadamo ''formulu'' (preciznije, analitički izraz u zatvorenoj formi)
pomoću koje se za svaku pojedinu vrijednost nezavisne varijable računa pripadna vrijednost
zavisne varijable. Međutim, u matematici se funkcija može potpuno definirati na tri načina:
već opisanom ''formulom'', tablično i grafički. Tablični i grafički prikaz naročito su pogodni
načini zadavanja funkcije ukoliko je njezino prirodno područje definicije (domena) relativno
''mali'' konačan skup, a u analizi vremenskih nizova imamo upravo takav slučaj. Stoga ćemo
spomenutu funkciju vremena uvijek najprije definirati tablično, a potom ćemo – potpuno
analogno kao u regresijskoj analizi – nastojati pronaći najbolju ''formulu'', tj. analitički izraz
kojim možemo definirati istu tu funkciju. Taj će izraz praktički uvijek biti približno točan jer
je korelacija vremena i promatrane pojave vrlo rijetko funkcijska. Iz toga se razloga statistički
modeli korišteni u analizi vremenskih nizova mogu ubrojiti u regresijske modele, pa se
njihova reprezentativnost može procjenjivati na isti način kao i za sve druge regresijske
modele.

Zaključno spomenimo da sve vremenske nizove možemo podijeliti u dvije skupine:

1.) intervalni vremenski niz – to je niz frekvencija dobivenih mjerenjem u određenomu
vremenskom intervalu (npr. broj noćenja u svratištu ''Zlatna kokoš'' u Škrabutniku u
razdoblju od 2001. godine do 2007. godine, broj vozila na autocesti Zagreb – Lipovac u
razdoblju od 08:00 do 20:00 sati itd.).

2. trenutačni vremenski niz – to je niz frekvencija dobivenih mjerenjem ili promatranjem u
određenomu trenutku (npr. broj stanovnika mjesta Sveti Petar u Šumi u razdoblju od 1971.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 204

godine do 2001. godine – stanje na dan 30.6., broj vozila na autocesti Zagreb – Lipovac dana
15.svibnja 2008. u 12:00 sati itd.).


5.2. Pokazatelji pojedinačnih apsolutnih promjena


Bilo koja razlika vrijednosti dviju frekvencija promatrane pojave naziva se apsolutna
promjena te pojave. Apsolutna promjena može biti pozitivna ili negativna: ako je njezin
predznak +, govorimo o povećanju vrijednosti pojave, a ako je njezin predznak –, govorimo o
smanjenju vrijednosti pojave.

Primjer 4. Godinama (x) iz Primjera 3. pridružimo vrijednosti vremenske varijable (t) prema
formuli: t = x – 2003. Drugim riječima, 2003. godini pridružimo t = 0, 2004. godini
pridružimo t = 1 itd. Izračunajmo razlike Y
0
– Y
4
i Y
3
– Y
1
i objasnimo njihovo značenje.
Imamo redom:

Y
0
– Y
4
= 67 977 – 59 603 = 8 374,

što znači da je 2003. godine prosječan godišnji broj korisnika novčane naknade bio za 8 374
veći nego 2007. godine (ili, ekvivalentno, da je 2007. godine prosječan godišnji broj korisnika
novčane naknade bio za 8 374 manji nego 2003. godine). Nadalje,

Y
3
– Y
1
= 66 407 – 70 467 = – 4 060,
što znači da je 2006. godine prosječan godišnji broj korisnika novčane naknade bio za 4 060
manji nego 2004. godine (ili, ekvivalentno, da je 2004. godine prosječan godišnji broj
korisnika novčane naknade bio za 4 060 veći nego 2006. godine).

U praksi se najčešće računaju vrijednosti niza uzastopnih apsolutnih promjena (oznaka: ∆Y
t
)
neke pojave. Te se vrijednosti dobiju tako da se od vrijednosti pojave u tekućemu razdoblju
oduzmemo vrijednost pojave u neposredno prethodnomu razdoblju, tj.

∆Y
t
= Y
t
– Y
t – 1
, za svaki t = 1, 2, 3, ..., n – 1.

Primjer 5. Izračunajmo vrijednosti uzastopnih apsolutnih promjena prosječnoga broja
korisnika novčane pomoći (podaci iz Primjera 3.). Dobivamo:






ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 205

godina t prosječan godišnji broj
korisnika novčane naknade
uzastopne apsolutne
promjene (∆Y
t
)
2003. 0 67 977 nepoznata
2004. 1 70 467 2 490
2005. 2 72 802 2 335
2006. 3 66 407 -6 395
2007. 4 59 603 -6 804

U presjeku drugoga retka i trećega stupca gornje tablice upisali smo riječ nepoznata jer se
vrijednost uzastopne apsolutne promjene prosječnoga godišnjega broja korisnika novčane
naknade za 2003. godinu dobije tako da se od prosječnoga godišnjega broja korisnika novčane
naknade u 2003. godini oduzme prosječan godišnji broj korisnika novčane naknade u 2002.
godini, a potonji podatak nemamo naveden u tablici. Ovo pravilo vrijedi pri svakom
računanju apsolutnih promjena:

Pravilo 1. Vrijednost uzastopne apsolutne promjene za početno razdoblje (t = 0) uvijek je
nepoznata. OPREZ! Pogrešno je kao vrijednost uzastopne apsolutne promjene za
početno razdoblje (t = 0) navesti broj 0 (nula) jer broj 0, kao pokazatelj apsolutne
promjene, znači jednakost vrijednosti pojave u odgovarajućim razdobljima, a ne da taj
pokazatelj ne možemo efektivno izračunati.

Iz dobivenoga stupca tablice vidimo npr. da je prosječan broj korisnika novčane naknade u
2004. godini bio za 2 490 veći nego u 2003. godini, prosječan broj korisnika novčane naknade
u 2006. godini bio je za 6 395 manji nego u 2005. godini itd.

Istaknimo i da se apsolutne promjene mogu računati u odnosu na isto (bazno) vremensko
razdoblje. Odgovarajući se pokazatelji dobiju tako da se od frekvencije pojave u tekućemu
razdoblju oduzme frekvencija pojave u baznomu razdoblju (b):

∆*Y
t
= Y
t
– Y
b
, za svaki t = 0, 1, …, n – 1.

Primjer 6. Izračunajmo pokazatelje apsolutnih promjena u odnosu na 2004. godinu za
podatke iz Primjera 3. Budući da je b = 1, tj. Y
b
= Y
1
= 70 467, dobivamo:

godina t prosječan godišnji broj
korisnika novčane naknade
pojedinačne apsolutne
promjene u odnosu na
2004. godinu (∆*Y
t
)
2003. 0 67 977 -2 490
2004. 1 70 467 0
2005. 2 72 802 2 335
2006. 3 66 407 -4 060
2007. 4 59 603 -10 864


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 206

Iz posljednjega stupca dobivene tablice možemo zaključiti npr. da je prosječan broj korisnika
novčane pomoći u 2005. godini bio za 2 335 veći, a prosječan broj korisnika novčane pomoći
u 2006. godini za 4 060 manji nego u 2004. godini.


5.3. Modeli trenda


Ukoliko postoji određena pravilnost u promjenama vrijednosti promatrane pojave u
određenom vremenskom razdoblju (tj. ukoliko vremenski niz ima tendenciju rasta ili pada),
kažemo da vremenski niz ima trend. Tendencija rasta ili pada se vrlo dobro može ''očitati''
izračunavanjem vrijednosti uzastopnih apsolutnih apsolutnih promjena: ako je dobiveni niz
rastući, tj. ukoliko za svaki t = 1, 2, …, n – 2 vrijedi nejednakost

∆Y
t
≤ ∆Y
t + 1
,

kažemo da vremenski niz ima tendenciju rasta, a ukoliko vrijedi nejednakost

∆Y
t
≥ ∆Y
t + 1
,

kažemo da vremenski niz ima tendenciju pada. U takvim se slučajevima kretanje promatrane
pojave može opisati pomoću odgovarajućega modela trenda. Grubo govoreći, modeli trenda,
zapravo, nisu ništa drugo negoli ''obični'' regresijski modeli u kojima ''ulogu'' nezavisne
varijable X preuzima vremenska varijabla t.

Ukoliko se promatrana pojava mijenja za približno jednake apsolutne iznose u svakoj jedinici
vremena, njezino kretanje možemo opisati modelom linearnoga trenda. Odgovarajuća
jednadžba modela linearnoga trenda i pripadni parametri isti su kao i kod modela jednostavne
linearne regresije, samo što se u slučaju modela linearnoga trenda vrijednost parametra A
interpretira kao očekivana prosječna promjena vrijednosti varijable Y u jedinici vremena.

Ukoliko se, pak, promatrana pojava ne mijenja linearno, nego sve brže (ili sporije) ovisno o
vrijednosti vremenske varijable, njezino kretanje možemo opisati modelom eksponencijalnoga
trenda. Odgovarajuća jednadžba i pripadni parametri toga modela trenda isti su kao i kod
modela jednostavne eksponencijalne regresije, samo što se u slučaju modela
eksponencijalnoga trenda vrijednost parametra A interpretira kao očekivana relativna
prosječna promjena vrijednosti varijable Y u jedinici vremena.

Reprezentativnost modela trenda obično se procjenjuje na temelju koeficijenta varijacije toga
modela, ali se za procjenu može koristiti i koeficijent determinacije. Formule za izračun


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 207

navedenih pokazatelja jednake su odgovarajućim formulama iz podtočaka 4.2.3.3. i 4.2.3.4.
Kad god je to moguće, treba izračunati oba navedena pokazatelja.

Ilustrirajmo primjenu modela trenda na sljedećem primjeru:

Primjer 1. U donjoj je tablici prikazano kretanje prosječne cijene nafte u SAD u razdoblju od
1. travnja 2007. do 31. travnja 2008. godine.

mjesec i godina t prosječna cijena nafte
[USD/barel]
travanj 2007. 0 63,98
svibanj 2007. 1 63,45
lipanj 2007. 2 67,49
srpanj 2007. 3 74,12
kolovoz 2007. 4 72,36
rujan 2007. 5 79,91
listopad 2007. 6 85,80
studeni 2007. 7 94,77
prosinac 2008. 8 91,69
siječanj 2008. 9 92,97
veljača 2008. 10 95,39
ožujak 2008. 11 105,46
travanj 2008. 12 112,58
Izvor: Energy Information Administration – službena energetska statistika Vlade SAD

a) Prikažimo kretanje prosječne cijene nafte u promatranom razdoblju linijskim grafikonom s
ishodištem u početnoj godini razdoblja promatranja. Uz grafikon navedimo sve potrebne
oznake.
b) Odredimo jednadžbu modela linearnoga, odnosno eksponencijalnoga trenda koji najbolje
opisuje kretanje promatrane pojave. Objasnimo značenje parametara trenda i prikažimo
dobivene modele grafički.
c) Na temelju koeficijenata determinacije procijenimo koji od navedenih modela trenda bolje
opisuje kretanje prosječne cijene nafte. Potom na temelju reprezentativnijega modela trenda
prognozirajmo kretanje prosječne cijene nafte u svakom pojedinom mjesecu do kraja 2008.
godine.
d) Ukoliko se kretanje prosječne cijene nafte nastavi prema modelu odabranom u c)
podzadatku, odredimo u kojem mjesecu možemo očekivati da cijena nafte prvi put dosegne
200 USD/barel.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 208

Kretanje prosječne cijene nafte na američkom tržištu u promatranom razdoblju grafički je
prikazano sljedećim linijskim grafikonom:



Jednadžbe modela linearnoga, odnosno eksponencijalnoga trenda zajedno s pripadajućim
krivuljama trenda i koeficijentima determinacije navedene su na sljedećoj slici:



Zasebno ćemo analizirati svaki model trenda:

– model linearnoga trenda: njegovi parametri su:


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 209

A = 3.9743 ⇔ očekivano mjesečno prosječno povećanje prosječne cijene nafte iznosi
približno 4 USD po barelu;
B = 60.767 ⇔ procijenjena prosječna cijena nafte u travnju 2007. godine iznosi
približno 60,77 USD
– model eksponencijalnoga trenda: njegovi parametri su:
A = e
0.0475
= 1.048646 ⇒ 100 ⋅ (A – 1) ≈ 4.865 ⇔ očekivani prosječan mjesečni rast
prosječne cijene nafte iznosi 4.865%;
B = 62.614 ⇔ procijenjena prosječna cijena nafte u travnju 2007. godine iznosi
približno 62,61 USD

Koeficijent determinacije modela linearnoga trenda iznosi 0.9561, što znači da se 95.61%
periodičnih promjena prosječne cijene nafte može objasniti modelom linearnoga trenda. S
druge strane, koeficijent determinacije modela eksponencijalnoga trenda iznosi 0.9609, što
znači da se 96.09% periodičnih promjena prosječne cijene nafte može objasniti modelom
eksponencijalnoga trenda. Prema kriteriju koeficijenata determinacije, model
eksponencijalnoga trenda je reprezentativniji.

Prosječnu cijenu nafte u svakom pojedinom mjesecu preostalom do kraja 2008. godine
možemo prognozirati na dva načina:

1.) uvrštavanjem x = 13, x = 14, …, x = 19 i x = 20 u svaku od dobivenih jednadžbi;
2.) (u MS Excelu) korištenjem funkcije TREND za prognozu pomoću modela linearnoga
trenda, odnosno GROWTH za prognozu pomoću modela eksponencijalnoga trenda.

U oba slučaja dobivamo:

mjesec i
godina
t prognoza pomoću modela
linearnoga trenda
prognoza pomoću modela
eksponencijalnoga trenda
svibanj 2008. 13 112,43 USD 116,05 USD
lipanj 2008. 14 116,41 USD 121,69 USD
srpanj 2008. 15 120,38 USD 127,61 USD
kolovoz 2008. 16 124,36 USD 133,81 USD
rujan 2008. 17 128,33 USD 140,32 USD
listopad 2008. 18 132,30 USD 147,14 USD
studeni 2008. 19 136,28 USD 154,29 USD
prosinac 2008. 20 140,25 USD 161,79 USD

Da bismo procijenili kada će prosječna cijena nafte prvi puta dosegnuti 200 USD po barelu,
trebamo riješiti jednadžbu


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 210

62.614 ⋅ 1.048646
t
= 200

Njezino je rješenje
120
:
ln200 ln62.614
ln1.048646
t

= ≈ 24.

Vrijednost vremenske varijable t = 24 odgovara travnju 2009. godine. Prema tome, ukoliko se
kretanje prosječne cijene nafte nastavi prema modelu eksponencijalnoga trenda, može se
očekivati da će prosječna cijena nafte u travnju 2009. godine dosegnuti 200 USD/barel.


5.4. Osnovni brojčani pokazatelji relativnih promjena


U praksi se često pojavljuje problem analiziranja i usporedbe dinamike kretanja najmanje
dviju različitih pojava. Vrijednosti tih pojava obično su iskazane u različitim mjernim
jedinicama ili se, pak, značajno razlikuju po svojoj veličini. Zbog toga se u takvim
slučajevima, umjesto apsolutnih promjena, izračunavaju i interpretiraju relativni pokazatelji
promjena tih pojava.

Jedna od najčešćih mjera relativnih promjena je koeficijent dinamike (oznaka: K
t
). Koeficijent
dinamike jednak je omjeru apsolutne promjene frekvencija dvaju uzastopnih razdoblja i
frekvencije pojave u kronološki prvom od tih dvaju razdoblja:

1 1
1
t t
t
t t
Y Y
K
Y Y
− −

= = − za svaki t = 1, 2, …, n – 1.

Usko vezana uz koeficijent dinamike je pojedinačna stopa promjene (oznaka: S
t
) neke pojave.
Ona iskazuje relativnu promjenu vrijednosti pojave u dvaju uzastopnim razdobljima, a dobije
se množenjem koeficijenta dinamike sa 100:

S
t
= K
t
⋅ 100 =
1
100 1
t
t
Y
Y

| |
⋅ −
|
\ ¹
, za svaki t = 1, 2, …, n – 1.



120
Svima kojima rješavanje eksponencijalno-logaritamskih jednadžbi predstavlja težak i zahtjevan matematički
problem preporučuje se da navedenu jednadžbu riješe korištenjem procedure Traženje rješenja (Goal Seek).


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 211

Pojedinačna stopa promjene zapravo predstavlja postotak promjene frekvencije neke pojave u
tekućemu razdoblju u odnosu na prethodno razdoblje. Stoga se uz numeričku vrijednost
pojedinačne stope promjene uvijek piše znak %.

Osim za dva uzastopna razdoblja, pojedinačna stopa promjene može se računati i prigodom
uspoređivanja vrijednosti neke pojave tijekom svakoga od n razdoblja s vrijednošću te pojave
u proizvoljno odabranom, ali fiksiranom razdoblju. U takvim slučajevima pojedinačnu stopu
promjene vrijednosti pojave u tekućemu razdoblju u odnosu na vrijednost te pojave u
(proizvoljnom, ali fiksiranom) baznom razdoblju dobivamo iz izraza:

*
100 1 100
t t
t
b b
Y Y
S
Y Y

| | ∆
= ⋅ = − ⋅
|
\ ¹
, za svaki t = 0, 1, 2, …, n – 1.

Primjer 1. U sljedećoj su tablici prikazani podaci o kretanju broja osnovanih registriranih
pravnih osoba u Republici Hrvatskoj u proteklih godinu dana.


razdoblje broj osnovanih registriranih
pravnih osoba
1. kvartal 2007. 3 724
2. kvartal 2007. 3 567
3. kvartal 2007. 3 240
4. kvartal 2007. 3 500
1. kvartal 2008. 3 783
izvor: Broj i struktura poslovnih subjekata u Republici Hrvatskoj, priopćenje br. 11.1.1/1,
Državni zavod za statistiku, Zagreb, 9.5.2008.

Izračunajmo koeficijente dinamike promjene broja osnovanih registriranih pravnih osoba u
uzastopnim vremenskim razdobljima, te odgovarajuće pojedinačne stope promjene, pa
objasnimo značenje dobivenih rezultata za 3. kvartal 2007. godine i 1. kvartal 2008. godine.
Potom usporedimo brojeve osnovanih registriranih pravnih osoba u svakom pojedinom
kvartalu s brojem osnovanih registriranih pravnih osoba u posljednjem kvartalu 2007. godine i
objasnimo značenje pokazatelja koji odgovara 1. kvartalu 2007. godine.

Najprije izračunavamo koeficijente dinamike i njima odgovarajuće stope promjene:







ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 212

razdoblje t broj osnovanih registriranih
pravnih osoba
K
t
S
t

1. kvartal 2007. 0 3 724 nepoznat nepoznata
2. kvartal 2007. 1 3 567 -0.04216 -4.2159 %
3. kvartal 2007. 2 3 240 -0.09167 -9.16737 %
4. kvartal 2007. 3 3 500 0.080247 8.024691 %
1. kvartal 2008. 4 3 783 0.080857 8.085714 %

U presjecima 2. retka i 3., odnosno 4. stupca upisali smo riječi nepoznat i nepoznata jer nam
za izračunavanje vrijednosti odgovarajućega pokazatelja nedostaju podaci iz 1. kvartalu
neposredno prethodnoga razdoblja, tj. iz 4. kvartala 2006. godine.

Iz dobivene tablice vidimo da je broj osnovanih registriranih pravnih osoba u 3. kvartalu
2007. godine bio za približno 9.17% manji nego u 2. kvartalu iste godine, te da je broj
osnovanih registriranih pravnih osoba u 1. kvartalu 2008. godine bio za približno 8.09% veći
nego u 4. kvartalu 2007. godine.

Sada izračunavamo pojedinačne stope promjene uzimajući 4. kvartal 2007. godine kao bazno
razdoblje:

razdoblje t broj osnovanih registriranih
pravnih osoba
*
t
S
1. kvartal 2007. 0 3 724 6.4%
2. kvartal 2007. 1 3 567 1.91429%
3. kvartal 2007. 2 3 240 -7.42857%
4. kvartal 2007. 3 3 500 0%
1. kvartal 2008. 4 3 783 8.08571%

Pokazatelj koji odgovara 1. kvartalu 2007. godine jednak je 6.4%, što znači da je broj
osnovanih registriranih pravnih osoba u 1. kvartalu 2007. godine bio za 6.4% veći nego u
posljednjem kvartalu 2007. godine.


5.5. Individualni indeksi


Jedna od najčešće rabljenih relativnih promjena vrijednosti neke pojave su tzv. indeksi.
Pomoću njih uspoređujemo odnos stanja jedne ili više pojava u različitim vremenskim
razdobljima (''vremenskim točkama'') ili u istim vremenskim razdobljima, ali na različitim
mjestima (tj. u različitim gradovima, regijama, državama, skupinama država itd.)


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 213

Opća podjela razlikuje dvije vrste indeksa: individualne i skupne. Individualni indeksi prate
razvoj točno jedne pojave u vremenu ili prostoru, te se uobičajeno dijele na verižne (lančane)
indekse i indekse na stalnoj bazi (bazne indekse). Za razliku od jednostavnih, skupni indeksi
prate razvoj barem dvije različite pojave u vremenu ili prostoru.

U nastavku se ukratko opisuje svaka pojedina vrsta indeksa.


5.5.1. Verižni (lančani) indeksi


Verižni (lančani) indeks (oznaka: V
t
) predstavlja pokazatelj relativne promjene stanja neke
pojave u dvama uzastopnim vremenskim razdobljima. On je, dakle, pokazatelj relativne
promjene stanja neke pojave u tekućemu razdoblju u odnosu na tekućem razdoblju
neposredno prethodno razdoblje. Ukoliko kretanje pojave promatramo tijekom n razdoblja,
onda ukupno n – 1 verižnih indeksa računamo pomoću relacije:

V
t
=
1
t
t
Y
Y

⋅ 100, za svaki t = 1, 2, …, n – 1,

ili, ekvivalentno, na temelju koeficijenata dinamike:

V
t
= (K
t
+ 1) ⋅ 100, za svaki t = 1, 2, …, n – 1.

Svaki verižni indeks zapravo predstavlja postotni udio vrijednosti promatrane pojave u
tekućemu razdoblju u odnosu na vrijednost te pojave u neposredno prethodnomu razdoblju.
Ako je V
t
= A, onda opća interpretacija toga indeksa glasi:

Na svakih 100 jedinica mjere promatrane pojave u razdoblju (t – 1) dolazi A jedinica mjere te
pojave u razdoblju t.

Istaknimo da, kao i koeficijent dinamike, verižni indeks nije definiran za početno razdoblje
(t = 0), pa se u takvim slučajevima obično stavlja riječ nepoznat.
121




121
Ova činjenica znači da je pogrešno kao verižni indeks za početno razdoblje definirati broj 0. U ovom bi
slučaju vrijednost 0 povlačila da znamo vrijednost promatrane pojave u razdoblju koje neposredno prethodi
početnom razdoblju i da je ta vrijednost jednaka nuli. Očito, niti jedna niti druga posljedica nisu istinite.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 214

Umjesto iz koeficijenta dinamike, pojedinačnu stopu promjene u uzastopnim vremenskim
razdobljima možemo izračunati i pomoću odgovarajućega verižnoga indeksa:

S
t
= V
t
– 100, za svaki t = 1, 2, …, n – 1.

Primjer 1. U sljedećoj su tablici navedeni podaci o ukupnom broju zaposlenih u
djelatnostima financijskoga posredovanja u svakom od mjeseci koji tvore 1. kvartal 2008.
godine.

mjesec ukupan broj zaposlenih
siječanj 1 604
veljača 1 636
ožujak 1 621
izvor: Zaposleni u obrtu i u djelatnostima slobodnih profesija u prvom tromjesečnju 2008.,
priopćenje br. 9.2.2/1, Državni zavod za statistiku, Zagreb, 12.5.2008.

Izračunajmo odgovarajuće koeficijente dinamike, verižne indekse i pojedinačne stope
promjene, pa objasnimo značenje vrijednosti dobivenih za ožujak 2008.

Vrijednosti traženih relativnih pokazatelja navedene su u sljedećoj tablici:

mjesec t ukupan broj zaposlenih K
t
V
t
S
t
siječanj 0 1 604 nepoznat nepoznat nepoznata
veljača 1 1 636 0.01995 101.995 1.995012 %
ožujak 2 1 621 -0.00917 99.08313 -0.91687 %

Iz dobivenih pokazatelja zaključujemo da je na svakih 100 zaposlenih u djelatnostima
financijskoga posredovanja u ožujku 2008. godine dolazilo približno 102 zaposlena u veljači
iste godine, odnosno da je broj zaposlenih u djelatnostima financijskoga posredovanja u
ožujku 2008. godine bio za približno 0.92% manji nego u veljači iste godine.

Pomoću svih n – 1 verižnih indeksa kojima mjerimo dinamiku promjene vrijednosti neke
pojave u n razdoblja, te zadane vrijednosti te pojave u bilo kojem od tih n razdoblja (označimo
ga s b) možemo izračunati vrijednosti pojave u svakom od preostalih n – 1 razdoblja na
temelju sljedećih relacija:

1
1
100, za .
, za .
100
t
t
t
t t
t
Y
Y t b
V
V Y
Y b t


= ⋅ <

= <



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 215

Ilustrirajmo taj postupak na primjeru.

Primjer 2. U sljedećoj su tablici navedeni verižni indeksi promjene prosječne isplaćene
mjesečne neto-plaće u razdoblju od 2003. do 2007. godine.

godina t V
t
2003. 0 nepoznat
2004. 1 105.9
2005. 2 105.9
2006. 3 105.2
2007. 4 105.2
izvor: Mjesečno statističko izvješće 3/2008, Državni zavod za statistiku, ožujak, 2008.

Ako je prosječna mjesečna isplaćena neto-plaća u 2006. godini iznosila 4.603,00 kn,
odredimo prosječne mjesečne isplaćene neto-plaće u svakoj od preostalih godina.

2006. godini odgovara vrijednost vremenske varijable t = 3, pa je Y
3
= 4.603,00. Za t < 3,
odnosno t = 0, 1, 2 dobivamo redom:

3
2
3
2
1
2
1
0
1
4.603, 00
100 100 4.375, 48
105.2
4.375, 48
100 100 4.131, 70
105.9
4.131, 70
100 100 3.901, 52
105.9
Y
Y
V
Y
Y
V
Y
Y
V
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈


dok za t > 3, odnosno t = 4 dobivamo:

4 3
4
105, 2 4.603, 00
4.842, 36
100 100
V Y
Y
⋅ ⋅
= = ≈ .

Dobivene podatke možemo zapisati u obliku tablice:

godina t prosječna mjesečna
isplaćena neto–plaća [kn]
V
t
2003. 0 3.901,52 nepoznat
2004. 1 4.131,70 105.9
2005. 2 4.375,46 105.9
2006. 3 4.603,00 105.2
2007. 4 4.842,36 105.2


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 216

Pri računanju prosječnoga tempa promjene promatrane pojave rabimo geometrijsku sredinu
verižnih indeksa (oznaka: G). Pojam geometrijske sredine već smo upoznali u točki 3.1.2. pa
ćemo još jednom navesti samo osnovnu formulu za njezino računanje (u terminologiji
verižnih indeksa):

1
1 2 1
...


⋅ ⋅ ⋅ =
n
n
V V V G .

Iz definicije verižnih indeksa slijedi da njihovu geometrijsku sredinu možemo izračunati i
prema formuli:

100 1
0
1
⋅ = −

n
n
Y
Y
G

Stoga možemo zaključiti da za alternativno računanje vrijednosti geometrijske sredine
verižnih indeksa moramo znati samo prvi (Y
0
) i posljednji (Y
n–1
) član vremenskoga niza. To je
ujedno i najveći nedostatak geometrijske sredine (kao mjere prosječnoga tempa promjene) jer
ne uzima u obzir sve frekvencije vremenskoga niza (za razliku od, npr., ranije spomenutih
modela trenda), nego isključivo prvu i posljednju frekvenciju. Pomoću spomenute
geometrijske sredine verižnih indeksa računa se i prosječna stopa promjene vrijednosti
promatrane pojave (oznaka: S ):

S = G – 100.

Kao i svi drugi relativni pokazatelji, i prosječna stopa promjene iskazuje se u postotcima. Na
temelju nje se okvirno mogu procijeniti (prognozirati) frekvencije te pojave i u budućim
vremenskim razdobljima uz nužnu pretpostavku da se dinamika pojave ne mijenja u odnosu
na dinamiku pojave u promatranomu razdoblju. Pri takvim se prognozama koristi relacija:

t
t
G
Y Y |
¹
|

\
|
⋅ =

100
0
, za t = n, n + 1, …

No, budući da prosječna stopa promjene ovisi isključivo o prvoj i posljednjoj frekvenciji u
vremenskom nizu, u praksi se navedene vrijednosti prognoziraju uglavnom na temelju nekoga
od modela trenda.
Primjer 3. Na temelju podataka iz Primjera 2. izračunajmo prosječnu godišnju stopu
promjene prosječne mjesečne isplaćene neto-plaće u razdoblju od 2003. do 2007. godine, pa
procijenimo prosječnu mjesečnu isplaćenu neto-plaću u Republici Hrvatskoj za svaku od
godina u razdoblju od 2008. do 2010. godine.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 217

Geometrijska sredina verižnih indeksa jednaka je

4
4 4
0
4.842, 36
100 100
3.901, 52
Y
G
Y
= ⋅ = ⋅ = 105.5494197.

Stoga je prosječna godišnja stopa promjene

S = G – 100 = 105.5494197 – 100 ≈ 5.55%,

što znači da su u promatranom razdoblju prosječne mjesečne isplaćene neto–plaće rasle za
prosječno 5.55% godišnje. Budući da 2008. godini odgovara vrijednost vremenske varijable
t = 5, 2009. godini t = 9, a 2010. godini t = 10, prognozu prosječnih mjesečnih isplaćenih
neto-plaća za 2008., 2009. i 2010. godinu dajemo na temelju izraza:

5 5
5
0
6 6
6
0
7 7
7
0
105.5494197
3.901, 52 5.111, 08
100 100
105.5494197
3.901, 52 5.394, 71
100 100
105.5494197
3.901, 52 5.694, 09
100 100
G
Y Y
G
Y Y
G
Y Y



| | | |
= ⋅ = ⋅ ≈
| |
\ ¹ \ ¹
| | | |
= ⋅ = ⋅ ≈
| |
\ ¹ \ ¹
| | | |
= ⋅ = ⋅ ≈
| |
\ ¹ \ ¹


Dakle, procijenjena prosječna mjesečna isplaćena neto-plaća u Republici Hrvatskoj za 2008.
godini iznosi 5.111,08 kn, u 2009. godini 5.394,71 kn, a u 2010. godini 5.694,09 kn (uz
smjelu pretpostavku da neće doći do značajnije promjene dinamike kretanja plaća).
Spomenimo zaključno da se verižni indeksi grafički uobičajeno prikazuju specifičnim
linijskim grafikonom ili jednostavnim stupcima. Tako su npr. grafički prikazi verižnih indeksa
iz Primjera 3. sljedeći grafikoni:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 218





5.5.2. Indeksi na stalnoj bazi (bazni indeksi)


Indeksi na stalnoj bazi (kraće: bazni indeksi) pokazatelji su relativnih promjena u tekućemu
razdoblju u odnosu na neko proizvoljno, ali fiksirano bazno razdoblje. Označimo li to
razdoblje s b, onda za svako pojedino razdoblje t odgovarajući indeks I
t
na stalnoj bazi b
računamo pomoću relacije:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 219

100 ⋅ =
b
t
t
Y
Y
I , za svaki t = 0, 1, 2, …, n – 1.

Iz navedene relacije proizlaze sljedeća svojstva koja je vrlo korisno primijeniti pri provjeri
ispravnosti izračuna indeksa na stalnoj bazi:

Svojstvo 1. Za t = b vrijedi jednakost I
b
= 100.
Svojstvo 2. Pretpostavimo da je b ≠ n – 1, tj. da posljednje od ukupno n razdoblja nije ujedno
i bazno razdoblje. Tada za t = b + 1 vrijedi jednakost:

I
t
= V
t
.

Ekvivalentno, indeks razdoblja t na stalnoj bazi b jednak je verižnomu indeksu razdoblja t
ako i samo ako je t = b + 1.

Indeks na stalnoj bazi zapravo predstavlja postotni udio frekvencije promatrane pojave u
tekućemu razdoblju u odnosu na frekvenciju promatrane pojave u baznomu razdoblju. Stoga je
njegova opća interpretacija sljedeća:

I
t
= A ⇔ Na svakh 100 jedinica mjere pojave A u razdoblju b dolazi A jedinica mjere pojave
A u razdoblju B.

Kao i za verižne indekse, i za indekse na stalnoj bazi može se računati odgovarajuća
pojedinačna stopa promjene (oznaka:
*
t
S ) u odnosu na bazno razdoblje b, i to prema formuli:

*
t
S = I
t
– 100 , za svaki t = 0, 1, 2, …, n – 1.

Primjer 4. U donjoj su tablici navedeni podaci o prosječnom godišnjem broju žena
zaposlenih u pravnim osobama, obrtu i djelatnostima slobodnih profesija u Republici
Hrvatskoj za razdoblje od 1997. do 2006. godine.










ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 220

godina t prosječan broj zaposlenih žena
[000]
1997. 0 546
1998. 1 574
1999. 2 571
2000. 3 573
2001. 4 578
2002. 5 580
2003. 6 595
2004. 7 606
2005. 8 617
2006. 9 640
izvor: Statistički ljetopis Republike Hrvatske za 2006. godinu,
Državni zavod za statistiku, Zagreb, 2007.

Izračunajmo indekse na stalnoj bazi 2003 = 100 i odgovarajuće pojedinačne stope promjene,
pa objasnimo značenje navedenih pokazatelja za 2000. i 2006. godinu. Potom dobivene bazne
indekse prikažimo grafički jednostavnim stupcima.

Traženi indeksi na stalnoj bazi 2003 = 100 i njima odgovarajuće stope promjene navedene su
u sljedećoj tablici:

godina t prosječan broj zaposlenih žena
[000]
I
t
*
t
S
1997. 0 546 91.76471 -8.23529
1998. 1 574 96.47059 -3.52941
1999. 2 571 95.96639 -4.03361
2000. 3 573 96.30252 -3.69748
2001. 4 578 97.14286 -2.85714
2002. 5 580 97.47899 -2.52101
2003. 6 595 100 0
2004. 7 606 101.8487 1.848739
2005. 8 617 103.6975 3.697479
2006. 9 640 107.563 7.563025

Iz dobivenih rezultata vidimo da na svakih 100 zaposlenih žena u 2003. godini dolazi
približno 96 zaposlenih žena u 2000. godini, odnosno približno 108 zaposlenih žena u 2006.
godini. Ekvivalentno rečeno, prosječan broj zaposlenih žena u 2000. godini je za približno
3.69% manji, a u 2006. godini za približno 7.56% veći nego u 2003. godini.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 221

Indekse na stalnoj bazi obično grafički prikazujemo jednostavnim stupcima. Grafički prikaz
indeksa na stalnoj bazi 2003 = 100 je donja slika:



Vidjeli smo da sve frekvencije neke pojave možemo odrediti pomoću verižnih indeksa i bilo
koje unaprijed zadane frekvencije te pojave. Analogno, možemo ih određivati i pomoću svih
unaprijed zadanih indeksa na nekoj stalnoj bazi b i (barem) jedne unaprijed zadane
frekvencije te pojave. Ovisno o zadanoj frekvenciji, razlikujemo sljedeća dva podslučaja:

1.) Ako je zadana frekvencija pojave u baznomu razdoblju b (tj. vrijednost Y
b
), tada
vrijednosti pojave u svakom od n razdoblja
122
dobivamo iz jednakosti:

100
t b
t
I Y
Y

= , za svaki t = 0, 1, 2, …, n – 1.

2.) Ako je zadana frekvencija pojave u nekom drugom razdoblju t
1
različitomu od baznoga (tj.
ako je zadana frekvencija
1
t
Y , pri čemu je t
1
≠ b), tada najprije izračunamo frekvenciju
promatrane pojave u baznomu razdoblju b pomoću relacije:

100
t
b
t
Y
Y
I
= ⋅


122
Navedena formula očito vrijedi i u slučaju t = b.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 222

(I
t
je indeks razdoblja t na stalnoj bazi b). Na taj način ovaj podslučaj svodimo na podslučaj
1. pa za računanje vrijednosti pojave u ostalim godinama primijenjujemo formulu navedenu u
tomu slučaju.

Napomenimo da i iz indeksa na stalnoj bazi neovisno o izboru stalne baze b možemo
izračunati prosječnu stopu promjene frekvencija neke pojave u promatranomu razdoblju, i to
prema formuli:
1
1
0
1 100
n
n
I
S
I


| |
= − ⋅
|
|
\ ¹
.
Primjer 5. Zadani su indeksi na stalnoj bazi 2005 = 100 zaposlenih u pravnim osobama svih
oblika vlasništva.

godina t indeks na stalnoj bazi
2005 = 100
1997. 0 89
1998. 1 96
1999. 2 95
2000. 3 95
2001. 4 95
2002. 5 95
2003. 6 98
2004. 7 99
2005. 8 100
2006. 9 104

Odredimo prosječan broj zaposlenih u pravnim osobama svih oblika vlasništva u svakoj
pojedinoj godini ako je poznato da je prosječan broj zaposlenih u pravnim osobama svih
oblika vlasništva u 1997. godini iznosio 995 000. Potom odredimo prosječnu godišnju stopu
promjene broja zaposlenih i objasnimo značenje dobivene vrijednosti.

Iz podataka Y
0
= 995 000, b = 8 (jer 2005. godini odgovara t = 8) i I
0
= 89 slijedi:

0
8
0
995000
100 100
89
b
Y
Y Y
I
= = ⋅ = ⋅ ≈1 117 978.

Dakle, prosječan broj zaposlenih u baznoj godini iznosi 1 117 978. Na temelju toga podatka
računamo prosječan broj zaposlenih u svakoj od preostalih godina:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 223

1 8 1
1
8 2
2
3 4 5 2
8 6
6
8 7
7
8 9
9
1117978 96
1073258
100 100 100
1117978 95
1062079
100 100
1062079
1117978 98
1095618
100 100
1117978 99
1106798
100 100
1117978 104
1162697
100 100
b
Y I Y I
Y
Y I
Y
Y Y Y Y
Y I
Y
Y I
Y
Y I
Y
⋅ ⋅ ⋅
= = = ≈
⋅ ⋅
= = ≈
= = = ≈
⋅ ⋅
= = ≈
⋅ ⋅
= = ≈
⋅ ⋅
= = ≈


Dobivene podatke pregledno možemo zapisati u sljedećoj tablici:

godina t prosječan broj zaposlenih
[000 000]
1997. 0 0.95
1998. 1 1.073258
1999. 2 1.062079
2000. 3 1.062079
2001. 4 1.062079
2002. 5 1.062079
2003. 6 1.095618
2004. 7 1.106798
2005. 8 1.117978
2006. 9 1.162697

Prosječna godišnja stopa promjene broja zaposlenih iznosi:

1 9
9
1 9
0 0
104
1 100 1 100 1 100 1.745668
89
n
n
I I
S
I I


| | | | | |
= − ⋅ = − ⋅ = − ⋅ ≈
| | |
\ ¹ \ ¹ \ ¹
.

Prema tome, prosječan broj zaposlenih u pravnim osobama svih oblika vlasništva u
promatranom se razdoblju povećavao za prosječno 1.75% godišnje. Primijetimo da dobiveni
pokazatelj relativno loše opisuje kretanje prosječnoga broja zaposlenih u promatranom
razdoblju jer se u podrazdoblju od 1999. do 2002. godine navedeni prosječan broj nije


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 224

mijenjao. Zbog toga je u takvim slučajevima za analizu promjena promatrane pojave
primjerenije rabiti modele trenda.


5.5.3. Pretvorba indeksa


Jedna od značajnih prednosti individualnih indeksa jest mogućnost pretvorbe
(preračunavanja) svake pojedine vrste indeksa u preostalu vrstu indeksa bez poznavanja
frekvencija koje tvore vremenski niz. Drugim riječima, promjene promatrane pojave možemo
analizirati i bez poznavanja originalnih emipirijskih frekvencija te pojave.

Pretvorbe individualnih indeksa možemo podijeliti na tri tipa:

1.) pretvorba indeksa na stalnoj bazi b u indekse na stalnoj bazi b
1
≠ b;
2.) pretvorba indeksa na stalnoj bazi b u verižne indekse;
3.) pretvorba verižnih indeksa u indekse na stalnoj bazi b.

Na po jednom primjeru opisat ćemo svaki pojedini tip.

Primjer 6. Indekse na stalnoj bazi 2005 = 100 navedene u Primjeru 5. pretvorimo u indekse
na stalnoj bazi 2000 = 100. U tu svrhu koristimo sljedeću formulu:

100
1
*
⋅ =
b
t
t
I
I
I , za svaki t = 0, 1, 2, …, n – 1,
pri čemu su:

*
t
I – indeks razdoblja t na ''novoj'' stalnoj bazi b
1
;
I
t
– indeks razdoblja t na ''staroj'' stalnoj bazi b;
1
b
I – indeks razdoblja b
1
na ''staroj'' stalnoj bazi b.

U ovome su primjeru b = 8 (jer 2005. godini odgovara t = 8) i b
1
= 3 (jer 2000. godini
odgovara t = 3). Tako dobivamo:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 225

* 0
0
3
* 1
1
3
* 2
2
3
* * *
4 5 2
* 6
6
3
* 7
7
3
* 8
8
3
*
9
89
100 100 93.68421
95
96
100 100 101.0526
95
95
100 100 100
95
100
98
100 100 = 103.1579
95
99
100 100 = 104.2105
95
100
100 100 105.2632
95
I
I
I
I
I
I
I
I
I
I I I
I
I
I
I
I
I
I
I
I
I
I
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ =
= = =
= ⋅ = ⋅
= ⋅ = ⋅
= ⋅ = ⋅ =
=
9
3
104
100 100 109.4737
95 I
⋅ = ⋅ =


Dobivene rezultate pregledno možemo prikazati u sljedećoj tablici:

godina t indeks na stalnoj bazi
2000 = 100
1997. 0 94
1998. 1 101
1999. 2 100
2000. 3 100
2001. 4 100
2002. 5 100
2003. 6 103
2004. 7 104
2005. 8 105
2006. 9 109

Primjer 7. Indekse na stalnoj bazi 2005 = 100 navedene u Primjeru 5. pretvorimo u verižne
indekse. U tu svrhu koristimo sljedeću jednadžbu:

1
100
t
t
t
I
V
I

= ⋅ , za svaki t = 1, 2, …, n – 1.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 226

Tako redom dobivamo:

1
1
0
2
2
1
3
3
2
4 5 3
6
6
5
7
7
6
8
8
7
9
9
8
96
100 100 118.5185
89
95
100 100 98.95833
96
95
100 100 100
95
100
98
100 100 103.1579
95
99
100 100 101.0204
98
100
100 100 101.0101
99
104
100
100
I
V
I
I
V
I
I
V
I
V V V
I
V
I
I
V
I
I
V
I
I
V
I
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ =
= = =
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = 100 104 ⋅ =


Dobivene rezultate pregledno možemo zapisati u sljedećoj tablici:

godina t verižni indeks (V
t
)
1997. 0 nepoznat
1998. 1 119
1999. 2 99
2000. 3 100
2001. 4 100
2002. 5 100
2003. 6 103
2004. 7 101
2005. 8 101
2006. 9 104


Primjer 8. Zadani su verižni indeksi prosječne isplaćene neto-plaće po zaposlenome u
svakom od mjeseci u 2007. godini:




ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 227

mjesec t verižni indeks V
t
siječanj 0 nepoznat
veljača 1 96
ožujak 2 98.9
travanj 3 98.1
svibanj 4 100.7
lipanj 5 100.1
srpanj 6 100.3
kolovoz 7 100.6
rujan 8 98.0
listopad 9 100.6
studeni 10 106.0
prosinac 11 102.4
izvor: Mjesečno statističko izvješće 3/08, Državni zavod za statistiku, Zagreb, travanj 2008.

Odredimo indekse na stalnoj bazi (rujan 2007. = 100), objasnimo značenje indeksa
dobivenoga za prosinac 2007. godine i procijenimo prosječnu mjesečnu stopu promjene
prosječne isplaćene neto-plaće. U ovom je slučaju b = 8 jer rujnu 2007. godine odgovara
vrijednost vremenske varijable t = 8. Indeks I
t
na stalnoj bazi (rujan 2007. = 100) računamo
prema sljedećim jednakostima:

1
1
100 za ;
100 za ;
za .
100
t
t
t
t
t t
t
I t b
I
I t b
V
I V
I b t


= =
= ⋅ <

= <


Prigodom pretvorbe, dakle, krećemo od baznoga indeksa I
8
. On je jednak I
8
= 100. Pomoću
njega računamo najprije vrijednosti indeksa I
7
, I
6
, I
5
, I
4
, I
2
, I
1
i I
0
koristeći drugu od triju gore
navedenih jednakosti. Imamo redom:

8
7
8
7
6
7
6
5
6
100
100 100 102.04082
98.0
102.04082
100 100 101.43222
100.6
101.43222
100 100 101.12884
100.3
I
I
V
I
I
V
I
I
V
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 228

5
4
5
4
3
4
3
2
3
2
1
2
1
0
1
101.12884
100 100 101.02781
100.1
101.02781
100 100 100.32553
100.7
100.32553
100 100 102.26863
98.1
102.26863
100 100 103.4061
98.9
103.4061
100 100 107.71469
96
I
I
V
I
I
V
I
I
V
I
I
V
I
I
V
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈


Vrijednosti indeksa I
9
, I
10
i I
11
računamo pomoću posljednje od triju navedenih formula:

8 9
9
9 10
10
10 11
11
100 100.6
100 100.6
100 100
100.6 106.0
100 106.636
100 100
106.636 102.4
109.19526
100 100
I V
I
I V
I
I V
I
⋅ ⋅
= = ⋅ =
⋅ ⋅
= = ⋅ =
⋅ ⋅
= = ≈


Dobivene rezultate pregledno možemo zapisati u sljedećoj tablici:

mjesec t indeks na stalnoj bazi I
t

(rujan = 100)

siječanj 0 107.71
veljača 1 103.41
ožujak 2 102.27
travanj 3 100.33
svibanj 4 101.03
lipanj 5 101.13
srpanj 6 101.43
kolovoz 7 102.04
rujan 8 100
listopad 9 100.6
studeni 10 106.64
prosinac 11 109.2

Vrijednost indeksa za prosinac jednaka je (približno) 109.2, što znači da na svakih 100 kn
prosječne isplaćene neto–plaće u rujnu 2007. godine dolazi po 109.2 kn prosječne isplaćene


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 229

neto–plaće u prosincu iste godine. Ekvivalentno možemo reći da je prosječna isplaćena neto–
plaća u prosincu 2007. godine bila za 9.2% veća nego u rujnu iste godine.

Prosječna mjesečna promjena isplaćene mjesečne neto–plaće jednaka je:

1
1 2 1
100 ... 100 0.1242
n
n
S G V V V


= − = ⋅ ⋅ ⋅ − ≈ ,

što znači da su se u promatranom razdoblju prosječne mjesečne neto–plaće povećavale za
približno 0.1242% mjesečno.


5.6. Skupni indeksi


Kako je istaknuto u točki 5.5., individualnim (verižnim ili baznim) indeksima prati se
dinamika kretanja neke pojave iskazane jednim statističkim nizom. Međutim, često je
potrebno pratiti kretanje barem dvije pojave koje, prema nekom kriteriju, pripadaju istoj
skupini. Tako se npr. može pratiti kretanje proizvodnje svih vrsta proizvoda neke tvornice,
kretanje prometa svih trgovina nekoga trgovačkoga lanca, kretanje cijena na malo osnovnih
životnih potrepština itd. Takve se pojave predočavaju barem dvama statističkim nizovima, a
prate se tzv. skupnim indeksima.

Problem računanja skupnih indeksa ne može se postaviti jednoznačno, tj. nema jedinstvenoga
analitičkog izraza koji bi poslužio za računanje svih skupnih indeksa. U praksi se najčešće
koriste Laspeyresov
123
i Paascheov
124
oblik skupnih indeksa. Prije nego li objasnimo
spomenute indekse, uvedimo neke dogovorne oznake.

Razdoblje u kojem iskazujemo dinamiku promjene pojave nazivamo tekuće ili izvještajno
razdoblje, a razdoblje u odnosu na koje se iskazuje dinamika pojava naziva se bazno
razdoblje. Sukladno tome, definiramo sljedeće veličine:

p
0
:= cijena u baznomu razdoblju;
p
1
:= cijena u tekućemu razdoblju;
q
0
:= količina u baznomu razdoblju;
q
1
:= količina u tekućemu razdoblju.



123
Ernst Louis Étienne Laspeyres (1834. – 1913.), njemački ekonomist i statističar.
124
Hermann Paasche (1851. – 1925.), njemački ekonomist i statističar.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 230

Slova p i q su prva slova engleskih riječi price = cijena i quantity = količina. Brojčani indeks
0 (napisan u subskriptu) uvijek označava pojavu u baznomu razdoblju, dok brojčani indeks 1
uvijek označava pojavu u tekućemu razdoblju.

Istaknimo još da se vrijednost neke robe u određenomu razdoblju definira kao umnožak
iznosa količine te robe i njezine cijene po jedinici mjere količine u istom razdoblju. Ako je
npr. cijena 1 kg kruha jednaka 5 kn, onda je vrijednost 2 kg kruha jednaka:

2 kg ⋅ 5
kg
kn
= 10 kn.

(jer je jedinica mjere količine 1 kg). Vrijednost neke robe obično se iskazuje u istoj jedinici
mjere kao i odgovarajuća cijena te robe (po jedinici količine)


5.6.1. Skupni indeksi količina


5.6.1.1. Laspeyresov skupni indeks količina

Laspeyresov skupni indeks količina (oznaka: q
01
(p
0
)) je pokazatelj relativne promjene ukupnih
količina promatrane skupine od točno n pojava u tekućemu razdoblju u odnosu na ukupne
količine te skupine pojava u baznomu razdoblju računajući uz neizmijenjene cijene iz baznoga
razdoblja. (Dakle, fiksirana veličina pri izračunu ovoga skupnog indeksa jest p
0
.)

Praktično najjednostavniji za izračun je tzv. agregatni Laspeyresov skupni indeks količina
definiran formulom:

1 0
1
01 0
0 0
1
( ) 100
n
i i
i
n
i i
i
q p
q p
q p
=
=

= ⋅





U brojniku navedenoga izraza nalaze se hipotetske vrijednosti određenih količina robe
proizvedenih u tekućem razdoblju, ali računate prema cijenama iz baznoga razdoblja. U
nazivniku navedenoga izraza nalaze se stvarne vrijednosti količina iste robe (proizvedenih u
baznom razdoblju) računate prema cijenama iz baznoga razdoblja. Budući da i u brojniku i u
nazivniku imamo iste cijene, razlika između brojnika i nazivnika može biti isključivo
posljedica promjene proizvedenih količina robe, a ni u kojem slučaju posljedica promjene


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 231

cijena te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
proizvedenih količina.

Analogno kao i individualne indekse, i Laspeyresov skupni indeks količina najlakše
interpretiramo rabeći odgovarajuću stopu promjene:
01
0 01 0
( ) ( ) 100
q
S p q p = − [%]

5.6.1.2. Paascheov skupni indeks količina

Paascheov skupni indeks količina (oznaka: q
01
(p
1
)) je pokazatelj relativne promjene ukupnih
količina promatrane skupine od točno n pojava u tekućemu razdoblju u odnosu na ukupne
količine te skupine pojava u baznomu razdoblju računajući uz neizmijenjene cijene iz
tekućega razdoblja. (Dakle, fiksirana veličina pri računanju ovoga skupnog indeksa jest p
1
.)

Praktično najjednostavniji za izračun je tzv. agregatni Paascheov skupni indeks količina
definiran formulom:

1 1
1
01 1
0 1
1
( ) 100
n
i i
i
n
i i
i
q p
q p
q p
=
=

= ⋅



.

U brojniku navedenoga izraza nalaze se stvarne vrijednosti određenih količina robe
proizvedenih u tekućem razdoblju i računate prema cijenama iz toga razdoblja. U nazivniku
navedenoga izraza nalaze se hipotetske vrijednosti količina iste robe proizvedenih u baznom
razdoblju, ali računate prema cijenama iz tekućega razdoblja. Budući da i u brojniku i u
nazivniku imamo iste cijene, razlika između brojnika i nazivnika može biti isključivo
posljedica promjene proizvedenih količina robe, a ni u kojem slučaju posljedica promjene
cijena te robe. Stoga i navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
proizvedenih količina robe.

Analogno kao i Laspeyresov skupni indeks količina, i Paascheov skupni indeks količina
najlakše interpretiramo rabeći odgovarajuću stopu promjene:

01
1 01 1
( ) ( ) 100
q
S p q p = − [%].



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 232

Primjer 9. Promatraju se prosječne prodajne cijene (PDV uračunat) i prodane količine četiri
različite vrste proizvoda u trgovini ''Sve po malo kuna'' u Frkljevcima tijekom listopada i
studenoga 2008. g. Podaci su navedeni u donjoj tablici.

vrsta
proizvoda
prosječna prodajna
cijena u listopadu
2008.
[kn/kg]
prodana količina
u listopadu 2008.
[kg]
prosječna prodajna
cijena u studenom
2008.
[kn/kg]
prodana količina
u studenom 2008.
[kg]
brašno
T-850
2,19 190 2,39 200
smeđa
espresso
kava
89 50 88 54
sitna
morska
sol
3,05 170 2,99 150
bijeli
šećer
12,10 190 12,20 180

Izračunajmo Laspeyresov i Paascheov skupni indeks količina, pa objasnimo njihovo značenje.
U ovome je primjeru bazno razdoblje listopad 2008., a tekuće (izvještajno) razdoblje studeni
2008. Stoga ćemo prosječnu prodajnu cijenu u listopadu označiti s p
0
, prodanu količinu u
listopadu s q
0
, prosječnu prodajnu cijenu u studenom s p
1
, a prodanu količinu u studenom s q
1
.
Laspeyresov skupni indeks količina jednak je:

4
1 0
1
01 0 4
0 0
1
01 0
200 2.19 54 89 150 3.05 180 12.10 7879.50
( ) 100 100 100
190 2.19 50 89 170 3.05 190 12.10 7683.60
( ) 102.54959
i i
i
i i
i
q p
q p
q p
q p
=
=

⋅ + ⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅
|
⋅ + ⋅ + ⋅ + ⋅
\ ¹

=




Pripadna stopa promjene iznosi

01
0 01 0
( ) ( ) 100
q
S p q p = − = 102.54959 – 100 = 2.54959.

Zaključujemo da su prodane količine svih promatranih vrstâ proizvoda u studenom bile za
2.54959% veće od nego u listopadu računajući uz neizmijenjene cijene iz listopada.

Paascheov skupni indeks količina jednak je



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 233

4
1 1
1
01 1 4
0 1
1
01 1
200 2.39 54 88 150 2.99 180 12.20 7874.50
( ) 100 100 100
190 2.39 50 88 170 2.99 190 12.20 7680.60
( ) 102.52721
i i
i
i i
i
q p
q p
q p
q p
=
=

⋅ + ⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅
|
⋅ + ⋅ + ⋅ + ⋅
\ ¹

=




Pripadna stopa promjene iznosi

01
1 01 1
( ) ( ) 100
q
S p q p = − = 102.52721 – 100 = 2.52721.

Zaključujemo da su prodane količine svih promatranih vrstâ proizvoda u studenom bile za
2.54959% veće od nego u listopadu računajući uz neizmijenjene cijene iz studenoga.

Dakle, za iste prodane količine dobivaju se različite vrijednosti skupnoga indeksa ako se u
izračun uzmu cijene iz različitih razdoblja. Stoga skupni indeks nije jednoznačna precizna
mjera relativnih promjena neke skupine pojava, nego isključivo mjera uz unaprijed zadane
pretpostavke. U ovom su primjeru izračunati skupni indeksi prodanih količina promatranih
vrsta proizvoda izračunati uz pretpostavku da su odnosi vrijednosti pojedinih vrsta proizvoda
onakvi kakve izražavaju cijene u listopadu 2008.g., odnosno cijene u studenom 2008.g. Time
se ne umanjuje značaj skupnih indeksa, nego se daje naglasak na obvezu njihova tumačenja
uz uvažavanje pretpostavki pod kojima su izračunati.


5.6.1.3. Fisherov skupni indeks količina


U praksi se često koristi i Fisherov
125
skupni indeks količina ili idealni skupni indeks količina
(oznaka: Q
01
) Taj je indeks, po definiciji, jednak geometrijskoj sredini Laspeyresova i
Paascheova skupnoga indeksa količina, tj.

01 01 0 01 1
( ) ( ) Q q p q p = ⋅ .

Fisherov skupni indeks količina se najjednostavnije interpretira pomoću pripadne stope
promjene. Ona se računa pomoću izraza:



125
Irving Fisher (1867. – 1947.), američki ekonomist, jedan od tvoraca neoklasične ekonomije.,


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 234

01
01
100
Q
S Q = − [%]

i predstavlja prosječnu relativnu promjenu količina u tekućemu razdoblju u odnosu na
količine u baznomu razdoblju.

Primjer 10. Izračunajmo Fisherov skupni indeks količina na temelju podataka iz prethodnoga
primjera i objasnimo njegovo značenje. Dobivamo:

01 01 0 01 1
7879.50 7874.50
( ) ( ) 100 102.5384
7683.60 7680.60
Q q p q p = ⋅ = ⋅ ⋅ = ,
pa je pripadna stopa promjene

01
01
100
Q
S Q = − = 102.5384 – 100 = 2.5384.

Zaključujemo da su količine svih promatranih vrstâ proizvoda u studenom 2008. bile za
prosječno 2.5384% veće nego u listopadu 2008.


5.6.2. Skupni indeksi cijena


Skupni indeksi cijena mjere relativnu promjenu razine cijena za određeni asortiman robe,
usluga itd. U praksi postoji više različitih vrsta skupnih indeksa cijena: skupni indeks cijena
na malo, skupni indeks cijena na veliko, skupni indeks izvoznih cijena, skupni indeks cijena u
turizmu itd. Odmah napomenimo da se niti jednim od tih indeksa ne mogu obuhvatiti cijene
svih roba i usluga, pa se time nameću nimalo trivijalni problemi izbora proizvoda i(li) usluga
koji će biti reprezentanti skupine za koju želimo izračunati skupne indekse cijena, problemi
izbora cijene (kada i gdje treba prikupiti podatke o cijenama odabranih proizvoda i(li) usluga)
itd. Sve to ukazuje na činjenicu da, iako skupne indekse nije teško izračunati, treba biti vrlo
oprezan u njihovoj interpretaciji, a napose u poopćavanju zaključaka izvedenih pomoću
odabranih reprezentanata na cijelu skupinu.

Dva najčešća skupna indeksa cijena su Laspeyresov skupni indeks cijena i Paascheov skupni
indeks cijena koje ćemo upoznati u nastavku.






ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 235

5.6.2.1. Laspeyresov skupni indeks cijena


Laspeyresov skupni indeks cijena (oznaka: p
01
(q
0
)) je pokazatelj relativne promjene ukupnih
cijena promatrane skupine od točno n pojava u tekućemu razdoblju u odnosu na ukupne cijene
te skupine pojava u baznomu razdoblju računajući uz neizmijenjene količine iz baznoga
razdoblja. (Dakle, fiksirana veličina pri računanju ovoga skupnog indeksa jest q
0
.)
Praktično najjednostavniji za izračun je tzv. agregatni Laspeyresov skupni indeks cijena
definiran formulom


1 0
1
01 0
0 0
1
( ) 100
n
i i
i
n
i i
i
p q
p q
p q
=
=

= ⋅





Uočimo da se u brojniku navedenoga izraza nalaze hipotetske vrijednosti određenih količina
robe proizvedenih u baznom razdoblju, ali računate prema cijenama iz tekućega razdoblja. U
nazivniku navedenoga izraza nalaze se stvarne vrijednosti količina iste robe (proizvedenih u
baznom razdoblju) računate prema cijenama iz baznoga razdoblja. Budući da i u brojniku i u
nazivniku imamo iste količine, razlika između brojnika i nazivnika može biti isključivo
posljedica promjene cijena promatrane robe, a ni u kojem slučaju posljedica promjene
količina te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele skupine
promatranih cijena.
Analogno kao i skupne indekse količina, i skupne indeks cijena najlakše interpretiramo rabeći
odgovarajuće stope promjene. Za Laspeyresov skupni indeks cijena pripadajuća stopa
promjene računa se prema formuli:

01
0 01 0
( ) ( ) 100
p
S q p q = − [%]


5.6.2.2. Paascheov skupni indeks cijena


Paascheov skupni indeks cijena (oznaka: p
01
(q
1
)) je pokazatelj relativne promjene ukupnih
cijena promatrane skupine od točno n pojava u tekućemu razdoblju u odnosu na ukupne cijene
te skupine pojava u baznomu razdoblju računajući uz neizmijenjene količine iz tekućega
razdoblja. (Dakle, fiksirana veličina pri računanju ovoga skupnoga indeksa jest q
1
.)
Praktično najjednostavniji za izračun je tzv. agregatni Paascheov skupni indeks cijena
definiran formulom:


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 236

1 1
1
01 1
0 1
1
( ) 100
n
i i
i
n
i i
i
p q
p q
p q
=
=

= ⋅





Uočimo da se u brojniku navedenoga izraza nalaze stvarne vrijednosti određenih količina robe
proizvedenih u tekućem razdoblju računate prema cijenama iz tekućega razdoblja. U
nazivniku navedenoga izraza nalaze se hipotetske vrijednosti količina iste robe (proizvedenih
u tekućem razdoblju), ali računate prema cijenama iz baznoga razdoblja. Budući da i u
brojniku i u nazivniku imamo iste količine, razlika između brojnika i nazivnika može biti
isključivo posljedica promjene cijena promatrane robe, a ni u kojem slučaju posljedica
promjene količina te robe. Stoga navedeni odnos mjeri smjer i jakost relativne promjene cijele
skupine promatranih cijena.

I Paascheov skupni indeks cijena najlakše interpretiramo rabeći odgovarajuću stopu promjene.
Ona se računa prema formuli:

01
1 01 1
( ) ( ) 100
p
S q p q = − [%]

Primjer 11. Za prosječne prodajne cijene (PDV uračunat) i prodane količine četiri različite
vrste proizvoda iz Primjera 9. izračunajmo Lasyperesov i Paascheov skupni indeks cijena, pa
objasnimo njihovo značenje.

Podsjetimo da je bazno razdoblje listopad 2008., a tekuće (izvještajno) razdoblje studeni 2008.
Stoga prosječnu prodajnu cijenu u listopadu označavamo s p
0
, prodanu količinu u listopadu s
q
0
, prosječnu prodajnu cijenu u studenom s p
1
, a prodanu količinu u studenom s q
1
.
Laspeyresov skupni indeks cijena jednak je:
4
1 0
1
01 0 4
0 0
1
01 0
2.39 190 88 50 2.99 170 12.2 190 7680.40
( ) 100 100 100
2.19 190 89 50 3.05 170 12.1 190 7683.60
( ) 99.958353
i i
i
i i
i
p q
p q
p q
p q
=
=

⋅ + ⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅
|
⋅ + ⋅ + ⋅ + ⋅
\ ¹

=




Pripadna stopa promjene iznosi

01
0 01 0
( ) ( ) 100
p
S q p q = − = 99.958353 – 100 = -0.041647



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 237

Zaključujemo da su prosječne prodajne cijene svih promatranih vrstâ proizvoda u studenom
bile za približno 0.042% manje nego u listopadu računajući uz neizmijenjene prodane
količine iz listopada.

Paascheov skupni indeks cijena jednak je

4
1 1
1
01 1 4
0 1
1
01 1
2.39 200 88 54 2.99 150 12.2 180 7874.50
( ) 100 100 100
2.19 200 89 54 3.05 150 12.1 180 7879.50
( ) 99.936544
i i
i
i i
i
p q
p q
p q
p q
=
=

⋅ + ⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅
|
⋅ + ⋅ + ⋅ + ⋅
\ ¹

=




Pripadna stopa promjene iznosi

01
1 01 1
( ) ( ) 100
p
S q p q = − = 99.936544 – 100 = -0.063456

Dakle, prosječne prodajne cijene svih promatranih vrstâ proizvoda u studenome bile su za
približno 0,063% manje nego u listopadu računajući uz neizmijenjene prodane količine iz
studenoga.


5.6.2.3. Fisherov skupni indeks cijena


Analogno Fisherovu skupnu indeksu količina, definira se Fisherov skupni indeks cijena ili
idealni skupni indeks cijena (oznaka: P
01
) Taj je indeks, po definiciji, jednak geometrijskoj
sredini Laspeyresova i Paascheova skupnoga indeksa cijena, tj.

01 01 0 01 1
( ) ( ) P p q p q = ⋅ .

Fisherov skupni indeks količina se najjednostavnije interpretira pomoću pripadne stope
promjene. Ona se računa pomoću izraza:

01
01
100
P
S P = − [%]

i predstavlja prosječnu relativnu promjenu cijena u tekućemu razdoblju u odnosu na cijene u
baznomu razdoblju.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 238

Primjer 12. Izračunajmo Fisherov skupni indeks cijena na temelju podataka iz Primjera 9. i
objasnimo njegovo značenje. Dobivamo:

01 01 0 01 1
7680.40 7874.50
( ) ( ) 100 99.94745
7683.60 7879.50
P p q p q = ⋅ = ⋅ ⋅ = ,

pa je pripadna stopa promjene

01
01
100
P
S P = − = 99.94745 – 100 = –0.52555.

Zaključujemo da su cijene svih promatranih vrstâ proizvoda u studenom 2008. bile za
prosječno 0.52555% manje nego u listopadu 2008.


5.6.3. Skupni indeksi vrijednosti


Skupni indeks vrijednosti (oznaka: V
01
) je pokazatelj relativne promjene ukupne vrijednosti
promatrane skupine od točno n pojava u tekućemu razdoblju u odnosu na ukupnu vrijednost te
skupine pojava u baznomu razdoblju. Računa se prema formuli:

1 1
1
01
0 0
1
100
n
i i
i
n
i i
i
p q
V
p q
=
=

= ⋅




Kao i svi ostali indeksi, najlakše ga je interpretirati pomoću pripadajuće stope promjene. Ona
se računa prema formuli:

01
V
S = V
01
– 100 [%].

Napomenimo da se skupni indeks vrijednosti može izračunati i kao umnožak Laspeyresova
indeksa cijena i Paascheova indeksa količina podijeljenoga sa 100, odnosno Paascheova
indeksa cijena i Laspeyresova indeksa količina podijeljenoga sa 100. Točnije, vrijede sljedeće
jednakosti:

01 0 01 1 01 1 01 0
01
( ) ( ) ( ) ( )
100 100
p q q p p q q p
V
⋅ ⋅
= =



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 239

Također, skupni indeks vrijednosti jednak je umnošku Fisherova skupnoga indeksa cijena i
Fisherova skupnoga indeksa količina podijeljenoga sa 100, tj. vrijedi jednakost:

01 01
01
100
P Q
V

= .

Primjer 13. Za promatrane vrste proizvoda iz Primjera 9. izračunajmo skupni indeks
vrijednosti i objasnimo njegovo značenje. Radi točnosti izračuna koristit ćemo originalnu
formulu za skupni indeks vrijednosti, a potom ćemo provjeriti dobiveni rezultat koristeći
netom navedene jednakosti. Imamo redom:

4
1 1
1
01 4
0 0
1
01
2.39 200 88 54 2.99 150 12.2 180 7874.50
100 100 100
2.19 190 89 50 3.05 170 12.1 190 7683.60
102.484512
i i
i
i i
i
p q
V
p q
V
=
=

⋅ + ⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅
|
⋅ + ⋅ + ⋅ + ⋅
\ ¹

=




Pripadna stopa promjene iznosi

01
V
S = V
01
– 100 = 102.484512 – 100 = 2.484512.

Zaključujemo da je ukupna vrijednost promatrane skupine robâ u studenom 2008. bila za
približno 2.48% veća nego u listopadu 2008.

Izračun skupnoga indeksa vrijednosti pomoću Laspeyresovih i Paascheovih, odnosno
Fisherovih indeksa daje sljedeće rezultate:

01 0 01 1
01
( ) ( ) 99.958353 102.52721
102.48451
100 100
p q q p
V
⋅ ⋅
= = =
01 1 01 0
01
( ) ( ) 99.936544 102.54959
102.48442
100 100
p q q p
V
⋅ ⋅
= = =
01 01
01
99.94745 102.5384
100 100
P Q
V
⋅ ⋅
= = = 102.48452

Za postizanje veće točnosti u izračunima odgovarajuće skupne indekse trebali bismo
izračunati na više decimalnih mjesta. Najtočnija je svakako vrijednost dobivena iz originalne
formule za izračun skupnoga indeksa vrijednosti jer sadrži najmanje podataka dobivenih
približnim izračunima pa tu formulu treba primjenjivati kad god je to moguće.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 240

Primjer 14. U sljedećoj su tablici navedeni podaci o broju ostvarenih noćenja i prosječnim
cijenama jednoga noćenja u gradu Ždralovgradu u tri različita sektora za 2007. i 2008. godinu.

vrsta
usluge
prosječna cijena jednoga
noćenja u 2007. g.
[€]
ostvareni broj
noćenja u 2007. g.
[000]
prosječna cijena jednoga
noćenja u 2008. g.
[€]
ostvareni broj
noćenja u 2008. g.
[000]
hoteli 80 32 90 30
kampovi 29 12 25 13
privatni
smještaj
60 44 59 51

Odredimo:

a) Za koliko su se ukupno promijenile prosječne cijene jednoga noćenja u 2008. godini u
odnosu na 2007. godinu računajući uz neizmijenjen ostvaren broj noćenja u 2007. godini?
b) Za koliko se ukupno promijenio ostvaren broj noćenja u 2008. godini u odnosu na 2007.
godinu računajući uz neizmijenjene prosječne cijene jednoga noćenja u 2008. godini?
c) Za koliko su se prosječno promijenile prosječne cijene jednoga noćenja u 2008. godini u
odnosu na 2007. godinu?
d) Je li ostvarena prognoza gradonačelnika Ždralovgrada Mutimira Lupiglupostića da će
ukupna vrijednost svih noćenja ostvarenih u 2008. godini biti za 10% veća nego u prethodnoj
godini? Objasnimo svoj odgovor.

Najprije primijetimo da je u ovome primjeru 2007. godina bazna godina, a 2008. godina
tekuća ili izvještajna godina. Stoga su veličine u drugomu stupcu cijene u baznoj godini, pa
ćemo ih označiti s p
0
. Na isti način označavamo i ostale stupce: u trećemu su stupcu
vrijednosti količina u baznoj godini koje označavamo s q
0
, u četvrtomu stupcu vrijednosti
veličine p
1
, a u posljednjemu stupcu vrijednosti veličine q
1
. Stoga početnu tablicu možemo
zamijeniti sljedećom:

vrsta usluge p
0
q
0
p
1
q
1
hoteli 80 32 90 30
kampovi 29 12 25 13
privatni smještaj 60 44 59 51

a) U ovome je slučaju neizmijenjena veličina broj noćenja u 2007. godini odnosno, sukladno
gornjim oznakama, veličina q
0
. Promatramo relativnu promjenu cijena uz pretpostavku o
neizmijenjenoj veličini q
0
, pa računamo Laspeyresov skupni indeks cijena (p
01
(q
0
)):



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 241

3
1 0
1
01 0 3
0 0
1
90 32 25 12 59 44 5776
( ) 100 100 100 104.10959
80 32 29 12 60 44 5548
i i
i
i i
i
p q
p q
p q
=
=

⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅ =
|
⋅ + ⋅ + ⋅
\ ¹





Pripadna stopa promjene iznosi

01
0
( )
p
S q = p
01
(q
0
) – 100 = 104.10959 – 100 = 4.10959.

Stoga zaključujemo: Računajući uz neizmijenjen ostvareni broj noćenja u 2007. godini,
prosječne cijene jednoga noćenja u 2008. godini bile su za približno 4.11% nego u 2007.
godini.

b) U ovome je slučaju neizmijenjena veličina prosječna cijena jednoga noćenja u 2008.
godini, tj., sukladno ranijim oznakama, veličina p
1
. Promatramo relativnu promjenu
ostvarenih noćenja uz pretpostavku o fiksiranoj veličini p
1
, pa računamo Paascheov skupni
indeks količina (q
01
(p
1
)):

3
1 1
1
01 1 3
0 1
1
30 90 13 25 51 59 6034
( ) 100 100 100 104.46676
32 90 12 25 44 59 5776
i i
i
i i
i
q p
q p
q p
=
=

⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅ =
|
⋅ + ⋅ + ⋅
\ ¹





Pripadna stopa promjene iznosi

01
1
( )
q
S p = q
01
(p
1
) – 100 = 4.46676.

Stoga zaključujemo: Računajući uz neizmijenjene prosječne cijene jednoga noćenja u 2008.
godini, ostvareni broj noćenja u 2008. godini bio je za 4.46676% veći nego u 2007. godini.

c) U ovome slučaju računamo prosječnu promjenu cijena u tekućem razdoblju u odnosu na
cijene u baznom razdoblju. U tu ćemo svrhu izračunati Fisherov skupni indeks cijena, pa će
rješenje biti tom indeksu pripadajuća stopa promjene. Fisherov skupni indeks cijena jednak je:

01 01 0 01 1
01
90 32 25 12 59 44 90 30 25 13 59 51
( ) ( ) 100
80 32 29 12 60 44 80 30 29 13 60 51
103.7417
P p q p q
P
⋅ + ⋅ + ⋅ ⋅ + ⋅ + ⋅
= ⋅ = ⋅ ⋅
⋅ + ⋅ + ⋅ ⋅ + ⋅ + ⋅
=



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 242

a njemu pripadna stopa promjene

01
01
100
P
S P = − = 103.7417 – 100 = 3.7417.

Dakle, prosječne cijene jednoga noćenja u 2008. godini bile su za prosječno 3.7417% veće
nego u 2007. godini.

d) U ovome slučaju uspoređujemo stopu promjene koja odgovara skupnom indeksu
vrijednosti s očekivanom stopom promjene. Najprije računamo skupni indeks vrijednosti:

3
1 1
1
01 3
0 0
1
90 30 25 13 59 51 6034
100 100 100 108.76
80 32 29 12 60 44 5548
i i
i
i i
i
p q
V
p q
=
=
⋅ + ⋅ + ⋅
| |
= ⋅ = ⋅ = ⋅ =
|
⋅ + ⋅ + ⋅
\ ¹


,

pa je pripadna stopa promjene
01
V
S = V
01
– 100 = 108.76 – 100 = 8.76

Stoga možemo zaključiti: Ukupna vrijednost noćenja u 2008. godini je za 8.76% veća nego u
2007. godini. Dakle, gradonačelnikova prognoza se nije ostvarila
126
.

5.6.4. Neki posebni oblici skupnih indeksa i njihova primjena

U određenim ekonomskim analizama često se koriste različiti oblici individualnih i skupnih
indeksa. Tako se npr. skupni indeks cijena može računati za cijene na malo, cijene na veliko,
cijene poljoprivrednih proizvoda, cijene tzv. "sindikalne košarice" itd. Pogledajmo to na
sljedećim primjerima.

5.6.4.1. Izračunavanje realnih plaća na osnovu skupnih indeksa troškova života

Jedan od najvažnijih oblika skupnih indeksa cijena je indeks potrošačkih cijena
127
. Indeks
potrošačkih cijena odražava promjene na razini cijena dobara i usluga koje u tijeku vremena


126
Gradonačelnikova prognoza ne bi bila istinita niti da smo skupni indeks V
01
računali kao količnik umnoška
indeksa p
01
(q
0
) ⋅ q
01
(p
1
) i broja 100. Provjerite to.
127
Sve do 2004. godine umjesto indeksa potrošačkih cijena računao se tzv. indeks troškova života koji je imao
istu namjenu kao i indeks potrošačkih cijena. Od 2004. godine u statističkim se izvješćima primjenjuje indeks
potrošačkih cijena, a u svrhu usklađivanja hrvatskih statističkih izvješća sa svjetskim izvješćima i pokazateljima.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 243

nabavlja, koristi se njima ili plaća referentno stanovništvo radi osobne potrošnje, te je
jedinstvena i opća mjera inflacije u Republici Hrvatskoj. On je samo mjera kretanja cijena
dobara i usluga osobne potrošnje, a ne stvarnih promjena razlike i strukture osobne potrošnje,
za koje se podaci prikupljaju posebnim anketama. Izračunava se i objavljuje na osnovi oko
590 reprezentativnih dobara i usluga. Svakog mjeseca prikupi se više od 27 000 cijena na
unaprijed definiranu uzorku prodajnih mjesta na unaprijed definiranu uzorku prodajnih mjesta
na devet lokacija (gradova) u Republici Hrvatskoj (Zagreb, Slavonski Brod, Osijek, Sisak,
Rijeka, Pula, Split, Dubrovnik i Varaždin), odabranih prema kriteriju broja stanovnika i
reprezentativnosti za pojedinu statističku regiju. Za klasificiranje izdataka koristi se
Klasifikacija osobne potrošnje prema namjeni (COICOP) koja izdatke dijeli u sljedećih 12
osnovnih kategorija dobara i usluga:

- prehrana i bezalkoholna pića;
- alkoholna pića i duhan;
- odjeća i obuća;
- stanovanje, voda, energija, plin i druga goriva;
- pokućstvo, oprema za kuću i redovito održavanje;
- zdravstvo;
- promet;
- komunikacije;
- rekreacija i kultura;
- obrazovanje;
- ugostiteljske usluge;
- ostala dobra i usluge
128
.

Indeks potrošačkih cijena služi ponajprije za mjerenje inflacije (porasta cijena) u privredi, a
može se koristiti i u druge svrhe (npr. za očuvanje vrijednosti kod ugovora s indeksnim
klauzulama, deflacioniranje (uklanjanje utjecaja inflacije) određenih vrijednosnih pokazatelja
itd.).

Pomoću indeksa potrošačkih cijena mjeri se utjecaj potrošačkih cijena na nominalne plaće.
Tako se dobiju realne plaće čije kretanje služi za opis kretanja životnoga standarda
stanovništva. Realne plaće i pripane indekse realnih plaća kao pokazatelje njihove dinamike
kretanja izračunavamo prema formulama:



128
Definicije navedene u prvom dijelu ove točke preuzete su iz Statističkoga ljetopisa Republike Hrvatske za
2008. godinu, DZS, Zagreb, 2009.


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 244

100
100
NP
RP
IPC
INP
IRP
IPC
= ⋅
= ⋅

pri čemu su:

RP – iznos realne plaće;
NP – iznos nominalne plaće;
IPC – indeks potrošačkih cijena na stalnoj bazi;
IRP – indeks realne plaće na stalnoj bazi;
INP – indeks nominalne plaće na stalnoj bazi.

Istaknimo da se svi ovdje navedeni indeksi na stalnoj bazi obavezno moraju odnositi na isto
bazno razdoblje (tj. moraju se odnositi na razdoblje u odnosu na čije potrošačke cijene
računamo iznose realnih plaća).

Primjer 15. Prosječne mjesečne neto-plaće u Republici Hrvatskoj i verižni indeksi
potrošačkih cijena za razdoblje od rujna 2008. do siječnja 2009. godine navedeni su u donjoj
tablici.

Razdoblje
Prosječna
mjesečna
neto-plaća
[kn]
Verižni indeks
potrošačkih
cijena
rujan 2008. 5.203 ––––––
listopad 2008. 5.263 100.0879507
studeni 2008. 5.397 99.73637961
prosinac 2008. 5.410 99.38325991
siječanj 2009. 5.307 101.2411348

Izračunajmo realne plaće i pripadne indekse realnih plaća na stalnoj bazi prosinac 2008. =
100. Objasnimo vrijednosti izračunate za listopad 2008. godine i odredimo ukupnu relativnu
promjenu realnih plaća u promatranom razdoblju.

Verižne indekse potrošačkih cijena najprije moramo pretvoriti u indekse potrošačkih cijena na
stalnoj bazi (uzimajući prosinac 2008. godine a bazno razdoblje, tj. b = prosinac 2008.).
Koristimo formule:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 245

1
1
100 za prosinac 2008.;
100 za prosinac 2008.;
za prosinac 2008. .
100
t
t
t
t
t t
t
I t
I
I t
V
I V
I t


= =
= ⋅ <

= <


Tako najprije imamo:

I
prosinac
= 100,

pa

prosinac
prosinac
100
100 100 100.6206
99.38326
100, 6206
100 100 100.8865
99.73638
100.8865
100 100 100.7979
100.088
studeni
studeni
listopad
studeni
listopad
rujan
listopad
I
I
V
I
I
V
I
I
V
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
= ⋅ = ⋅ ≈
,

dok za siječanj 2009. dobivamo:

prosinac
100 101.2411
101.2411
100 100
siječanj
siječanj
I V
I


= = = .

(To smo mogli zaključiti i bez računanja. Zašto?) Dobivene podatke pregledno zapišimo u
posljednji stupac sljedeće tablice:

Razdoblje
Prosječna mjesečna
neto-plaća [kn]
Verižni indeks
potrošačkih cijena
Indeks potrošačkih cijena
(prosinac 2008. = 100)
rujan 2008. 5.203 –––––– 100.7978724
listopad 2008. 5.263 100.0879507 100.8865248
studeni 2008. 5.397 99.73637961 100.6205674
prosinac 2008. 5.410 99.38325991 100
siječanj 2009. 5.307 101.2411348 101.2411348

Realne plaće (uz prosinac 2008. kao bazno razdoblje) računamo prema formuli:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 246

prosječna mjesečna neto-plaća
100
indeks potrošačkih cijena na stalnoj bazi (prosinac 2008. = 100)
RP = ⋅ .

Tako redom imamo:

prosinac
5.203
100 5.161,82
100.7979
5.263
100 5.216, 75
100.8865
5.397
100 5.363, 72
100.6206
prosječna mjesečna netoplaća za prosinac = 5.410
5.307
100 5.241
101.2411
rujan
listopad
studeni
siječanj
RP
RP
RP
RP
RP
= ⋅ ≈
= ⋅ ≈
= ⋅ ≈
=
= ⋅ ≈ , 94


Potom računamo indeks realnih plaća (IRP) ponovno uzimajući prosinac 2008. godine kao
bazno razdoblje. Taj indeks možemo izračunati izravno iz gore navedenih realnih plaća kao:

realna plaća u tekućem razdoblju
100
realna plaća u prosincu 2008.
IRP = ⋅

pa dobivamo:

prosinac
5.161,82
100 95.41248
5.410
5.216, 75
100 96.42795
5.410
5.363, 72
100 99.14445
5.410
100
5.241, 94
100 96.89354
5.410
rujan
listopad
studeni
siječanj
IRP
IRP
IRP
IRP
IRP
= ⋅ ≈
= ⋅ ≈
= ⋅ ≈
=
= ⋅ ≈


Sve dobivene podatke možemo pregledno zapisati tablično:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 247

Razdoblje
Prosječna
mjesečna
neto-plaća
[kn]
Verižni
indeks
potrošačkih
cijena
Iindeks potrošačkih
cijena
(prosinac 2008. =
100)
Realne plaće
(bazno razdoblje:
prosinac 2008.)
Indeks realnih
plaća
(prosinac
2008. = 100)
rujan 2008. 5.203 –––––– 100.7978724 5.161,82 95.41248245
listopad
2008.
5.263
100.0879507 100.8865248 5.216,75 96.42795188
studeni 2008. 5.397 99.73637961 100.6205674 5.363,71 99.14444616
prosinac
2008.
5.410
99.38325991 100 5.410 100
siječanj
2009.
5.307
101.2411348 101.2411348 5.241,94 96.89353887

Iz tablice vidimo da su realne plaće u listopadu 2008. godine, uz potrošačke cijene iz
prosinca 2008. godine, iznosile 5.216,75 kn. Pripadni indeks realnih plaća interpretiramo
pomoću odgovarajuće stope promjene:

S
t
= IRP – 100.
Stoga imamo:

S
listopad
= IRP
listopad
– 100 = 96.42795188 – 100 = -3.57204812.

Zaključujemo da su, uz potrošačke cijene iz prosinca 2008. godine, u listopadu 2008. godine
realne plaće bile za približno 3.57% manje nego u prosincu iste godine.

Ukupnu relativnu promjenu, tj. ukupan postotak promjene realnih plaća u promatranom
razdoblju možemo izračunati na dva različita načina:

1.) određivanjem omjera posljednje i prve vrijednosti realne plaće uz potrošačke cijene iz
prosinca 2008. godine:

100 100
5.241, 94
100 100
5.161,82
1.552267
siječanj
rujan
Y
P
Y
P
P
= ⋅ −
= ⋅ −



2.) određivanjem omjera posljednjeg i prvog indeksa realnih plaća (uz prosinac 2008.
godine kao bazno razdoblje):



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 248

100 100
96.89354
100 100
95.41248
1.552267
siječanj
rujan
IRP
P
IRP
P
P
= ⋅ −
= ⋅ −



Zaključujemo da su se, uz potrošačke cijene iz prosinca 2008. godine, u promatranom
razdoblju realne plaće ukupno povećale za približno 1.55%.

Napomena: Apsolutna vrijednost realnih plaća ovisi o razdoblju za kojega su vezane
potrošačke cijene (tj. za različita bazna razdoblja dobivamo različite vrijednosti realnih plaća),
pa se prigodom njihova računanja obvezatno mora navesti uz koje su bazno razdoblje vezane
potrošačke cijene (upravo kako smo to učinili u prethodnomu primjeru). No, prigodom
računanja indeksa ili odgovarajućih stopa promjene nije bitno uz koje su razdoblje vezane
potrošačke cijene jer vrijednost indeksa (odnosno, stope promjene) ne ovisi o izboru razdoblja
za kojega vežemo potrošačke cijene. U tome je prednost uporabe pokazatelja relativnih
promjena.


5.6.4.2. Vrijednost u stalnim cijenama i indeks fizičkoga obujma


Jedna od vrlo čestih pojava u ekonomskim analizama jest tzv. deflacija. Tim se postupkom
uklanja utjecaj promjena cijena na vrijednosno izražene pojave, a provodi se tako da se
nominalne vrijednosti (vrijednosti izražene u tekućim cijenama) podijele s odgovarajućim
skupnim indeksom cijena (kojega nazivamo deflator). Njegova obilježja općenito ovise o
strukturi pojave čije vrijednosti deflacioniramo. Potreba za deflacijom osobito se javlja pri
inflacijskim kretanjima u kojima promjene cijena onemogućuju uvid u stvarni razvoj
promatranih pojava (npr. količina proizvoda, količina usluga itd.). Deflacionirane vrijednosti
nazivamo i vrijednosti u stalnim cijenama, a općenito ih određujemo pomoću formule

100
TC
SC
V
V
IC
= ⋅

gdje su:

V
SC
– vrijednost iskazana u stalnim cijenama;
V
TC
– vrijednosti iskazana u tekućim cijenama;
IC – indeks cijena na stalnoj bazi.



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 249

Tipični primjeri deflatora su ranije spomenuti indeks potrošačkih cijena i tzv. indeks fizičkoga
obujma. Taj je indeks poseban oblik skupnoga indeksa količina, a računamo ga pomoću
izraza:

( )
100
( )
SC t
t
SC b
V
IFO
V
= ⋅ , za t = 0, 1, …, n – 1

gdje su:

(IFO)
t
– indeks fizičkoga obujma za razdoblje t;
(V
SC
)
t
– vrijednost u stalnim cijenama za razdoblje t;
(V
SC
)
b
– vrijednost u stalnim cijenama za bazno razdoblje b.

Indeks fizičkoga obujma rabimo, primjerice, kada želimo uspoređivati bruto domaći proizvod
u određenoj godini (iskazan u stalnim cijenama) s bruto domaćim proizvodom u nekoj
odabranoj baznoj godini.

Pokažimo primjenu ovih vrsta indeksa na primjeru.

Primjer 16. U donjoj su tablici navedeni podaci o proizvodnji u tekućim cijenama, indeksu
cijena na stalnoj bazi 2005 = 100 i proizvodnji u stalnim cijenama iz 2005. godine.

Godina Verižni
indeks
cijena
Proizvodnja u
tekućim
cijenama
[000 000 €]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u stalnim cijenama
iz 2005. godine
[000 000 €]
Indeks
fizičkoga
obujma
(2005 = 100)
1997. 69.76990634 0,90296810
1998. 0.75 74.65379979
1999. 76.89341378 1,14444132
2000. 0.96 77.66234792
2001. 82.32208879 1,29977266
2002. 1.23 85.61497235
2003. 88.18342152 1,54224000
2004. 1.52 92.59259259
2005. 100 1,85000000
2006. 1,98 110
2007. 118,8 2,11279461
2008. 2,75 125.928
Dopunimo navedenu tablicu podacima koji nedostaju, pa potom pomoću reprezentativnijega
od dvaju modela trenda (jednostavni linearni i jednostavni eksponencijalni model trenda)
prognozirajmo kretanje proizvodnje (iskazane u stalnim cijenama iz 2005. godine) u razdoblju


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 250

od 2009. do 2013. godine. Zaključno, odredimo ukupnu relativnu promjenu i prosječnu
godišnju relativnu promjenu cijena u promatranom razdoblju, te očekivanu ukupnu relativnu
promjenu i očekivanu prosječnu godišnju relativnu promjenu proizvodnje (iskazane u stalnim
cijenama iz 2005. godine) u razdoblju od 2009. do 2013. godine.

Izračunajmo najprije verižne indekse cijena koristeći zadane indekse na stalnoj bazi 2005 =
100. Podsjetimo da se indeksi na stalnoj bazi pretvaraju u verižne indekse pomoću relacije:

1
100
t
t
t
I
V
I

= ⋅ , za svaki t = 1, 2, …, n – 1.

Pritom 1997. godini odgovara vrijednost vremenske varijable t = 0, 1998. godini vrijednost
vremenske varijable t = 1 itd. Verižni indeks cijena za 1997. godinu nije moguće izračunati,
pa ćemo u odgovarajući stupac tablice upisati riječ nepoznat. Za ostale godine dobivamo:

1
1
0
2
2
1
3
3
2
74.65379979
100 100 107;
69.76990634
76.89341378
100 100 103;
74.65379979
77.66234792
100 100 101;
76.89341378
IC
V
IC
IC
V
IC
IC
V
IC
= ⋅ = ⋅ =
= ⋅ = ⋅ =
= ⋅ = ⋅ =


itd. Tako drugi stupac zadane tablice izgleda ovako:

Verižni
indeks
cijena
nepoznat
107
103
101
106
104
103
105
108
110
108
106


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 251

Nepoznate proizvodnje u tekućim cijenama izračunat ćemo koristeći relaciju

100
TC
SC
V
V
IC
= ⋅

iz koje je
100
SC
TC
V IC
V

= .

Tako je vrijednost proizvodnje u tekućim cijenama za 1997. godinu jednaka

0 0
0
( ) 0.90296810 69.76990634
( ) 0.63
100 100
SC
TC
V IC
V
⋅ ⋅
= = = ,

vrijednost proizvodnje u tekućim cijenama za 1999. godinu

2 2
2
( ) 1.14444132 76.89341378
( ) 0.88
100 100
SC
TC
V IC
V
⋅ ⋅
= = =

itd. Stoga treći stupac zadane tablice izgleda ovako:

Proizvodnja u
tekućim cijenama
[000 000 €]
0,63
0,75
0,88
0,96
1,07
1,23
1,36
1,52
1,85
1,98
2,51
2,75

Peti stupac tablice popunjavamo koristeći definicijsku relaciju za vrijednost u stalnim
cijenama:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 252

100
TC
SC
V
V
IC
= ⋅ .

Tako se dobiva:

1998
1998
1998
2000
2000
2000
2002
2002
2002
( ) 0.75
( ) 100 100 1.00463741;
74.65379979
( ) 0.96
( ) 100 100 1.23612024;
77.66234792
( ) 1.23
( ) 100 100 1.43666460;
85.61497235
TC
SC
TC
SC
TC
SC
V
V
IC
V
V
IC
V
V
IC
= ⋅ = ⋅ =
= ⋅ = ⋅ =
= ⋅ = ⋅ =


itd. Stoga peti stupac zadane tablice izgleda ovako:

Proizvodnja u stalnim cijenama
iz 2005. godine
[000 000 €]
0.90296810
1.00463741
1.14444132
1.23612024
1.29977266
1.43666460
1.54224000
1.64160000
1.85000000
1.80000000
2.11279461
2.18378756

Indeks fizičkoga obujma izračunat ćemo koristeći relaciju

( )
100
( )
SC t
SC b
V
IFO
V
= ⋅ , za t = 0, 1, 2, …, 10, 11 i b = 8,

jer 2005. godini odgovara vrijednost vremenske varijable t = 8. Zbog toga je:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 253

0
0
8
1
1
8
2
2
8
( ) 0.90296810
100 100 48.80908667;
( ) 1.85
( ) 1.00463741
100 100 54.30472482;
( ) 1.85
( ) 1.14444132
100 100 61.86169300;
( ) 1.85
SC
SC
SC
SC
SC
SC
V
IFO
V
V
IFO
V
V
IFO
V
= ⋅ = ⋅ =
= ⋅ = ⋅ =
= ⋅ = ⋅ =


itd. Prema tome, posljednji stupac zadane tablice izgleda ovako:

Indeks
fizičkoga
obujma
(2005 = 100)
48.80908667
54.30472482
61.86169300
66.81731017
70.25798141
77.65754595
83.36432432
88.73513514
100
97.29729730
114.20511421
118.04257087

a cijela tablica ovako:

Godina Verižni indeks
cijena
Proizvodnja u
tekućim cijenama
[000 000 €]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u
stalnim cijenama
iz 2005. godine
[000 000 €]
Indeks
fizičkoga
obujma
(2005 = 100)
1997. nepoznat 0.63 69.76990634 0.90296810 48.80908667
1998. 107 0.75 74.65379979 1.00463741 54.30472482
1999. 103 0.88 76.89341378 1.14444132 61.861693
2000. 101 0.96 77.66234792 1.23612024 66.81731017
2001. 106 1.07 82.32208879 1.29977266 70.25798141
2002. 104 1.23 85.61497235 1.43666460 77.65754595
2003. 103 1.36 88.18342152 1.54224000 83.36432432
2004. 105 1.52 92.59259259 1.64160000 88.73513514
2005. 108 1.85 100 1.85000000 100


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 254

Godina Verižni indeks
cijena
Proizvodnja u
tekućim cijenama
[000 000 €]
Indeks cijena na
stalnoj bazi
(2005 = 100)
Proizvodnja u
stalnim cijenama
iz 2005. godine
[000 000 €]
Indeks
fizičkoga
obujma
(2005 = 100)
2006. 110 1.98 110 1.80000000 97.2972973
2007. 108 2.51 118.8 2.11279461 114.2051142
2008. 106 2.75 125.928 2.18378756 118.0425709

Iz navedenih podataka vidimo npr. da je 2001. godine proizvodnja iskazana u stalnim
cijenama iz 2005. godine bila za 100 – 70.25798141 = 29.74201859% manja nego u 2005.
godini, a 2007. godine za 114.20511421 – 100 = 14.20511421% veća nego u 2005. godini.

Kretanje proizvodnje u stalnim cijenama iz 2005. godine, kao i jednadžbe modela
jednostavnoga linearnoga trenda i modela jednostavnoga eksponencijalnoga trenda s
odgovarajućim koeficijentima determinacije navedene su na donjoj slici:



Koeficijent determinacije modela jednostavnoga eksponencijalnoga trenda (R
2
= 0.986) je
veći od koeficijenta determinacije modela jednostavnoga linearnoga trenda (R
2
= 0.984), pa je


ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 255

model jednostavnoga eksponencijalnoga trenda reprezentativniji. Koristeći funkciju
GROWTH u MS Excelu prognoziramo vrijednosti proizvodnje u stalnim cijenama iz 2005.
godine u razdoblju od 2009. do 2013. godine:

godina t prognozirana proizvodnja
[000 000 €]
2009 12 2.42576156
2010 13 2.62304438
2011 14 2.83637186
2012 15 3.06704888
2013 16 3.31648645

(Ista se prognoza može dobiti tako da se u jednadžbu modela jednostavnoga
eksponencijalnoga trenda

0.0782
0.9492 0.9492 1.0813389048
x x
y e

= ⋅ = ⋅

uvrštavaju redom vrijednosti x = 12, x = 13, …, x = 16.)

Za izračun relativnih pokazatelja promjene cijenâ, odnosno proizvodnje bit će korisna
sljedeća tri svojstva:

Svojstvo 1. Prosječna stopa promjene vrijednosti neke pojave (iskazana u postotcima) jednaka
je razlici geometrijske sredine verižnih indeksa te pojave i broja 100.

Dokaz: Neka je Y
i
vrijednost promatrane pojave u razdoblju i, i = 0, 1, 2, …, n – 1. Označimo
sa S prosječnu stopu promjene vrijednosti te pojave (iskazanu u postotcima). Tada mora
vrijediti jednakost:

( )
1
1 0
1
n
n
Y Y S


= ⋅ + ,

a odavde je

1
1
0
1
n
n
Y
S
Y

− + = .

Geometrijska sredina G svih n – 1 verižnih indeksa te pojave jednaka je:



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 256

1 1
1 3 2 1 1 1 2
1 1 1 1
1 1 1 0 1 2 3 2 0
100 100 ... 100
n n
n i n n n
n n n n
i
i i i n n
Y Y Y Y Y Y Y
G V
Y Y Y Y Y Y Y
− −
− − − −
− − − −
= = − − −
| |
= = ⋅ = ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ = ⋅
|
\ ¹
∏ ∏
,

odnosno, uvažavajući prethodnu jednakost,

100 (1 ) G S = ⋅ + .

Odavde slijedi

100
1 100
100 100
G G
S G

= − = = − [%],

što je i trebalo pokazati.

Iz navedenoga dokaza još se jednom može uočiti nedostatak geometrijske sredine (i iz nje
izvedene prosječne relativne stope promjene) kao pokazatelja za prognozu vrijednosti neke
pojave. U dokazu se ništa ne govori o međuvrijednostima Y
1
, Y
2
, …, Y
n – 2
, već se isključivo
zahtijeva da se podudaraju prva (nulta) i posljednja ((n – 1)–va) vrijednost pojave. Zbog toga
je za prognoziranje budućih vrijednosti te pojave bolje primijeniti ranije spomenute modele
trenda.

Svojstvo 2. Za svaki i = 0, 1, …, n – 1 neka su Y
i
vrijednosti neke pojave u razdoblju i, a I
i

pripadni indeksi na stalnoj proizvoljnoj, ali fiksiranoj bazi b, za bilo koji b ∈ {0, 1, …, n – 1}.
Tada je prosječna stopa S promjene vrijednosti te pojave (iskazana u postotcima) jednaka

1
1
0
100 1
n
n
I
S
I


| |
= ⋅ −
|
|
\ ¹
[%].

Dokaz: Prema prethodnom dokazu je

1
1
0
1
n
n
Y
S
Y

− + = ,

odnosno



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 257

1 1
1 1
0 0
1 100 1
n n
n n
Y Y
S
Y Y
− −
− −
| |
= − = ⋅ −
|
|
\ ¹
[%].

Stoga je dovoljno dokazati da vrijedi jednakost:

1 1
0 0
n n
I Y
I Y
− −
= ,

a ona izravno slijedi iz definicije indeksa na stalnoj bazi:

1
1 1
0
0 0
n
n b n
b
Y
I Y Y
Y
I Y
Y

− −
= = .

Svojstvo 3. Neka je S prosječna stopa promjene neke pojave (iskazana u postotcima) u
nekom razdoblju. Tada je ukupna relativna promjena vrijednosti te pojave (iskazana u
postotcima) u promatranom razdoblju:

( )
1
1 1
n
p S

= + − [%].

Dokaz: Prema dokazu Svojstva 1. vrijedi jednakost:

( )
1
1 0
1
n
n
Y Y S


= ⋅ + .

Ukupna relativna stopa promjene iskazana u postotcima jednaka je:

1 0
0
100
n
Y Y
p
Y


= ⋅ .
Iz tih dviju jednakosti slijedi:

( )
( )
1
1
0
0 0
1 0
0 0 0
1 1
1
100 100 100
n
n
n
Y S
Y S Y
Y Y
p
Y Y Y



(
⋅ + −
⋅ + −
− (
¸ ¸
= ⋅ = ⋅ = ⋅ ,



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 258

odnosno

( )
1
1 1 100
n
p S

(
= + − ⋅
(
¸ ¸
,

što je i trebalo pokazati.

Na temelju prethodnih svojstava rješavamo preostali dio zadataka iz Primjera 16. Ukupnu
relativnu promjenu i prosječnu godišnju promjenu cijena u promatranom razdoblju izračunat
ćemo primjenom Svojstava 2. i 3. na indekse cijena na stalnoj bazi 2005 = 100. Tako je
najprije prosječna godišnja promjena cijena u promatranom razdoblju jednaka

[ ]
12 1 11
11
12 1 11
0 0
125.928
100 1 100 1 100 1 5.044 %
69.76990634
c
I I
S
I I


| | | | | |
= ⋅ − = ⋅ − = ⋅ − ≈
| | |
\ ¹ \ ¹ \ ¹
,

tj. cijene su rasle prema prosječnoj godišnjoj stopi od približno 5,044%. Ukupna relativna
promjena cijena je

( ) [ ]
12 1
1
5.0439829422782
1 1 100 1 1 100 71.8237 %
100
n
c
p S

− (
| |
(
= + − ⋅ = + − ⋅ ≈
(
|
(
¸ ¸
\ ¹
(
¸ ¸
,

tj. u promatranom se su razdoblju cijene povećale za ukupno približno 71.8237%.

Očekivanu ukupnu relativnu promjenu i očekivanu prosječnu godišnju promjenu proizvodnje
u stalnim cijenama iz 2005. godine za razdoblje od 2009. do 2013. godine izračunat ćemo
koristeći Svojstvo 3. i formulu

1 1
1 1
0 0
1 100 1
n n
n n
Y Y
S
Y Y
− −
− −
| |
= − = ⋅ −
|
|
\ ¹
[%].
Izračunajmo najprije očekivanu prosječnu godišnju promjenu proizvodnje. Budući da imamo
ukupno 5 prognoziranih vrijednosti proizvodnje u stalnim cijenama iz 2005. godine, to je n =
= 5, pa je Y
n – 1
= krajnja prognozirana vrijednost proizvodnje = 3.31648645 i Y
0
= početna
prognozirana vrijednost proizvodnje = 2.42576156. Stoga je

5 1 4
3.31648645 3.31648645
100 1 100 1 8.13282
2.42576156 2.42576156
p S

| | | |
= ⋅ − = ⋅ − ≈
| |
\ ¹ \ ¹
[%],



ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 259

tj. proizvodnja u stalnim cijenama iz 2005. godine u razdoblju od 2009. do 2013. godine
očekivano će rasti po prosječnoj godišnjoj stopi od približno 8.13282%. Očekivano ukupno
povećanje proizvodnje u stalnim cijenama iz 2005. godine u razdoblju od 2009. do 2013.
godine dobit ćemo iz jednakosti:

( ) [ ]
5 1
1
8.13282
1 1 100 1 1 100 36.7194 %
100
n
p
p
p S

− (
| |
(
= + − ⋅ = + − ⋅ ≈
(
|
(
¸ ¸
\ ¹
(
¸ ¸
,

tj u promatranom će se razdoblju proizvodnja u stalnim cijenama iz 2005. godine očekivano
ukupno povećati za približno 36.7194%.

Zaključno napomenimo da bi sve gore izračunate relativne vrijednosti promjena cijena,
odnosno proizvodnje ostale nepromijenjene ukoliko bismo za bazno razdoblje uzeli bilo koju
drugu godinu promatranoga razdoblja. To, dakako, ne vrijedi za prognoziranu proizvodnju u
stalnim cijenama jer njezine vrijednosti izravno ovise o tome koju smo godinu odabrali za
baznu godinu (za drugu baznu godinu dobit ćemo druge vrijednosti proizvodnje u stalnim
cijenama iz te godine). Zbog toga se pri ekonomskim analizama u ovakvim slučajevima češće
primjenjuju relativni pokazatelji promjena vrijednosti neke pojave.
























ELEKTROTEHNIČKI ODJEL

Poslovna statistika

© mr.sc. Bojan Kovačić, predavač 260

6. LITERATURA


1. M. Papić: ''Primijenjena statistika u MS Excelu'' (2. izdanje), VPŠ ''Libertas'' –
Naklada ''Zoro'', Zagreb, 2008.
2. M. Vukičević, M. Papić: Matematičko-statistički priručnik za poduzetnike, Golden-
marketing – Tehnička knjiga, Zagreb, 2003.
3. I. Šošić: Primijenjena statistika, Školska knjiga, Zagreb, 2004.
4. V.Serdar, I. Šošić: Uvod u statistiku, Školska knjiga, Zagreb, 2000.
5. A. Rozga, B. Grčić: Poslovna statistika, Veleučilište u Splitu
129
, Split, 1999.
6. Statistički ljetopisi Republike Hrvatske i Mjesečna statistička izvješća [objavljeni na
www.dzs.hr ], Državni zavod za statistiku, Zagreb
7. „Žene i muškarci u Hrvatskoj“ (publikacija objavljena na www.dzs.hr), Državni zavod
za statistiku, Zagreb, 2007.
8. Sveučilišna anketa o kvaliteti nastave objavljena na www.unizg.hr, Sveučilište u
Zagrebu, Zagreb, 2008.
9. nastavni materijali iz kolegija Statistika objavljeni na www.efos-statistika.com,
Ekonomski fakultet Sveučilišta u Osijeku, Osijek, 2009.
10. nastavni materijal doc.dr.sc. Snježane Pivac iz kolegija Poslovna statistika objavljen
na www.efst.hr/nastava/44/12.Skupni_indeksi._Doc._dr._S._Pivac.pdf, Ekonomski
fakultet Sveučilišta u Splitu, Split, 2009.
11. članci objavljeni na Wikipedii:
http://en.wikipedia.org/wiki/Correlation,
http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient,
http://en.wikipedia.org/wiki/Regression_analysis,
http://en.wikipedia.org/wiki/Dollar_cost_averaging,
http://en.wikipedia.org/wiki/Trend_estimation






129
Današnji Sveučilišni studijski centar za stručne studije Sveučilišta u Splitu.

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

SADRŽAJ
PREDGOVOR ....................................................................................................................5 0. REKLI SU O STATISTICI… ...................................................................................8 1. UVOD U STATISTIKU .............................................................................................8
1.1. Pojam statistike ............................................................................................................................ 8 1.2. Opisna i inferencijalna statistika .................................................................................................. 8 1.3. Statistička analiza, statistički skup i obilježja elemenata statističkog skupa .............................. 9 1.3.1. Skale obilježja ...................................................................................................................... 11 1.3.2. Vrste obilježja ...................................................................................................................... 14

2. FAZE STATISTIČKOGA ISTRAŽIVANJA ......................................................18
2.1. Određivanje cilja i razrada plana istraživanja ............................................................................ 18 2.2. Organizirano prikupljanje statističkih podataka ........................................................................ 19 2.3. Grupiranje statističkih podataka ................................................................................................ 21 2.3.1. Grupiranje kvalitativnih podataka ....................................................................................... 21 2.3.2. Grupiranje kvantitativnih podataka .................................................................................... 23 2.3.3. Kumulativni nizovi frekvencija ............................................................................................. 25 2.3.4. Dijagram ''stablo – list'' (stem – leaf) .................................................................................. 30 2.4. Tablični prikaz statističkih podataka .......................................................................................... 32 2.5. Grafički prikaz statističkih podataka .......................................................................................... 38 2.5.1. Površinski grafikoni.............................................................................................................. 39 2.5.2. Histogram ............................................................................................................................ 47 2.5.3. Linijski grafikoni ................................................................................................................... 54 2.5.4. Ostale vrste grafikona ............................................................................................................. 59

3. OSNOVNE KARAKTERISTIKE NUMERIČKIH NIZOVA ...........................63
3.1. Srednje vrijednosti numeričkih nizova ........................................................................................ 63 3.1.1. Aritmetička sredina ............................................................................................................. 64 3.1.2. Geometrijska sredina ........................................................................................................... 75

© mr.sc. Bojan Kovačić, predavač

2

ELEKTROTEHNIČKI ODJEL
Poslovna statistika
3.1.3. Harmonijska sredina ............................................................................................................ 80 3.1.4. Kvantili ................................................................................................................................. 84 3.1.5. Mod ..................................................................................................................................... 92 3.2. Mjere raspršenja (disperzije) ...................................................................................................... 94 3.2.1. Raspon varijacije.................................................................................................................. 95 3.2.2. Interkvartil ........................................................................................................................... 97 3.2.3. Interpercentilni razmak ....................................................................................................... 98 3.2.4. Varijanca i standardna devijacija ........................................................................................ 99 3.2.5. Srednje apsolutno odstupanje ........................................................................................... 105 3.2.6. Koeficijent varijacije........................................................................................................... 108 3.2.7. Koeficijent kvartilne devijacije ........................................................................................... 111 3.3. Standardizirano obilježje .......................................................................................................... 115 3.4. Vrste razdioba (distribucija) ..................................................................................................... 119 3.4.1. Mjere asimetrije ................................................................................................................ 120 3.4.2. Mjere zaobljenosti ............................................................................................................. 124 3.5. Programska potpora deskriptivnoj statističkoj analizi ............................................................. 126

4. KORELACIJSKA I REGRESIJSKA ANALIZA ............................................. 127
4.1. Korelacijska analiza .................................................................................................................. 128 4.1.1. Spearmanov koeficijent korelacije ranga .......................................................................... 139 4.2. Regresijska analiza ................................................................................................................... 146 4.2.1. Model jednostavne linearne regresije ............................................................................... 148 4.2.2. Analiza varijance modela jednostavne linearne regresije ................................................. 164 4.2.3. Mjere reprezentativnosti modela jednostavne linearne regresije ..................................... 166
4.2.3.1. Varijanca regresijskoga modela............................................................................................... 166 4.2.3.2. Standardna devijacija regresijskoga modela ........................................................................... 167 4.2.3.3. Koeficijent varijacije regresijskoga modela .............................................................................. 167 4.2.3.4 Koeficijent determinacije .......................................................................................................... 168

4.3. Primjeri nelinearnih modela jednostavne regresije .................................................................. 172 4.3.1. Model jednostavne eksponencijalne regresije................................................................... 172

© mr.sc. Bojan Kovačić, predavač

3

ELEKTROTEHNIČKI ODJEL
Poslovna statistika
4.3.2. Model jednostavne logaritamske regresije ....................................................................... 181 4.3.3. Model jednostavne potencijske regresije (POWER) .......................................................... 186 4.4. Primjer modela višestruke (multiple) regresije: model višestruke linearne regresije ............... 194

5. INDIVIDUALNI BROJČANI POKAZATELJI RAZVOJA VREMENSKOGA NIZA ......................................................................................................................... 199
5.1. Definicija i vrste vremenskih nizova.......................................................................................... 202 5.2. Pokazatelji pojedinačnih apsolutnih promjena ........................................................................ 204 5.3. Modeli trenda .......................................................................................................................... 206 5.4. Osnovni brojčani pokazatelji relativnih promjena .................................................................... 210 5.5. Individualni indeksi ................................................................................................................... 212 5.5.1. Verižni (lančani) indeksi ..................................................................................................... 213 5.5.2. Indeksi na stalnoj bazi (bazni indeksi) ............................................................................... 218 5.5.3. Pretvorba indeksa .............................................................................................................. 224 5.6. Skupni indeksi ........................................................................................................................... 229 5.6.1. Skupni indeksi količina ....................................................................................................... 230
5.6.1.1. Laspeyresov skupni indeks količina .......................................................................................... 230 5.6.1.2. Paascheov skupni indeks količina............................................................................................. 231 5.6.1.3. Fisherov skupni indeks količina ................................................................................................ 233

5.6.2. Skupni indeksi cijena .......................................................................................................... 234
5.6.2.1. Laspeyresov skupni indeks cijena ............................................................................................. 235 5.6.2.2. Paascheov skupni indeks cijena .............................................................................................. 235 5.6.2.3. Fisherov skupni indeks cijena ................................................................................................... 237

5.6.3. Skupni indeksi vrijednosti .................................................................................................. 238 5.6.4. Neki posebni oblici skupnih indeksa i njihova primjena .................................................... 242
5.6.4.1. Izračunavanje realnih plaća na osnovu skupnih indeksa troškova života ................................ 242 5.6.4.2. Vrijednost u stalnim cijenama i indeks fizičkoga obujma ........................................................ 248

6. LITERATURA .......................................................................................................... 260

© mr.sc. Bojan Kovačić, predavač

4

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

PREDGOVOR
Jedna od najprimjenjivanijih matematičkih disciplina u gotovo svim područjima čovjekova djelovanja danas je nesumnjivo statistika. Bez te su discipline današnja znanost i cjelokupan ljudski život praktički nezamislivi. Prikupljanje podataka, njihova obrada i analiza, te izvo enje zaključaka na temelju tih postupaka provode se u tolikoj mjeri da su razvojem moderne informatičke tehnologije usporedno razvijeni i ''specijalizirani'' računalni programi namijenjeni potrebama statističke analize i statistike općenito. S druge strane, zbog svojega raširenoga područja primjene, statistika je vrlo često potpuno neopravdano i neutemeljeno bila meta različitih kritika koje su je nastojale obezvrijediti, prikazati njezina područja i metode kao ''nešto zanimljivo samo statističarima'', a statističare kao neshvaćene asocijalne čudake koji, umjesto druženja s tzv. normalnim ljudima i uživanja u svim ljepotama i čarima ovozemaljskoga života, radije odabiru uživanje u hrpama i tonama podataka, tablicama, grafovima i sličnim statističkim objektima. Još od samoga početka svojega bavljenja statistikom u studentskim danima nastojao sam tu matematičku disciplinu promatrati sa stajališta da je riječ o disciplini ništa manje vrijednoj i ništa manje važnoj od algebre, analize, geometrije i inih matematičkih disciplina. Kasnije, kao predavač statističkih kolegija na različitim visokim školama, s više ili manje uspjeha nastojao sam približiti statistiku studentima i ukazati im na svu pogrešnost uobičajenih zabluda o statistici. Kao rezultat takvoga pristupa razvile su se sljedeće temeljne postavke koje se provlače kroz ova skripta: 1.) Statistika je sastavni dio matematike, unatoč činjenicama da je znatan dio stručnjaka uporno pokušava ubrojiti u sastavnice ekonomske znanosti. Iako se statistika ponajviše primjenjuje u ekonomiji, pa se na ekonomskim fakultetima zbog toga izučava kao posebno područje, temelji statistike i statističkoga načina mišljenja su isključivo matematički. 2.) Nitko ne može zamijeniti istraživača prigodom interpretacije rezultata statističke analize. Računala i ''specijalizirani'' računalni programi mogu vrlo brzo i točno izračunati sve željene statističke pokazatelje, ali ne mogu dati njihovu univerzalnu interpretaciju jer ona ovisi o svakom pojedinom razmatranom slučaju. Statističar mora znati uz koje se temeljne pretpostavke izračunavaju pojedine statistički pokazatelji i provjeriti vrijede li te pretpostavke u slučaju koji razmatra. Ukoliko ne vrijede, dobiveni statistički pokazatelj bit će točno izračunat, ali neće biti reprezentativan, tj. neće dovoljno dobro opisivati podatke iz kojih je izračunat. 3.) Ne postoje univerzalni statistički pokazatelji koji bi dovoljno reprezentativno opisivali bilo koji statistički niz podataka. Ova zabluda naročito se odnosi na aritmetičku sredinu (popularni ''prosjek'') koju se, zbog jednostavnosti njezina izračuna, uporno nastoji ''progurati'' © mr.sc. Bojan Kovačić, predavač 5

Ispravan pristup ovoj problematici je tipičan pristup problemima matematičkoga modeliranja: klasificirati statističke probleme u tzv. ali uz uvažavanje svih gore navedenih postavki. kao takvo. No. U prva dva poglavlja obra eni su osnovni statistički pojmovi definirani s matematičkoga stajališta. većina će statističara proglasiti upravo ''osnovama osnovnih osnova'' statistike. Pojednostavljivanje ovdje uzrokuje nereprezentativnost dobivenoga statističkoga pokazatelja. Stoga se na samom početku pisanja ovih skripta pojavio sljedeći problem: kako na dovoljno jednostavan i razumljiv način. napisati tekst koji će istodobno biti i podloga za predavanja i nastavni materijal prema kojemu će studenti moći pripremati ispit iz poslovne statistike? Navedeni je problem razlog što je ovaj tekst nastajao tijekom mojih svakogodišnjih predavanja statistike u gotovo svim godinama 21. U trećem se poglavlju obra uju u praksi najčešće korištene srednje vrijednosti i mjere raspršenosti (disperzije) uz poseban naglasak na reprezentativnost svake pojedine srednje vrijednosti. ali takav je slučaj s apsolutnom većinom matematičkih problema. Posebna se pozornost posvećuje statističkim tablicama i grafikonima. ali i neekonomskih studija poput fizioterapije. U tom su smislu i svi studenti – slušači statističkih kolegija koje sam predavao koautori ovih skripta jer su mi njihova pitanja. predavač 6 . kao i njihovim interpretacijama. Kao dio osnovnoga teksta u svim je poglavljima naveden relativno velik broj detaljno riješenih primjera od kojih je veći dio riješen ''klasično'' (bez korištenja bilo kojega od © mr. pri čemu se temeljne postavke i ideje uglavnom izlažu na problemima u kojima se razmatraju točno dvije varijable. ova bi se skripta mogla zvati i Osnove statistike. Naime.. naime. Konceptualno je skripta podijeljena u pet poglavlja. Stoga skripta mogu koristiti svi studenti stručnih studija ekonomije. Iako u nazivu skripta stoji Poslovna statistika. upravnoga prava itd. konstruktivne kritike i komentari pomogli uvidjeti na koje dijelove gradiva treba posebno obratiti pozornost i dodatno ih pojasniti jer nisu sami po sebi dovoljno razumljivi. odgovorno tvrdim da bilo koja skripta može biti nastavni materijal prema kojemu će studenti moći pripremati ispit ako i samo ako je skripta bila efektivno korištena u nastavi tijekom najmanje 5 godina. posljednjem poglavlju izlažu se osnove analize vremenskih nizova i opisuju neke posebne vrste skupnih indeksa. te svi koji u svojim poslovima primjenjuju ma koji dio izloženoga gradiva. Bojan Kovačić. upravo te ''osnove osnovnih osnova'' danas tvore područje koje se najčešće primjenjuje u različitim poslovnim analizama i. što u svojim kritikama često iskorištavaju protivnici statistike. Četvrto je poglavlje posvećeno osnovama korelacijske i regresijske analize. sasvim je primjereno studentima stručnih studija. stoljeća.sc. U petom. Gradivo koje je u njoj izloženo. klase dovoljno me usobno ''sličnih'' problema koji se mogu riješiti uz iste polazne pretpostavke i istu.ELEKTROTEHNIČKI ODJEL Poslovna statistika kao univerzalni statistički pokazatelj prikladan za opis bilo kojega statističkoga niza. te osnovne faze statističkoga istraživanja. Spomenuta klasifikacija nije nimalo jednostavna i predstavlja problem o kojemu se raspravlja i dan-danas. zadovoljavajuću reprezentativnost dobivenih rezultata.

U Zagrebu. Bojan Kovačić © mr. odnosno kvalitetu skripta.ELEKTROTEHNIČKI ODJEL Poslovna statistika ''specijaliziranih'' računalnih programa). predavač 7 . a gdje god je to bilo primjereno. Bojan Kovačić. To se ponajprije odnosi na već spomenute studente koji su svojim pitanjima.sc. a zainteresirani ih čitatelj može pronaći u literaturi [1]. komentirana je i reprezentativnost konkretnoga pokazatelja. U tom smislu unaprijed zahvaljujem i svima onima koji budu pročitali skripta i ukazali na neku nenamjerno napravljenu tiskarsku pogrešku. Uz gotovo sve izračunate statističke pokazatelje navedena je njihova interpretacija. primjedbu ili prijedlog za poboljšanje osnovnoga teksta. početkom svibnja 2011. tehnike rješavanja statističkih problema u MS Excelu ovdje se ne opisuju zasebno. Ugodna mi je dužnost da se na kraju ovoga predgovora iskreno zahvalim svima koji su na bilo koji način pomogli u nastajanju ovih skripta. te dali konstruktivnu kritiku. a manji dio uz korištenje MS Excela. Budući da je riječ o nastavnom materijalu namijenjenom za predavanja. konstruktivnim kritikama i komentarima utjecali na završnu verziju.

U tim se istraživanjima skup svih promatranih objekata 1 Mnogobrojni slikovitiji komentari studenata koji su više-manje uspješno polagali statističke kolegije iz ćudorednih razloga ovdje nisu navedeni. REKLI SU O STATISTICI1… ''Statistika je poput bikinija: otkriva ono sugestivno. odabiru. prokleta laž i statistika. Da bi se ostvarili svi prethodno navedeni zadaci i ciljevi. Opisna i inferencijalna statistika Kao zasebna znanstvena disciplina. grupiranju.2. zdravstvu.'' (Vladimir Bulatović Vib) ''Ja jedem kupus. 1.1. obrazovanju. Opisna (deskriptivna) statistika temelji se na konkretnim rezultatima dobivenima nekim istraživanjima ili mjerenjima.'' (Aaron Levenstein) ''Kad bi netko stao jednom nogom u kipuću vodu. matematičke statistike. te interpretiranju rezultata provedene analize u svrhu ostvaraja postavljenih istraživačkih ciljeva.sc. Bojan Kovačić. statistika je razvila svoje vlastite metode i tehnike.'' (Anonimus) 1.'' (Walter Heller) ''Postoje tri vrste laži: laž. UVOD U STATISTIKU 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika 0. ona slika. © mr. a drugom nogom u hladnjak.'' (Mark Twain) ''Statistika je bajka razuma. sportu.'' (Martin Kessel) ''Statistika je skup točnih podataka koji daje pogrešan rezultat. znanosti itd. predavač 8 . Potonji se često smatra dijelom tzv. prezentaciji i analizi podataka. politici. Pojam statistike Statistika je znanstvena disciplina koja na organiziran način pristupa prikupljanju. statističar bi rekao da se taj čovjek nalazi u prosječno ugodnoj temperaturi. kulturi. ti jedeš meso – u prosjeku jedemo sarmu. statistika se grubo može podijeliti na dva posebna dijela: opisnu (deskriptivnu) i inferencijalnu statistiku. a skriva ono vitalno.'' (Anonimus) ''Statistika naša dika: štogod hoćeš. One se danas primjenjuju u vrlo različitim područjima: ekonomiji.

poslovni subjekti. o besmrtnosti komarca malaričara.) koji imaju barem jedno zajedničko svojstvo (obilježje ili varijabla2) koje od elementa do elementa očituje statističku promjenjivost. te uvid u njihovu me usobnu povezanost. daljnju analizu i primjenu. statistički skup i obilježja elemenata statističkog skupa Statistička analiza bilo koje prirodne ili društvene pojave ili procesa nužno se temelji na statističkim informacijama. Rezultati se dobivaju ispitivanjem odre enoga dijela (uzorka) promatranih objekata. Koristeći metodu "od pojedinačnoga ka općemu" (tzv. Statistička analiza. razumljiviji i pogodniji za interpretaciju.sc.ELEKTROTEHNIČKI ODJEL Poslovna statistika obuhvaća u cijelosti. a zamišljeni statistički skupovi sastoje se od elemenata generiranima različitim modelima 2 U opisnoj se statistici izraz varijabla obično poistovjećuje s izrazima obilježje i svojstvo. induktivna metoda) izvode se zaključci o karakteristikama (obilježjima) svih promatranih objekata. statističke skupove (kao i sve druge skupove) dijelimo na konačne i beskonačne. tj. Inferencijalna statistika temelji se na djelomičnu obuhvatu skupa svih promatranih objekata. nego nepostojanje u realnom svijetu. uostalom. Zadaća opisne statistike je "opisati'' dobivene rezultate. predavač 9 . srediti ih i sažeti tako da budu što pregledniji. i skup u matematici). Stvarni statistički skupovi sastoje se od elemenata koji postoje u tekućem vremenu i prostoru. naziva kardinalni broj skupa. 3 U teoriji skupova taj se broj. Tvore ga statističke jedinice ili elementi (osobe. © mr. Statistički skup je osnovni pojam u statistici (kao. 1. U ovom ćemo se kolegiju baviti opisnom statistikom jer se taj dio statistike praktično najviše primijenjuje u različitim poslovnim sustavima. Bojan Kovačić. Rizik i nesigurnost u primjeni rezultata dobivenih istraživanjem na temelju uzorka procjenjuje se na temelju načela teorije vjerojatnosti. Pri izvedbi takvih zaključaka postoji odre eni rizik pogrešno izvedenih zaključaka. a prema vrsti elemenata na stvarne (realne) i zamišljene4 (hipotetične). Statističkom analizom dobiva se uvid u strukturu pojava ili procesa u vremenu i prostoru. procesima itd.3 Prema opsegu. dok se termin opseg više koristi u geometrijskim razmatranjima. regije. metodama i tehnikama. dok se u matematičkoj statistici odnosi isključivo na numerička obilježja. države. Predmet statističke analize različita su kvalitativna i kvantitativna obilježja promatranih pojava ili procesa vezanih za promatrani skup objekata.3. inače. Ukupan broj elemenata statističkoga skupa naziva se opseg statističkoga skupa. predmeti itd. 4 Pritom izraz zamišljen ne znači stanje statističkoga skupa u kojemu svi njegovi elementi promišljaju npr.

7 Pri prostornom definiranju skupa obično se navodi i npr. Bojan Kovačić. iako u pravilu ne treba pretjerivati s prostornim definiranjem. država: Republika Hrvatska. © mr. naziv radne organizacije. Poput statističkoga. Skup svih takvih podataka naziva se osnovni skup ili populacija5. U opisnoj se statistici nerijetko pojmovi statističkoga skupa. te stvaran ili zamišljen. godine stručnoga studija računovodstva i financija prostorna definicija: Visoka škola za financijski menadžment u Špičkovini7 vremenska definicija: 01. osnovnoga skupa i uzorka poistovjećuju jer se statistička analiza provodi na isti način neovisno o kojem od tih triju tipova skupa je riječ.2010. pod terminom uzorak podrazumijevamo i neki dio elemenata statističkoga skupa i odgovarajuće podatke o tim elementima. godine stručnoga studija računovodstva i financija Visoke škole za financijski menadžment u Špičkovini na dan 01. reći: Visoka škola za financijski menadžment u Špičkovini.03. Statistički skup mora biti definiran pojmovno. Nasuprot tome. radi o radnicima na crno u gradu Ouagadougou). predavač 10 . Bilo koji neprazan podskup6 statističkoga skupa i osnovnoga skupa naziva se uzorak.sc. Poslovna statistika se u pravilu bavi realnim konačnim statističkim skupovima. krokodila itd. Pojmovna definicija utvr uje pripadnost bilo kojega objekta navedenom skupu. prazan skup (skup koji nema niti jednoga jedinoga elementa). planet: Zemlja. pa npr. Tako er. Statistički skup nužno mora biti precizno definiran kako bi se na temelju njegove definicije moglo jasno i jednoznačno odrediti pripada li neki element tome skupu ili ne. nerijetko ipak treba istaknuti neke dodatne prostorne pokazatelje (naročito ukoliko se npr. Primjer 1. a vremenska definicija utv uje vremensko razdoblje ili vremenski trenutak za koji su vezani svi elementi statističkoga skupa. prostorno i vremenski: • • • pojmovna definicija: studenti 1. Već je istaknuto da statistički skup tvore elementi koji imaju barem jedno zajedničko svojstvo. i osnovni skup može biti konačan ili beskonačan. prostorna definicija utvr uje prostor kojemu pripadaju svi elementi statističkoga skupa.2010. 5 Izraz populacija obično se rabi isključivo u kontekstu vezanom za odre eni skup živih bića (populacija ljudi. galaksija: Milječna staza. Promatra se statistički skup koji tvore svi studenti 1. iako bi možda prirodnije pripadali pojmovnoj definiciji. visokoobrazovne ustanove itd. čudnovatih kljunaša. prostorno i vremenski.ELEKTROTEHNIČKI ODJEL Poslovna statistika procesa ili pokusa.). inferencijalna statistika strogo razdvaja navedene pojmove jer provedba statističke analize ovisi o tome iz kojega se od tih triju skupova uzimaju podaci koji se žele analizirati. Dakle. i prazni uzorci) koriste se isključivo u matematičkoj statistici.03. 6 Iz teorije skupova je poznato da je jedan od podskupova svakoga skupa tzv. prema tome. Stoga za svaki element statističkoga skupa znamo odgovarajući podatak o tome svojstvu. kontinent: Europa. Prazni skupovi (pa. Definirajmo navedeni skup pojmovno.

3. kolovoz. na temelju njega ne možemo izvući istinit zaključak o uspjehu svih studenata na ispitima iz Gospodarske matematike. Nominalne skale dodatno se dijele na atributivne (varijabilitet promatranoga obilježja iskazuje se opisno) i prostorne (varijabilitet promatranoga obilježja iskazuje se zemljopisnim jedinicama). To se poglavito odnosi na obilježja čiji se modaliteti ne iskazuju numeričkim vrijednostima (tzv. Skale obilježja mogu se podijeliti sukladno odre enim metričkim svojstvima. 10 Pritom odmah treba naglasiti da taj uzorak nije reprezentativan. skala modaliteta ''mjesec u godini'' siječanj. veljača. pri čemu s 0 možemo označiti činjenicu da student dosad nije uspio položiti navedeni kolegij. sintagma ljestvica modaliteta (još) nije ušla u svakodnevnu uporabu. Svako obilježje se javlja u više pojavnih oblika (modaliteta). Ti se elementi prigodom definiranja skale mogu navesti proizvoljno odabranim redoslijedom.sc. subota i nedjelja. Nominalna skala zadaje se u obliku skupa čiji su elementi nenumeričke vrijednosti: slovne oznake. me usobno nisu u parovima različite jer ih ima svega 5 različitih: 0. 1. Skup svih modaliteta nekoga obilježja naziva se skala11. četvrtak. skala modaliteta obilježja ''spol'' muški i ženski. svibanj. Primjer osnovnoga skupa vezanoga za promatrani statistički skup jest skup svih zaključnih ocjena iz kolegija Poslovna matematika. 11 Unatoč upornom zagovaranju glazbeno nadarenih statističara. Na temelju toga razlikujemo nominalnu. kategorije itd.ELEKTROTEHNIČKI ODJEL Poslovna statistika Taj skup je zamišljen i konačan. Skale obilježja Kako je istaknuto. Tako je npr. U nekim se slučajevima 8 Skup je zamišljen jer dotična visokoobrazovna ustanova (nažalost) još ne postoji. Jedan od uzoraka toga skupa je npr. predavač 11 . Te ocjene. Stoga osnovni skup tvore ukupno 100 zaključnih ocjena9. lipanj. kvalitativna obilježja). Top 20. Dirichletovo načelo može se pokazati da sigurno postoji barem 20 studenata koji imaju istu zaključnu ocjenu iz Poslovne matematike. 9 © mr. Bojan Kovačić.3. srijeda. tj. Prilikom podjele elemenata statističkoga skupa prema barem jednom obilježju kad god je to moguće treba utvrditi skalu modaliteta. studeni i prosinac itd. listopad. petak. redosljednu (ordinalnu ili rang). 2. srpanj. obilježja (varijable) elemenata statističkog skupa su odgovarajuća svojstva po kojima uspore ujemo te elemente. utorak. tj. intervalnu i omjernu skalu. rujan. Koristeći npr. ožujak. pridjevi. naravno. a njegov opseg iznosi 100 [studenata]8. 4 i 5. travanj. skala modaliteta obilježja ''dan u tjednu'' ponedjeljak. skup svih studenata koji su navedeni kolegij uspjeli položiti sa zaključnom ocjenom izvrstan10.1.

0 + 1.14 Ukoliko elementima statističkoga skupa pridružujemo realne brojeve sukladno intenzitetu promatranoga svojstva. industrijskih proizvoda. 12 © mr. mi znamo da je ocjena 5 bolja od ocjene 2. dobit ćemo intervalnu skalu.. skala stupnjeva stručne spreme. 2. usluga itd. a feministice (i feministi?) operaciju zbrajanja ovakvih brojeva sukladno uobičajenoj aritmetici. pri čemu navedene numeričke oznake služe isključivo kao identifikatori. kolika je temperatura zraka na Zavižanu?''. rang) skala elementima statističkoga skupa pridružuje slovne oznake. opet ne možemo definirati operacije zbrajanja i oduzimanja. a ukoliko je njihov broj vrlo velik. 13 Šovinisti (i šovinistice?) bi vjerojatno vrlo rado definirali operaciju množenja. pa se elementi potom klasificiraju i ure uju sukladno stupnju promatranoga svojstva. onda se može reći da je u Zagrebu za 20°C toplije nego na Zavižanu. u Zagrebu 0°C. Ako je na Zavižanu 20 puta hladnije nego u Zagrebu.sc.ELEKTROTEHNIČKI ODJEL Poslovna statistika nenumeričke oznake zamjenjuju numeričkima12. Npr. Ovo se pravilo praktično zanemaruje prigodom računanja prosječne ocjene. a za 20°C hladnije nego u Splitu. Tipični primjeri su različite nomenklature djelatnosti. 4. a u Splitu 20°C. Bojan Kovačić. Naime. skala stupnjeva zadovoljstva kvalitetom nastave iz kolegija ''Zabavljačke vještine'' itd. Npr. Iako ova skala ima bolja metrička svojstva od nominalne. zamijenimo li nenumerički modalitet muški numeričkim modalitetom 0. s podacima dobivenima mjerenjem na intervalnoj su skali suvislo definirane operacije zbrajanja i oduzimanja15. dogovorno utvr ena nula znači da element statističkoga skupa posjeduje odre eno svojstvo i da je modalitet toga svojstva jednak nuli. Tipični primjeri redosljedne skale su skala ocjena (1. skala se utvr uje dogovorno i u takvim slučajevima govorimo o nomenklaturi. pa ima bolja metrička svojstva od prethodnih dviju skala jer omogućuje i razvrstavanje i rangiranje i brojčano utvr ivanje razlika mjerenoga svojstva. Konkretno. Redosljedna (ordinalna. Ona uvijek ima definiranu mjernu jedinicu i dogovorno utvr enu nulu. 5). onda nema smisla zapisati niti računati npr. ali ne možemo npr. 0 ⋅ 1 itd. reći da je ocjena 5 za 3 bolja od ocjene 2. o čemu će biti govora u posebnom poglavlju. Poredak modaliteta ovdje nije proizvoljan: modalitete obično navodimo od onoga koji označava najmanji stupanj svojstva do onoga koji označava najveći stupanj svojstva ili obrnuto. 3. Tako er. 14 Tj.13 Istaknimo da nominalna skala ponajprije služi za razvrstavanje (kategorizaciju) elemenata osnovnoga skupa u kategorije. predavač 12 . a nenumerički modalitet ženski modalitetom 1. pa tako jednake razlike brojeva na skali govore o jednakoj razlici mjerenih svojstava. ako je temperatura zraka na Zavižanu -20°C. pa s njima nema smisla provoditi nikakve računske operacije. 15 Množenje i dijeljenje se ne definiraju zbog problema tipa: ''Temperatura zraka u Zagrebu je 0°C. osnovni nedostatak joj je nemogućnost preciznoga utvr ivanja razlika mjerenoga svojstva: npr. Takva je ''zamjena'' zapravo bijekcija sa skale nenumeričkih modaliteta u jednakobrojnu skalu numeričkih modaliteta: svaki nenumerički modalitet zamjenjuje se točno jednim numeričkim modalitetom i nikoja dva nenumerička modaliteta nisu zamijenjena istim numeričkim modalitetom. simbole ili brojeve prema intenzitetu mjerenoga svojstva.

na skali sati u danu je 1 –24 8 = 17 jer je. ako Vlatka na svojem deviznom računu ima 0. 16 © mr. 31. 17 Zbrajanje modulo n (oznaka: +n) je binarna operacija definirana formulom: a +n b := (a + b) mod n = ostatak pri dijeljenju zbroja a + b (dobivenoga uobičajenim zbrajanjem cijelih brojeva) brojem n. Oduzimanje modulo n (oznaka: –n) je binarna operacija na skali modaliteta definirana opisno s: a –n b = broj c takav da je b +n c = a.000. nedjelja}. odnosno za 90.sc.000.00 kn više od Blaženka. 17 +24 8 = 1. stoljeća itd. počevši od razdoblja koje je nastupilo najranije i završavajući s razdobljem koje je nastupilo najkasnije. kako smo vidjeli. subota. 2005. petak. na skali sati u danu je 17 +24 8 = ostatak pri dijeljenju broja 17 + 8 s 24 = ostatak pri dijeljenju broja 25 s 12 = 1. skala dana u tjednu.00 €.ELEKTROTEHNIČKI ODJEL Poslovna statistika činjenica da je temperatura zraka u Zagrebu 0°C znači da zrak u Zagrebu ima svoju temperaturu i da je ta temperatura jednaka 0°C. skala minuta u pojedinom satu. a. tj. desetljeća. a Draženko 100. Ona se dobije tako da se elementima statističkoga skupa pridruže realni brojevi sukladno intenzitetu mjerenoga svojstva.000. 2007. 60}. skala godina. omjerna skala. četvrtak.16 Skala s najboljim metričkim svojstvima je tzv. 2003. Npr. pri čemu je obično n ∈ {7. osim definirane mjerne jedinice. Bojan Kovačić.00 kn. Modaliteti kronološke skale mogu se iskazivati nazivima (npr. skala godina u prvom desetljeću ovoga tisućljeća {2001. Na tako formiranoj skali ima smisla definirati operacije zbrajanja i oduzimanja. Zbog toga se na takvoj skali mogu definirati sve četiri osnovne računske operacije jer razlike i omjeri vrijednosti imaju suvislo tumačenje. srijeda. 28.) ili brojevima (npr. 12.00 kn. predavač 13 . 2010} itd. pri čemu se u nekim slučajevima uobičajene operacije zbrajanja i oduzimanja realnih brojeva zamijenjuju operacijama zbrajanja i oduzimanja modulo n17. 2008. znači da je njezin devizni račun potpuno prazan. 2004. da na njemu (do daljnjega) nema novaca. Tipični primjeri kronoloških skala su: skala dana u tjednu {ponedjeljak. tj. ako Blaženko na tekućem računu ima 10. Nadalje. skala sati u danu. 29. 2006. Npr. Poseban tip skale obilježja je kronološka skala. 2002. onda Draženko na svojem tekućem računu ima 10 puta više novaca. Ona obično sadrži vremenska razdoblja poredana kronološki. skala mjeseci u godini itd. ima i nulu koja označava nepostojanje svojstva. skala datuma u pojedinom mjesecu. Npr. Tipičan primjer takvoga skupa je točka u bilo kojem euklidskom prostoru. utorak. 24. 2009. 30.). Matematički nadareni statističari odmah će se sjetiti da se na isti način u matematici definiraju skupovi površine nula: to su skupovi koji imaju površinu i ta površina je jednaka 0.

''Tena''. veljača 2008. tip osobnoga automobila. kvantitativna i vremenska obilježja.) sa skalom {redovni. boja kose. Primjer alternativnoga statističkoga obilježja: Razdioba svih studenata Visoke škole za financijski menadžment u Špičkovini koji su položili kolegij Poslovna matematika putem kolokvija u akademskoj godini 2007/2008. Vrste obilježja Sukladno navedenoj podjeli skala. Nominalna obilježja vezana su uz nominalnu skalu izražavanja modaliteta promatranoga obilježja. pa odredite njegov opseg. opća podjela obilježja razlikuje kvalitativna. na statističkomu skupu svih ljudi) sa skalom {muški. predavač 14 .03 72. bračno stanje. Kvalitativna obilježja su obilježja kod kojih su svojstva elemenata statističkoga skupa iskazana odre enim pridjevima ili atributima. kategorijama i sl. a dodatno se dijele na atributivna i prostorna (geografska). Novije sociološke analize u priznatim znanstvenim časopisima ''Glorija''.2.03. ''Story'' itd. Tipični primjeri takvih obilježja su: spol. Bojan Kovačić. izvanredni} itd. Atributivna obilježja su obilježja čiji modaliteti iskazuju svojstva elemenata statističkoga skupa. boja očiju.2008. Ova obilježja mogu biti nominalna i redosljedna (obilježja ranga).sc. vrsta trgovačkoga društva. Primjer 2.97 100.00 Izvor: osobna evidencija predmetnoga nastavnika.ELEKTROTEHNIČKI ODJEL Poslovna statistika 1. prema spolu spol muški ženski ukupno broj studenata 10 27 37 struktura [%] 27. ženski}18. Tipični primjeri takvoga obilježja su: spol (npr.3. Atributivno obilježje čija se skala sastoji od točno dva modaliteta nazivamo alternativno obilježje. horoskopski znak. a) Definirajte statistički skup u gornjem primjeru pojmovno. politička stranka itd. 18 ozbiljno © mr. ugrožavaju ovu tradicionalističko-konzervativnu podjelu svih ljudi prema spolu. način studiranja (npr. Zadatak 1. prostorno i vremenski. na statističkom skupu svih studenata Visoke škole za financijski menadžment u Bedekovčini na dan 01. b) Odredite osnovni skup i njegov opseg.

a dodatno se dijele na diskretna (diskontinuirana) i kontinuirana.ELEKTROTEHNIČKI ODJEL Poslovna statistika Prostorno (geografsko) obilježje je nominalno obilježje čiji modaliteti odražavaju vezu elemenata statističkoga skupa s odre enim prostorom.09. stupanj akademskoga obrazovanja.2007. Primjeri takvoga obilježja su: mjesto ro enja. prebivalište.83 ukupno: 100. Primjer redosljednoga statističkoga obilježja: Razdioba svih studenata Visoke poslovne škole ''Mutimir Škegro'' iz Špičkovine u akademskoj godini 2006/07.56 vrlo zadovoljan 11 6. Podsjetnik za nematematički nastrojene statističare: apsolutna vrijednost bilo kojega realnoga broja x  x. boravište. stupanj zadovoljstva kvalitetom nastave itd.77 zadovoljan 17 10. apsolutna vrijednost19 njihove razlike. definirana je formulom | x | =  − x.88 uglavnom nezadovoljan 21 13. Razmak izme u dvaju modaliteta je.32 nezadovoljan 32 19. za x ≥ 0.60 uglavnom zadovoljan 27 16. Redosljedna obilježja ili obilježja ranga vezana su uz ordinalnu skalu iskazivanja modaliteta. 19 © mr. iznos ukupnih mjesečnih primanja itd. zapravo. Bojan Kovačić. predavač 15 . stručna kvalifikacija. Kvantitativna obilježja često se nazivaju i numerička obilježja. sjedište tvrtke. Diskretno (diskontinuirano) obilježje je obilježje čija je skala modaliteta konačan skup (općenito. državljanstvo. država ili ekonomska unija država s kojom se vrši odre ena trgovinska razmjena itd. za x < 0. broj djece u obitelji. Tipični primjeri obilježja su broj soba u stanu.00 161 Izvor: Studentski zbor VPŠ ''Mutimir Škegro'' Kvantitativna obilježja su obilježja kod kojih se svojstva elemenata statističkoga skupa izražavaju brojevima. realnih) brojeva takav da izme u svakih dvaju modaliteta postoji razmak. a vezana su uz intervalnu i omjernu skalu iskazivanja modaliteta. Tipični primjeri obilježja ranga su ranije spomenuta ocjena. Primjer 3.) stupanj zadovoljstva broj studenata struktura [%] vrlo nezadovoljan 15 9.sc. prema stupnju zadovoljstva radom studentske referade (stanje na dan 30.04 ni zadovoljan ni nezadovoljan 38 23.

ELEKTROTEHNIČKI ODJEL
Poslovna statistika Pritom modalitet diskretnoga obilježja ne mora biti nužno cjelobrojan. Postoje i četveroipolsobni stanovi, iznos mjesečnih primanja može biti necjelobrojan, veličina obuće može biti 48 i pol, ali neovisno o tome izme u bilo kojih dvaju različitih modaliteta uvijek postoji spomenuti razmak. Primjer 4. Primjer kvantitativnoga diskretnoga obilježja: Razdioba svih zaposlenika u tvrtki ''Brodolomac d.d.'' iz Muća prema broju djece (stanje na dan 31.12.2007.) broj djece broj zaposlenih struktura [%] 0 175 15.31 1 244 21.35 2 438 38.32 3 194 16.97 4 i više 92 8.05 ukupno 1.143 100.00
Izvor: Služba ljudskih potencijala tvrtke ''Brodolomac''

Kontinuirano obilježje je obilježje čija je skala modaliteta (teoretski) beskonačan skup. Ta je skala najčešće poluotvoreni interval 〈a, b]20 ili konačna unija takvih poluotvorenih intervala. Praktično, to znači da modalitet obilježja može biti bilo koja vrijednost unutar nekoga od intervala koji tvore omjernu skalu. Tipični primjeri ovoga obilježja su visina, masa itd. Primjer 5. Primjer kvantitativnoga kontinuiranoga obilježja: Razdioba svih učenika 4.b razreda gimnazije ''Ljilja Kokić'' iz Kašine u šk.god. 2007/2008. prema visini (stanje na dan 01.03.2008.)
visina [cm] broj učenika struktura [%] (160) – 165 3 11.11 165 – 170 6 22.22 170 – 175 7 25.93 175 – 180 4 14.81 180 – 185 5 18.52 185 – (195) 2 7.41 ukupno: 27 100.00
Izvor: osobna evidencija učitelja tjelesne i zdravstvene kulture Jože Kotrmelca

20

Podsjetnik za nematematički nastrojene statističare: 〈a, b] je skup svih realnih brojeva koji su strogo veći od

realnoga broja a, a manji ili jednaki realnom broju b, tj. 〈a, b] = {x ∈ R: a < x ≤ b}.

© mr.sc. Bojan Kovačić, predavač

16

ELEKTROTEHNIČKI ODJEL
Poslovna statistika Zadatak 2. a) Definirajte statističke skupove u Primjerima 3. – 5. pojmovno, prostorno i vremenski, pa odredite njihove opsege. b) Odredite osnovne skupove u Primjerima 3. – 5. i njihove opsege. c) Odredite skale modaliteta obilježja promatranih u Primjerima 3. – 5. Pri razlikovanju diskretna i kontinuirana obilježja u nekim je slučajevima vrlo važno precizno definirati promatrano kvantitativno obilježje. Npr. "starost (čovjeka, drveta, zgrade)" je kvantitativno kontinuirano obilježje, no, ukoliko to obilježje predefiniramo kao "navršene godine starosti", ono postaje kvantitativno diskretno obilježje (zašto?). Poseban tip obilježja je vremensko obilježje. To je obilježje vezano uz kronološku skalu modaliteta, odnosno odgovarajući kronološki ure aj. Sukladno njemu grupiramo elemente osnovnoga skupa i dobivamo vremenski statistički niz. Vremenski niz može biti intervalan i trenutačan ovisno o tome jesu li podaci iz osnovnoga skupa dobiveni neprekidnim praćenjem i kumuliranjem promatrane pojave u odabranom vremenskom intervalu ili pak odre ivanjem stanja pojave u odabranim vremenskim trenutcima. Primjer 6. Primjer intervalnoga vremenskoga niza: Razdioba ostvarenoga prometa u trgovini na malo u Kraljevini Dajdamdaš u razdoblju od 2002.-2006. prema godini
ostvareni promet [000 000 USD] 2002. 9.45575824 2003. 11.79383472 2004. 18.51123944 2005. 25.55631827 2006. 30.10276687 Izvor: Statistički ljetopis Kraljevine Dajdamdaš za 2007. godinu godina

Primjer 7. Primjer trenutačnoga vremenskoga niza Razdioba svih studenti koji su položili ispit iz Poslovne statistike na Veleučilištu u Brlog Gradu na ispitnim rokovima u razdoblju od 01.09.2007. do 01.03.2008. prema datumu polaganja ispita datum 01.09.2007. 20.09.2007. 04.10.2007. 12.02.2008. 29.02.2008. © mr.sc. Bojan Kovačić, predavač 17 broj studenata 2 1 26 0 1

Izvor: Studentska služba Veleučilišta u Brlog Gradu

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

2. FAZE STATISTIČKOGA ISTRAŽIVANJA
Statističko istraživanje općenito možemo podijeliti na sljedeće faze: 1. 2. 3. 4. 5. Odre ivanje cilja i razrada plana istraživanja; Organizirano prikupljanje statističkih podataka; Grupiranje i sre ivanje statističkih podataka; Tablični i grafički prikaz statističkih sre enih podataka; Statistička analiza i interpretacija njezinih rezultata.

U ovom ćemo se kolegiju detaljno baviti fazama 3., 4. i 5., pa ćemo prve dvije faze ovdje spomenuti samo okvirno.

2.1. Odre ivanje cilja i razrada plana istraživanja
Iako se vrlo često neopravdano zanemaruje, ova je faza zapravo jedna od najvažnijih faza cjelokupnoga statističkog istraživanja. Naime, prije negoli se krene na prikupljanje podataka, svakako treba jasno i precizno definirati što se želi postići statističkim istraživanjem jer već dobro definiran cilj istraživanja može nametnuti prirodan izbor pogodnih metoda za prikupljanje podataka. Ukoliko cilj istraživanja i plan istraživanja nisu dovoljno precizno definirani, moguće je uzalud prikupiti veliki broj podataka koje potom nije moguće dostatno kvalitetno podvrgnuti statističkoj analizi i interpretaciji. Druga velika prednost preciznoga definiranja cilja i plana istraživanja je što znatno pojednostavljuje i skraćuje cjelokupni postupak. Npr. pretpostavimo da želimo ispitati zainteresiranost hrvatskih umirovljenika za aktivno sudjelovanje u tečaju osnova rada na osobnim računalima. Iako npr. odlazak u Hrvatsku stranku umirovljenika i razgovor s njezinim čelnicima može dati korisne podatke o cilju našega istraživanja, ta relativno jeftina i kratkotrajna metoda nije dobra za postizanje željenoga cilja21 jer stav čelnika stranke ne mora održavati stav relativne većine hrvatskih umirovljenika. Teorijski najbolja metoda je postaviti odgovarajuće anketno pitanje svakom pojedinom umirovljeniku, ali ta je metoda npr. zbog

21

Navedena metoda, me utim, može biti vrlo korisna za postavljanje hipoteze istraživanja. Hipoteza je temeljna neprovjerena pretpostavka koju nastojimo potvrditi ili oboriti statističkim istraživanjem. U navedenom bi primjeru (nakon obavljenih razgovora u HSU) postavljena hipoteza mogla glasiti: ''Većina hrvatskih umirovljenika je zainteresirana za sudjelovanje u tečajevima osnova rada na osobnim računalima.''

© mr.sc. Bojan Kovačić, predavač

18

ELEKTROTEHNIČKI ODJEL
Poslovna statistika svoje dugotrajnosti22 uzrokovane znatnim brojem hrvatskih umirovljenika praktički potpuno neprimjerena. Praktično najpogodnija metoda je izabrati dovoljno reprezentativan uzorak23 i (npr. telefonski) anketirati sve članove toga uzorka. Metodama izbora uzoraka i procjenjivanja njihove reprezentativnosti bavi se posebna statistička disciplina teorija uzoraka. Detalje ovdje izostavljamo.

2.2. Organizirano prikupljanje statističkih podataka
Statistički podaci obično se prikupljaju: a) b) c) d) brojanjem (npr. iznos mjesečne plaće svakoga od djelatnika tvtke ''Drp–commerce'') mjerenjem (npr. masa svake od natjecateljica za Miss Mliječne staze) ocjenjivanjem (npr. stupanj zadovoljstva kvalitetom nastave iz Poslovne statistike); evidentiranjem (npr. zaključne ocjene iz Poslovne statistike svih studenata Visoke škole za financijski menadžment u Bedekovčini koji su položili taj kolegij u prošloj akademskoj godini); e) anketiranjem (intervjuiranjem) (npr. politička stranka za koju na predstojećim mjesnim izborima namjerava glasovati svaki stanovnik Muća)

Rezultat organiziranoga prikupljanja statističkih podataka su tzv. ''sirovi'' (negrupirani, neobra eni) podaci. Iz njih se najjasnije vidi koji je element osnovnoga skupa pridružen svakom pojedinom elementu statističkoga skupa. Uočimo da obrnuta tvrdnja nije točna jer bez grupiranja i sre ivanja podataka općenito ne možemo ''očitati'' kojim je sve elementima statističkoga skupa pridružen svaki element osnovnoga skupa. Najpoznatija, a možda i najprimjenjivanija metoda organiziranoga prikupljanja statističkih podataka je anketiranje. Anketa predstavlja skup različitih postupaka kojima se pobu uju, prikupljaju i analiziraju izjave anonimnih ljudi24 kako bi se dobili podaci o njihovu ponašanju, stavu prema odre enom problemu, mišljenju, interesima, preferencijama itd. Ti se podaci dobivaju na temelju anketnih upitnika koji sadrže promišljeno odabrana pitanja koja trebaju

22

Drugi prirodan razlog je cijena praktične provedbe takve metode koja nerijetko predstavlja ozbiljnu prepreku za kvalitetnu provedbu statističkoga istraživanja. 23 Vrlo česta pogreška statističkih istraživanja upravo je ''megalomanija'' odgovarajućih planova istraživanja jer se istraživanje planira obaviti na prevelikom uzorku. 24 Psihološka istraživanja pokazuju da je uvjet anonimnosti sudionika ankete iznimno važan jer čak može utjecati na iskrenost u davanju odgovora na anketna pitanja, a time i na realnost rezultata provedene ankete.

© mr.sc. Bojan Kovačić, predavač

19

ELEKTROTEHNIČKI ODJEL
Poslovna statistika biti jednostavna, jasna i nesugestivna. Ta se pitanja mogu postaviti pismeno i usmeno. Usmeno postavljanje anketnih pitanja obično se naziva intervjuiranje25. U nastavku navodimo primjer prvoga dobro strukturirane ankete za procjenu nastavnika i kolegija koja se sukladno načelima Bolonjskoga procesa provodi na svim znanstvenonastavnim sastavnicama Sveučilišta u Zagrebu. Jedini možebitni nedostatak navedene ankete je pretpostavka da svaki pojedini anketirani student poznaje temeljni postotni račun od sto, što u praksi ne mora biti slučaj.

25

Moderna praksa nerijetko pokazuje da se postavljanje pitanja (unaprijed) u pismenoj formi i prepisivanje njihovih odgovora tako er naziva intervju, napose ukoliko je riječ o medijski poznatim osobama (npr. predsjednici država, premijeri vlada itd.). Sa statističkoga je stanovišta takvo izjednačavanje potpuno pogrešno.

© mr.sc. Bojan Kovačić, predavač

20

gdje je f funkcija iz Bilješke 28. za svaki pojedini modalitet utvrditi (prebrojati) kolikom broju elemenata statističkoga skupa je pridružen dotični modalitet. iscrpnost: svaki element statističkoga skupa mora biti obuhvaćen grupiranjem podataka. tj. Osnovna ideja grupiranja je podijeliti statistički skup na podskupove prema svim modalitetima koji tvore skalu obilježja. za svaki modalitet y ∈ M ima smisla definirati skup f ←(y) = {x ∈ S: f(x) = y}. Dakle. 29 Aritmetika kardinalnih brojeva iz teorije skupova osigurava da navedeno svojstvo ne ovisi o tipu statističkoga skupa (konačan ili beskonačan). općenito je bolje i preciznije u definiciji rabiti pojam osnovnoga skupa. grupiranjem podataka za svaki pojedini modalitet utvr ujemo kolikom je broju elemenata statističkoga skupa pridružen taj modalitet.ELEKTROTEHNIČKI ODJEL Poslovna statistika 2. Iako je relativna Izuzetak su slučajevi kad osnovni skup sadrži relativno malo (obično ≤ 30) podataka. Dobiveni broj obično se naziva apsolutna frekvencija (učestalost). Budući da je svakom elementu statističkoga skupa nužno pridružen točno jedan modalitet. Relativna frekvencija modaliteta jednaka je količniku odgovarajuće apsolutne frekvencije toga modaliteta i opsega statističkoga skupa. Takav se račun provodi jer želimo vidjeti kolikom dijelu statističkoga skupa je pridružen odre eni modalitet. No. zbroj apsolutnih frekvencija svih modaliteta mora biti jednak opsegu statističkoga skupa29.sc. predavač 21 . Grupiranje statističkih podataka Nakon što su prikupljanjem (i odgovarajućim unosom) dobiveni ''sirovi'' statistički podatci. Navedeni skup se naziva praslika modaliteta y. neovisno o tome je li statistički skup konačan ili beskonačan. zbroj apsolutnih frekvencija svih modaliteta uvijek je jednak opsegu statističkoga skupa. Bojan Kovačić. Grupiranje kvalitativnih podataka Kako je već istaknuto. apsolutna frekvencija nekoga modaliteta jednaka je ukupnom broju pojavljivanja toga modaliteta u osnovnom skupu28. Stoga strogo formalno možemo reći da je grupiranje podataka particija statističkoga skupa na me usobno disjunktne praslike pojedinih modaliteta. Pritom treba poštovati dva osnovna načela: isključivost: svaki element statističkoga skupa ne može istodobno biti u barem dva različita podskupa. Neformalno.27 2. vrlo često ih treba ''srediti'' tako da budu što pregledniji i lakši za daljnju statističku analizu26. U tu se svrhu koristi grupiranje statističkih podataka. 28 Strogo formalno.3. Autori koji poistovjećuju pojmove statistički skup i osnovni skup definiraju apsolutnu frekvenciju kao ukupan broj pojavljivanja nekoga modaliteta u statističkom skupu. apsolutna frekvencija modaliteta y je ukupan broj elemenata skupa f← (y). Budući da je preslikavanje f koje svakom elementu statističkoga skupa S pridružuje točno jedan element skale modaliteta M funkcija.3. 27 26 © mr.1.

izme u ostalih. 1]. predavač 22 . Bojan Kovačić. u odjeljku 1. Istraživanjem potrošnje inozemnih putnika u Kraljevini Eldorado na uzorku od ukupno 30 370 inozemnih putnika u razdoblju od lipnja do prosinca 2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika frekvencija općenito neki nenegativan realan broj iz segmenta [0. odnosno relativnih frekvencija. što znači da je ukupno 25 924 anketirana inozemna putnika anketirano na cestovnim graničnim prijelazima. dobiveni su sljedeći podaci: vrsta prijelaza broj putnika struktura [%] cestovni 25 924 85. relativna frekvencija modaliteta izvrstan jednaka je 20 = 0. 100 Tako možemo zaključiti da iz kolegija Poslovna matematika 20% svih promatranih studenata ima zaključnu ocjenu ''izvrstan''31. Za vježbu objasnite svaku od ostalih apsolutnih.00% Apsolutna frekvencija modaliteta cestovni je 25 924. 31 Strogo formalno govoreći. Proporcija označava odre eni dio jedinične veličine. Primjer 2. što znači da je 85. a to je zapravo decimalan broj izme u 0 i 1. Budući da se obično iskazuju u postotcima ili promilima. godine i odgovarajućim grupiranjem podataka.sc. postotcima ili promilima30.83% pomorski 1 017 3.35% ukupno: 30 370 100. Budući da je opseg promatranoga statističkoga skupa 100. Kod beskonačnih se statističkih skupova relativne frekvencije modaliteta ne odre uju jer aritmetika beskonačnih kardinalnih brojeva ne definira pojam dijeljenja kardinalnih brojeva.36% svih anketiranih inozemnih putnika anketirano na cestovnim graničnim prijelazima. Odgovarajuća relativna frekvencija je 85. Stoga je apsolutna frekvencija modaliteta izvrstan u odgovarajućem osnovnom skupu jednaka 20. Zbog svakodnevnoga govora mi ćemo dozvoljavati i navedenu interpretaciju. Stoga su relativne frekvencije praktično vezane isključivo za realne konačne statističke skupove.36%. odnosno promilni račun od tisuću.2 = 20%. 30 © mr.3. interpretacija bi trebala glasiti: Ukupan broj studenata koji su dobili ocjenu „izvrstan“ iznosi 20% od ukupnoga broja svih studenata. Ukupno 20 studenata (elemenata promatranoga skupa) iz kolegija Poslovna matematika ima zaključnu ocjenu izvrstan. za njihovo je računanje potrebno poznavati postotni račun od sto. radi praktičnih ga je potreba vrlo prikladno izraziti u proporcijama.46% željeznički 2 075 6. Promatramo statistički skup iz Primjera 1. Primjer 1.36% zračni 1 354 4.

Me utim. Sturgesovo35 pravilo: k ≈ 1 + log2N ≈ 1 + 3. razdiobi (distribuciji) frekvencija. Realan broj h = b – a naziva se širina (veličina) razreda i taj je broj praktično uvijek strogo pozitivan (tj.321928091 ⋅ log N ≈ 1 + 1. Bojan Kovačić. +∞〉 ili 〈–∞. u slučaju velikoga broja modaliteta radi preglednosti ih je primjerenije grupirati u tzv. 34 Kasnije ćemo vidjeti da je razredna sredina zapravo aritmetička sredina donje i gornje granice razreda. –0. Zatvoreni razred32 je bilo koji poluzatvoreni podskup skupa realnih brojeva R oblika 〈a. 35 Herbert Sturges. 36 x = najmanji cijeli broj veći ili jednak x. Npr. 33 Za matematički nenastrojene statističare: 〈a. a otvoreni razred je bilo koji otvoreni podskup skupa realnih brojeva R oblika 〈a. američki statističar. Definirajmo ukratko osnovne pojmove. a realan broj b gornja granica (zatvorenoga) razreda. a〉 je skup svih realnih brojeva koji su strogo manji od broja a. U slučaju maloga broja modaliteta grupiranje ovakvih podataka praktično se ne razlikuje od grupiranja kvalitativnih podataka. Širina razreda jednaka je h = b – a = 100 – 50 = 50. 100] jednaka je a = 50. Grupiranje kvantitativnih podataka Ukoliko se podaci koje grupiramo odnose na kvantitativno statističko obilježje. 2 Primjer 3. © mr. b]. Realan broj a nazivamo donja granica (zatvorenoga) razreda. a razredna sredina je broj 1 1 s = (a + b) = (50 + 100) = 75. +∞〉 je skup svih realnih brojeva koji su strogo veći od broja a: 〈a. U većini statističkih istraživanja i izradama odgovarajućih računalnih programa primijenjuje se tzv.3.05 = 0 itd. +∞〉 = {x ∈ R: x > a}.442695 ⋅ ln N. strogo veći od nule). te prešutno pretpostavljati da za realne brojeve a i b vrijedi stroga nejednakost a < b. dok je gornja granica jednaka b = 100. mi ćemo pod pojmom razred podrazumijevati zatvoreni razred.ELEKTROTEHNIČKI ODJEL Poslovna statistika 2. Donja granica razreda 〈50. a〉= {x ∈ R: x < a}. tj.36 32 Radi potreba daljnje statističke analize. predavač 23 .sc. 〈–∞. njihovim grupiranjem dobivamo poseban tip grupiranih statističkih podataka.2. razrede. Istaknimo još 1 da realan broj s = ⋅ (a + b) uobičajeno nazivamo razredna sredina34. Riječ je o tzv. a〉33. 2 2 Ukupan broj (k) razreda u koje trebamo grupirati ukupno N različitih modaliteta kvantitativnoga obilježja općenito nije unaprijed odre en. 3. 〈–∞.14 = 4.

6. izme u dvaju uzastopnih razreda postoji razmak).) gornja granica svakoga pojedinoga razreda.) gornja granica svakoga pojedinoga razreda. pri čemu prešutno pretpostavljamo da je razdioba podataka barem približno simetrična. Naime. O interkvartilu n ćemo nešto više reći kasnije u poglavlju o mjerama raspršenja.ELEKTROTEHNIČKI ODJEL Poslovna statistika Pojedine širine razreda tako er se ne zadaju unaprijed. 2. primjereno je koristiti razrede manjih širina na području u kojemu je ''gustoća'' podataka veća. Bojan Kovačić. Tada izračunamo razliku najvećega i najmanjega modaliteta. pa je dobivene podatke primjereno grupirati u jednake razrede čija je širina 193 − 151 h= = 7. Prvi slučaj praktično primijenjujemo uvijek kad analiziramo modalitete kvantitativnoga kontinuiranoga obilježja kojih teorijski može biti beskonačno mnogo. nije jednaka donjoj granici neposredno sljedećega razreda (tj. računaju 2 ⋅ IQ prema Freedman – Diaconisovoj formuli: h = 3 . a ukupan broj različitih modaliteta je 38. 7. pravih razreda (objašnjenje u nastavku teksta). O tipovima razdiobe podataka bit će više riječi kasnije u poglavlju o mjerama asimetrije. nego općenito ovise o tipu razdiobe podataka37. osim posljednjega. osim posljednjega.213 = 7 razreda. pa tu razliku podijelimo ukupnim brojem razreda i tako dobijemo traženu širinu razreda. 37 © mr. grupiranjem modaliteta kvantitativnoga obilježja u razrede dobivamo točno jedan od sljedećih dvaju slučajeva: 1.sc. Visine učenika su obično približno simetrično raspore ene.. razreda Osnovne škole ''Milivoj Glavović“ iz Brckovljana na dan 29. 6 Uz grupiranje statističkih podataka često se javlja tzv..02. Ovaj se slučaj naročito primijenjuje kod tzv. Ako razdioba podataka nije simetrična. gdje je IQ interkvartil osnovnoga skupa. dobiveno je ukupno 506 podataka. umjesto izvedeno iz Sturgesova pravila. predavač 24 . problem nominalnih razreda.2008. Prema Sturgesovu pravilu podaci se mogu grupirati u ukupno k ≈ 1 + log238 = 6. najveći 193. Granice tako dobivenih razreda nazivamo prave granice i razredi s takvim granicama se najčešće koriste u statistici. Primjer 4. jednaka je donjoj granici neposredno sljedećega razreda. i 8. Mjerenjem visina (i iskazivanjem podataka u centimetrima) svih učenika 5. Najmanji od njih je 151. Ovdje istaknimo jedino da noviji statistički radovi predlažu da se širine razreda. a razrede većih širina na području s manjom ''gustoćom'' podataka. Najjednostavniji i praktično najprimjenjeniji slučaj je grupiranje podataka u razrede jednakih širina.

3. dobivamo: iznos mjesečne plaće [kn] broj zaposlenika 1550 – 1950 2 1950 – 2450 4 2450 – 2950 6 2950 – 3450 2 3450 – 8050 1 2. Objasnit ćemo ih na sljedećem primjeru. Zbog toga izme u gornje granice jednoga razreda i donje granice njemu neposredno sljedećega razreda postoji razmak (obično jednak 1). Najjednostavniji postupak pokazat ćemo na sljedećem primjeru. Budući da je polovina razmaka jednaka 50. Razmaci izme u dvaju uzastopnih razreda su jednaki i iznose 100. Pretpostavimo da smo grupiranjem podataka o iznosu mjesečnih plaća svih zaposlenika knjigovodstvenoga servisa ''Knjiži kod mene'' iz Košara dobili sljedeću tablicu: iznos mjesečne plaće [kn] broj zaposlenika 1600 – 1900 2 2000 – 2400 4 2500 – 2900 6 3000 – 3400 2 3500 – 8000 1 Sve navedene granice su očito nominalne granice. Bojan Kovačić.3. U praksi se najviše koriste dva tipa takvih nizova: kumulativni niz ''manje od'' i kumulativni niz ''veće od''. Kumulativni nizovi frekvencija Ponekad je radi kvalitetnije statističke analize apsolutne i relativne frekvencije potrebno grupirati u konačne nizove. To se poglavito radi ukoliko analiziramo kvalitativno redosljedno obilježje čiji su modaliteti iskazani numeričkim vrijednostima (npr. ocjena na ispitu) ili bilo koje kvantitativno obilježje. Primjer 5. Pretvaranje u prave granice radimo tako da svaku pojedinu donju nominalnu granicu umanjimo za polovinu razmaka. Takve granice nazivaju se nominalne granice. a radi potreba daljnje statističke analize obično ih je potrebno ''pretvoriti'' u prave. a svaku pojedinu gornju nominalnu granicu uvećamo za polovicu razmaka. predavač 25 .ELEKTROTEHNIČKI ODJEL Poslovna statistika Drugi slučaj se obično primijenjuje pri analizi modaliteta kvantitativnoga diskretnoga obilježja kojih je obično konačno mnogo. © mr.sc.

ocjenom 4 ili ocjenom 5. 50 studenata je na ispitu ocijenjeno ocjenom 2. ocjenom 3. a 80 studenata je na ispitu ocijenjeno ocjenom 2.2008. kumulativna apsolutna frekvencija ''manje od'' modaliteta 3 jednaka je 25 (ukupno 10 studenata je ocijenjeno ocjenom strogo manjom od 3. Svi oni su polagali pismeni ispit iz kolegija ''Zabavljačke vještine''.sc. a 15 studenata je ocijenjeno ocjenom 3). 25 studenata je na ispitu ocijenjeno ocjenom najviše © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 6. Tako je kumulativna apsolutna frekvencija ''manje od'' modaliteta 1 jednaka 0 jer niti jedan student nije ocijenjen ocjenom 1. Bojan Kovačić. Rezultati pismenoga ispita dani su u sljedećoj tablici: ocjena broj studenata 1 0 2 10 3 15 4 25 5 30 ukupno: 80 Za svaki pojedini modalitet definiramo kumulativnu apsolutnu frekvenciju ''manje od'' kao ukupan broj elemenata osnovnoga skupa koji su ili strogo manji od dotičnoga modaliteta ili jednaki tom modalitetu.02. ali postoji 10 studenata koji su ocijenjeni ocjenom 2). a jednako toliko ih je ocijenjeno ocjenom 4) i kumulativna apsolutna frekvencija ''manje od'' modaliteta 5 jednaka je 80 (svi studenti su ocijenjeni ocjenom jednakom ili manjom od 5). broj studenata kumulativna apsolutna frekvencija ''manje od'' 1 0 0 2 10 10 3 15 25 4 25 50 5 30 80 ukupno: 80 ocjena Dobivene kumulativne apsolutne frekvencije objašnjavamo ovako: 10 studenata je na ispitu ocijenjeno ocjenom 2 (niti jedna ocjena nije strogo manja od 2). Kraće i matematičkije. Na 1. bilo je ukupno 80 studenata. predavač 26 . kumulativna apsolutna frekvencija ''manje od'' modaliteta 4 jednaka je 50 (25 studenata je ocijenjeno ocjenom strogo manjom od 4. tu rečenicu možemo izreći ovako: 10 studenata je na ispitu ocijenjeno ocjenom najviše jednakom 2. 25 studenata je na ispitu ocijenjeno ocjenom 2 ili ocjenom 3. ocjenom 3 ili ocjenom 4. godini stručnoga studija smjehologije na Višoj uzaludnoj školi u Špičkovini na dan 29. Kumulativna apsolutna frekvencija ''manje od'' modaliteta 2 jednaka je 10 (nema studenata koji su dobili ocjenu strogo manju od 2.

© mr. Podijelimo li svaki član dobivenoga niza kumulativnih apsolutnih frekvencija s opsegom promatranoga statističkoga skupa. odnosno izraza jednak x ili strogo manji od x. dobit ćemo kumulativni niz relativnih frekvencija ''manje od''. 12.sc.5% studenata je na ispitu ocijenjeno ocjenom najviše jednakom 2.5 3 15 25 31. a svi studenti su na ispitu ocijenjeni ocjenom najviše jednakom 5.5% studenata je na ocjena 38 Mini-tečaj hrvatskoga jezika. 62.38 < Označimo li s fx apsolutnu frekvenciju. U promatranom primjeru taj je niz: broj studenata kumulativna apsolutna kumulativna relativna frekvencija ''manje od'' frekvencija ''manje od'' [%] 1 0 0 0 2 10 10 12. čija je kumulativna apsolutna frekvencija ''manje od'' jednaka odgovarajućoj ''običnoj'' apsolutnoj frekvenciji) kumulativnu apsolutnu frekvenciju ''manje od'' izračunamo tako da izračunatoj kumulativnoj apsolutnoj frekvenciji ''manje od'' prethodnoga modaliteta pribrojimo apsolutnu frekvenciju modaliteta čiju kumulativnu frekvenciju ''manje od'' želimo izračunati. Bojan Kovačić. 31. Računamo ih krećući se od najslabijega modaliteta prema najboljemu i za svaki modalitet (osim prvoga. lekcija 1: najviše jednak x je istoznačnica izraza manji ili jednak x. posljednjega) modaliteta nužno mora biti jednaka opsegu statističkoga skupa.ELEKTROTEHNIČKI ODJEL Poslovna statistika jednakom 3. nije teško vidjeti da vrijedi jednakost: < cx = ∑ f y =∑ f y + f x y≤ x y< x koja nam omogućuje relativno brzo računanje svake pojedine kumulativne apsolutne frekvencije. a s cx kumulativnu apsolutnu frekvenciju ''manje od'' modaliteta x. predavač 27 .5 5 30 80 100 ukupno: 80 Dobiveni kumulativni niz interpretiramo na sljedeći način: Niti jedan student na ispitu nije ocijenjen ocjenom 1.25 4 25 50 62. 50 studenata je na ispitu ocijenjeno ocjenom najviše jednakom 4.25% studenata je na ispitu ocijenjeno ocjenom najviše jednakom 3. Kao provjera ispravnosti izračuna može nam poslužiti i činjenica da kumulativna apsolutna frekvencija ''manje od'' najboljega (praktično.

39 Kod izračuna pojedinih kumulativnih apsolutnih frekvencija ''veće od'' korisno je primijetiti da kumulativna apsolutna frekvencija ''veće od'' najslabijega (praktično. 70 studenata je na ispitu ocijenjeno ocjenom 3 ili većom od 3. Tako je kumulativna apsolutna frekvencija ''veće od'' modaliteta 1 jednaka 80 (svi studenti su ocijenjeni ocjenom 1 ili strogo većom od 1). lekcija 2: najmanje jednako x ili barem jednako x je istoznačnica izraza veći ili jednak x. 39 Mini-tečaj hrvatskoga jezika. Bojan Kovačić. Kumulativna apsolutna frekvencija ''veće od'' modaliteta 2 tako er je jednaka 80 jer su svi studenti ocijenjeni ocjenom 2 ili strogo većom od 2. 55 studenata je na ispitu ocijenjeno ocjenom 4 ili većom od 4. predavač 28 . a 30 studenata ocjenom 5) i kumulativna apsolutna frekvencija ''veće od'' modaliteta 5 jednaka 30 (30 studenata ocijenjeno je ocjenom 5.ELEKTROTEHNIČKI ODJEL Poslovna statistika ispitu ocijenjeno ocjenom najviše jednakom 4. ocjena broj studenata kumulativna frekvencija ''veće od'' 1 0 80 2 10 80 3 15 70 4 25 55 5 30 30 ukupno: 80 Dobivene apsolutne frekvencije objašnjavamo ovako: Svi studenti su na ispitu ocijenjeni ocjenom 2 ili većom od 2. a 30 studenata je na ispitu ocijenjeno ocjenom 5. Kumulativna apsolutna frekvencija ''veće od'' modaliteta 3 jednaka je 70 (15 studenata je ocijenjeno ocjenom 3. kumulativna apsolutna frekvencija ''veće od'' modaliteta 4 jednaka je 55 (25 studenata ocijenjeno je ocjenom 4. a svi studenti su na ispitu ocijenjeni ocjenom najviše jednakom 5. tu rečenicu možemo izreći ovako: Svi studenti su na ispitu ocijenjeni ocjenom najmanje jednakom 2. Na potpuno analogan način definiramo kumulativnu apsolutnu frekvenciju ''veće od'' svakoga pojedinoga modaliteta To je ukupan broj elemenata osnovnoga skupa koji su ili strogo veći od dotičnoga modaliteta ili jednaki tom modalitetu. prvoga) modaliteta nužno mora biti jednaka opsegu statističkoga skupa i ta nam činjenica može biti svojevrsna provjera ispravnosti provedenih izračuna. Kraće i matematičkije. a niti jedan student nije ocijenjen ocjenom strogo većom od 5). 70 studenata je na ispitu ocijenjeno ocjenom najmanje jednakom 3.sc. a 30 studenata je na ispitu ocijenjeno ocjenom 5. a 30 studenata ocjenom 5). odnosno izraza jednak x ili strogo veći od x. 55 studenata je na ispitu ocijenjeno ocjenom najmanje jednakom 4. 25 studenata ocjenom 4. © mr.

nije teško vidjeti da vrijedi jednakost: > cx = ∑ f y = ∑ f y + f x y≥ x y>x koja nam omogućuje relativno brzo računanje svake pojedine kumulativne apsolutne frekvencije ''veće od''. ocjena © mr.75% studenata je na ispitu ocijenjeno ocjenom najmanje jednakom 4.5 ukupno: 80 Dobivene kumulativne relativne frekvencije objašnjavamo ovako: Svi studenti su na ispitu ocijenjeni ocjenom najmanje jednakom 2. U promatranom primjeru taj je niz: broj studenata kumulativna apsolutna kumulativna relativna frekvencija ''veće od'' frekvencija ''veće od'' [%] 1 0 80 100 2 10 80 100 3 15 70 87.5 4 25 55 68. Računamo ih krećući se od najboljega modaliteta prema najlošijemu i za svaki pojedini modalitet (osim najboljega čija je kumulativna apsolutna frekvencija ''veće od'' jednaka odgovarajućoj ''običnoj'' apsolutnoj frekvenciji) kumulativnu apsolutnu frekvenciju ''veće od'' izračunamo tako da izračunatoj kumulativnoj apsolutnoj frekvenciji ''veće od'' prethodnoga modaliteta pribrojimo apsolutnu frekvenciju modaliteta čiju kumulativnu frekvenciju ''veće od'' želimo izračunati. 87. predavač 29 . a s cx kumulativnu apsolutnu frekvenciju ''veće od'' modaliteta x. a 37. Kao i u slučaju kumulativnih frekvencija ''manje od''.ELEKTROTEHNIČKI ODJEL Poslovna statistika > Označimo li s fx apsolutnu frekvenciju. 68.5% studenata je na ispitu ocijenjeno ocjenom 5. svaku od dobivenih kumulativnih frekvencija ''veće od'' možemo podijeliti s opsegom statističkoga skupa. Bojan Kovačić.75 5 30 30 37.5% studenata je na ispitu ocijenjeno ocjenom najmanje jednakom 3.sc. Tako se dobije kumulativni niz relativnih frekvencija ''veće od''.

Dijagram ''stablo – list'' (stem – leaf) Jedan od načina sažetoga prikaza kvantitativnih statističkih podataka. 7 list i izložene ideje grupiranja podataka odmah dobivamo originalni podatak: 2008. 40 © mr. a x stablo.y.y s 10. a iz njega se vrlo lako mogu izračunati medijan i mod41.ELEKTROTEHNIČKI ODJEL Poslovna statistika 2. a) Stablo numeričkoga podatka 2008. Ta je uputa ovdje jednostavna: pomnožiti zapis x. Bojan Kovačić. ovaj je dijagram zapravo unija stabala kojima su listovi znamenke jedinica prirodnih brojeva. a list broj 7. predavač 30 . Primjer 7. . decimalna točka. a u ovom slučaju ona glasi: podijeliti zapis x. U ovakvom zapisu y nazivamo list. Ukoliko numerički podatak uopće nema znamenaka iza decimalne točke ili ima barem dvije znamenke iza decimalne točke.y dobiti originalni podatak. odnosno reći kako iz podatka x. I u ovome je slučaju list znamenka 8. b) Prirodan broj 2008 nema niti jedne znamenke iza decimalne točke. Ilustrirajmo to na primjerima. No. Ovaj način je osobito prikladan ukoliko želimo vidjeti oblik i razdiobu podataka. leaf) su dio osnovnih termina teorije grafova. jest dijagram ''stablo – list''40. gdje je y bilo koja znamenka dekadskoga brojevnoga sustava.7. a x ostatak numeričkoga podatka. Tako er. Opišimo ukratko o čemu se radi. Me utim. list će biti posljednja znamenka broja. tj. Sukladno toj teoriji. slijedeći osnovnu ideju dobili bismo broj 200. Opet nedostaje ''uputa za uporabu''.8. tj. a stablo 200. a stablo sve ostale znamenke broja u redoslijedu u kojemu se pojavljuju u samom broju. c) Decimalan broj 20. iz ovakvoga zapisa slijedi da je originalan podatak 200. 41 Medijan i mod su srednje vrijednosti ili mjere centralne tendencije o kojima će detaljnije biti govora u posebnom poglavlju. a stablo sve ostale znamenke broja poredane redoslijedom u kojemu se pojavljuju u zapisu broja. u duhu te teorije primjereniji prijevod naziva ovoga tipa dijagrama bio bi ''stabljika – list''. osobito korišten u statističkim računalnim programima. 200.3.y s 10.y pravilno očitati polaznu numeričku vrijednost. Termini stablo (engl. tj. Ovdje nam ne treba nikakva ''uputa za uporabu'' jer iz činjenica da je 2008 stablo. Osnovna ideja ovakvoga tipa grupiranja podataka jest zapisati svaki numerički podatak u obliku x.8. što je netočno. a korijeni sve ostale znamenke. kako iz zapisa x. Stoga ovdje moramo dati ''uputu za uporabu''.7 je broj 2008. U tom slučaju list je posljednja znamenka toga broja.08 ima dvije znamenke iza decimalne točke. 8. tree) i list (engl. što je netočno.4.sc. kad bismo iz ovakvoga zapisa htjeli dobiti originalni podatak. U takvim slučajevima obavezno moramo dati odgovarajuću ''uputu za uporabu''.

9 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Nakon što smo svaki element osnovnoga skupa jedinstveno zapisali na gore navedeni način. 76. 99.6.9 0.8. Pokažimo to na primjerima.4.7.2.8 8. 61.5.2.sc.5.9 0. 11.9 6 5. 67. 92.3.6. 68.3. 8. ''Uputa za uporabu'' kaže da se originalni podaci dobiju množenjem svakoga od tih brojeva s 10. Tako dobivamo sljedeću tablicu: stablo 5 6 7 8 9 uputa za uporabu: list 1.2.9 i 7. Dakle. predavač 31 .8.3. 59. 76. 76.0.4. originalni podaci su 51.5 2. a list znamenka iza decimalne točke. preostaje nam grupirati elemente osnovnoga skupa prema stablima: u istu grupu svrstat ćemo sve elemente koji imaju isto stablo.d. 13. Npr.5. 55.8. 95.6. 95.3. 64. 78.5.3.9. od najmanjega do najvećega.2. 13.6.2.8 0. 11.0. 70 i 90.5. Primjer 9.9 pomnožiti stablo. 14.2.8. 12.3. 13. 69. Na potpuno analogan način se iz ostalih redaka tablice dobiju ostali elementi osnovnoga skupa.9 5.6.5.list s 10 Iz ovako navedene tablice se pomoću ''upute za uporabu'' vrlo lako dobivaju polazni podaci. 58 i 59.3. 9. 13. 12.9 © mr.6.1. 14.12. 11.9. 72.4 1. Svi studenti Visoke škole za financijski menadžment u Špičkovini koji su položili kolegij Poslovna matematika putem dvaju kolokvija ostvarili su sljedeće brojeve bodova: 64. Zaključne cijene dionica (u €) mobilnoga operatera ''Bla–bla–mobile d.2. 80.8 i 5.7 0.5.6. 63.8. 10. 5.7.5. 13.6. 13.2. 90.7.9. 66. Bojan Kovačić. 58.7.6. iznosile su: 8.8. 12.2. U ovome će slučaju stablo svakoga podatka biti znamenke ispred decimalne točke. 7. tj. 87. 6.2007.2.8.12.6.8.2. 9. 7. 6. Tako dobivamo sljedeću tablicu: stablo 6 7 8 9 10 11 12 13 14 list 8.9.0.2. 5. 72. 55. 80. Primjer 8. 81. 8. 86. 7. 12. Pritom ćemo stabla poredati prema uobičajenom ure aju u skupu realnih brojeva.4.1. a druga list. 93. 82.9 0. 51. 8. 63. 94. 13. 5.0.2.7. Budući da je riječ o dvoznamenkastim prirodnim brojevima.9. 58.3.4. 72.4. 11.4.1. u prvom retku tablice zapravo pišu decimalni brojevi 5.8.5.2006. 93. i 31.'' na bečkoj burzi u 30 slučajno odabranih dana u razdoblju izme u 31.2. prva znamenka svakoga od tih brojeva bit će stablo. 58.

1.7. 59. 59.7.5.47.4.2.44.5. 59.7.7.37.46.) izvor podataka. 59. 59.42. pa se tako dobiju podaci 59.1.) tekstualni dio tablice.8 0.3 i 7.58.4.39. Npr.8.8.9 0.3.41.3 podijeliti stablo.4 itd.7.2.2.9.63 i 59.3. 59.9 i 593. Cilj te faze jest na jasan. Zaključne cijene dionica (u kn) tvrtke ''Stara TV' na frkljevačkoj burzi u veljači 2008. iz drugoga 7.4.58. 59.9 0. 59.sc.37. iz prvoga retka odmah dobivamo podatke 6.43. 59. Na potpuno analogan način se iz ostalih redaka dobiju ostali elementi osnovnoga skupa.51. ''Uputa za uporabu'' kaže da odgovarajuće originalne podatke dobivamo dijeljenjem svakoga od navedenih decimalnih brojeva s 10. 59.39 i 59. U ovoj ćemo točki ukratko spomenuti neke najvažnije vrste tablica. 3.62.38. predavač 32 .8. cjelovit i pregledan način prezentirati rezultate prikupljanja i grupiranja podataka.55. u prvom retku tablice zapravo pišu decimalni brojevi 593. 4. 59.52.8 i 6. Tablični prikaz statističkih podataka Tablični prikaz statističkih podataka je treća faza obrade ''sirovih'' statističkih podataka.2. 2. 2.57.52. 59. 59.) naslov tablice. 59.) numerički dio tablice.2.3. 59. 59. 593. 59. 59.48. 593. 59. Primjer 10. Tako dobivamo sljedeću tablicu: stablo 593 594 595 596 uputa za uporabu: list 7. 59.2.0. 59. 59.8. 59. godine iznosile su: 59. Bojan Kovačić.6. 59.45.2. 59. Više statističkih nizova nastalih © mr. 59.5.ELEKTROTEHNIČKI ODJEL Poslovna statistika ''Uputu za uporabu'' ovdje ne moramo navesti jer se originalni podaci dobivaju izravno bez ikakvih dodatnih aritmetičkih operacija. U ovome će slučaju list svakoga elementa osnovnoga skupa biti znamenka na mjestu stotinki (druga znamenka iza decimalne točke). 59.list s 10 I ovdje pomoću ''upute za uporabu'' vrlo lako dobivamo polazne podatke. Pritom istaknimo da svaka statistička tablica nužno mora imati sljedeće dijelove: 1. Npr.9.9.42. 59. 59.39.49.62.38.53. a stablo sve ostale znamenke.39.43.6. Točno jedan statistički niz nastao sre ivanjem podataka prema modalitetima jednoga obilježja tabelarno se pregledno prikazuje jednostavnom tablicom.

pa sukladno tome kombinirana tablica može biti dvodimenzionalna. četverodimenzionalna itd. marginalnoga retka (retka ukupno) i marginalnoga stupca (stupca ukupno). Primjer skupne statističke tablice: Razdioba registriranih cestovnih motornih i priključnih vozila u Republici Hrvatskoj na dan 31. Pogledajmo po jedan primjer svake od spomenutih vrsta tablica. prema spolu spol broj zaposlenika muški 7 ženski 3 ukupno: 10 Izvor: služba kadrovskih potencijala tvrtke ''Lupeškić d.o. Svaka takva tablica uvijek se sastoji od predstupca.'' Primjer 2. Dobiveni rezultati pregledno se prikazuju kombiniranom ili kontingencijskom tablicom.12. predavač 33 . Ukupan broj obilježja prema kojemu je podijeljen skup naziva se dimenzija tablice. pa se i tako dobiveni podaci mogu grupirati i sre ivati. Ukoliko je statistički skup podijeljen prema točno © mr.o.o. trodimenzionalna.'' iz Zlobina na dan 10. zaglavlja.2008.sc.2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika sre ivanjem podataka prema modalitetima jednoga obilježja pregledno prikazujemo skupnom tablicom. prema vrsti vlasnika vrsta vozila fizičke osobe pravne osobe ukupno autobusi 701 4 322 5 023 kombinirani automobili 6 316 4 592 10 908 mopedi 97 845 8 498 106 343 motocikli 52 104 4 191 56 295 osobna vozila 1 334 894 152 234 1 487 128 priključna vozila 19 792 15 118 34 910 vrsta vozila fizičke osobe pravne osobe ukupno radni strojevi 2 587 4 407 6 994 teretna i radna vozila 70 888 94 347 165 235 traktori 101 854 4 190 106 044 Izvor: mjesečno statističko izvješće broj 1/2008 Državnoga zavoda za statistiku Republike Hrvatske Statistički skup moguće je podijeliti i prema najmanje dvama različitim obilježjima. Bojan Kovačić.o. ali se zbog potreba daljnje analize podataka preporučuje izraditi ih u MS Excelu. Primjer 1. Primjer jednostavne statističke tablice: Razdioba svih zaposlenika tvrtke ''Lupeškić d. polja tablice. Jednostavne i skupne tablice vrlo je jednostavno izraditi i u MS Wordu i MS Excelu.03.

Bojan Kovačić. Tako npr.sc. 43 Uobičajeni izraz za ženu koja piše lijevom rukom.2006. predavač 34 . Taj izraz treba razlikovati od izraza ljevičarka koji se odnosi isključivo na političku orijentaciju. Iz presjeka marginalnoga stupca i drugoga retka očitavamo da me u svim promatranim studentima ima točno 17 studenata muškoga spola. Primjer 4. Za vježbu objasnite svaku od preostalih frekvencija navedenih u tablici. muškarac koji piše lijevom rukom nije niti ljevičar niti lijevak. 42 © mr. prema spolu i ruci kojom pišu muški ženski ukupno: desna 12 17 29 lijeva 5 6 11 ukupno: 17 23 40 izvor: studentska služba Veleučilišta u Špičkovini Apsolutna frekvencija u retku i i stupcu j označava ukupan broj elemenata statističkoga skupa koje istodobno imaju oblik obilježja 1 naveden u retku i i oblik obilježja 2 naveden u retku j. apsolutna frekvencija 12 u presjeku drugoga retka i drugoga stupca znači da me u svim promatranim studentima ima točno 12 studenata muškoga spola koji pišu desnom rukom (''dešnjaci''42).12. apsolutna frekvencija 6 u presjeku trećega retka i trećega stupca znači da me u svim promatranim studentima ima točno 12 studentica koji pišu lijevom rukom (''ljevakinje''43) itd. a iz presjeka marginalnoga retka i trećega stupca očitavamo da me u svim promatranim studentima ima točno 11 studenata koji pišu lijevom rukom. Taj izraz treba razlikovati od izraza desničar koji se odnosi isključivo na političku orijentaciju. Pogledajmo dva primjera tablica s apsolutnim frekvencijama. Primjer 3. Primjer dvodimenzionalne kombinirane statističke tablice: Razdioba svih studenata 1. navršenim godinama radnoga staža i iznosu prosječne mjesečne plaće Uobičajeni izraz za muškarca koji piše desnom rukom.2008.03. Primjer četverodimenzionalne kombinirane statističke tablice: Razdioba svih zaposlenika tvrtke ''Viktor Stečaj'' iz Plomina na dan 31. godine stručnoga studija računovodstva i financija Veleučilišta u Špičkovini na dan 10. a njezin marginalni redak i marginalni stupac sadrže odgovarajuće apsolutne ili relativne frekvencije svakoga pojedinoga obilježja. odgovarajuća kombinirana tablica je dvodimenzionalna. nego ljevak.ELEKTROTEHNIČKI ODJEL Poslovna statistika dvama obilježjima. prema spolu. stupnju stručne spreme. Tako er.

Ovdje ćemo izdvojiti i na primjerima ilustrirati tri tipa takvih tablica: tablica ''kutno 100''.ELEKTROTEHNIČKI ODJEL Poslovna statistika 3000-4999 5000-6999 7000-9000 srednja viša viša visoka visoka 0-9 M 3 1 1 0 0 Ž 3 1 0 2 1 10-19 M 3 1 3 3 3 Ž 0 0 4 0 2 20-30 M 3 0 2 0 0 Ž 3 0 0 0 1 ukupno 15 3 10 5 7 izvor: služba kadrovskih potencijala tvrtke ''Viktor Stečaj'' ukupno 5 7 13 6 5 4 40 Ovdje prva apsolutna frekvencija.sc.00 kn i 7. to zbroj svih relativnih frekvencija mora biti jednak 1 (ili 100%. najviše 9 godina radnoga staža i prosječnu mjesečnu plaću izme u 3. te da unutar toga zbroja možemo postaviti parove zagrada na koja god mjesta želimo. te prosječnu mjesečnu plaću izme u 7. tj. znači da me u svim promatranim zaposlenicima postoje točno 3 zaposlenika muškoga spola koji imaju srednju stručnu spremu. koliko ukupno zaposlenika ima visoku stručnu spremu i sl.00 kn i 5. Kako je istaknuto.000. Tablica ''kutno 100'' dobije se iz kombinirane tablice koja sadrži apsolutne frekvencije tako da se svaka apsolutna frekvencija podijeli s opsegom statističkoga skupa. © mr. tablica ''vodoravno 100'' i tablica ''okomito 100''. Učinite to za vježbu i objasnite značenje svih preostalih apsolutnih frekvencija navedenih u tablici. predavač 35 .00 i 9. izme u 20 i 30 godina radnoga staža. Posljednja apsolutna frekvencija.00 kn.000.00 (opet ne cjepidlačimo) kn ima točno 10 zaposlenika koji imaju višu stručnu spremu itd. kombinirana tablice može sadržavati i relativne frekvencije. Taj zbroj možemo izračunati na dva načina44: 44 Navedeni načini posljedica su svojstva komutativnosti i asocijativnosti zbrajanja realnih brojeva koja zajednički kažu da zbroj proizvoljno (ali konačno) mnogo realnih brojeva ne ovisi o poretku tih brojeva. Frekvencija 13 iz marginalnoga stupca znači da me u svim zaposlenicima koji imaju izme u 10 i 20 godina radnoga staža ima točno 13 zaposlenika muškoga spola. Bojan Kovačić. iz dobivene kombinirane tablice vrlo lako možemo izračunati koliko je žena me u svim promatranim zaposlenicima. Iako te frekvencije nisu navedene.000.000.000. dok frekvencija 10 iz marginalnoga retka znači da me u svim zaposlenicima čija je prosječna mjesečna plaća izme u 5. pa posebno izračunati zbroj unutar svakoga pojedinoga para zagrada. Budući da je zbroj svih apsolutnih frekvencija uvijek jednak opsegu statističkoga skupa.000.00 (nećemo cjepidlačiti) kn. 1. osim apsolutnih. 3. izrazimo li relativne frekvencije u postotcima). znači da me u svim promatranim zaposlenicima postoji točno jedna zaposlenica (ženskoga spola) koja ima visoku stručnu spremu. tj.

razini obrazovanja i navršenim godinama starosti © mr. Tada relativne frekvencije računamo tako da u svakom pojedinom retku svaku od apsolutnih frekvencija podijelimo s opsegom odgovarajućega uzorka. pa potom zbrojiti sve dobivene zbrojeve.65% 30.42% ukupno 32. Bojan Kovačić.87% 1.17% nepoznata nasilna smrt 0.40% 66.24% 67. možemo očitati da su me u svim umrlima nasilnom smrću u Republici Hrvatskoj u 2005.05% posljedice ratnih operacija 0. godine) prema spolu. 2. pa potom zbrojiti sve dobivene zbrojeve. Tablica ''vodoravno 100'' dobije se iz kombinirane tablice s apsolutnim frekvencijama tako da svaki redak te tablice shvatimo kao tablični prikaz uzorka statističkoga skupa.sc.75% 22. Za vježbu objasnite svaku od ostalih relativnih frekvencija. primjerice. godini prema spolu i vrsti nasilne smrti žene muškarci ukupno nesretni slučaj 23. Državni zavod za statistiku. 2007. Primjer tablice ''kutno 100'': Struktura svih umrlih nasilnom smrću u Republici Hrvatskoj u 2005.40% ubojstvo 0. Primjer 5.56% 43.35% 0. Iz ove tablice. Primjer 6.76% 100. godini njih 7.) zbrajajući relativne frekvencije u svakom pojedinom stupcu.17% 0.00% Izvor: ''Žene i muškarci u Hrvatskoj''.75% žene koje su izvršile samoubojstvo. Primjer tablice ''vodoravno 100'': Struktura stanovništva Republike Hrvatske (popis iz 2001.ELEKTROTEHNIČKI ODJEL Poslovna statistika 1.18% 2.) zbrajajući relativne frekvencije u svakom pojedinom retku. predavač 36 .07% 0.00% 0.96% samoubojstvo 7.

30% 61.00% 100. 2007.90% 19.64 žene 65.00% muškarci 52.40% 100.00% 25 .00% 75 .00% 2.50% u četvrtom stupcu znači da me u svim muškarcima koji su navršili izme u 15 i 24 godine njih 1.70% 100.00% 85 + žene 88. relativna frekvencija 27. Uočimo da ovdje zapravo imamo 16 uzoraka: prvi uzorak tvore sve žene koje su navršile izme u 15 i 24 godine.20% 100. Primjer 7.70% 8. Tako.30% 57.00% 45 . Tada relativne frekvencije računamo tako da u svakom pojedinom stupcu svaku od apsolutnih frekvencija podijelimo s opsegom odgovarajućega uzorka.20% 13. treći uzorak tvore sve žene koje su navršile izme u 25 i 34 godine itd.90% 100.00% 55 .34 žene 18.00% muškarci 17.00% muškarci 25. primjerice.90% 2.24 žene 41.80% 100.10% 100.00% 35 .44 žene 27.00% izvor: ''Žene i muškarci u Hrvatskoj''. riječ je o segmentima [15.ELEKTROTEHNIČKI ODJEL Poslovna statistika osnovno ili srednje više ili ukupno: manje visoko 15 .50% 34.40% 100.50% 100. predavač 37 .10% 10.00% muškarci 61. Tablica ''okomito 100'' dobije se iz kombinirane tablice s apsolutnim frekvencijama tako da svaki stupac te tablice shvatimo kao tablični prikaz uzorka statističkoga skupa.70% 24.20% 16.4% ima osnovno obrazovanje ili manje. drugi uzorak tvore svi muškarci koji su navršili izme u 15 i 24 godine.10% 17.74 žene 81. [25. Bojan Kovačić. a relativna frekvencija 1.60% 4.80% 100. Za vježbu objasnite svaku od ostalih relativnih frekvencija.40% 55.00% muškarci 42.40% 16.00% 15.00% muškarci 20.00% 56.30% 46. Državni zavod za statistiku. 24].60% 42. 34] itd.20% 56.70% 100.00% muškarci 68.10% 64. godine prema spolu i području znanosti iz kojega su obranili doktorsku disertaciju © mr.50% 22.70% 68.00% 65 .50% 100. Primjer tablice ''okomito 100'': Struktura svih državljana Republike Hrvatske koji su titulu doktor znanosti stekli 2005.60% 9.80% 100.30% 1.60% 13.50% 100.54 žene 41.00% muškarci 37.50% 2.40% 25.sc.90% 12. Granice razreda u ovom su primjeru nominalne.50% 100.70% 13.50% ima više ili visoko obrazovanje.60% 17.40% u drugom stupcu znači da me u svim ženama koje su navršile izme u 35 i 44 godine njih 27.60% 100. tj.30% 10.84 žene 86.

fakulteti.5. Državni zavod za statistiku. Grafičke prikaze ili.) točkasti grafikoni. Za vježbu objasnite svaku od ostalih relativnih frekvencija. statistika se. izme u ostaloga.00% izvor: ''Žene i muškarci u Republici Hrvatskoj''. godine njih 20. kraće.) linijski grafikoni.90% navedena u trećem stupcu znači da je me u svim muškarcima koji su titulu dr. ali i izlaganja na svim vrstama nastave u različitim tipovima škola (osnovne. kako je istaknuto u uvodu.69% 24. grafikone obično dijelimo u četiri osnovne skupine: 1. 2007. javnih medija (osim radija). faza statističkoga istraživanja). a drugi uzorak tvore svi muškarci koji su titulu dr. visoke. Bojan Kovačić. Uočimo da ovdje zapravo imamo dva uzorka: prvi uzorak tvore sve žene koje su titulu dr.64% 12. stekle 2005.32% humanističke znanosti 13.64% biotehničke znanosti 9.96% biomedicina i zdravstvo 20. predavač 38 . stekli 2005. srednje.sc.9% tu titulu steklo na području prirodnih znanosti.) kartogrami © mr. Stoga ćemo u ovoj točki ukratko navesti osnovne i najčešće korištene statističke prikaze podataka ilustrirajući ih na primjerima. Psihologija ljudskoga ponašanja pokazuje da se u gotovo svim vrstama tiskovina. odmah istaknimo da tablice i grafički prikazi pružaju isključivo prve informacije o promatranoj pojavi. godine.48% društvene znanosti 12.sc. 2. izlaganja na različitim vrstama znanstvenih/stručnih skupova. primjerice.48% 10.00% 100. Naime. a relativna frekvencija 10. Tako. 4. relativna frekvencija 20. Grafički prikaz statističkih podataka Grafički prikaz statističkih podataka je jedan od najvažnijih dijelova prezentacije rezultata statističkoga istraživanja. a ni u kojemu slučaju nisu (potpuno) dovoljne za statističku analizu i interpretaciju njezinih rezultata (5.sc. bavi i organiziranim načinima prezentacije rezultata statističkoga istraživanja.ELEKTROTEHNIČKI ODJEL Poslovna statistika žene muškarci prirodne znanosti 34. 3.77% 9.) površinski grafikoni.90% tehničke znanosti 8.69% navedena u drugom stupcu znači da je me u svim ženama koje su titulu dr. Ipak.69% tu titulu steklo na području biomedicine i zdravstva. 2.sc.sc.69% ukupno: 100. godine njih 10. stekle 2005.79% 14. godine. stekli 2005.62% 27. …) pozornost slušatelja najprije i najvećim dijelom usmjerava na grafičke prikaze podataka.

U slučaju strukturnoga kruga i prikaza relativnih frekvencija površina kružnoga isječka identički je jednaka relativnoj frekvenciji tom isječku odgovarajućega modaliteta. te strukturni krug najčešće koriste za grafički prikaz kvalitativnih obilježja. položeni. gdje je ri relativna frekvencija i – toga modaliteta iskazana kao proporcija (tj.333333 = 120° itd. legendu (dio grafikona koji dodatno pojašnjava osobitosti grafikona) itd.). Najčešći i praktično najviše korišteni tipovi površinskih grafikona su različite vrste stupaca (jednostavni. Primjer 1.3333% odgovara središnji kut 360° ⋅ 0.1. relativnoj frekvenciji 33. predavač 39 . Površinski grafikoni Osnovna karakteristika ove vrste grafikona jest da se frekvencije podudaraju s površinama geometrijskih likova (pravokutnik. strukturni). pa je u tom slučaju apsolutna frekvencija identički jednaka duljini pravokutnika. O histogramu ćemo nešto više reći u posebnoj podtočki. pa ni u kojemu slučaju ne može predstavljati dobar prikaz rezultata statističke analize. Bojan Kovačić. 2.5. Budući da je površina pravokutnika jednaka umnošku njegove duljine a i širine b.sc. ''Struktura…'' itd. Primjer jednostavnih stupaca: © mr. krug).).. a krug može imati bilo koji polumjer (a ne nužno polumjer r = 1 jed. kao decimalan broj). apsolutna (ili relativna) frekvencija svakoga modaliteta jednaka je površini tom modalitetu odgovarajućega pravokutnika ili dijela kruga. vrsta stručne spreme itd. broj zaposlenika. strukturni krug. Npr. višestruki. dvostruki. nazive kategorija na koordinatnim osima (npr. Paretov dijagram i histogram. a ovdje samo istaknimo da se nabrojene vrste stupaca. Ukratko i uz odgovarajuće primjere opisat ćemo najčešće predstavnike svake pojedine vrste grafikona. osobito treba istaknuti da uz svaki grafikon obavezno treba navesti odgovarajuće oznake: naslov grafikona (najčešće: ''Razdioba…''. Bez spomenutih oznaka grafikon je nepotpun i ''nečitljiv''.). Drugim riječima. Krug – kojega možemo zamišljati i kao kut od 360° – dijelimo na kružne isječke čiji su središnji kutovi 360° ⋅ ri. za širinu se najčešće uzima b = 1 jed.ELEKTROTEHNIČKI ODJEL Poslovna statistika Kako bi grafički prikaz imao svoj potpuni smisao. godina.

Primjer 2. b = 1 jed. a najmanji broj promatranih studenata ocijenjen ocjenom 5.ELEKTROTEHNIČKI ODJEL Poslovna statistika Uočimo odmah da svi stupci imaju jednaku širinu i ta je širina jedinična (tj.sc. predavač 40 . Primjer položenih stupaca: © mr.). Stoga je površina svakoga pravokutnika identički jednaka duljini pravokutnika. Iz zadanoga grafikona ne možemo očitati točne apsolutne frekvencije svakoga pojedinoga modaliteta. što znači da je i apsolutna frekvencija svakoga od pet modaliteta identički jednaka duljini pripadnoga pravokutnika. Bojan Kovačić. ali možemo zaključiti da je najveći broj promatranih studenata na ispitu ocijenjen ocjenom 3.

u legendi bi trebali pisati točni nazivi modaliteta obilježja spol. predavač 41 . možemo zaključiti jedino da je u svim dosadašnjim sazivima Hrvatskoga sabora ukupan broj saborskih zastupnika bio znatno veći od ukupnoga 45 Strogo precizno. ali za preostala tri ne). ponekad se radi lakše interpretacije grafikona ti modaliteti zamjenjuju imenicama muškarci i žene. Primjer 3. U ovom je slučaju tumač (legenda) prikazana sa strane neizostavan dio grafikona jer bez nje ne bismo mogli točno znati (već samo prilično točno naslutiti) površine kojih pravokutnika označavaju apsolutne frekvencije modaliteta muškarci. ali možemo zaključiti da je najviše promatranih studenata završilo ekonomsku školu. a koji modaliteta žene. tj. pa je potom svaki od uzoraka podijeljen prema obilježju spol.sc. a najmanje tehničku školu. nazivi muški i ženski. (Na ovom načelu se konstruiraju položeni stupci u MS Excelu.ELEKTROTEHNIČKI ODJEL Poslovna statistika Položene stupce možemo shvatiti kao jednostavne stupce zarotirane za 90° ulijevo. a koriste se najčešće kod obilježja s nomenklaturama. Bojan Kovačić. No.) Oni imaju potpuno ista svojstva kao i jednostavni stupci. primjerice. Niti iz ovoga grafikona ne možemo ''očitati'' točnu apsolutnu frekvenciju svakoga pojedinoga modaliteta (za dva modaliteta to možemo učiniti.45 Iz zadanoga grafikona. © mr. pa potom zrcaljene s obzirom na os modaliteta. Primjer dvostrukih stupaca: Uočimo da se ovdje zapravo radi o podjeli statističkoga skupa (svi dosadašnji zastupnici u Hrvatskom saboru) na 6 me usobno nedisjunktnih uzoraka (dio zastupnika je biran u barem dva saziva Hrvatskoga sabora).

te izme u 10 i 19 godina radnoga staža najviše njih ima plaću izme u 7. predavač 42 .03. te pokušajte izvući još neke zaključke iz ovoga prikaza (npr. Bojan Kovačić.) prema trima različitim obilježjima: stupnju stručne spreme. što sve možete reći o zaposlenicima koji imaju srednju stručnu spremu. Primjer višestrukih stupaca: Ovaj grafikon prikazuje podjelu istoga statističkoga skupa (svi zaposlenici tvrtke ''Ljubo Jamio'' iz Muća na dan 10. pa je. Svi stupci imaju širinu jednaku 1. Iz prikazanoga grafikona možemo izvući razne zaključke. Potonja dva obilježja su kvantitativna.00 i 9. Zbog toga su za daljnju analizu primjereniji strukturni stupci (vidjeti Primjer 6. iznosu prosječne mjesečne plaće i navršenim godinama radnoga staža.) Primjer 4. Primjer strukturnoga kruga: © mr. da od svih zaposlenika koji imaju visoku stručnu spremu.ELEKTROTEHNIČKI ODJEL Poslovna statistika broja saborskih zastupnica.00 i 6.000. I ovdje je tumač sa strane nužan kako bismo znali koja se boja odnosi na svaku kategoriju. npr.999. koliko puta veći itd.000.00 kn. ali ne možemo reći npr.000. najviše 9 godina radnoga staža i prosječnu mjesečnu plaću izme u 3.00 i 4. duljina pravokutnika jednaka apsolutnoj frekvenciji.000. kao i kod jednostavnih stupaca. Primjer 5. što o zaposlenicima čija je plaća izme u 5. Za vježbu objasnite svaki prikazani stupac.).00 kn itd.sc. te su grupirana u razrede s nominalnim granicama (neprikladno za daljnju statističku analizu. za koliko posto veći. da postoji 6 zaposlenika koji imaju srednju stručnu spremu. ali prikladno za grafički prikaz).2008.999.00 kn itd.

Napomenimo da neki programi (MS Excel) omogućuju dobivanje strukturnoga kruga na osnovu jednostavne tablice s apsolutnim frekvencijama. a središnji kutovi odgovarajućih isječaka dobiveni su množenjem broja 360 redom s brojevima 0. 0. Primjer 6. površina tamnoplavoga kružnoga isječka jednaka 16% površine cijeloga kruga itd.ELEKTROTEHNIČKI ODJEL Poslovna statistika Na ovom grafikonu površina svakoga pojedinoga kružnoga isječka odgovara relativnoj frekvenciji modaliteta kojega predstavlja taj isječak. Iz navedenoga strukturnoga kruga možemo ''očitati'' da me u svim nastavnicima Ekonomskoga fakulteta Sveučilišta u Banovoj Jaruzi ima 16% mla ih asistenata. 0.18. 0.16.1 i 0. duljina polumjera kruga može biti bilo koji strogo pozitivan realan broj.13. 0. pa se time izbjegava efektivno računanje relativnih frekvencija.24.sc. pa je tako površina narančastoga kružnoga isječka jednaka 24% površine cijeloga kruga.19. predavač 43 . Kako je već istaknuto. Za vježbu objasnite značenje svake preostale relativne frekvencije. Bojan Kovačić. 24% redovnih profesora itd. Primjer razdijeljenih stupaca (dobivenih iz odgovarajuće tablice ''okomito 100''): © mr.

predavač 44 ..ELEKTROTEHNIČKI ODJEL Poslovna statistika Širina svakoga stupca jednaka je 1 jed.. © mr. jedan razdijeljeni stupac možemo ''nacrtati'' na n! = 1 ⋅ 2 ⋅ … ⋅ n načina. ako imamo ukupno n relativnih frekvencija. Pritom poredak modaliteta nije bitan. Bojan Kovačić. Ta je površina jednostavnim računom diobe podijeljena u omjeru relativnih frekvencija.sc. u svakomu je razdijeljenom stupcu jednak redoslijed pojedinih modaliteta. a duljina 100 jed. jed. pa je njegova površina 100 kv. pa se za svaku pojedinu relativnu frekvenciju odre uje pripadni dio površine pravokutnika. Radi lakše usporedbe. tj.

8%) s osnovnim ili manjim obrazovanjem.. objasnite svaku pojedinu relativnu frekvenciju.. 21. 62. pa zrcaljenjem s obzirom na os modaliteta. predavač 45 . godini najviše (točnije. Širina svakoga pojedinoga pravokutnika jednaka je 1 jed. Bojan Kovačić. godini najviše (točnije. pa je površina svakoga pravokutnika 100 kv. jed.4%) s višim ili visokim obrazovanjem itd. © mr. 6. npr. Primjer položenih razdijeljenih stupaca (dobivenih iz odgovarajuće tablice ''vodoravno 100''): Položeni razdijeljeni stupci su vrlo prikladni za prikaz strukture statističkoga skupa pri podjeli prema kvalitativnom obilježju s nomenklaturom.. Strogo formalno rečeno. a duljina 100 jed. Za vježbu.sc.ELEKTROTEHNIČKI ODJEL Poslovna statistika Iz ovako prikazanih stupaca možemo izvući razne zaključke. pa iz navedenoga grafikona pokušajte izvući još neke zaključke. a najmanje (točnije. 55.9%) njih je sa srednjim obrazovanjem. Primjer 7. a najmanje (točnije. dobivaju se rotiranjem ''običnih'' razdijeljenih stupaca za 90° ulijevo. a dijelovi koji odgovaraju pojedinim relativnim frekvencijama dobivaju se pomoću dijeljenjem te površine jednostavnim računom diobe u omjeru svih zadanih relativnih frekvencija. da me u svim nezaposlenim muškarcima u Republici Hrvatskoj u 2006.7%) njih je sa srednjim obrazovanjem. da me u svim zaposlenim ženama u Republici Hrvatskoj u 2006.

porijeklom Talijan. te pokušajte izvući još nekoliko zaključaka iz prikazanoga grafikona. da u privatnim kućanstvima sa zaposlenim osobljem ima 14 puta više zaposlenih žena nego muškaraca. U tome se poretku slažu i odgovarajući stupci. Iz zadanoga grafikona mogu se izvući razni zaključci. Primjer 8. Naravno. ali ni u kojemu slučaju ne predstavlja pravilo prema kojemu treba slagati stupce. ekonomist i filozof. te se njegove relativne frekvencije u svakoj pojedinoj kategoriji tablice ''vodoravno 100'' poredaju od najveće do najmanje. Bojan Kovačić. npr. predavač 46 . francuski sociolog. © mr. takvo je slaganje stupaca ekvivalentno slaganju stupaca prema rastućem poretku (od najmanje do najveće) relativnih frekvencija drugoga modaliteta.sc.ELEKTROTEHNIČKI ODJEL Poslovna statistika Ovakav se grafikon često konstruira tako da se odabere jedan modalitet (u ovom je slučaju to modalitet žene). me u svim zaposlenicima u financijskom posredovanju njih 70% su žene itd. objasnite značenje svake pojedine relativne frekvencije. Primjer Paretova46 dijagrama: 46 Vilfredo Federico Damaso Pareto. Odmah treba napomenuti da se ovakva konstrukcija provodi isključivo radi lakše mogućnosti usporedbe relativnih frekvencija istoga modaliteta u različitim kategorijama. Za vježbu. u slučajevima kad se u stupcima tablice ''vodoravno 100'' nalaze točno dva modaliteta.

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Za crtanje Paretova dijagrama treba poredati apsolutne frekvencije modaliteta u silaznom poretku, tj. od najveće do najmanje, te izračunati relativne frekvencije i formirati odgovarajući kumulativni niz relativnih frekvencija. Formiranje toga niza potpuno je jednako formiranju kumulativnoga niza ''manje od'', ali zbog kvalitativnoga obilježja dan riječi ''manje od'' ovdje treba izostaviti. Ovaj je dijagram svojevrsna ''kombinacija'' površinskoga grafikona (jednostavnih stupaca) i linijskoga grafikona (kojim se prikazuje kumulativni niz relativnih frekvencija), a specifičnost mu je što se na istom grafikonu primjenjuju dva tipa mjerila: prvo mjerilo odnosi se na prikaz apsolutnih frekvencija jednostavnim stupcima, a drugo na prikaz kumulativnih relativnih frekvencija. Istaknimo odmah da primjena dvaju ili više tipova mjerila na istom grafikonu u pravilu nije dozvoljena. Iz Paretova je dijagrama vrlo lako odrediti mod47 kvalitativnoga niza, odnosno modalitet koji se najčešće pojavljuje u osnovnom skupu. To je jednostavno modalitet koji odgovara prvom stupcu u Paretovu grafikonu, a lako je vidjeti i postoji li još koji modalitet s istom apsolutnom frekvencijom kao i prvi (prema načelima konstrukcije Paretova dijagrama, on se nužno mora nalaziti neposredno iza prvoga modaliteta). U ovome je slučaju najčešći modalitet subota, pa možemo zaključiti da se najviše promatranih prometnih nesreća dogodilo subotom, te da se najmanje promatranih prometnih nesreća dogodilo sredinom tjedna (tj. utorkom, srijedom ili četvrtkom) Tako er, iz linijskoga grafikona kumulativnih relativnih frekvencija možemo ''očitati'' da se 30% svih promatranih prometnih nesreća dogodilo subotom, polovica svih prometnih nesreća petkom ili subotom itd. Istaknimo da se Paretov dijagram u MS Excelu vrlo lako može dobiti primjenom procedure Analiza podataka (Data Analysis), ali je nužan preduvjet za primjenu te procedure da modaliteti obilježja budu numerički. Stoga, ukoliko je obilježje kvalitativno, a modaliteti iskazani riječima, slovima itd., najprije treba provesti ''kodiranje'' modaliteta48 (zamjenu riječi brojevima), a nakon provedbe cijele procedure ''dekodirati'' brojeve, tj. vratiti originalne modalitete.

2.5.2. Histogram

Histogram je posebna vrsta površinskoga stupčastoga grafikona koja se najčešće koristi za prikaz modalitetâ kvantitativnih obilježja grupiranih u razrede. Osnovna ideja konstruiranja histograma je potpuno jednaka ideji izloženoj kod opisa stupčastih grafikona navedenih u točki 2.5.1.: apsolutne frekvencije modaliteta trebaju biti jednake površini tom modalitetu
47 48

O modu će više riječi biti u 3. poglavlju. Usporediti s bilješkom br. 13.

© mr.sc. Bojan Kovačić, predavač

47

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

odgovarajućega pravokutnika. Kod kvalitativnih i negrupiranih kvantitativnih obilježja taj je postupak bio relativno jednostavan: pretpostavili smo da su širine svih pravokutnika jednake 1 jed., pa je apsolutna frekvencija zbog toga bila jednaka duljini pravokutnika. No, kod grupiranja kvantitativnih podataka u razrede cijela se priča malo komplicira. Radi jednostavnosti, pretpostavit ćemo da histogramom želimo prikazati isključivo apsolutne frekvencije jer za prikaz relativnih frekvencija obično koristimo strukturne stupce opisane u prethodnoj točki. Prvo ćemo opisati najlakši slučaj, a taj je kad su modaliteti kvantitativnoga obilježja grupirani u prave razrede jednakih širina. Označimo navedenu jednaku širinu s d. To znači da će širina svakoga pravokutnika čija će površina predstavljati apsolutnu frekvenciju razreda biti jednaka d. Da bismo nacrtali pravokutnik, potreban nam je podatak o njegovoj duljini. Njegovu duljinu a (za svaki pojedini razred) jednostavno dobijemo tako da apsolutnu frekvenciju dotičnoga razreda podijelimo brojem d. To ujedno znači da nam duljina pravokutnika a općenito više neće biti jednaka apsolutnoj frekvenciji (osim u slučaju d = 1), nego d puta manja od nje. Zbog toga budite oprezni: kod histograma duljina pravokutnika općenito ne mora biti jednaka apsolutnoj frekvenciji tom pravokutniku odgovarajućega razreda, nego može biti nekoliko puta veća ili manja od nje (ovisno o tome je li 0 < d < 1 ili d > 1). Istaknimo da se duljina a izračunata na opisani način naziva korigirana apsolutna frekvencija. Primijetimo još jednu važnu činjenicu: budući da apsolutnu frekvenciju dijelimo strogo pozitivnim realnim brojem, razred s najvećom apsolutnom frekvencijom imat će najveću korigiranu apsolutnu frekvenciju. Drugim riječima, možemo uspore ivati korigirane apsolutne frekvencije pojedinih razreda (ali ne i ''očitavati'' apsolutne frekvencije) kako smo to činili dosad s apsolutnim frekvencijama. Malo složeniji je slučaj kad su podaci grupirani u prave razrede različitih širina. Tada za svaki pojedini razred moramo izračunati odgovarajuću širinu i taj će strogo pozitivan realan broj ujedno biti širina pripadnoga pravokutnika. Potom računamo korigiranu apsolutnu frekvenciju kao količnik apsolutne frekvencije i upravo izračunate širine pravokutnika. Iako se naizgled čini da je ovaj slučaj samo poopćenje prethodnoga, to nije tako: naime, ovdje nema smisla uspore ivati korigirane apsolutne frekvencije jer pravokutnici nemaju jednaku širinu. Drugim riječima, ne vrijedi pravilo da najveća korigirana apsolutna frekvencija odgovara razredu koji ima najveću apsolutnu frekvenciju. Stoga oprez: jedino što možemo napraviti jest uspore ivati površine pravokutnika, a to već zahtijeva točno ''očitanje'' duljina stranica svakoga pravokutnika, što uz nedovoljno ''gusto'' mjerilo na koordinatnim osima ne mora biti moguće izvesti.

© mr.sc. Bojan Kovačić, predavač

48

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Najsloženiji je slučaj kad su podaci grupirani u nominalne razrede (što se općenito doga a kod diskretnih obilježja) ili ako je barem jedan od razreda otvoren. Da bismo dobili histogram, nominalne razrede najprije moramo pretvoriti u prave49, definirati nedostajuće donje ili gornje granice, pa potom primijeniti postupak ili iz prvoga ili iz drugoga opisanoga slučaja. Niti u ovom slučaju nema smisla uspore ivati korigirane apsolutne frekvencije jer pravokutnici općenito ne moraju imati jednaku širinu. U nastavku ćemo dati nekoliko primjera histograma dobivenih pomoću MS Excela, te ukazati na posebnosti izradbe histograma pomoću ovoga programa.
Primjer 9. Primjer histograma (pravi razredi jednakih širina):

Pretpostavimo da smo brojeve bodova na 1. kolokviju iz kolegija Osnove računovodstva održanom 22.11.2007. koje su postigli studenti 1. godine stručnoga studija računovodstva i financija Visoke škole za financijski menadžment u Klokočevcu grupirali u sljedeće razrede:
broj bodova 0-10 10-20 20-30 30-40 40-50 broj studenata 15 14 20 17 7

Odmah vidimo da svaki razred ima širinu 10, što znači da je riječ o pravim razredima jednakih širina. Izračunajmo korigirane apsolutne frekvencije podijelivši svaku pojedinu apsolutnu frekvenciju s 10:
broj bodova 0-10 10-20 20-30 30-40 40-50 korigirana apsolutna frekvencija 1,5 1,4 2 1,7 0,7

Tako histogram u ovom primjeru izgleda ovako:

49

Vidjeti Primjer 5. u točki 2.3.2.

© mr.sc. Bojan Kovačić, predavač

49

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Uočimo odmah da natpis podataka na osi y nije Broj studenata (kao u slučaju jednostavnih stupaca), nego Korigirana apsolutna frekvencija. Istaknimo još jednom da je broj studenata, odnosno apsolutna frekvencija pojedinoga razreda jednaka površini tom razredu odgovarajućega pravokutnika, pa nema nikakvoga smisla podatke na osi frekvencija nazvati apsolutne frekvencije (to bi značilo da je 1.5 studenata na kolokviju ostvarilo najviše 10 bodova, što je besmisleno). Iako mjerilo na osi frekvencija nije dovoljno precizno za izračun apsolutnih frekvencija svakoga pojedinoga razreda, ipak možemo zaključiti da je najviše studenata (njih ukupno 2 ⋅ 10 = 20) na kolokviju ostvarilo izme u 20 i 30 bodova, a najmanje studenata ostvarilo je izme u 40 i 50 bodova, što se potpuno slaže s podacima iz originalne tablice.
Primjer 10. Primjer histograma (pravi razredi različitih širina):

Pretpostavimo da smo brojeve bodova na 1. kolokviju iz kolegija Osnove informatike održanom 03.12.2007. koje su postigli studenti 1. godine stručnoga studija računovodstva i financija Visoke škole za financijski menadžment u Klokočevcu grupirali u sljedeće razrede:

broj bodova broj studenata 0-20 10 20-25 16 25-30 18 30-35 22 35-45 7
© mr.sc. Bojan Kovačić, predavač 50

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Iako je riječ o pravim razredima, oni nisu jednakih širina. Širina prvoga razreda jednaka je 20, širine triju srednjih razreda jednake su 5, dok je širina posljednjega razreda jednaka 10. Računamo korigirane apsolutne frekvencije:

broj bodova 0-20 20-25 25-30 30-35 35-45
pa pripadni histogram izgleda ovako:

korigirana apsolutna frekvencija 0.5 3.2 3.6 4.4 0.7

Uočimo odmah da usporedba korigiranih apsolutnih frekvencija ovdje navodi na pogrešan zaključak da je najmanje studenata na kolokviju ostvarilo najviše 20 bodova. Zbog nedovoljno preciznoga mjerila ovdje ne možemo točno očitati korigirane frekvencije, pa je jedan od zaključaka koji možemo izvesti na temelju ovoga grafikona npr. da je me u svim studentima koji su na kolokviju postigli izme u 20 i 35 bodova najviše onih koji su postigli izme u 30 i 35 bodova. (Uspore ivali smo razrede istih širina za koje vrijedi pravilo da razred s najvećom apsolutnom frekvencijom ima najveću korigiranu frekvenciju.)
Primjer 11. Primjer histograma (pravi razredi različitih širina):

© mr.sc. Bojan Kovačić, predavač

51

a naročito ne u slučaju izrazito asimetričnih razdioba. Primjer histograma (nepravi razredi različitih širina): © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika Iz sljedećega histograma usporedbom korigiranih apsolutnih frekvencija zaključujemo da je najviše promatranih studenata na kolokviju ostvarilo izme u 30 i 35 bodova. takav pristup općenito nije uvijek primjeren. Bojan Kovačić. Primjer 12. potpuno je drugačije jer je gornji histogram dobiven iz sljedeće tablice: broj bodova broj studenata 0-20 24 20-30 11 30-35 9 35-50 16 50-80 30 Iako se ovdje prirodno nameće zaključak da je uvijek najbolje grupirati podatke u razrede jednakih širina jer je tada usporedba najlakša. Detalje ovdje izostavljamo. a najmanje studenata izme u 50 i 80 bodova. predavač 52 .sc. Činjenično stanje. me utim.

5 – 49.5).49 372 50 .5 374 32.5 182 Dalje postupamo kao i u prethodnom primjeru.375 23. Tako dobivamo tablicu: navršene godine života broj brakova 16 .5 – 80.5 – 39.5 8.5 107 23. tj.5 – 32.5 – 44.5 475 39.85714 39.5 – 80. Stoga nominalne granice pretvaramo u prave tako da svaku donju granicu smanjimo za polovicu razmaka. godinu Odmah uočimo da su prvi i posljednji razred otvoreni.2 59.555556 32. prvi razred nema definiranu donju. a svaku gornju uvećamo za polovicu razmaka (opet za 0.5 – 49.5 212 59.23 107 24 .39 40 . tj.49 50 .44 45 . Bojan Kovačić. Tako dobivamo sljedeću tablicu: godine života broj brakova 15.5 – 32.5 21.5 456 44.59 60 i više godine života broj brakova 107 374 475 456 372 212 182 izvor: Statistički ljetopis Kraljevine Dajdamdaš za 2006.5 74.5 91.32 374 33 – 39 475 40 . godine: navršene do 23 24 – 32 33 .5 – 59. Procjena tih granica ovisi o svakom slučaju posebno.2 44.5 372 49. Razredi nemaju jednake širine. predavač 53 . a gornja granica posljednjega razreda 80 godina.5 41. za 0.5 – 59. a posljednji razred gornju granicu. pa je potrebno izračunati korigirane apsolutne frekvencije za svaki pojedini razred.5 67.59 212 60 – 80 182 Razmaci izme u donje granice svakoga razreda (osim prvoga) i gornje granice tom razredu neposredno prethodnoga razreda su jednaki i iznose 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Zadana je razdioba rastavljenih brakova prema navršenim godinama života supruge u Kraljevini Dajdamdaš 2006.666666667 pa je odgovarajući histogram © mr.5 – 23.5 – 39.5 13. Ovdje ćemo pretpostaviti da je donja granica prvoga razreda 16. Dobivamo: godine života korigirana apsolutna frekvencija 15.5.sc.4 49.5 – 23.44 456 45 .5 – 44.

Bojan Kovačić. Primjer 13. Po jednim primjerom ilustrirat ćemo svaku pojedinu podvrstu linijskih grafikona. pa bismo samo na temelju grafikona mogli donijeti pogrešan zaključak o najčešćoj dobi supruge. te za usporedbu najmanje dvaju nizova kvantitativnih podataka.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primijetimo ponovno da razred s najvećom/najmanjom apsolutnom frekvencijom nema najveću/najmanju korigiranu apsolutnu frekvenciju. Linijski grafikoni Linijski grafikoni pripadaju u tipove grafikona naročito pogodne za grafički prikaz vremenskih nizova. Za vježbu navedite najmanje jedan točan zaključak koji možemo izvesti na temelju gornjega grafikona.sc. 2.5.3. poligona frekvencija i kumulante odre ene razdiobe (najčešće prema nekom kvantitativnom obilježju). predavač 54 . © mr. Primjer linijskoga grafikona – grafički prikaz vremenskoga niza50 50 Osnovama analize vremenskih nizova detaljnije ćemo se baviti kasnije.

345292) i C = (ožujak. © mr.345292). B = (veljača. srpanj – kolovoz. Iz grafikona zaključujemo da je tečaj američkoga dolara gotovo tijekom cijele godine pokazivao tendenciju pada i bio bitno nestabilniji od tečaja eura. a najviši potkraj mjeseca ožujka. Iz grafikona možemo zaključiti da je najniži srednji devizni tečaj eura bio potkraj mjeseca rujna. Radi lakše usporedbe vrijednosti za pojedini mjesec.3734) i B = (veljača. predavač 55 . 7. Primjer linijskoga grafikona – usporedba dvaju vremenskih nizova Na sljedećem grafikonu prikazana je grafička usporedba srednjih deviznih tečajeva dviju inozemnih valuta (euro i američki dolar) Hrvatske narodne banke tijekom 2007.382466) itd. odgovarajuće su točke spojene okomitom spojnicom. te da je tijekom godine srednji devizni tečaj pokazivao tendenciju rasta u razdobljima veljača – ožujak. 7.ELEKTROTEHNIČKI ODJEL Poslovna statistika Srednji devizni tečaj eura Hrvatske narodne banke u 2007. godine (stanje potkraj razdoblja). Primjer 14. 7. 7. dok je u ostalim vremenskim razdobljima tečaj pokazivao tendenciju pada.51 51 Nestabilnost tečaja dolara u odnosu na tečaj eura bila bi još izraženija kad bi se mjerilo na okomitoj osi sljedećega grafikona podudaralo s mjerilom na okomitoj osi gornjega grafikona. rujan – listopad i studeni – prosinac. godini (stanje potkraj mjeseca) Me usobno spojene su točke A = (siječanj. Bojan Kovačić.sc.

predavač 56 . naziv poligon (mnogokut) zadržao se kao dio uobičajenoga statističkoga nazivlja. © mr. Primjer poligona frekvencija (kvantitativno obilježje s negrupiranim modalitetima) 52 Prema strogoj matematičkoj definiciji. riječ je o linijskom analogonu histograma). a razlike ordinata (tj. Oblik poligona frekvencija ukazuje na način rasporeda podataka. poligon frekvencija je zapravo otvorena poligonalna crta. Ukoliko su ti modaliteti grupirani u razrede. poligon frekvencija dobiva se tako da se.sc. sukladno redoslijedu razreda na osi apscisa.ELEKTROTEHNIČKI ODJEL Poslovna statistika Poseban primjer linijskoga grafikona je poligon52 frekvencija. poligon frekvencija dobiva se spajanjem točaka koje predstavljaju ure eni par modaliteta i njegove apsolutne frekvencije. Primjer 15. spoje točke koje predstavljaju ure eni par razredne sredine i apsolutne ili korigirane apsolutne frekvencije dotičnoga razreda. Ukoliko modaliteti kvantitativnoga obilježja nisu grupirani u razrede. Iako matematički netočan. Bojan Kovačić. Da bi se dobio zatvoreni poligon. drugih koordinata) točaka o razlikama frekventiranosti oblika obilježja. Riječ je o linijskom grafikonu namijenjenu grafičkom prikazu razdiobe različitih vrsta frekvencija (dakle. treba spojiti prvu i posljednju ucrtanu točku.

ELEKTROTEHNIČKI ODJEL Poslovna statistika Prikazani grafikon predstavlja svojevrstan linijski analogon jednostavnih (ili položenih) stupaca. Bojan Kovačić. Primjer 16. možemo zaključiti npr.sc. Budući da ne možemo točno očitati apsolutnu frekvenciju svakoga modaliteta. Primjer poligona frekvencija (kvantitativno obilježje s modalitetima grupiranim u razrede s nominalnim granicama) © mr. da najviše obitelji ima dvoje djece. a najmanje obitelji ima sedmero djece. predavač 57 . Razlike u frekventiranosti nisu odveć značajne jer krivulja nije zamjetno ''izbočena''.

2000]. kumulantom.000. primjerice..000. 3500 itd. +∞〉 najmanju stopu aktivnosti.ELEKTROTEHNIČKI ODJEL Poslovna statistika Na gornjoj su slici prikazana dva poligona relativnih frekvencija koja predočuju stope aktivnosti pojedinih dobnih razreda.000. 〈2000. 〈3000. Primjer poligona frekvencija (kvantitativno obilježje čiji su modaliteti grupirani u prave razrede) Razredi u koje su grupirani iznosi prosječne mjesečne plaće su 〈1000. 11000] čija je apsolutna frekvencija 0. Pokušajte navesti još neke zaključke koji se mogu izvesti iz navedenoga grafikona. Možemo zaključiti da najviše zaposlenika promatrane tvrtke ima plaću izme u 1. a otvoreni razred [65. 2500. Uočimo da bi najprimjereniji površinski analogon prikazanoga linijskoga grafikona bio Paretov dijagram (apsolutne frekvencije su poredane od najveće do najmanje) iako bi se promatrana razdioba mogla prikazati i histogramom. a odgovarajuće razredne sredine su 1500.00 kn. 34] ima najveću stopu aktivnosti (tj. Bojan Kovačić. Ovaj je grafikon zapravo svojerstan linijski analogon strukturnih stupaca. predavač 58 . postotni udio radne snage u odnosu na radno sposobno stanovništvo je najveći za promatrani razred). a najmanje izme u 9. 3000]. © mr. 1000] i 〈10000.00 i 2. a mi ćemo ga ilustrirati na razdiobi iz Primjera 16.00 kn.sc. Iz njega. 4000] itd. Praktično crtanje kumulante u pravokutnom koordinatnom sustavu u ravnini ovisi o tipu obilježja (diskretno ili kontinuirano). Da se (zajedno osi apscisa) dobije zatvorena poligonalna crta.00 i 10. a posebno za muškarce. Kumulativni niz apsolutnih (ili relativnih) frekvencija ''manje od'' uobičajeno se grafički prikazuje linijskim grafikonom tzv. ''umjetno'' su dodani razredi 〈0. možemo očitati da za oba spola nominalni razred [30.000. i to posebno za žene. Primjer 17.

Primjer kumulante (kvantitativno obilježje čiji su modaliteti grupirani u prave razrede) Kumulanta se crta tako da se donjoj granici prvoga razreda (u našem je slučaju to 1000) pridruži frekvencija 0 (na taj smo način dobili točku (1000. Primjer 19. Primjer točkastoga grafikona – dijagram točaka (razdioba statističkoga skupa prema jednom obilježju) U matematici se pod pojmom glatka krivulja podrazumijeva graf bilo koje neprekidno diferencijabilne funkcije. Primjer grafa koji sadrži ''šiljke'' je bilo koji poligon frekvencija. …. pa je iz tih razloga ovdje i ne navodimo. 2. riječ je o grafu koji ne sadrži niti jedan ''šiljak''. te se sve tako dobivene točke spoje glatkom53 krivuljom.5. 4000. iako teorijski ima smisla. Napomenimo da se. 53 © mr. Bojan Kovačić. 3000.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 18. predavač 59 . 10000) pridruži odgovarajuća kumulativna apsolutna frekvencija ''manje od''.4.sc. Potom se svakoj od gornjih granica razreda (to su 2000. kumulanta niza ''veće od'' u praksi vrlo rijetko koristi. Ostale vrste grafikona Budući da ćemo se u ovom kolegiju susretati isključivo s površinskim i linijskim grafikonima. Grubo govoreći. ostale vrste grafikona dajemo samo pregledno bez detaljnijih opisa i analiza. 0)).

sc. a iz njega je lako očitati mod dobivenoga statističkoga niza. Iako ovaj primjer to ne daje naslutiti. Primjer točkastoga grafikona – dijagram točaka (razdioba statističkoga skupa prema trima obilježjima) 54 55 Slučajni pokus je jedan od osnovnih pojmova teorije vjerojatnosti. tj. a time i matematičke statistike. © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika Iznad svakoga pojedinoga modaliteta broj točaka označava odgovarajuću apsolutnu frekvenciju.55 Primjer 20. Razdiobu u kojoj imamo točno dvije najčešće vrijednosti nazivamo bimodalna razdioba. u dobivenom statističkom nizu svaka od znamenaka pojavit će se (približno) jednako često. Ovdje prikazani dijagram točaka označava razdiobu rezultata ukupno 50 slučajnih pokusa54 izbor jedne dekadske znamenke. zakon velikih brojeva (jedan od najznačajnijih poučaka teorije vjerojatnosti) tvrdi da će u slučaju vrlo velikoga broja provedenih slučajnih pokusa (pod istim uvjetima) dobivene apsolutne frekvencije znamenaka biti približno jednake. predavač 60 . tj. Bojan Kovačić. U promatranom slučaju imamo dvije takve znamenke: 7 i 9. najčešću znamenku koja se pojavila kao rezultat slučajnoga pokusa.

prosječna plaća i prosječan broj tjednih radnih sati. ali i da najviše rade. dok su težaci najslabije plaćeni za svoj rad unatoč većem broju tjednih radnih sati. ta se činjenica kod točkastih grafikona može zanemariti (kod površinskih i linijskih se ta činjenica ne smije zanemariti).ELEKTROTEHNIČKI ODJEL Poslovna statistika Na istom grafikonu prikazana je podjela svog radno aktivnog stanovništva odre ene regije prema trima obilježjima: vrsta posla kojim se bave. predavač 61 . nego prema prosječnim plaćama. Primjer točkastoga grafikona – dijagram rasipanja (dijagram raspršenja. tj.sc. 56 © mr. poglavlju. promatrano stanovništvo se više razlikuje prema tjednom radnom vremenu. Uočimo da dva kvantitativna obilježja nemaju istu mjernu jedinicu. Iz prikazanoga grafikona se može zaključiti da su menadžeri najbolje plaćeni. može se zaključiti da je varijabilitet prosječnih plaća manji od varijabiliteta prosječnih tjednih radnih sati. no.56 Primjer 21. oblak raspršenja) Navedena usporedba varijabiliteta obično se utvr uje na temelju koeficijenata varijacije o kojima ćemo više reći u 4. Bojan Kovačić. Tako er.

odnosno uzorku toga skupa). Bojan Kovačić. tj. pa detalje ovdje izostavljamo. 57 © mr. Primjer dijagrama točaka – struktura sadašnjega saziva Hrvatskoga sabora Primjer 23.ELEKTROTEHNIČKI ODJEL Poslovna statistika O dijagramu rasipanja više ćemo govoriti u poglavlju 4. Ovdje istaknimo samo da se ovakva vrsta grafikona uobičajeno koristi prigodom utvr ivanja korelacije dvaju kvantitativnih obilježja. Ovdje se već na prvi pogled zbog ''raspršenosti'' točaka po grafikonu može naslutiti da na promatranom uzorku ne postoji statistički značajna veza izme u iznosa mjesečnoga džeparca učenika i njihove tjelesne mase. prigodom ispitivanja postoji li statistički značajna veza me u promatranim kvantitativnim obilježjima (definiranih na istom statističkom skupu. nego se iz njihova položaja i oblika točastoga grafikona nastoje izvući zaključci o jačini i smjeru veze me u promatranim obilježjima. Točke se ne spajaju nikakvim krivuljama. Primjer kartograma57 – statistička karta Najpoznatiji tipovi kartograma su piktogram i statistička karta. no. Primjer 22.sc. oni se koriste isključivo u zemljopisu za grafički prikaz nominalnih prostornih obilježja. predavač 62 .

pa se zato naziva i mjera središnje (centralne) tendencije.sc. Pod pojmom prosjek zapravo se podrazumijeva aritmetička sredina.1. © mr. odnosno prosječne vrijednosti. i to su tzv. Srednje vrijednosti numeričkih nizova U praksi se vrlo često javlja problem kvalitetnoga reprezentiranja velikih nizova podataka kvalitativnih ili kvantitativnih obilježja vezanih za relativno velike statističke skupove (npr. U pravilu je riječ o vrijednosti oko koje se ''gomila'' većina podataka numeričkog niza. predavač 63 . srednje vrijednosti. 58 U svakodnevnom se životu pojam srednje vrijednosti vrlo često pogrešno zamjenjuje s pojmom prosjeka. Što je više podataka ''nagomilano'' oko pojedine srednje vrijednosti.ELEKTROTEHNIČKI ODJEL Poslovna statistika 3. I dok je u slučaju kvalitativnih obilježja najbolji mogući rezultat tablični ili grafički prikaz podataka. njezina će reprezentativnost biti bolja. cjelokupno stanovništvo nekoga grada/županije/države). OSNOVNE KARAKTERISTIKE NUMERIČKIH NIZOVA 3. za kvantitativna se obilježja uvode posebni numerički pokazatelji. Srednja vrijednost58 je općenito neka realna konstanta čiji je cilj na što reprezentativniji način predočiti niz varijabilnih podataka numeričkog niza. Bojan Kovačić.

1. Zajednička karakteristika svih takvih izračuna jest da su vrijednosti dobivene izračunom iz grupiranih podataka nepreciznije od vrijednosti dobivenih izračunom iz negrupiranih podataka. pa u njihovu izračunu ne sudjeluju svi elementi numeričkoga niza. postoje brojni primjeri numeričkih nizova takvi da aritmetička sredina nije dovoljno dobar reprezentant svakoga od tih nizova. dok se beskonačni nizovi promatraju u matematičkoj statistici.sc. niz može biti konačan (ako je prirodno područje definicije odgovarajuće funkcije konačan podskup skupa N) i beskonačan (ako je prirodno područje definicije odgovarajuće funkcije cijeli skup N). Bojan Kovačić. Njihova je vrijednost odre ena položajem unutar numeričkog niza. U praksi se ovo pravilo često vrlo neopravdano zanemaruje. srednje vrijednosti dijelimo na potpune i položajne srednje vrijednosti. a prilično je upitno proglašavati je i najvažnijom srednjom vrijednošću. onda se aritmetička sredina definira kao jednaki dio totala po jednom elementu niza. To praktično 59 Jedan tipičan primjer takvoga niza je niz mjesečnih plaća svih zaposlenika na (ne)odre eno vrijeme u našoj zemlji. geometrijska sredina. predavač 64 .1. 3. geometrijsku sredinu i harmonijsku sredinu.59 U izračunu pojedine srednje vrijednosti mogu se pojaviti svi članovi numeričkoga niza ili samo dio tih članova. medijan i mod. harmonijska sredina. kako ćemo vidjeti. U izračunu tih vrijednosti koriste se svi elementi numeričkoga niza. uzima aritmetička sredina. 60 Ovdje namjerno naglašavamo riječ konačan jer se u matematici niz (u bilo kojem skupu S) definira kao funkcija sa skupa prirodnih brojeva N u skup S. naročito ako su podaci grupirani u razrede relativno velikih širina. © mr. Definiramo li total kao zbroj svih elemenata konačnoga60 numeričkoga niza. Vrlo je važno istaknuti da je primjena svake pojedine vrste srednje vrijednosti odre ena karakterom (svojstvima) promatranoga kvantitativnoga obilježja. Sukladno tome.ELEKTROTEHNIČKI ODJEL Poslovna statistika Osnovne vrste srednjih vrijednosti su aritmetička sredina. E(x)) je najraširenija i najčešće korištena srednja vrijednost. pa ne postoji ''univerzalna'' srednja vrijednost koja će dovoljno reprezentativno opisati bilo koji numerički niz podataka. x . U položajne srednje vrijednosti ubrajamo medijan i mod. Zaključno uvodno istaknimo da svaku od navedenih srednjih vrijednosti možemo računati iz negrupiranih (''sirovih'') i grupiranih podataka. U deskriptivnoj se statistici promatraju isključivo konačni nizovi. Takav je pristup potpuno pogrešan jer. zbog relativno jednostavnoga načina izračuna. Sukladno tome. U potpune srednje vrijednosti ubrajamo aritmetičku sredinu. Aritmetička sredina Aritmetička sredina (oznake: X . pa se za spomenutu ''univerzalnu'' srednju vrijednost.

8 + 1.875. 1. 4 + 1. 1. Postoji nekoliko različitih vrsta aritmetičkih sredina.875.849.) godini iznosi približno 1.8 Izračunajmo Smiljkovu prosječnu mjesečnu neto-plaću u prošloj godini: 1.849. 4 + 1. 7375 ≈ 1.4.5. Uporabljujući ovakvu rečenicu mi niz od ukupno 12 numeričkih vrijednosti zamjenjujemo jednom jedinom vrijednošću: 1.850. 1. 1..ELEKTROTEHNIČKI ODJEL Poslovna statistika znači da se aritmetička sredina dobije tako da se total podijeli s ukupnim brojem elemenata numeričkoga niza.850. odnosno.862. 1.810.4. opisuje li dobivena vrijednost dovoljno dobro niz podataka kojega zamjenjuje.25.850.8 + = 1. govorimo o vaganoj ili ponderiranoj aritmetičkoj sredini. Bojan Kovačić. 4 + 12 1.5. preciznije.850.5 + 1.875.8. 1. Odgovor ćemo moći djelomično dati nakon iskazivanja općih svojstava bilo koje aritmetičke sredine.862.25. x2.25. predavač 65 .8 + 1.875.862.74 kn.. 25 + 1. Za njezino je izračunavanje potrebno zadati konačan niz negrupiranih numeričkih podataka x1. n Primjer 1. 1.25 + 1. Smiljkova prosječna mjesečna neto–plaća u prošloj (2007. 25 +1.810. xn.849.810. Najpoznatija i najraširenija je jednostavna aritmetička sredina. 1.) godini: 1. + xn .850. 1.849.8. Stoga se prirodno postavlja pitanje ''uspješnosti'' takve zamjene.5. …. 1.5 + 1.810. a potpuno nakon definiranja mjera raspršenja (disperzije) u sljedećem poglavlju.862.4.850. 1. Pri izračunu vagane aritmetičke sredine razlikujemo slučajeve kad modaliteti kvantitativnoga obilježja nisu grupirani u razrede i kad su modaliteti kvantitativnoga obilježja grupirani u razrede.875.810.5 + 1.74 kn.862.862. 74 12 X= Dakle. Tada se jednostavna aritmetička sredina računa pomoću formule: X= ∑x i =1 n i n = x1 + x2 + .875. U prvom slučaju zapravo se radi o ''skrivenoj'' jednostavnoj aritmetičkoj sredini jer grupiranje podataka isključivo prema modalitetima nije ništa drugo nego ''skraćeni'' (tablični) zapis © mr.sc. Ukoliko se aritmetička sredina računa iz grupiranih podataka. Zadan je numerički niz Smiljkovih mjesečnih neto–plaća (iskazanih u kn) u prošloj (2007.810.

. + f k ∑fx i =1 k k i i ∑f i =1 i Često se kaže da u izrazima ovoga oblika apsolutne frekvencije imaju ulogu pondera ili težine pojedinoga modaliteta. x2.95 . 17 dvojki. …. 25 trojki..ELEKTROTEHNIČKI ODJEL Poslovna statistika numeričkoga niza. Budući da nam je bitno lakše umjesto ukupno 99 operacija zbrajanja izvršiti 6 operacija množenja i 4 operacije zbrajanja. f2.) prema broju položenih jednosemestralnih kolegija: broj položenih jednosemestralnih kolegija broj studenata 0 7 1 12 2 17 3 25 4 21 5 18 ukupno: 100 izvor: studentska služba Više uzaludne škole u Špičkovini Navedena tablica zapravo zamjenjuje niz od 100 numeričkih podataka koji se sastoji od 7 nula. 12 jedinica. 100 100 © mr. pa otuda i naziv odgovarajuće aritmetičke sredine. …. Bojan Kovačić.sc.. xk me usobno različiti modaliteti kvantitativnoga obilježja. ako su x1.. onda se vagana aritmetička sredina računa pomoću izraza f x + f x + . fk njima odgovarajuće apsolutne frekvencije. prosječan broj položenih jednosemestralnih ispita računamo kao vaganu aritmetičku sredinu: X= ∑fx i =1 6 6 i i ∑f i =1 = i 7 ⋅ 0 + 12 ⋅ 1 + 17 ⋅ 2 + 25 ⋅ 3 + 21 ⋅ 4 + 18 ⋅ 5 295 = = 2. Primjer 2. a f1. Formalno. godine studija smjehologije na Višoj uzaludnoj školi u Špičkovini (akademska godina 2007/2008. Zadana je razdioba svih studenata 1. 21 četvorke i 18 petica. predavač 66 . + f k xk X= 1 1 2 2 = f1 + f 2 + .

glasi: Svaki od promatranih studenata položio je prosječno 3 jednosemestralna kolegija. …. x2. b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje odgovore. umjesto. a ne svih 100.00. pretpostavimo da su relativne frekvencije iskazane u postotcima. pa odredite njegov opseg i odgovarajući osnovni skup. a p1. xn.sc. 61 Strogo formalna interpretacija. sukladno definiciji aritmetičke sredine. Odmah primijetimo da je točno 3 jednosemestralna kolegija uistinu položilo točno 25 studenata. …. ako su x1. Aritmetička sredina može se računati i ukoliko su. Bojan Kovačić. ali mogu biti iskazane i kao proporcije (decimalni zapisi omjera apsolutne frekvencije modaliteta i totala). Zadatak 1. prostorno i vremenski. ….ELEKTROTEHNIČKI ODJEL Poslovna statistika Dobiveni rezultat obično interpretiramo ovako: Prosječan broj položenih jednosemestralnih kolegija po jednom studentu približno iznosi 3. Formalno. pk ovdje su razlomci s nazivnikom 100. p2. pk njima odgovarajuće relativne frekvencije iskazane u postotcima62.61 Ovdje treba pripaziti i na red riječi u rečenici: prilog prosječno uvijek dolazi neposredno ispred veličine na koju se odnosi.. a sintagma prosječan student obično znači student čiji je prosjek ocjena približno 3. onda se vagana aritmetička sredina računa pomoću izraza X = p1 x1 + p2 x2 + . apsolutnih zadane odgovarajuće (''obične'') relativne frekvencije. x2. 62 Relativne frekvencije p1. Podaci o broju djece u svakoj obitelji iz mjesta Svinjarevci u veljači 2008. predavač 67 . + pk xk = ∑ pi xi . u interpretacijama se obično primjenjuje zamjena izraza ''svaki element nekoga skupa X ima svojstvo S'' izrazom ''svi elementi skupa X imaju svojstvo S''. pa je u ovakvim slučajevima nužno izračunati dodatne pokazatelje reprezentativnosti aritmetičke sredine. ….. Stoga je pogrešno reći: Svi promatrani studenti prosječno su položili 3 jednosemestralna kolegija ili Prosječan promatrani student položio je 3 jednosemestralna kolegija jer sintagma prosječno položiti obično znači položiti s ocjenom dobar(3). No. 63 Čitatelji upoznati s osnovama diskretne teorije vjerojatnosti odmah će uočiti da je navedeni izraz zapravo definicija matematičkoga očekivanja diskretne slučajne varijable koja poprima vrijednosti x1. a) Definirajte statistički skup iz prethodnoga primjera pojmovno. godine obra eni su i grafički prikazani strukturnim krugom. xk me usobno različiti modaliteti kvantitativnoga obilježja. Primjer 3.63 i =1 k Ilustrirajmo primjenu ove formule na sljedećem primjeru. Radi jednostavnosti. © mr.

ali da praktično dolazi do višemanje značajnih odstupanja nastalih uslijed približnih izračuna relativnih frekvencija.11 100 100 Dobiveni rezultat možemo objasniti ovako: Prosječan broj djece po jednoj (promatranoj) obitelji jednak je 2. pa odredite pripadni osnovni skup. Zadatak 2.ELEKTROTEHNIČKI ODJEL Poslovna statistika Na temelju navedenih podataka možemo izračunati prosječan broj djece po jednoj obitelji iz promatranoga mjesta: X= ∑px i =1 7 i i 100 = 16 ⋅ 0 + 18 ⋅ 1 + 28 ⋅ 2 + 23 ⋅ 3 + 9 ⋅ 4 + 4 ⋅ 5 + 2 ⋅ 6 211 = = 2. Prosječna (promatrana) obitelj ima dvoje djece (kako to često čine u javnim medijima!). Opet treba pripaziti i na red riječi u rečenici jer je pogrešno reći npr. predavač 68 . spomenuto odstupanje bit će manje. Što je približni izračun relativnih frekvencija točniji. prostorno i vremenski. Spomenimo još da vagana aritmetička sredina dobivena iz relativnih frekvencija teorijski mora biti identički jednaka jednostavnoj aritmetičkoj sredini. b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje odgovore. a) Definirajte statistički skup u prethodnom primjeru pojmovno. Bojan Kovačić.sc. pa se u © mr.

2 69 . Procijenit ćemo da spomenuta gornja granica jednaka 70.8 50 – 65 19.6 Prigodom računanja aritmetičke sredine iz podataka grupiranih u prave razrede. razredna sredina prvoga razreda je s1 = © mr. jednostavna aritmetička sredina identički mora biti jednaka vaganoj aritmetičkoj sredini. U slučajevima poput netom razmotrenih. pa dobivenoj vrijednosti kao ponder pridružiti odgovarajujuću apsolutnu frekvenciju.2 65 – (70) 0. predavač 15 + 25 = 20 . Da bismo mogli izračunati aritmetičku sredinu i u ovom slučaju. tj.ELEKTROTEHNIČKI ODJEL Poslovna statistika ovakvim slučajevima preporučuje izračunavati relativne frekvencije na najmanje 5 decimalnih mjesta. Objasnimo nastajanje tih razlika na konkretnom primjeru. U slučaju obilježja navršene godine starosti prave granice se dobiju izjednačavanjem gornje granice prethodnoga razreda s donjom granicom tekućega razreda : navršene godine starosti broj nezaposlenih [000] 15 – 25 25. u pravilu. Upravo na ovom mjestu nastaju spomenute razlike izme u jednostavne i vagane aritmetičke sredine: različite podatke grupirane u isti razred zamjenjujemo istim podatkom.2 25 – 49 75.6 ≥ 65 izvor: mjesečno statističko izvješće Državnoga zavoda za statistiku Republike Ljenčarije. ali ''uloge'' modaliteta x1. Zadana je razdioba svih nezaposlenih državljana Republike Ljenčarije u veljači 2008. Točnije. dolazi do razlika koje. zadane nominalne granice razreda trebamo pretvoriti u prave. Konkretno. Bojan Kovačić. ukoliko podatke grupiramo u razrede. a ne o ukupnom broju razreda. dakle. ovise o veličini (širini) pojedinih razreda. za svaki pojedini razred trebamo izračunati njegovu razredu sredinu.sc. No. x2. xk preuzimaju razredne sredine. godine prema dobi navršene godine starosti broj nezaposlenih [000] 15 – 24 25. …. ulogu ponderâ (težinâ) i dalje imaju apsolutne frekvencije. te procijeniti gornju granicu posljednjega (otvorenoga) razreda. ožujak 2008.2 25 – 50 75. Primjer 4. razrednom sredinom.8 50 – 64 19.2 0.

64 Iznimka''koja potvr uje pravilo'' su nizovi podataka s ekstremno velikim ili ekstremno malim vrijednostima. 65 Prigodom izračuna aritmetičke sredine ''mjernu jedinicu'' apsolutnih frekvencija (000) možemo zanemariti. pa ne možemo govoriti o stvarnoj. nego isključivo o procijenjenoj aritmetičkoj sredini). vagana aritmetička sredina izračunata iz podataka grupiranih u razrede je u pravilu lošiji reprezentant promatranoga statističkoga skupa od jednostavne aritmetičke sredine.2 ⋅ 20 + 75. nego pri njezinu izračunu rabimo originalne podatke.2 65 – (70) 67.2 + 75. pa prigodom dijeljenja dolazi do njezinoga kraćenja.sc. Bojan Kovačić.5 75. Prosječan nezaposleni državljanin Republike Ljenčarije ima navršenih 37 godina ili neku sličnu ''mudroliju'').5 4491 = ≈ 37.5 + 19. 20. Razlog tome je što se ista jedinica pojavljuje i u brojniku i u nazivniku odgovarajućega razlomka. predavač 70 .8 + 19.8 50 – 65 57. a time i donekle poboljšati reprezentativnost aritmetičke sredine. Budući da takvu zamjenu ne provodimo kod izračuna jednostavne aritmetičke sredine.2 + 0.8 ⋅ 37. ne moramo računati s tisućama. te zamijenivši originalne podatke razrednim sredinama (u svakom od tih slučajeva smo napravili odre enu pogrešku. Ovdje obavezno moramo navesti riječ procijenjena jer smo navedeni rezultat dobili koristeći procjenu gornje granice posljednjega razreda.6 120.5 19.ELEKTROTEHNIČKI ODJEL Poslovna statistika pa u daljnjem izračunu niz od 25 200 podataka iz prvoga razreda me u kojima sigurno ima me usobno različitih (jer inače grupiranje u razrede nema smisla) zamjenjujemo nizom od 25 200 me usobno jednakih podataka i svaki od tih novih podataka jednak je razrednoj sredini prvoga razreda. © mr. Grupiranjem takvih nizova u razrede i zamjenom originalnih podataka razrednom sredinom moguće je znatno smanjiti razliku izme u pojedinih ekstremno velikih vrijednosti i ostalih vrijednosti skupa.177 25.6 ⋅ 67.2 25 – 50 37.2 ⋅ 57.5 0.64 Izračunom razrednih sredina dobivamo: navršene godine starosti razredna sredina broj nezaposlenih [000] 15 – 25 20 25. tj.8 Dobiveni rezultat možemo interpretirati ovako: Procijenjeni prosjek navršenih godina starosti promatranih državljana približno je jednak 37 (pogrešno je reći npr.6 pa je vagana aritmetička sredina izračunata iz podataka grupiranih u razrede65: X= ∑ f ⋅s i i =1 4 i ∑f i =1 4 = i 25.5 + 0. tj.

pa će se u nazivniku odgovarajućega razlomka naći broj 100. Njihov je zbroj jednak 100. b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje odgovore. predavač 71 . c) U koliko su razreda podijeljeni dobiveni podaci? Za svaki od njih odredite donju granicu.2 ukupno: 100 © mr. Državni zavod za statistiku. a kao gornju granicu posljednjega razreda uzmimo 60. umjesto apsolutnih.ELEKTROTEHNIČKI ODJEL Poslovna statistika Zadatak 3.4 18. Primjer 5. Kao donju granicu prvoga razreda uzmimo 10. prostorno i vremenski. Zadana je struktura žena – ovisnica o drogama liječenih u zdravstvenim ustanovama u Republici Hrvatskoj tijekom 2005. Za izračunavanje aritmetičke sredine iz grupiranih podataka.0 25.8 14. U takvom slučaju razredne sredine imaju ulogu modaliteta. a) Definirajte statistički skup iz prethodnoga primjera pojmovno. Nominalne granice pretvorimo u prave izjednačavanjem gornje granice prethodnoga razreda s donjom granicom tekućega razreda: navršene godine starosti struktura [%] (10) – 15 0.5 15 – 20 12.2 ≥ 40 ukupno: 100 izvor: ''Žene i muškarci u Republici Hrvatskoj u 2007.5 12. 2008. Bojan Kovačić. gornju granicu i veličinu. možemo koristiti i relativne frekvencije.0 2.1 27. godine prema navršenim godinama starosti: navršene godine starosti ≤ 14 15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 struktura [%] 0.0 25 – 30 25.0 40 – (60) 2. Radi jednostavnosti pretpostavit ćemo da su relativne frekvencije već iskazane u postotcima.4 35 – 40 18.sc.1 20 – 25 27. Procijenimo prosječnu navršenu dob svih promatranih žena. Ilustrirajmo to primjerom. godini“. a relativne frekvencije ulogu pondera (težina).8 30 – 35 14. pa odredite njegov opseg.

5 25.4 35 – 40 37.5 15 – 20 17.5 + 2.5 + 18 ⋅ 37.2006.0 25 – 30 27.5 12. Bez poznavanja navedenih vrijednosti izračun aritmetičke sredine aritmetičkih sredina je praktički besmislen.5 + 12.5 27.2 ukupno: 100 Procijenjena aritmetička sredina izračunata iz grupiranih podataka je: X= ∑ p ⋅s i i =1 7 i 100 2788 = = 27. U takvim slučajevima treba poznavati apsolutne ili relativne frekvencije odgovarajućih modaliteta66. aritmetičku sredinu aritmetičkih sredina.5 14. Bojan Kovačić. i njihovim prosječnim mjesečnim neto– plaćama u razdoblju od 01.8 30 – 35 32.0 40 – (60) 50 2. Ulogu pondera (težina) u ovom slučaju imaju zadane aritmetičke sredine.).2006. Pokažimo to na primjeru: Primjer 6. pa prije izračuna procijenjene aritmetičke sredine najprije moramo izračunati odgovarajuće razredne sredine (si): navršene godine starosti razredna sredina struktura [%] (10) – 15 12.5 + 14.5 0.2 ⋅ 50 = 100 Dobiveni rezultat možemo interpretirati ovako: Procijenjena prosječna dob svih promatranih žena je približno jednaka 28 godina (pogrešno je npr. tj. reći: Prosječna žena – ovisnica o drogama ima navršenu dob od 28 godina i sl.5 18.01.4 ⋅ 32. do 31.sc.5 + 27 ⋅ 22. predavač 72 .2006. Zadani su podaci o ukupnom broju zaposlenih u Republici Hrvatskoj u području financijskoga posredovanja na dan 31.3. 66 Zadavanje navedenih vrijednosti je nužan uvjet za izračun prosječne vrijednosti svih podataka.88 100 = 0. © mr.8 ⋅ 27.ELEKTROTEHNIČKI ODJEL Poslovna statistika Kako smo već istakli. u praksi se često javlja slučaj kad treba izračunati ''prosjek prosjeka''. u ovakvim slučajevima razredne sredine shvaćamo kao modalitete. Naposljetku. a relativne frekvencije (iskazane u postotcima) kao pondere (težine).1 20 – 25 22.1 ⋅ 17. Zbroj svih relativnih frekvencija uvijek je jednak 100.3.5 ⋅ 12.5 + 25.

Zagreb.00 izvor: Statistički ljetopis Republike Hrvatske za 2006. (problem školskih ocjena) Kako smo već ranije istakli. izračunati aritmetičku sredinu aritmetičkih sredina neto–plaća.00 214. godinu.616. 2007.505.sc.505. dakle.ELEKTROTEHNIČKI ODJEL Poslovna statistika vrsta djelatnosti financijsko posredovanje osim osiguranja i mirovinskih fondova osiguranje i mirovinski fondovi osim obveznoga osiguranja pomoćne djelatnosti u financijskom posredovanju ukupno: broj zaposlenih prosječna mjesečna neto – plaća [kn] 25 310 6 077 1 763 33 150 6. pa odredite njegov opseg. procijenjena prosječna mjesečna neto – plaća svih promatranih zaposlenika u navedenom razdoblju iznosi 6.00 + 1763 ⋅ 4. b) Prema kojemu je obilježju podijeljen zadani statistički skup? U koju grupu obilježja pripada i uz koju je skalu izražavanja modaliteta vezano to obilježje? Objasnite svoje odgovore.00 4. Riječ procijenjena ovdje navodimo zato jer ne znamo metodologiju izračuna zadanih prosječnih mjesečnih neto–plaća: moguće je da su one izračunate iz originalnih podataka. dok iznosi prosječnih neto–plaća imaju ulogu modaliteta.617. ali je isto tako moguće da su izračunate i iz podataka grupiranih u razrede. Stoga je aritmetička sredina aritmetičkih sredina neto–plaća jednaka X= ∑ f ⋅x i i =1 3 i ∑f i =1 3 = i 25310 ⋅ 6.480. Zadatak 4. Brojevi zaposlenih su apsolutne frekvencije i one imaju uobičajenu ulogu pondera (težine). a) Definirajte statistički skup iz prethodnoga primjera pojmovno.816.444. pa se nad njima ne mogu provoditi osnovne računske operacije.616. Procijenimo prosječnu mjesečnu neto–plaću svih promatranih zaposlenika u navedenom razdoblju.14 kn. Stoga je u interpretaciji primjereno koristiti riječ procijenjena neovisno o tome što je moguće da je dobivena vrijednost ujedno i stvarna prosječna mjesečna netoplaća promatranih zaposlenika. predavač 73 . No.00 6. Trebamo. u praksi se u © mr. školske ocjene su primjer kvalitativnoga redosljednoga obilježja i vezane su uz redosljednu skalu izražavanja modaliteta.444. prostorno i vremenski. Primjer 7.14 25310 + 6077 + 1763 33150 Prema tome. Bojan Kovačić.00 + 6077 ⋅ 6. Državni zavod za statistiku.00 = ≈ 6.480.

pa – budući da je na skupu prirodnih brojeva definirana operacija zbrajanja – možemo računati aritmetičku sredinu dobivenoga numeričkoga niza i zaokružiti je na najbliži prirodan broj. ocjeni ''dobar'' prirodan broj 3. Svojstvo 1. Svojstvo 5. dobivamo spomenutu prosječnu ocjenu. ocjeni ''vrlo dobar'' prirodan broj 4 i ocjeni ''izvrstan'' prirodan broj 5. tj. (jedinstvenost) Svaki numerički niz ima točno jednu aritmetičku sredinu. ''očitavanjem'' kojoj je ocjeni pridružen taj prirodan broj. Aritmetička sredina može poslužiti za usporedbu dvaju ili više numeričkih nizova nastalih grupiranjem prema istom kvantitativnom obilježju. Opisani postupak kodiranja i dekodiranja je vrlo čest u statistici. svakoj ocjeni bijektivno pridružujemo točno jedan prirodan broj: ocjeni ''nedovoljan'' pridružujemo prirodan broj 1. To osobito znaju učenici koji muče muku s ''ispravljanjem ocjena''. Alternativni načini opisivanja takvih podataka u slučaju redosljednih obilježja mogu biti i odre ivanje moda ili medijana69. a primjenjuje se u slučajevima kad je niz kvalitativnih podataka potrebno (dovoljno reprezentativno) opisati točno jednim podatkom. Svojstvo 4. 70 Statističke pokazatelje ''finijih'' procjena reprezentativnosti aritmetičke sredine navodimo u sljedećem poglavlju. Aritmetička sredina se uvijek nalazi izme u najmanje (xmin) i najveće (xmax) vrijednosti numeričkoga niza. uopće nema smisla. Svojstvo 2. Jedno od osnovnih svojstava aritmetičke sredine68 je da se ona nalazi izme u najmanje i najveće vrijednosti u numeričkom nizu. vrijede nejednakosti: 67 Napomenimo da se prosječna ocjena praktično ne računa ukoliko je barem jedan element odgovarajućega kvalitativnoga niza jednak ''nedovoljan''. na sljedećoj stranici. © mr. U čemu se zapravo sastoji ovaj prividni paradoks? Prigodom odre ivanja (pogrešno: računanja!) prosječne ocjene67 mi zapravo kodiramo svaku pojedinu ocjenu. Na taj način kvalitativni niz ocjena bijektivno preslikavamo u numerički niz prirodnih brojeva. tj. (potpunost) Pri izračunu aritmetičke sredine niza numeričkih podataka obuhvaćene su sve vrijednosti numeričkoga niza.ELEKTROTEHNIČKI ODJEL Poslovna statistika brojnim slučajevima odre uje prosječna ocjena ili prosjek ocjena (kao zbroj svih ocjena podijeljen s njihovim ukupnim brojem) iako ta veličina. prema dosad iskazanoj statističkoj teoriji. tj. Svojstvo 3. predavač 74 . Dekodiranjem dobivenoga prirodnoga broja. 68 Vidjeti svojstvo 5. a to u ovom slučaju znači da je riječ o jednom od prirodnih brojeva izme u 1 i 5. 69 Navedeni se načini u školstvu ipak ne primjenjuju unatoč činjenici da bi cjelokupna učenička populacija nesumnjivo zdušno podržala da zaključna ocjena iz nekoga predmeta bude mod niza pozitivnih ocjena pojedinih područja iz dotičnoga predmeta. Na kraju ove točke navodimo osnovna svojstva aritmetičke sredine koja uvelike mogu koristiti pri gruboj procjeni70 je li izračunata aritmetička sredina dobar reprezentant numeričkoga niza. ocjeni ''dovoljan'' prirodan broj 2.sc. Svaka razdioba u kojoj su vrijednosti obilježja pridružene elementima skupa na temelju intervalne ili omjerne skale ima aritmetičku sredinu. Bojan Kovačić.

) Svojstvo 9. x2. a osobito kada nije moguće objektivno procijeniti nepoznate granice otvorenih razreda. Bojan Kovačić. Svojstvo 8. Aritmetička sredina izračunata na temelju razdiobe frekvencija u kojoj su modaliteti obilježja predstavljeni razredima uvijek sadrži pogrešku budući da izračunata razredna sredina.sc. n vrijedi xi > 0. 73 Stvarna razredna sredina je aritmetička sredina svih numeričkih podataka koji pripadaju dotičnom razredu. Svojstvo 10. vrijede sljedeće jednakosti: ∑ (x − X ) = 0 i i =1 n ∑ f ⋅ (x − X ) = 0 i i i =1 n Svojstvo 7. Svojstvo 6. Problem reprezentativnosti aritmetičke sredine dodatno je izražen u slučaju kada razdioba frekvencija sadrži barem jedan otvoren razred. godišnje) plaće svih registriranih djelatnika neke zemlje. Aritmetička je sredina jedina srednja vrijednost takva da je zbroj odstupanja svih elemenata numeričkoga niza od nje uvijek jednak nuli.1. (svojstvo minimuma zbroja kvadrata) Neka je x1. ….71 Točnije. nego isključivo na jednostavnu aritmetičku sredinu ili aritmetičku sredinu izračunatu iz podataka grupiranih prema modalitetima (za koju smo već utvrdili da je zapravo identički jednaka jednostavnoj aritmetičkoj sredini). x2. xk zadani numerički niz podataka. 72 Dijeljenjem navedene minimalne vrijednosti ukupnim brojem elemenata numeričkoga niza dobiva se varijanca niza i ona se često neprecizno objašnjava kao prosječno kvadratno odstupanje od aritmetičke sredine. xn konačan numerički niz takav da za svaki i = 1. Tada realna funkcija f(x) = ∑ ( x − x) i i =1 n 2 poprima minimalnu vrijednost za x = X . …. navedeni zbroj kvadrata poprima minimalnu vrijednost72 kad je vrijednost varijable x jednaka aritmetičkoj sredini elemenata zadanoga niza. O varijanci ćemo više reći u sljedećem poglavlju. Geometrijska sredina Neka je x1. korištena za izračun vagane aritmetičke sredine. Geometrijska sredina (oznaka: G) je srednja vrijednost koja se dobije kao n-ti korijen iz Iz samoga iskaza svojstva vidljivo je da se ono ne odnosi na aritmetičku sredinu izračunatu iz podataka grupiranih u razrede. 71 © mr. 2. …. (Ovo se svojstvo vrlo neopravdano zanemaruje pri izračunu prosječne (mjesečne. predstavlja samo približnu zamjenu stvarne razredne sredine73 nekoga razreda. Aritmetička sredina nije dobar reprezentant numeričkoga niza ukoliko u numeričkom nizu postoje ekstremno male ili velike vrijednosti promatranoga kvantitativnoga obilježja. tj.2. 3.ELEKTROTEHNIČKI ODJEL Poslovna statistika xmin ≤ X ≤ xmax. predavač 75 .

605171085. …. Ukoliko je barem jedan član numeričkoga niza najviše jednak nuli. Za negrupirane podatke geometrijsku sredinu računamo prema formuli: G = n x1 ⋅ x2 ⋅ .. Geometrijska sredina niza 1.2008.. tj. Bojan Kovačić. broj članova domaćinstva broj studenata 2 25 3 20 4 30 5 15 6 10 ukupno: 100 Geometrijska sredina zadane razdiobe jednaka je G = 100 225 ⋅ 320 ⋅ 430 ⋅ 515 ⋅ 610 ≈ 3. Pretpostavimo sada da su podaci grupirani... približno jednak © mr. n označimo s fi apsolutnu frekvenciju modaliteta xi.3.sc. U promatranim primjerima osnovni je problem uobičajeno interpretirati. godine stručnoga studija računovodstva i financija na Veleučilištu u Piškorevcima dana 20. …. jednom studentu iz Primjera 2. Primjer 2. xn. 2. Primjer 1. Zadana je razdioba studenata 1.. x2. da imamo ukupno n različitih modaliteta x1. Drugim riječima.6.419482401.ELEKTROTEHNIČKI ODJEL Poslovna statistika umnoška svih članova niza. 2. predavač 76 bio što dobiveni rezultat nismo mogli smo reći da je prosječna vrijednost svih a prosječan broj članova domaćinstva po 3. 4. ⋅ x f1 1 f2 2 fn n = ∑ fi i =1 n n ∏x i =1 i fi .. geometrijska se sredina takvoga niza ne definira.. 3.. prema broju članova domaćinstva u kojemu žive. ⋅ xn . Za svaki i = 1. ali te bismo interpretacije uobičajeno . 5 jednaka je G = 5 1⋅ 2 ⋅ 3 ⋅ 4 ⋅ 5 ≈ 2. približno jednaka 2. Tada je vagana (ponderirana) geometrijska sredina izračunata iz grupiranih podataka dana izrazom G= ∑ fi i=1 n x ⋅ x ⋅ . mogli članova niza u Primjeru 1.

mjesečna plaća. © mr. pa je u takvim slučajevima prosječna promjena pojave u jedinici vremena jednaka razlici geometrijske sredine niza 100 + p1. ….. Njihovim izjednačavanjem i sre ivanjem dobivenoga izraza dobiva se   p   p   p   p = 100 ⋅  n  1 + 1  ⋅ 1 + 2  ⋅ . ⋅  1 + m  − 1 . 100 + p2. ⋅  1 + m   100   100   100  n Lijeve strane tih jednakosti su jednake. ⋅ (100 + pn ) − 100 ..  100     100   100    U slučaju kad je ukupan broj promjena (m) jednak ukupnom broju razdoblja (n) gornju jednakost možemo zapisati u obliku p = n (100 + p1 ) ⋅ (100 + p2 ) ⋅ . 100 + pn i broja 100. pa takve moraju biti i desne strane..76 74 75 Takva situacija pripada u analizu vremenskih nizova. broj stanovnika) tijekom razdoblja od ukupno n vremenskih jedinica promijenila ukupno m puta. promatramo sljedeći opći problem: Problem: Neka se pojava (npr... p2. Odredimo prosječnu promjenu p promatrane pojave u jednoj vremenskoj jedinici. …. pm i pretpostavimo da su iskazane u postotcima.sc. Koristeći formulu za sukcesivnu promjenu osnovne svote75 dobivamo da istodobno moraju vrijediti sljedeće jednakosti:  p  Cn = C0 ⋅  1 +   100  p  p   p    Cn = C0 ⋅  1 + 1  ⋅  1 + 2  ⋅ . predavač 77 . Stoga se nameće pitanje u kojim situacijama geometrijsku sredinu možemo točno interpretirati kao prosječnu vrijednost neke pojave.ELEKTROTEHNIČKI ODJEL Poslovna statistika shvaćali kao interpretacije aritmetičke sredine zbog već istaknutoga uobičajenoga poistovjećivanja pojma prosjek s aritmetičkom sredinom. cijena. Tipična takva situacija je računanje prosječne promjene cijena u nekom promatranom razdoblju74.. Označimo te promjene s p1. o čemu ćemo više reći u posebnom poglavlju. Točnije. Preporučuje se ponoviti gradivo postotnoga računa od sto iz kolegija Gospodarska matematika. Bojan Kovačić. Odgovor: Neka je C0 početna vrijednost pojave. a Cn njezina vrijednost na kraju razdoblja od n vremenskih jedinica.

5   = 100 ⋅   1 +  ⋅ 1 +  ⋅ 1 +  ⋅ 1 +  − 1 100   100     100   100     ≈ 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Ilustrirajmo netom provedeno razmatranje na primjerima.5.2% i naposljetku povećana za još 1.7%.7. p3 = –0. 76 © mr. potom je povećana za daljnjih 0.5. 2 2 ali ne i aritmetičkoj sredini svih četiriju promjena koja iznosi pa = 0.5%. a predznak – označava da je riječ o sniženju cijene. kako pokazuje sljedeći primjer.5 + 0.5 = 0. …. nije aritmetička sredina promatranih promjena jer zbroj svih članova numeričkoga niza ne dijelimo ukupnim brojem tih članova.2 i p4 = +1.625.2) + 1.25 77. Odredimo prosječnu mjesečnu promjenu cijene loživoga ulja. a ukupan broj promjena cijena m = 4. Brojevi 100 + p1.5 = = 1.7   −0. Te promjene iznose redom p1 = +0.) Tražena prosječna promjena jednaka je   p   p   p   p   p = 100 ⋅   1 + 1  ⋅  1 + 2  ⋅  1 + 3  ⋅  1 + 4  − 1 =   100   100   100   100       0.5   0. 100 + pn u praksi se nazivaju verižni (lančani) indeksi. Cijena loživoga ulja se u minula dva mjeseca mijenjala točno četiri puta: najprije je povećana za 0. 77 Navedeni približni izraz.7 + ( −0.sc.5%. Bojan Kovačić.5. Jedinično vremensko razdoblje je 1 mjesec.2) + 1.5 + 0. zbog relativno male razlike izme u navedenih numeričkih vrijednosti. O njima ćemo nešto više reći u točki 5. (Predznak + označava da je riječ o povećanju cijene. predavač 78 . razlika izme u aritmetičke i geometrijske sredine je bitno izraženija. 4 No. Primjer 3.250239 Uočimo da je.2   1. navedena prosječna promjena približno jednaka p≈ ∑p i =1 m i n = p1 + p2 + p3 + p4 0. naravno. pa je snižena za 0. pa je ukupan broj jediničnih razdoblja n = 2. p2 = +0.7 + ( −0.1. u slučajevima kad izme u numeričkih vrijednosti promjena postoje veće razlike.

Taj zaključak.92 €. Provjerimo dobivena razmatranja uzimajući da je početna cijena četvornoga metra zemljišta 100.91933 . No. p2 = –50 u formulu za prosječnu promjenu cijene dobivamo da je ta promjena jednaka p = (100 + 100) ⋅ (100 − 50) − 100 = 0. Netom provedena razmatranja u praksi treba provoditi vrlo oprezno jer je njihov temeljni nedostatak činjenica da prigodom izračuna prosječne promjene zapravo uzimaju u obzir jedino početnu i konačnu vrijednost pojave.91933% dobit ćemo najprije 154. izračunom pomoću navedene formule za prosječnu promjenu dobivamo: p = (100 + 100) ⋅ (100 + 20) − 100 ≈ 54. Odredimo prosječnu godišnju promjenu cijene četvornoga metra toga zemljišta. dobili bismo: pa = 100 + 20 = 60 . što je za 16 € (ili 6. Iz navedenih podataka vidimo da su numeričke vrijednosti promjena p1 = +100 i p2 = +20. ukoliko cijenu od 100. a potom cijenu od 240.sc. a potom 256. me utim. Cijena četvornoga metra (''kvadrata'') zemljišta u Lokvama u protekle je dvije godine najprije udvostručena. Ukoliko bismo traženu prosječnu godišnju promjenu računali kao jednostavnu aritmetičku sredinu (što je i formalno ispravno jer imamo dvije promjene u dvije godine). Cijena automobila ''Ficho'' u protekle se dvije godine mijenjala dva puta: najprije je udvostručena.00 €. očito nedovoljno reprezentativno opisuje navedeno kretanje cijena automobila jer smo u promatrane dvije godine imali ukupno dvije različite promjene: jedno povećanje i jedno sniženje. dobit ćemo najprije 160. a potom ''prepolovljena'' (snižena za 50%).00 €. predavač 79 . a nakon drugoga 240. Ukoliko cijenu od 100. što ponekad može dovesti do potpuno pogrešnih zaključaka. Početna cijena je tada očito jednaka krajnjoj. što je i stvarna krajnja cijena. Tada je cijena nakon prvoga povećanja 200.00 €.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 4. ali ne i njezine me uvrijednosti.00 €. otkuda slijedi da se u prosjeku cijena automobila godišnje nije mijenjala (pogrešno je reći: prosječna cijena automobila se godišnje nije mijenjala!).00 € povećavamo dva puta po 54.00 €.67%) više od stvarne krajnje cijene zemljišta. Aritmetička sredina je još lošiji pokazatelj: © mr. a potom povećana za još 20%. 2 pa bismo zaključili da se promatrana cijena povećavala za prosječno 60% godišnje.00 € povećavamo dva puta po 60%. pa uvrštavanjem p1 = +100. Bojan Kovačić. Pogledajmo to na primjeru. Primjer 5. pa zaključujemo da se promatrana cijena povećavala za prosječno (približno) 55% godišnje.00 €. No.

. Primjer 1. …. 1 1 1 + + 2 3 6 Pretpostavimo sada da su podaci grupirani. + x1 x2 xn n 1 ∑x i =1 i n . Tada je vagana (ponderirana) harmonijska sredina izračunata iz grupiranih podataka dana izrazom Iako se od čitanja naglas ove definicije može zapetljati jezik. …. predavač 80 . …. 78 © mr. x2. Harmonijska sredina Neka je x1.3.1. Stoga sve vrste sredina treba primjenjivati oprezno i uz dodatne statističke analize. xn. da imamo ukupno n različitih modaliteta x1. navedena je definicija uistinu jedina potpuno ispravna definicija harmonijske sredine.. 2. a nikako ''šablonski'' i prema nekom automatizmu. 2. ….ELEKTROTEHNIČKI ODJEL Poslovna statistika pa = 100 + (−50) = 25 . 3. Za numeričke nizove kojima je barem jedan član najviše jednak nuli harmonijska sredina se ne definira. 6. Sukladno navedenoj definiciji. što je u suprotnosti s točnom činjenicom da je početna cijena automobila jednaka njegovoj krajnjoj cijeni. n označimo s fi apsolutnu frekvenciju modaliteta xi. 2 pa bismo zaključili da se cijena automobila prosječno povećavala za 25% godišnje. 3. Ona je jednaka H= 3 = 3. harmonijska sredina negrupiranih numeričkih podataka računa se iz izraza: H= n = 1 1 1 + + . n vrijedi nejednakost xi > 0. x2.sc. Za svaki i = 1. xn konačan numerički niz podataka takav da za svaki i = 1. Odredimo harmonijsku sredinu niza 2. Harmonijska sredina (oznaka: H) navedenoga numeričkoga niza definira se kao recipročna vrijednost aritmetičke sredine recipročnih vrijednosti svih elemenata niza. Bojan Kovačić.78. tj.

Odredimo harmonijsku sredinu za razdiobu iz Primjera 2.: broj članova domaćinstva broj studenata 2 25 3 20 4 30 5 15 6 10 ukupno: 100 Ona je jednaka H= ∑f i =1 5 5 i f ∑ xi i =1 i = 100 150 = ≈ 3.2. ni ovdje interpretacije Prosječna vrijednost svih članova niza 2. + f n = fn f1 f 2 + + . 3. + x1 x2 xn ∑f i =1 n n i f ∑ xi i =1 i . predavač 81 . Četiri radnika rade istovrstan posao.19149 . ali bez naznake o kojoj se srednjoj vrijednosti radi. svaki nestatistički nastrojen homo sapiens odmah bi pomislio da je riječ o interpretaciji aritmetičke sredine. te prosječan broj izra enih proizvoda po jednoj osmosatnoj radnoj smjeni.1. U nastavku dajemo dva primjera takvih problema.. Primjer 1. Bojan Kovačić. © mr. 25 20 30 15 10 47 + + + + 2 3 4 5 6 Kao ni u slučaju geometrijske sredine.79 Zbog toga hamonijsku sredinu koristimo prigodom rješavanja problema u kojima se pojavljuju obrnuto razmjerne veličine.. U četiri sata prvi je radnik izradio 48 komada proizvoda.. Odredimo prosječno vrijeme izrade jednoga proizvoda za sve radnike zajedno. treći 96 komada.ELEKTROTEHNIČKI ODJEL Poslovna statistika H= f1 + f 2 + . 79 Prilikom čitanja ovih dviju interpretacija.sc. 6 jednaka je 3 i Prosječan broj članova domaćinstva po jednom studentu približno je jednak 3 ne zvuče kao prirodne interpretacije harmonijske sredine.. Primjer 2. ali različitim brzinama. u točki 3. a četvrti 120 komada. drugi 80 komada.

Za navedeno vrijeme t prvi će radnik proizvesti t t t t ukupno proizvoda. Bojan Kovačić. .ELEKTROTEHNIČKI ODJEL Poslovna statistika Za izradu jednoga proizvoda prvi radnik utroši t1 = t3 = 4 1 4 1 sati. drugi proizvoda. Taj broj treba biti jednak 4. niza . tj. a četvrti t4 = = sati. t4. drugi t2 = = 48 12 80 20 4 1 4 1 = sati. Prema definiciji harmonijske sredine. odavde izravno slijedi da je traženo prosječno vrijeme izrade jednoga proizvoda za sva četiri radnika zajedno jednako harmonijskoj sredini niza t1. . pa 1 1 1 1 12 20 24 30 t t t t će sva četvorica u vremenu t proizvesti ukupno + + + = 1 1 1 1 12 20 24 30    1 1 1 1  t⋅  + + + proizvoda. = = = 1 1 1 1 12 + 20 + 24 + 30 86 43 + + + 1 1 1 1 12 20 24 30 ∑t i =1 n 1 i © mr.sc. treći proizvoda. treći = sati. : 12 20 24 30 H= n = 4 4 4 2 radna sata. pa dobivamo jednadžbu 1 1 1 1     12 20 24 30     1 1 1 1  t⋅  + + + =4 1 1 1   1   12 20 24 30  iz koje je t= 4 1 1 1 1 + + + 1 1 1 1 12 20 24 30 . 1 1 1 1 t2. a četvrti proizvoda. Mi tražimo vrijeme t za koje će četvorica 96 24 120 30 radnika proizvesti ukupno 4 proizvoda. predavač 82 . t3.

Odatle izravno slijedi da će za 8 radnih sati 43 43 43 43 43 8 promatrana četvorica radnika proizvesti prosječno = 172 proizvoda.00 35 jug 295. dok je prosječna prodajna cijena jednaka količniku vrijednosti prodaje i ukupnoga broja prodanih proizvoda. Podsjetimo se.00 25 središnja regija 300. godine. drugi prosječno 43 = proizvoda. 2 43 Primjer 2. a strukture vrijednosti prodaje kao pondere (težine): © mr. U donjoj su tablici navedeni podaci o prosječnoj prodajnoj cijeni udžbenika iz Poslovne statistike autora Statha Isticka tijekom 2007. a četvrti 1 1 43 43 20 24 2 60 2 prosječno 43 = proizvoda. Za sata prvi će radnik proizvesti prosječno 43 2 43 = 24 1 43 12 2 2 40 48 proizvoda.ELEKTROTEHNIČKI ODJEL Poslovna statistika 2 Provjerimo dobiveni rezultat.sc. Budući da su postoci vrijednosti prodaje upravno razmjerni vrijednostima prodaje svakoga pojedinoga područja. predavač 83 . Bojan Kovačić. te strukturi vrijednosti prodaje u trima prodajnim područjima prodajno prosječna prodajna cijena struktura vrijednosti područje [kn] prodaje [%] sjever 290. vrijednost prodaje jednaka je umnošku ukupnoga broja prodanih proizvoda i cijene jednoga proizvoda. traženu prosječnu prodajnu cijenu izračunat ćemo kao vaganu harmonijsku sredinu shvaćajući prosječne prodajne cijene kao modalitete.00 40 Odredimo prosječnu prodajnu cijenu za sva tri prodajna područja zajedno. treći prosječno 43 = proizvoda. Stoga će sva četvorica radnika za sata proizvesti prosječno 1 43 43 30 24 40 48 60 172 + + + = = 4 proizvoda.

SSS možemo zapisati kao ure eni niz SSS. VSS ili kao ure eni niz VSS. ako su A. …. VSS. geometrijska i harmonijska sredina istoga numeričkoga niza. U daljnjem. te promatramo isključivo tako ure ene konačne nizove. 14. n. VSS. Sn tako da vrijede sljedeća svojstva: © mr. ako je ak = c. 8. b) Niz kvalitativnih redosljednih modaliteta SSS. SSS. …. SSS. …. VŠS. 20 ili kao ure eni niz 20. VŠS. VŠS. Znakovi jednakosti vrijede ako i samo ako je odgovarajući numerički niz konstantan.ELEKTROTEHNIČKI ODJEL Poslovna statistika H= ∑p ∑ i =1 i =1 3 3 i pi xi = 25 + 35 + 40 ≈ 295. radi odre enosti. 10. 5. x2. 14. S2. VŠS. VŠS. VSS. …. x2. xm niz modaliteta kvantitativnoga ili kvalitativnoga redosljednoga obilježja. Svaki takav niz možemo urediti tako da podatke ili poredamo po veličini (od najmanjega do najvećega ili obrnuto) ako je riječ o modalitetima kvantitativnoga obilježja ili poredamo prema stupnjevima intenziteta mjerenoga svojstva ako je riječ o modalitetima kvalitativnoga redosljednoga obilježja. +∞〉 i za svaki k = 1. VŠS. 45 kn. Bojan Kovačić. 8. 2. 7. VŠS. 20. predavač 84 . tj. 5. 10. Na taj način dobivamo ure eni niz podataka. Primjer 1. tj. pretpostavljamo da je konačan niz kvantitativnih. VSS. SSS. onda vrijedi nejednakost H ≤ G ≤ A. od najmanjega (najlošijega) prema najvećemu (najboljemu). 7.4. xm) podijeliti na n ure enih podskupova S1. VSS. Problem koji ćemo razmatrati jest: Problem 1: Zadani ure eni konačan niz podijeliti na jednakobrojne dijelove zadržavajući pritom svojstvo ure enosti niza. SSS. VSS. SSS.sc. tj. VŠS. 7.1. G i H redom aritmetička. Formalnije i preciznije. VSS. 25 35 40 + + 290 300 295 Zaključno istaknimo da me u trima sredinama numeričkoga niza vrijedi poznata A – G – H nejednakost. 14. 8 možemo zapisati kao ure eni niz 5. odnosno kvalitativnih redosljednih modaliteta ure en uzlazno. za neki strogo pozitivan realan broj c ∈ 〈0. SSS. ure eni skup S = (x1. 3. a) Niz kvantitativnih modaliteta 10. VŠS. Kvantili Neka je x1.

ELEKTROTEHNIČKI ODJEL Poslovna statistika 1.sc. Navedenu uniju dobijemo tako da svaki od podskupova najprije shvatimo kao ''običan'' skup. Sukladno gore navedenim uvjetima. tj. tj. Uočimo da skupovi S1 i S2 imaju zajednički element 2. podijelimo na tri jednakobrojna dijela. Primjer 2. Taj zahtjev je namjerno izostavljen jer dozvoljavamo mogućnost da se isti član niza pojavi u dva uzastopna podskupa. Sukladno uvjetima problema. Bojan Kovačić. napravimo uobičajenu operaciju unije skupova uz dozvoljeno ponavljanje elemenata. S2. Lako se vidi da je jedina mogućnost takve podjele S1 = (1. može se pokazati da iz uvjeta 1. Sada tražimo tri ure ena podskupa S1. Odmah primijetimo da u postavci navedenoga problema nema uobičajenoga zahtjeva da skupovi na koje dijelimo polazni ure eni skup nemaju niti jedan zajednički element.) slijedi nejednakost n ≤ m. 2) i S2 = (3. ekvivalentno. Sn imaju najviše jedan zajednički element. n svaki element skupova S1. tj. 4). Tražimo dva ure ena podskupa S1 i S2 ure enoga skupa S = (1.) svaka dva uzastopna člana niza S1. 2. 4). 4 na dva jednakobrojna dijela. ure eni niz iz Primjera 1. da su me usobno disjunktni. a potom uredimo dobiveni skup. ….). svi podskupovi S1. skupovi S2 i S3 zajednički element 3. te da njihova unija daje skup S. unija80 svih ure enih podskupova treba biti jednaka polaznom ure enom skupu. 2. te da unija svih triju ure enih skupova daje skup S. da skupovi S1 i S2 imaju najviše jedan zajednički element. ….) ∪S i =1 i = S1 ∪ S2 ∪ … ∪ Sn = S. Formalno se ne navodi niti bilo kakva veza izme u brojeva m i n.) i 4. 80 © mr.) card(S1) = card(S2) = … = card(Sn). Sn imaju jednako mnogo elemenata. dok skupovi S1 i S3 nemaju zajedničkih elemenata. 3. n 4. 3.) za svaki i = 2. predavač 85 . no. Primjer 3. dok nesusjedni članovi niza nemaju niti jedan zajednički element. 3. Ona se intuitivno može objasniti kao činjenica da ure eni skup od m elemenata možemo podijeliti na najviše m dijelova tako da svi dijelovi imaju jednako mnogo elemenata. podijelimo ure eni niz 1. 2). Nije teško vidjeti da je jedina mogućnost takve podjele S1 = (1. 4) takva da svaki element skupa S1 nije veći od svakoga elementa skupa S2. 3. za svaki x ∈ ∪ S k i svaki y ∈ Si vrijedi nejednakost x ≤ y. 3) i S3 = (3. … Si i −1 k =1 – 1 nije veći od svakoga elementa skupa Si ili. S2 i S3 takva da svaki element skupa S1 nije veći od svakoga elementa skupa S2 i svaki element skupa S2 nije veći od svakoga elementa skupa S3. S2. S2 = (2. …. 2.

82 Upravo navedenu formulu koristi MS Excel prigodom izračuna vrijednosti pojedinih percentila. 99. čime se gubi na preciznosti (i istinitosti) interpretacije. i to prigodom proučavanja svojstava kumulativne funkcije distribucije slučajne varijable81. P3. točna definicija p – kvantila mora preinačiti. © mr. Bojan Kovačić. P2. P99. 2. 81 U matematičkoj je statistici slučajna varijabla bilo koja realna funkcija čije je područje definicije odre eni vjerojatnosni prostor. Približna formula za izračun k – toga percentila Pk za ure eni niz x1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 4. Percentili ili centili su položajne vrijednosti koje ure eni niz dijele na ukupno 100 jednakobrojnih dijelova. (per)centil i njega opisujemo u nastavku. 2.82 (Približna i matematički neprecizna!) 100 Interpretacija k – toga percentila Pk obično je jedna od sljedećih interpretacija: – prvih k% članova niza ima vrijednost manju ili jednaku Pk. 98. 2) i S2 = (2. x2. predavač 86 . a vjerojatnost da je vrijednost slučajne varijable X strogo veća od x jednaka najviše 1 – p. 3). Netom razmatrani problem poopćuje se u matematičkoj statistici. …. Sukladno uvjetima problema. P98. gdje je c cijeli. Uočimo da skupovi S1 i S2 imaju zajednički element 2. za k = 1. …. …. Kvantili su vrlo značajni i u deskriptivnoj statistici. U ovom se slučaju dobiva S1 = (1. Ondje se Problem 1. Nerijetko se (opet približno točno i matematički neprecizno) kaže i da k – ti percentil Pk odvaja k% najmanjih članova niza. Može se pokazati da tražena vrijednost x uistinu postoji i da je jedinstvena.sc. xm dana je s: Pk = xc + 1 + d ⋅ (xc + 2 – xc + 1). Ima ih ukupno 100 – 1 = 99 i označavaju se s P1. ali njihov osnovni nedostatak je nemogućnost točne interpretacije: deskriptivna statistika ''ne poznaje'' termin slučajna varijabla. odnosno (100 – k)% najvećih članova niza. Ovdje je spominjemo isključivo u kontekstu definiranja kvantila. ure eni niz 1. pa se gornja. – (100 – k)% članova niza ima vrijednost veću ili jednaku Pk. Približni deskriptivni ''ekvivalent'' p – kvantila je tzv. 3 podijelimo na dva jednakobrojna dijela. a d decimalni dio broja k ⋅ (m – 1). 1〉 odredi vrijednost x takva da je vjerojatnost da je vrijednost slučajne varijable X strogo manja od x jednaka najviše p. te se ona naziva p–kvantil. svodi na to da se za zadanu slučajnu varijablu X i zadani realan broj p ∈ 〈0.

© mr. približno 57 zaposlenika ima barem 8 godina navršenoga radnoga staža. predavač 87 . – 70% promatranih zaposlenika visoko je barem 170. – 70% promatranih zaposlenika visoko je barem 171 cm. navedene interpretacije zapravo znače da: približno 3 zaposlenika promatrane tvrtke imaju najviše 7 godina navršenoga radnoga staža.66 Dobivenu vrijednost možemo interpretirati na jedan od sljedećih dvaju načina: – 30% promatranih učenika visoko je najviše 170.). točno 3.o'' iz Klokočevca i odgovarajućim izračunom dobivena je vrijednost P5 = 7.sc. – 95% promatranih zaposlenika ima barem 7.o.25 godina navršenoga radnoga staža.25 godina navršenoga radnoga staža. Zbog toga je u ovakvim interpretacijama bolje izbjegavati navo enje konkretnih apsolutnih frekvencija. U ovom je slučaju obilježje ''visina'' kvantitativno diskretno obilježje (jer zanemarujemo milimetre. Odmah istaknimo da ovdje prilog ''približno'' ne znači da npr. pa navedene interpretacije možemo preformulirati ovako: – 30% promatranih učenika visoko je najviše 170 cm.25 Dobivenu vrijednost možemo interpretirati na jedan od sljedećih dvaju načina: – 5% promatranih zaposlenika ima najviše 7.a razreda Osnovne škole ''Štefica Šniclek'' iz Careva Sela i odgovarajućim izračunom dobivena je vrijednost P30 = 170.14 zaposlenika ima najviše 7 godina navršenoga staža (pa smo taj broj zaokružili na najbliži cijeli broj).66 cm. Prikupljanjem podataka o visinama (iskazanima kao cijeli broj cm) za ukupno 30 učenika 8. mikrometre itd. Bojan Kovačić.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 5. Greška je bitno veća: moguće je da točno 2 zaposlenika ili točno 4 zaposlenika promatrane tvrtke imaju najviše 7 godina navršenoga radnoga staža. Budući da znamo ukupan broj zaposlenih (60). Prikupljanjem podataka o navršenim godinama radnoga staža za ukupno 60 zaposlenika tvrtke ''Mućkalić – commerce d.66 cm. Primjer 6.

9 vrijedi jednakost Di = P10 ⋅ i koja.25 Riječ je o 4. budući da znamo ukupan broj učenika. Ovo vrlo korisno svojstvo omogućuje da se interpretacija svakoga decila poistovjeti s interpretacijom njemu odgovarajućega percentila.25.ELEKTROTEHNIČKI ODJEL Poslovna statistika Kao i u Primjeru 5. 2.o. Bojan Kovačić.. Prikupljanjem podataka o stupnju stručne spreme (uz uobičajeno rangiranje stupnjeva stručnih sprema) za svakoga zaposlenika tvrtke ''Pijetlović d. D9. koji su kolegij Poslovna statistika polagali putem dvaju kolokvija i odgovarajućim izračunom dobivena je vrijednost D4 = 1. decilu. tvrdi da je i – ti decil identički jednak (10 ⋅ i) – tom percentilu. Nije teško vidjeti da za svaki i = 1. Budući da da dobivanje ocjene 1 znači da kolokviji nisu položeni. – 60% promatranih studenata dobilo je ocjenu barem 1. …. Primjer 8. Decili su vrijednosti koje ure eni niz modaliteta dijele na 10 jednakobrojnih dijelova. U praksi se vrlo često koriste dvije posebne vrste percentila: decili i kvartili. zapravo. pa je opet primjerenije izostaviti interpretaciju s apsolutnim frekvencijama.sc. Me utim. …. Stoga dobivenu vrijednost možemo teorijski interpretirati na jedan od sljedećih dvaju načina: – 40% promatranih studenata dobilo je ocjenu najviše 1.o.'' i odgovarajućim izračunom dobivena je vrijednost © mr. …. Prikupljanjem podataka o ostvarenom uspjehu (1 – nedovoljan. godine stručnoga studija računovodstva i financija Veleučilišta u Špičkovini akademske godine 2006/2007. 5 – izvrstan) svih studenata 1. Ima ih ukupno 10 – 1 = 9 i označavaju se s D1.25. a toj vrijednosti odgovara 10 ⋅ 4 = 40. moguće je i da točno 10 promatranih učenika bude visoko najviše 170 cm. D2. Primjer 7. navedene interpretacije možemo preformulirati u sljedeće: – 40% promatranih studenata nije položilo kolegij Poslovna statistika putem kolokvija. – 60% promatranih studenata je položilo kolegij Poslovna statistika putem kolokvija. predavač 88 . dok visina svakoga od preostalih 21 učenika iznosi barem 171 cm. navedene interpretacije zapravo znače da je približno 9 promatranih učenika visoko najviše 170 cm. 8. 2 – dovoljan. percentil.

a imaju svoja posebna imena i oznake: – prvi ili donji kvartil (oznaka: Q1).ELEKTROTEHNIČKI ODJEL Poslovna statistika D8 = VŠS." iz Šuplje Lipe u razdoblju od 01. – 31. Uočimo da se u Primjerima 3. percentil. tvrdi da je i – ti kvartil identički jednak (25 ⋅ i) – tom percentilu. – drugi kvartil ili medijan (oznake: Q2. 3 vrijedi jednakost Qi = P25 ⋅ i koja. zbog postojanja ekstremno malih ili ekstremno velikih vrijednosti. a toj vrijednosti odgovara 10 ⋅ 8 = 80.o.12. Primjer 9. i 4. – treći ili gornji kvartil (oznaka: Q3) Nije teško vidjeti da za svaki i = 1.2007.01. radilo o odre ivanju percentila za niz modaliteta kvalitativnoga redosljednoga obilježja. Me). predavač 89 . Još jedna od spomenutih posebnih vrsta percentila su kvartili.o. Ima ih ukupno 4 – 1 = 3. a poglavito medijan. decilu. Stoga dobivenu vrijednost možemo teorijski interpretirati na jedan od sljedećih dvaju načina: – 80% promatranih zaposlenika ima višu stručnu spremu ili stručnu spremu manju od više stručne spreme. Kvartili su položajne vrijednosti koje ure eni numerički niz dijele na ukupno 4 jednakobrojna dijela. Ovo vrlo korisno svojstvo omogućuje da se interpretacija svakoga kvartila poistovjeti s interpretacijom njemu odgovarajućega percentila.: © mr. – 20% promatranih zaposlenika ima višu stručnu spremu ili stručnu spremu veću od više stručne spreme. U ovom je slučaju ta interpretacija jednostavnija i razumljivija od prve. Bojan Kovačić.2007. Istaknimo da se u slučajevima u kojima. Riječ je o 8. drugu interpretaciju možemo pojednostavniti ovako: 20% promatranih zaposlenika ima višu ili visoku stručnu spremu. aritmetička sredina nije reprezentativan pokazatelj statističkoga niza kao ''zamjenski'' pokazatelji rabe upravo kvartili.sc. Zadan je ure eni niz prosječnih mjesečnih plaća (iskazanima u kn) svih stalno zaposlenih djelatnika poduzeća "Schwindl–trade d. Budući da je jedino visoka stručna sprema veća od više stručne spreme. 2. zapravo.

2.88.64 i 60.090.081.718.248.62.27. 2.718. dok 6 promatranih djelatnika ima prosječnu mjesečnu plaću barem 2.000. negoli aritmetičku sredinu. 3.12).31. (1 djelatnik pripada objema kategorijama. 2.718. predavač 90 .417. očito je da su u ovom slučaju sva tri kvartila bitno reprezentativnije vrijednosti od aritmetičke sredine. Prosječna mjesečna plaća svakoga djelatnika navedene tvrtke iznosi 12.248.000.94 kn. Zbog postojanja ekstremno velikih vrijednosti (50. 50% promatranih djelatnika ima prosječnu mjesečnu plaću najviše 2. (2. – treći ili gornji kvartil: Q3 = 3. 2. 2.95.884.332.45. 2.000.25.95.081.12 kn.45) i (3.12 kn. 1. Odre ivanje pomoću grupiranih podataka zasniva se deskriptivnom analogonu © mr. Stoga je u statističkoj analizi takvih nizova.76.25.sc.248.332. primjerenije odrediti barem jedan kvartil (poželjno: sva tri).852. 2.646.75) u navedenom nizu plaća.947.12) i (2.) To znači da je iznos 2. 25% promatranih djelatnika ima prosječnu mjesečnu plaću veću od 3.83.417.852. 50.085. (2. 2. 50.12.718.27.718.45.76.000.718.090.000.62).718.75 Odgovarajućim izračunima se dobiva: – prvi ili donji kvartil: Q1 = 2.090. – jednostavna aritmetička sredina: X = 12.087.646.75).852. 2. 3.417.83.12 točno rješenje Problema 1.000.12.085. 60. 2.88 kn. I sva tri kvartila su točno rješenje Problema 1. 2. Iz zadanoga ure enoga niza lako možemo vidjeti da točno 6 promatranih djelatnika ima prosječnu mjesečnu plaću najviše 2. pa posebno i sva tri kvartila.18 (kn) – Te vrijednosti možemo redom interpretirati na sljedeći način: – – – – 25% promatranih djelatnika ima prosječnu mjesečnu plaću manju od 2.947. kad god je to moguće.718. 3. 1. 60.64. 2.12.935.27.18 kn.12.087. Bojan Kovačić.646.884. 60.718. Svi percentili.83.31.25. za navedeni niz plaća jer uistinu dijele niz na četiri jednakobrojna dijela: (1.62.64. 3. mogu se odre ivati iz negrupiranih i grupiranih podataka. 3.000.64. 1. 2.76.31. – medijan: Q2 = 2.947. 2.95. za navedeni niz plaća jer uistinu dijeli niz na dva jednakobrojna dijela: (1. 50.75).12 kn.085.718.884.ELEKTROTEHNIČKI ODJEL Poslovna statistika 1.000.

1. a drugi središnji element drugoj frekvenciji kumulativnoga niza. Primjer 10. Aritmetička sredina. i 51. Zadana je razdioba svih studenata 1. Iz stupca u 2 2 83 Usporediti s Primjer 2. tj. © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika funkcije distribucije. Na primjeru ćemo pokazati kako se iz grupiranih podataka odre uje medijan. Može se dogoditi da kod parnoga broja elemenata niza prvi središnji element pripada jednoj. Bojan Kovačić. On ima ukupno 100 članova. točka 3. godine studija smjehologije na Višoj uzaludnoj školi u Špičkovini (akademska godina 2007/2008. U tom slučaju medijan predstavlja aritmetičku sredinu dviju njima odgovarajućih vrijednosti diskretnoga obilježja.) prema broju položenih jednosemestralnih kolegija83: broj položenih jednosemestralnih kolegija broj studenata 0 7 1 12 2 17 3 25 4 21 5 18 ukupno: 100 izvor: studentska služba Više uzaludne škole u Špičkovini Odredimo medijan ovako grupiranoga niza podataka i objasnimo dobiveni rezultat.1.. Stoga se 100 100 njegovi središnji članovi nalaze na mjestima i + 1. a to je kumulativni niz ''manje od'' kojega smo već upoznali. predavač 91 . Na ranije opisani način formiramo kumulativni niz apsolutnih frekvencija ''manje od'': broj položenih jednosemestralnih broj studenata kumulativni niz apsolutnih kolegija (xi) (fi) frekvencija "manje od" 0 7 7 1 12 19 2 17 36 3 25 61 4 21 82 5 18 100 ukupno: 100 Promatrani statistički niz je već ure en uzlazno. na 50. mjestu.sc.

x50 = x51 = = 3. Svojstvo 5. 38. Medijan se nalazi izme u najmanje i najveće vrijednosti obilježja u razdiobi. mod je jedina srednja vrijednost koja se može odrediti i za kvalitativna i za kvantitativna obilježja. Svojstvo 3. pa je medijan jednak 3. Već iz same definicije moda očito je da se on može odrediti neovisno o tipu obilježja. Mod Pri analizi statističkih nizova vrlo često se najprije odre uje najčešći modalitet koji se pojavljuje u nizu (tj. Dakako. Na kraju ove točke dajemo pregled najvažnijih svojstava medijana kao svojevrsnoj položajnoj alternativi aritmetičke sredine: Svojstvo 1.. ure enoga niza napisane ''trojke''. Svojstvo 2. 49. Svojstvo 4. a 50% studenata položilo je najmanje 3 ispita. Detalje. 3. 60. što bi značilo da je 50% studenata položilo najviše 3 ispita.. 51. pa 17 dvojki i 14 trojki. 50. Oprez: Klasična pogreška prigodom interpretacije modova jest interpretiranje najveće apsolutne ili relativne frekvencije kao moda pripadnoga osnovnoga skupa.. To nije točno: mod je isključivo najčešći modalitet statističkoga obilježja. Na vrijednost medijana ne utječu ekstremne vrijednosti obilježja u razdiobi. Prema tome.1. a odre uje se pomoću najveće apsolutne ili relativne frekvencije (za negrupirana obilježja ili obilježja grupirana prema modalitetima). Medijan je srednja vrijednost osobito primjerena za opis izrazito asimetričnih razdioba. 39.. 21 četvorku i 18 petica. dok na preostalih 50 mjesta imamo 11 trojki. Bojan Kovačić...sc. 59. predavač 92 . označava s Mo i pripada u položajne srednje vijednosti. i 61. 52. Ta je interpretacija potpuno točna: na prvih 50 mjesta imamo najprije 7 nula.ELEKTROTEHNIČKI ODJEL Poslovna statistika kojemu su navedene kumulativne frekvencije ''očitavamo'' da su na mjestima 37. modalitet s najvećom apsolutnom ili relativnom frekvencijom). …. nužan uvjet za postojanje moda jest pojavljivanje barem dva jednaka modaliteta u statističkom nizu. Medijan se bez teškoća može odrediti i u razdiobama kod kojih se pojavljuju otvoreni razredi (osim ako je razred kojem pripada medijan otvoren). tj. pa 12 jedinica.. Takav modalitet naziva se mod. (jedinstvenost medijana) U svakoj razdiobi prema kvantitativnomu ili kvalitativnom redosljednom obilježju postoji točno jedan medijan. Na sličan se način iz grupiranih podataka odre uju i preostala dva kvartila. © mr.. ….5. kao i način odre ivanja kvartila iz podataka grupiranih u razrede ovdje izostavljamo.

ako promatrani statistički skup tvore 6 BMWa i dvije ''Opel Corse''. Stoga razlikujemo unimodalne razdiobe (razdiobe koja imaju točno jedan mod). Bojan Kovačić.75. & J. 3. Ta vrijednost dobro opisuje pripadni osnovni skup jer plaće 7 od ukupno 8 djelatnika odstupaju od moda za najviše 1. Primjer 4.47.92. I u ovome je slučaju mod promatranoga niza jednak 1. 2.800.o. onda opis ''Me u promatranim automobilima ima najviše automobila marke BMW'' očito nedovoljno dobro opisuje ''šarolikost'' skupa promatranih automobila.sc.86.224. 5 ima točno tri moda: 1. 7.“ iz Grudnjaka isplaćene u veljači ove godine tvore niz 1. 5.201.800. 10.928. Naime. Neto-plaće (iskazane u kn) svih djelatnika knjigovodstvenoga servisa ''Knjiži kod mene'' iz Košara isplaćene u siječnju ove godine tvore niz 1. Jedno od osnovnih svojstava moda je da ne mora nužno biti jedinstven.00. 3. predavač 93 .00. 1 ''Grand Cherokee''. 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 1. Stoga je taj niz bimodalan. 4.800.125%. Kao i sve ostale srednje vrijednosti. a) Ure eni niz 1.78 i 10.00 kn. Primjer 2. 5.800.800.000. Uočimo da modovi dobro opisuju oba navedena niza jer je u svakom od njih više od polovice elemenata niza jednako nekomu od modova. 2. Analizom dobivenoga osnovnoga skupa utvrdili smo da je mod promatranoga obilježja BMW.806%.o. 4. Mod promatranoga niza je 1. 1 ''Škoda Octavia''.00.25. Promatramo skup svih automobila parkiranih u Ratkajevu prolazu 01. poglavito Paretova grafikona koji kao prvu © mr.800. 30.75. 2. 1. 1.64.800.820.800.800. 2.64. 3. 1. Npr.103. 5. b) Ure eni niz 1.915. 5 ima točno dva moda: 2 i 3. a da su apsolutne frekvencije svih ostalih modaliteta strogo manje od njih. 4. 2. 1. 1 ''Opel Corsa''. 4.800. ali i iz grafičkih prikaza razdioba.00. ako promatrani statistički skup tvore 2 BMW-a. u ovom slučaju on loše opisuje pripadni osnovni skup jer plaće 7 od ukupno 9 djelatnika odstupaju od moda za barem 173. me u svim promatranim automobilima ima najviše automobila marke BMW.04. onda navedena interpretacija prilično dobro opisuje taj skup. 3. 2 i 3.165. no. No.00. 7.50. d. 1 ''Yugo'' i 1 ''Fićo''. 1. 1820.00. Primjer 3. može se dogoditi da barem dva modaliteta imaju jednake apsolutne frekvencije. u 16:30 sati i dijelimo njegove elemente prema obilježju marka automobila. ona ne mora dobro opisivati pripadni osnovni skup. Prema tome. 1. Iako je takva interpretacija potpuno točna.25. Stoga je taj niz multimodalan. 1.54. 3.2008. bimodalne razdiobe (razdiobe koja imaju točno dva moda) i multimodalne razdiobe (razdiobe koje imaju barem tri moda). i modovi se mogu odre ivati iz negrupiranih i grupiranih podataka. Neto–plaće (iskazane u kn) svih djelatnica knjigovodstvenoga servisa '' . 1 ''Mercedes''.).842.00 (interpretacija je ista kao i u Primjeru 2. što znači da je najčešća plaća promatranih djelatnika 1.

9 djelatnika ima prosječnu mjesečnu neto–plaću 3. Ilustrirajmo to na primjeru. Sljedeći je korak analiza reprezentativnosti izračunate srednje vrijednosti. a troje prosječnu mjesečnu neto–plaću 8.o. bez poznavanja originalnih podataka o prosječnim mjesečnim neto–plaćama nameće se zaključak da me u promatranim tvrtkama nema razlika u modalitetima obilježja ''prosječna mjesečna plaća''.00 kn. njezina izlazna vrijednost je prvi mod po veličini. Tvrtka ''Super Silva d. treba istaknuti da su slučajevi u kojima mod dobro opisuje pripadni osnovni skup relativno rijetki. što je očito netočno. Ukoliko uopće postoji mogućnost odre ivanja moda primjenom neke funkcije.000. četvero prosječnu mjesečnu neto-plaću 8.ELEKTROTEHNIČKI ODJEL Poslovna statistika kategoriju na osi Ox navodi upravo modalnu vrijednost. Kako bi se moglo što bolje opisati stupanj varijabilnosti statističkih podataka. Tvrtka ''Super Silvio d. pojednostavljeno rečeno.000. Prosječna mjesečna neto–plaća po zaposleniku u promatranoj tvrtki tako er iznosi 8.'' iz Duhića tako er zapošljava ukupno 10 stalno zaposlenih djelatnika.00 kn. pa time zapravo gubimo mogućnost utvr ivanja je li neki statistički niz unimodalan. Ti pokazatelji gotovo su jednako važni kao i izračunate srednje vrijednosti.00 kn.o. odnosno. Bojan Kovačić.000. Mjere raspršenja (disperzije) Izračun neke od potpunih ili položajnih srednjih vrijednosti predstavlja tek jedan korak u statističkoj analizi nekoga obilježja.o. © mr. MS Excel) je nemogućnost ''ispisa'' svih modova pojedine razdiobe. Sve navedeno samo potvr uje da problem opisa osnovnoga skupa ili statističkoga niza pomoću bilo koje od potpunih ili položajnih vrijednosti nije nimalo trivijalan i da obavezno zahtijeva dodatnu statističku analizu reprezentativnosti odre enih vrijednosti. 3.2. Isključivo na temelju izračunatih prosječnih mjesečnih neto–plaća. O nekim pokazateljima reprezentativnosti govorimo u sljedećoj točki. najmanji ili najveći mod.00 kn. disperzije). bimodalan ili multimodalan.sc.200. tj.00 kn.000. odre ivanje pokazatelja koliko izračunata srednja vrijednost dobro opisuje elemente osnovnoga skupa.800.'' iz Duhova zapošljava ukupno 10 stalno zaposlenih djelatnika.00 kn. Mjere raspršenja općenito mogu biti apsolutne i relativne.000. a jedan djelatnik prosječnu mjesečnu neto–plaću 53. Troje djelatnika ima prosječnu mjesečnu neto–plaću 7.00 kn. jedan od ozbiljnijih nedostataka većine računalnih statističkih potpora (npr. Iako se ova vrijednost vjerojatno odre uje najjednostavnije od svih srednjih vrijednosti. tj. Primjer 1. predavač 94 . Tako er. Stoga prosječna mjesečna neto–plaća po zaposleniku u toj tvrtki iznosi 8.o. definiraju se odgovarajući statistički pokazatelji pod zajedničkim imenom mjere raspršenja (stupnja varijabilnosti.

84 Grubo možemo reći da su te dvije veličine obrnuto razmjerne. Pravilo 2. Ukoliko je promatrano obilježje kvantitativno. Ako se radi o razdiobama različitih obilježja ili istih obilježja s različitim skalama modaliteta. Navedene mjere raspršenja.) Relativne mjere raspršenja obično se izražavaju u postocima. Dakle. kg.ELEKTROTEHNIČKI ODJEL Poslovna statistika Apsolutne mjere raspršenja su raspon varijacije. tj. interkvartil i koeficijent kvartilne devijacije. za usporedbu varijabliteta koriste se relativne mjere raspršenja. interpercentilni razmak. 3. Zajedničko obilježje svih navedenih mjera jest iskazivanje u jedinicama mjere obilježja statističkog skupa (kn. iz nje izvedena standardna devijacija). za analizu raspršenja mogu se koristiti raspon varijacije.sc. srednje apsolutno odstupanje i varijanca (odnosno. pri čemu vrijede sljedeća praktična pravila: Pravilo 1.1. a riječ je o dijagramu rasipanja ili dijagramu raspršenja spomenutom u 2. Ukoliko je promatrano obilježje kvalitativno redosljedno. Odmah napomenimo da izbor mjere raspršenja u pravilu ovisi o mjernim svojstvima statističkih varijabli. Bojan Kovačić. Pomoću mjera raspršenja uspore uju se razlike u varijablitetu barem dviju razdioba. eventualno. cm itd. Grubu sliku (''prvi dojam'') o raspršenosti podataka u osnovnom skupu zorno može predočiti i odgovarajući grafikon. €. Ukoliko se radi o razdiobama prema istim obilježjima (s istom skalom modaliteta). © mr. a dvije najčešće su koeficijent kvartilne devijacije i koeficijent varijacije. Raspon varijacije Raspon varijacije (oznaka: R) je najjednostavnija mjera raspršenja definirana kao razlika izme u najveće (M) i najmanje (m) vrijednosti kvantitativnoga (ili. predavač 95 . dakle. za usporedbu varijabiliteta koriste se apsolutne mjere raspršenja. Manja mjera raspršenja znači bolju reprezentativnost srednje vrijednosti i obrnuto84. shvaćamo kao svojevrsne mjere reprezentativnosti srednjih vrijednosti. ne postoji ''univerzalna'' mjera raspršenja koja bi se mogla primijeniti u svim slučajevima. interkvartil. primjereno je izračunati i interpretirati sve navedene mjere. U nastavku se podrobnije opisuje svaka pojedina mjera raspršenja. poglavlju.2. premda to matematički nije točno. kvalitativnoga redosljednoga) obilježja.

2. pa je procijenjeni raspon varijacije promatranoga obilježja R = M – m = 70 – 15 = 55 (godina). za najmanju vrijednost (m) uzimamo donju granicu prvoga razreda. 2. Uzmemo li da je procijenjena gornja granica posljednjega razreda 70. a za najveću (M) gornju granicu posljednjega razreda. Najveća vrijednost u tome nizu je M = 25.75.598.527. 2.42.02. Uočimo da je posljednji razred otvoren.64.64. Najveća vrijednost u tome nizu je M = 32. 7. do 31.000. Zadana je razdioba svih nezaposlenih državljana Republike Ljenčarije u veljači 2008. Njegov osnovni nedostatak je korištenje točno dvaju elemenata © mr. Navršene godine radnoga staža svih 10 zaposlenika tvrtke ''Super Silva d.01.527.25. 25. Najmanja moguća vrijednost raspona varijacije jednaka je nuli i nastupa u slučajevima kad je odgovarajući niz vrijednosti kvantitativnoga obilježja konstantan. 18.000. 2. a najmanja m = 7.ELEKTROTEHNIČKI ODJEL Poslovna statistika R = M – m. tvore niz 2.sc.75. Bojan Kovačić. Da bismo mogli odrediti raspon varijacije ovoga obilježja.576. godine prema navršenim godinama starosti: navršene godine starosti broj nezaposlenih [000] 15 – 24 25. 29. Osnovna prednost raspona varijacije u praktičnoj primjeni je jednostavnost njegova izračuna.03.8 50 – 64 19. 32. pa njegovu gornju granicu moramo procijeniti sami. Stoga je raspon varijacije vrijednosti promatranoga obilježja R = M – m = 32 – 7 = 25 (godina).584. predavač 96 .o. odnosno interpretacije. 10.2008. Najveća vrijednost raspona varijacije ne može se općenito odrediti.2 25 – 49 75.04.2008.89 (kn). Stoga je raspon varijacije promatranoga obilježja R = M – m = 25. ožujak 2008.64 – 2.2 0. svih 6 zaposlenika knjigovodstvenoga servisa ''Knjiži kod mene'' iz Košara na dan 01.6 ≥ 65 izvor: Mjesečno statističko izvješće Državnoga zavoda za statistiku Republike Ljenčarije.472. 16.2008.75 = 22. Prosječne mjesečne neto–plaće (iskazane u kn) u razdoblju od 01.000. a najmanja m = 2. 12. 17.o.'' tvore niz: 20. Primjer 2.527.528. 8. slijedi da je M = 70 i m = 15. Primjer 4.12. Primjer 3.

ima smisla primijeniti u slučajevima kad promatrani niz podataka ne sadrži ekstremno velike ili ekstremno male vrijednosti jer je u suprotnim slučajevima vrlo nepouzdan (npr. Primjer 6.2.55 (kn).5 – 10. Odatle slijedi da je interkvartil jednak Iq = Q3 – Q1 = 2.17 (kn).540. Bojan Kovačić. raspon varijacije središnjih 50% navršenih godina radnoga staža iznosi 9 godina.sc. bi se moglo pogrešno zaključiti da promatrane prosječne mjesečne plaće jako variraju jer odgovarajući niz sadrži ekstremno veliku vrijednost 25.5.64). Iz dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima manje od 10. kao reprezentativnu mjeru raspršenja.594. interkvartil je. Dakle. zapravo.17 kn.5 = 9 (godina). Primjer 5.594. Prvi (donji) kvartil niza navršenih godina radnoga staža iz Primjera 2. 25% promatranih zaposlenika ima više od 19.55 – 2. jednak je Q1 = 10. jednak je Q1 = 2. ali nije dovoljno precizna mjera za daljnju detaljnu analizu tih objekata. Odatle slijedi da je interkvartil jednak Iq = Q3 – Q1 = 19. predavač 97 . a treći (gornji) kvartil istoga niza Q3 = 2. Stoga ga.540. Još općenitije govoreći. 3. Dakle.2. jednak razlici trećega (gornjega) i prvoga (donjega) kvartila: Iq = Q3 – Q1. raspon varijacije središnjih 50% prosječnih mjesečnih neto–plaća iznosi 54.5 godina radnoga staža. Iz dobivenih vrijednosti slijedi da 25% promatranih zaposlenika ima prosječnu mjesečnu neto– © mr. Interkvartil Interkvartil (oznaka: Iq) je apsolutna mjera raspršenja definirana kao raspon varijacije središnjih 50% elemenata ure enoga niza (kvantitativnih ili kvalitativnih redosljednih) statističkih podataka. u Primjeru 3. a treći (gornji) kvartil istoga niza Q3 = 19. a navršene godine radnoga staža preostalih 50% promatranih zaposlenika su u rasponu od 9 godina.ELEKTROTEHNIČKI ODJEL Poslovna statistika osnovnoga skupa (u slučaju negrupiranih podataka) ili razdiobe (u slučaju grupiranih podataka) u njegovu izračunu.38 (kn).5 godina radnoga staža. raspon varijacije može se iskoristiti za ''grubi'' opis osnovnoga skupa ili statističkoga niza. Prvi (donji) kvartil niza prosječnih mjesečnih neto–plaća iz Primjera 3.38 = 54.5 (godina). Ekvivalentno rečeno.000.

Obično se interpretira kao raspon varijacije središnjih85 (l – k)% elemenata ure enoga statističkoga niza. zanemarujući ostalih 97 percentila.3. pa u izračunu interkvartila ne sudjeluju svi elementi niza.2.ELEKTROTEHNIČKI ODJEL Poslovna statistika plaću manju od 2. Izraz središnjih posljedica je činjenice da percentili Pk i Pl . predavač 98 .594.17 kn. drugi (''središnji'') dio tvore podaci smješteni izme u Pk i Pl.38 kn. Osnovna prednost interkvartila u odnosu na raspon varijacije je zanemarivanje ekstremno malih ili ekstremno velikih vrijednosti u statističkom nizu. 85 © mr. interdecilni razmak (razlika bilo kojih dvaju decila). No. a treći (''gornji'') dio tvori (100 – l)% podataka većih ili jednakih Pl. pa je bilo koji interpercentil uvijek nenegativan realan broj. 25% promatranih zaposlenika ima prosječnu mjesečnu neto– plaću veću od 2. dobivamo tzv. Posebno. kao i za raspon varijacije.55 kn. Za bilo koja dva prirodna broja k. općenito nejednaka.sc. dijele ure eni statistički niz na 3. Bojan Kovačić. 3. za k = 25 i l = 75 dobivamo interkvartil. za izračun interkvartila koriste se točno dvije položajne vrijednosti u statističkom nizu.540. dijela: prvi (''donji'') dio tvori k% podataka manji ili jednak Pk. a ako su oba broja k i l djeljiva s 10. Zbog toga se ta mjera raspršenja smatra nepotpunom. Interpercentilni razmak Interkvartil je poseban slučaj tzv. Praktično se brojevi k i l obično biraju tako da vrijedi jednakost k + l = 100 jer se na taj način ''odvaja'' jednak postotak ''najlošijih'' i ''najboljih'' elemenata niza. interpercentila. čime se dobiva točniji opis većine elemenata niza. Prema definiciji percentila vrijedi ekvivalencija (k ≤ l ) ⇔ (Pk ≤ Pl). a preostalih 50% promatranih zaposlenika ima prosječnu mjesečnu neto–plaću u rasponu od 54. l ∈ N takva da vrijedi nejednakost 0 < k ≤ l < 100 interpercentil je razlika l – toga i k – toga percentila: I Pl − Pk = Pl – Pk.

Varijanca i standardna devijacija Varijanca i iz nje izvedena standardna devijacija obično se svrstava u red najvažnijih pokazatelja varijabiliteta ili raspršenosti modaliteta kvantitativnih obilježja. Primjer 8. decila.o.sc. pa je odgovarajući interpercentilni razmak I P90 − P10 = P90 – P10 = 2. pa taj pokazatelj ne možemo koristiti za opis varijabiliteta statističkoga niza. No. kao i za raspon varijacije. pa u njegovu izračunu ne sudjeluju svi elementi niza.900. Primijetimo da je taj raspon ujedno i razlika 9. predavač 99 . Drugi je razlog tome što u izračunu varijance.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 7. raspon varijacije središnjih 85% – 15% = 70% visina iznosi 12 cm. Dakle. Osnovni razlog je činjenica da da je zbroj odstupanja svih vrijednosti kvantitativnoga obilježja od njihove aritmetičke sredine uvijek jednak nuli. raspon varijacije središnjih 90% – 10% = 80% prosječnih mjesečnih neto–plaća iznosi 300. a samim tim i © mr.00 kn.00 i P90 = 2. za izračun interpercentila koriste se točno dvije položajne vrijednosti u statističkom nizu.00 = 300. čime se dobiva točniji opis većine elemenata niza. i 1.4. 3. U zaštitarskoj tvrtki ''Orlović d.o'' iz Donje Vrbe 15% svih zaposlenika nije više od 185 cm. Iz interpretacije navedenih vrijednosti slijedi: P10 = 1. a 15% svih zaposlenika nije niže od 197 cm.00 kn. Bojan Kovačić.00.900.d.'' iz Brckovljana 10% svih zaposlenika ima prosječnu mjesečnu neto–plaću manju od 1. Dakle. Iz interpretacije navedenih percentila slijedi P15 = 185 i P85 = 197.200.00 (kn).200.2.200.900. Osnovna prednost interpercentila u odnosu na raspon varijacije je zanemarivanje obično jednakoga postotka ekstremno malih i ekstremno velikih vrijednosti u statističkom nizu. U tvrtki ''Kamen Stečaj d. pa je odgovarajući interpercentilni razmak I P85 − P15 = P85 – P15 = 197 – 185 = 12 (cm).00 kn. Zbog toga se ta mjera raspršenja smatra nepotpunom.00 – 1. dok drugih 10% svih zaposlenika ima prosječnu mjesečnu neto–plaću veću od 2.

ekvivalentno. 2. pa je možemo kategorizirati kao potpunu mjerom raspršenja. …. …. koristimo sve elemente statističkoga niza. 2. σ2 = ∑x i =1 n 2 i n −x . ali intuitivno prihvatljivije – definira kao prosječno kvadratno odstupanje vrijednosti kvantitativnoga obilježja od aritmetičke sredine tih vrijednosti. predavač 100 . ekvivalentno. i σ2 = ∑ f ⋅x i i =1 k 2 i ∑f i =1 k −x 2 i c) za podatke grupirane u točno k razreda takvih da je za svaki i = 1. x2. Varijanca (oznaka: σ2 (grčko slovo σ čitajte: sigma)) se definira kao aritmetička sredina kvadrata odstupanja vrijednosti kvantitativnoga obilježja od aritmetičke sredine svih vrijednosti. σ2 = ∑ f ⋅x i i =1 k 2 i ∑f i =1 k −x . n vrijedi xk = c. fi odgovarajuća apsolutna ili relativna frekvencija. k xi razredna sredina. a x aritmetička sredina svih podataka: σ2 = ∑ fi ⋅ xi − x i =1 k ( ) 2 ∑ fi i =1 k ili. varijanca i standardna devijacija mogu se računati i iz ''sirovih'' (negrupiranih ili neure enih) i iz grupiranih podataka. tj. k modalitet xi ima apsolutnu ili relativnu frekvenciju fi : σ2 = ∑ f ⋅( x − x) i i i =1 k 2 ∑f i =1 k ili. …. 2. 2 b) za podatke čija je aritmetička sredina x grupirane prema točno k različitih modaliteta tako da za svaki i = 1. …. Bojan Kovačić. Sukladno takvoj definiciji. ako postoji realan broj c ∈ R takav da za svaki k = 1. formule za izračun varijance su: a) za niz negrupiranih podataka x1. 2 i Primijetimo da je varijanca jednaka nuli ako i samo ako je pripadni statistički niz konstantan. xn čija je aritmetička sredina x : σ2 = ∑( i =1 n xi − x n ) 2 ili.sc. Drugim riječima. ekvivalentno. Nerijetko se varijanca – matematički netočno. U tom je © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika standardne devijacije.

što promatrani niz sadrži više me usobno različitih članova. relativno teško ju je interpretirati. Odredimo varijancu i standardnu devijaciju niza navršenih godina radnoga staža iz Primjera 2. predavač 101 . navodimo formule za izračun standardne devijacije: a) za negrupirane podatke: ∑( x − x) i n 2 σ= i =1 ∑x ili n 2 i n σ= i =1 n − x2 b) za podatke grupirane prema modalitetima ili u razrede: ∑ fi ⋅ xi − x σ= i =1 k ( ) 2 ∑ f ⋅x i k 2 i ∑f i =1 k ili i σ= i =1 ∑f i =1 k − x2 i Primjer 9. €. što je veći stupanj varijabilnosti niza. to su veća i odstupanja pojedinih modaliteta kvantitativnoga obilježja od njihove aritmetičke sredine. Radi potpunosti. drugi korijen iz varijance. Pomoću drugoga korijena iz varijance dolazimo do praktično najprimjenjenije potpune mjere raspršenja: standardne devijacije. ali intuitivno prihvatljivijom definicijom prema kojoj je standardna devijacija prosječno odstupanje vrijednosti kvantitativnoga obilježja od aritmetičke sredine tih vrijednosti ili. Istaknimo da je ''mjerna jedinica'' za standardnu devijaciju jednaka ''mjernoj jedinici'' odgovarajućega kvantitativnoga obilježja (kn. tj. cm itd.sc. po definiciji. još kraće i još nepreciznije. prosječno odstupanje od prosjeka. Takva formalna definicija obično se zamjenjuje matematički netočnom. kg. Bojan Kovačić. Standardna devijacija (oznaka: σ) je.ELEKTROTEHNIČKI ODJEL Poslovna statistika slučaju i aritmetička sredina jednaka broju c. Aritmetička sredina vrijednosti toga obilježja jednaka je: x= 20 + 12 + 7 + 29 + 32 + 10 + 18 + 16 + 8 + 17 = 16. 10 © mr.). Budući je varijanca ''kvadratna'' mjera raspršenja. No.9 (godina). Stoga možemo zaključiti da je varijanca upravno razmjerna stupnju raspršenja statističkoga niza.

Bojan Kovačić. Odredimo prosječan broj soba po jednom stanu. Primjer 10.49 Odavde slijedi da je standardna devijacija jednaka σ2 = ∑x i =1 10 2 i −x = 2 σ = σ 2 = 63.ELEKTROTEHNIČKI ODJEL Poslovna statistika pa je varijanca tih podataka: 10 202 + 122 + 72 + 292 + 322 + 102 + 182 + 162 + 82 + 172 2 − 16. Promatramo statistički skup svih stanova u onim stambenim zgradama (novogradnja i dogradnja) koje su 2006. dakle. Državni zavod za statistiku. godinu. 2007. godine dobile gra evinsku dozvolu u Republici Hrvatskoj. Prosječan broj soba po jednom stanu je vagana aritmetička sredina promatrane razdiobe: © mr. reći da je prosječno odstupanje pojedinačnih navršenih godina radnoga staža od njihove aritmetičke sredine približno 8 godina.968 ≈ 8 godina. Možemo. Promatrani skup dijelimo prema broju soba u stanu: broj soba broj stanova (xi) (fi) 1 3 256 2 7 428 3 7 244 4 4 414 5 1 794 6 997 7 266 8 118 ukupno: 25 517 izvor: Statistički ljetopis Republike Hrvatske za 2006.92 σ = 10 2 σ = 63. predavač 102 .49 = 7. te varijancu i standardnu devijaciju broja soba.sc.

Primjer 11. možemo reći da prosječno odstupanje pojedinačnih brojeva soba od njihove aritmetičke sredine iznosi približno 1. Dakle. U donjoj je tablici prikazana razdioba svih počinitelja kaznenih djela u Republici Hrvatskoj osu enih na bezuvjetni zatvor u 2006. predavač 103 .887192 = 1.373751 . Varijanca broja soba jednaka je: σ2 = ∑f i =1 8 i =1 8 i ⋅ xi2 −x i 2 ∑f σ2 = 3256 ⋅ 12 + 7428 ⋅ 22 + 7244 ⋅ 32 + 4414 ⋅ 4 2 + 25517 1794 ⋅ 52 + 997 ⋅ 62 + 266 ⋅ 7 2 + 118 ⋅ 82 + − 2.ELEKTROTEHNIČKI ODJEL Poslovna statistika x= ∑fx i =1 8 8 i i ∑f i =1 = i 3256 ⋅ 1 + 7428 ⋅ 2 + 7244 ⋅ 3 + 4414 ⋅ 4 + 1794 ⋅ 5 + 997 ⋅ 6 + 266 ⋅ 7 + 118 ⋅ 8 25517 x = 2. prosječan broj soba po jednom stanu iznosi približno 3.sc.949 Dakle. Bojan Kovačić.9493282 25517 σ 2 = 1.887192 otkuda slijedi da je odgovarajuća standardna devijacija broja soba σ = σ 2 = 1. godini prema trajanju zatvorske kazne: © mr.374.

5 10 – 15 29 12.75 1–2 658 1. te varijancu i standardnu devijaciju trajanja kazni. 2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika trajanje kazne broj [godina] počinitelja 0–1 2 535 1–2 658 2–3 232 3–5 164 5 – 10 102 10 – 15 29 15 11 20 3 20 – 40 8 ukupno: 3 742 izvor: Statistički ljetopis Republike Hrvatske za 2006.624 5 – 10 102 7.5 987 1480.5 2–3 232 2.200 ukupno: 3 742 5083 27.5 580 1.25 15 11 15 165 2.475 20 3 20 60 1. a potom i vaganu aritmetičku sredinu: trajanje kazne broj razredna fi ⋅ xi fi ⋅ xi2 [godina] počinitelja sredina (xi) (fi) 0–1 2 535 0.5 765 5737.5 4531.5 1267.5 362. Bojan Kovačić. predavač 104 .332 Vagana aritmetička sredina jednaka je: © mr.5 633. godinu. Državni zavod za statistiku.450 3–5 164 4 656 2.sc.200 20 – 40 8 30 240 7. Odredimo prosječno trajanje kazne po jednom počinitelju. U tablici imamo ukupno 7 pravih razreda i dva modaliteta koja nisu grupirana u razrede. Za svaki pojedini razred računamo razrednu sredinu.

dok svi ostali razredi obuhvaćaju nešto manje od 15% svih podataka. Varijanca trajanja kazni iznosi: σ2 = ∑ f ⋅x i i =1 9 2 i ∑f i =1 9 −x = 2 27332 − 1.6. Bojan Kovačić.358365 godina.sc.358365 . koeficijent varijacije o kojemu govorimo u podtočki 3. Stoga ima smisla definirati srednje apsolutno odstupanje (oznaka: MADx .458961 = 2. Primijetimo da u promatranom primjeru nešto više od 85% svih podataka pripada prvim dvama razredima. odnosno 1 godinu 4 mjeseca i 9 dana. Njihov je zbroj biti jednak nuli ako i samo ako je niz vrijednosti kvantitativnoga obilježja konstantan. prosječno odstupanje pojedinačnih trajanja kazni od njihove aritmetičke sredine iznosi približno 2.336442 godina. da postoji razred 20 – 40 kojemu pripada 8 elemenata osnovnoga skupa.5.336442 godina. tj.2. pa statistička analiza promatranoga obilježja mora obuhvatiti i izračun dodatnih pokazatelja (npr. MADx se izračunava prema sljedećim formulama: © mr.3583652 = 5.458961 . predavač 105 . pri čemu kratica: MAD od engleskih riječi Mean Absolute Deviation) kao prosječno apsolutno odstupanje od aritmetičke sredine. Na temelju aritmetičke sredine i standardne devijacije ne možemo zaključiti npr. a to općenito ne vrijedi (kvantitativna obilježja imaju najmanje dva različita modaliteta). Srednje apsolutno odstupanje Već je istaknuto da je zbroj svih odstupanja pojedinih vrijednosti kvantitativnoga obilježja od aritmetičke sredine jednak nuli. No. uzmemo li apsolutnu vrijednost svakoga odstupanja (izračunamo odstupanje i zanemarimo njegov predznak). 3742 i otkuda slijedi da je standardna devijacija trajanja kazni σ = σ 2 = 5. dobit ćemo nenegativne realne brojeve.2.).ELEKTROTEHNIČKI ODJEL Poslovna statistika x= ∑fx i =1 9 9 i i ∑f i =1 = i 5083 = 1. odnosno 2 godine 4 mjeseca i 1 dan. 3742 pa prosječno trajanje kazne po jednom počinitelju iznosi približno 1. 3.

1 + −4.9 + 17 − 16... 2.9 + −9..9 + 12.9 + 8 − 16. k modalitet xi ima apsolutnu ili relativnu frekvenciju fi : MADx = f1 ⋅ x1 − x + f 2 ⋅ x2 − x + . k ∑f k =1 c) za podatke grupirane u točno k razreda takvih da je za svaki i = 1.9 + 32 − 16. + f n ⋅ xn − x f1 + f 2 + . pa je srednje apsolutno odstupanje od aritmetičke sredine: MADx = ∑ k =1 10 xk − x 10 = 20 − 16. …. + f n ∑f = k =1 n k n ⋅ xk − x . ….. predavač 106 . xn čija je aritmetička sredina x : MADx = x1 − x + x2 − x + ..ELEKTROTEHNIČKI ODJEL Poslovna statistika a) za niz negrupiranih modaliteta kvantitativnoga obilježja x1.. x2.1 + −0. k ∑f k =1 Primjer 12.9 + 10 + 18 − 16.9 + −8.9 + 1. Bojan Kovačić.1 MADx = 10 © mr.9 + 7 − 16. Odredimo srednje apsolutno odstupanje od aritmetičke sredine za niz navršenih godina radnoga staža iz Primjera 2.. + f n ⋅ xn − x f1 + f 2 + .9 10 3.9 + 29 − 16. a x aritmetička sredina svih podataka: f1 ⋅ x1 − x + f 2 ⋅ x2 − x + .9 + 12 − 16.9 + 10 − 16.. + xn − x n =∑ k =1 n xk − x n . + f n MADx = ∑f = k =1 n k n ⋅ xk − x .1 + −6. fi odgovarajuća apsolutna ili relativna frekvencija.1 + 15.9 + 16 − 16.sc.. U Primjeru 9.9 + 0.. b) za podatke čija je aritmetička sredina x grupirane prema točno k različitih modaliteta tako da za svaki i = 1. k xi razredna sredina. izračunali smo da je aritmetička sredina toga niza x = 16. 2.9 (godina). ….

1 + 15.5 3–5 164 4 5 – 10 102 7.358365 + 102 ⋅ 7.9 + 1.358365 + + 3742 MADx = © mr.358365 + 3742 164 ⋅ 4 − 1.1 + 6. Bojan Kovačić.358365 (godina). prosječno apsolutno odstupanje od aritmetičke sredine iznosi 6.5 − 1.5 10 – 15 29 12.9 + 9.5 − 1. pa je traženo srednje apsolutno odstupanje MADx = ∑f k =1 9 k ⋅ xk − x 9 k ∑f k =1 2535 ⋅ 0.358365 + 658 ⋅ 1.5 − 1. Dobivena vrijednost je strogo manja od standardne devijacije istoga niza (σ ≈ 8 godina).5 1–2 658 1.9 + 0.1 + 0.358365 + 232 ⋅ 2.1 + 4. Odredimo srednje apsolutno odstupanje za vrijednosti obilježja iz Primjera 11: trajanje kazne broj razredna [godina] počinitelja sredina (xi) 0–1 2 535 0.5 15 11 15 20 3 20 20 – 40 8 30 ukupno: 3 742 U tom smo primjeru izračunali vaganu aritmetičku sredinu: x = 1.sc.358365 + 29 ⋅ 12.5 − 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika MADx = 3.3 godina.3 10 Dakle. predavač 107 . Primjer 13.5 2–3 232 2.5 − 1.9 + 12.1 = 6.9 + 8.

6. onda na temelju standardne devijacije ne možemo reći razlikuju li se promatrani natjecatelji više prema masi ili prema visini. Može se pokazati i da je prosječno apsolutno odstupanje od aritmetičke sredine ili medijana uvijek manje ili jednako standardnoj devijaciji.ELEKTROTEHNIČKI ODJEL Poslovna statistika + 11 ⋅ 15 − 1. Drugim riječima. Slobodno govoreći. Kao takva. skup svih natjecatelja u izboru za ovogodišnjeg Mistera Svrzigaća i podijelimo li sve njegove elemente prema obilježjima masa i visina.163 Dakle.358365 3742 MADx = 1.358365 + 3 ⋅ 20 − 1. možemo reći da je koeficijent varijacije © mr. Istaknimo da se prosječno apsolutno odstupanje može računati i u odnosu na medijan. a sve ostale veličine ostaju nepromijenjene). a ne idealnim uvjetima) primjenjuje prosječno apsolutno odstupanje.2. tim više što se utvrdilo da primjena takvoga odstupanja na različite vrste razdioba daje približno jednake ili čak bolje rezultate od standardne devijacije. Koeficijent varijacije Već smo istakli da je standardna devijacija potpuna mjera raspršenja iskazana u jedinicama promatranoga kvantitativnoga obilježja.63 godina. nego na standardnu devijaciju. prosječno apsolutno odstupanje od aritmetičke sredine iznosi približno 1. imaju manji utjecaj na prosječno apsolutno odstupanje. U takvim se slučajevima obavezno primjenjuju relativne mjere raspršenja jer one ne ovise o ''mjernim jedinicama'' promatranih obilježja. sve se više zagovara da se u statističkoj analizi realnih procesa (koji se odvijaju u realnim. neidealizirani uvjeti provedbe slučajnih pokusa ili opažanja općenito itd. a koriste se ponajprije za usporedbu varijabiliteta dvaju razdioba.sc. Promatramo li npr. Zaključno istaknimo da dio novijih radova iz statistike preporučuje primjenu srednjih apsolutnih odstupanja (od aritmetičke sredine ili medijana) umjesto ''tradicionalne'' standardne devijacije jer je praksa pokazala da pogreške u mjerenju.358365 + 8 ⋅ 30 − 1. predavač 108 . standardna devijacija nije prikladna za usporedbu varijabiliteta najmanje dvaju različitih tipova kvantitativnih obilježja prema kojima se može podijeliti isti statistički skup. pri čemu su odgovarajuće formule potpuno analogne navedenima (aritmetička sredina se zamijeni medijanom. 3. Bojan Kovačić. Dvije najčešće primjenjivane mjere su koeficijent varijacije i koeficijent kvartilne devijacije. Koeficijent varijacije (oznaka: V) definira se kao omjer standardne devijacije i aritmetičke sredine iskazan u postotcima.

predavač 109 . koeficijent varijacije neovisno o tome jesu li podaci grupirani ili nisu računamo prema formuli: V= σ x ⋅100 . Za svih 11 nogometaša prve postave NK ''Akumulator'' iz Babine Grede na dan 01.2008. jedan od najčešće primjenjivanih je kriterij naveden u sljedećoj tablici.50 50 .70 ≥ 70 varijabilitet vrlo slab relativno slab umjeren relativno jak vrlo jak Primjer 16. V [%] 0 – 10 10 . dok najveća vrijednosti općenito nije odre ena.04. Istaknimo da se koeficijent varijacije primijenjuje gotovo isključivo u statističkoj analizi kvantitativnih obilježja vezanih za ordinalnu skalu (zbog dogovorno definirane nule nije primjenjiv u obilježjima vezanima za intervalnu skalu). Praktične primjene pokazuju da koeficijent varijacije relativno rijetko prelazi 100%. Njegovi osnovni nedostaci su loša reprezentativnost u slučaju ekstremnih vrijednosti ili otvorenih razreda. Sukladno netom navedenoj definiciji. Iako ne postoji opći kriterij procjene varijabiliteta prema vrijednostima koeficijenta varijacije.sc. © mr. prikupljeni su podaci o masi i prosječnim mjesečnim neto–plaćama. te osjetljivost na male promjene aritmetičke sredine u slučajevima kad je aritmetička sredina vrlo blizu nuli. Naglasimo i činjenicu da je najmanja moguća vrijednost koeficijenta varijacije jednaka nuli (i postiže se isključivo za konstantne nizove podataka).ELEKTROTEHNIČKI ODJEL Poslovna statistika zapravo prosječno odstupanje vrijednosti kvantitativnoga obilježja od aritmetičke sredine iskazano u postotcima.30 30 . Podaci su prikazani u donjoj tablici. Bojan Kovačić.

Bojan Kovačić. u podtočki 3.2 65 – (70) 0. Uočimo da su varijabiliteti obaju promatranih obilježja vrlo slabi.8 50 – 65 19.1. Dobiva se: aritmetička standardna koeficijent sredina devijacija varijacije masa 83.2 25 – 50 75.1.00 5 91 1. predavač 110 . U nizu masa i nizu prosječnih mjesečnih neto–plaća nema ekstremno velikih vrijednosti.391839% prosječna neto–plaća 1.196.72727 (kg) 4.00 4 78 1.197.195.6 U navedenom smo primjeru izračunali: © mr.00 3 82 1.316734% Budući da je koeficijent varijacije masa strogo veći od koeficijenta varijacije prosječnih neto– plaća.183.400.198.00 2 89 1.00 7 83 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika redni br. pa koeficijent varijacije obaju obilježja računamo koristeći formule za jednostavnu aritmetičku sredinu i standardnu devijaciju za negrupirani niz podataka.00 6 84 1.51444 (kg) 5. pa praktično možemo zaključiti da nema zamjetnih razlika izme u varijabiliteta promatranih obilježja.36 (€) 64.88 (€) 5.sc.190.00 Utvrdimo razlikuju li se promatrani nogometaši više prema masi ili prema prosječnim mjesečnim neto-plaćama. masa prosječna mjesečna nogometaša [kg] neto–plaća [€] 1 79 1. Utvrdimo varijabilitet navršenih godina starosti svih nezaposlenih osoba u Republici Ljenčariji u veljači 2008. niti vrijednosti blizu nule. godine (Primjer 4.00 11 81 1.185.189.00 9 90 1.00 8 86 1.00 10 78 1.220.): obilježje navršene godine starosti broj nezaposlenih [000] 15 – 25 25. Primjer 17.191.300. zaključujemo da se promatrani nogometaši više razlikuju prema masama.

omjer interkvartila i zbroja prvoga i trećega kvartila: Vq = Iq Q3 + Q1 = Q3 − Q1 Q3 + Q1 Vq se interpretira kao intenzitet varijabiliteta središnje polovice (središnjih 50%) elemenata ure enoga statističkoga niza. jedan od najčešće primijenjenih kriterija naveden je u tablici. © mr. 1]. koeficijent varijacije je loš pokazatelj varijabiliteta vrijednosti promatranoga obilježja ukoliko promatrani niz vrijednosti obilježja sadrži ekstremno male ili ekstremno velike vrijednosti.7.sc. što znači da je koeficijent varijacije promatranoga obilježja V= σ x ⋅ 100 = 11. Koeficijent kvartilne devijacije Kako je već istaknuto. a može poprimiti točno sve vrijednosti iz segmenta [0. odnosno koeficijentom kvartilne devijacije kao pripadnom relativnom mjerom raspršenja.177 godina. Što je varijablitet središnje polovice niza manji. možemo zaključiti da je varijabilitet vrijednosti promatranoga obilježja umjeren. a budući da je aritmetička sredina računata iz grupiranih podataka nepreciznija od aritmetičke sredine računate iz negrupiranih podataka i (obično) manja od nje.48167 godina. predavač 111 . varijabilitet ''na granici'' relativno slaboga i umjerenoga.2.17715 U ovome je slučaju. vrijednost Vq je bliža 1.48167 ⋅ 100 = 30. 37. Bojan Kovačić.ELEKTROTEHNIČKI ODJEL Poslovna statistika x ≈ 37. pa je standardna devijacija računata iz podataka grupiranih u razrede σ = 11. Iako ne postoji opći kritetij za utvr ivanje varijabiliteta središnje polovice vrijednosti kvantitativnoga obilježja na temelju koeficijenta kvartilne devijacije.88%. Koeficijent kvartilne devijacije (oznaka: Vq) je. vrijednost Vq je bliža 0. a što je varijablitet središnje polovice veći. dakle. prema definiciji. 3. U takvim se slučajevima raspršenost vrijednosti obilježja obično iskazuje interkvartilom (kao apsolutnom mjerom raspršenja).

2 relativno slab 0. – 31. varijabilitet središnjih 50% prosječnih mjesečnih plaća je relativno slab. 935 = = 0.00 5 200.sc.5 – 1.88 − 2.3 umjeren 0.0. Stoga je koeficijent kvartilne devijacije promatranoga niza jednak Vq = Q3 − Q1 3.01.000.0 .2007.88 + 2.00 12 600. prema prosječnom mjesečnom neto–honoraru za sve održane oblike nastave: prosječan mjesečni broj neto–honorar (€) nastavnika 100. navedenih u Primjeru 9.o. Primjer 18.2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika Vq varijabilitet 0.1 .000.5 relativno jak 0. – treći ili gornji kvartil: Q3 = 3. izračunali smo: – prvi ili donji kvartil: Q1 = 2.0 vrlo jak Izračun koeficijenta kvartilne devijacije iz obiju vrsta podataka pokazat ćemo na sljedećim primjerima. Bojan Kovačić.0.13927 . predavač 112 .o.087.087.88.64 i 60.00 21 500.2 . Q3 + Q1 3.00 8 400.75). Zadana je razdioba svih honorarnih nastavnika Visoke škole za financijski menadžment u Špičkovini u zimskom semestru akademske godine 2007/2008.0. Odredimo varijabilitet središnjih 50% prosječnih mjesečnih plaća (iskazanima u kn) svih stalno zaposlenih djelatnika poduzeća "Schwindl–trade d.00 6 ukupno: 52 © mr.12.332. U ovom slučaju statistički niz sadrži dvije ekstremno velike vrijednosti (50. Primjer 19.3 .087.935 Dakle.0.332. U Primjeru 9. pa je za dobivanje slike o varijabilitetu primjereno uporabiti koeficijent kvartilne devijacije." iz Šuplje Lipe u razdoblju od 01.1 vrlo slab 0.332.935.

© mr.00) = 500.25 .75 .00.00. predavač 113 . vrijednost u nizu + = 500. Ukupan broj podataka jednak je n = 52 i djeljiv je s 4.00 − 250. vrijednost u nizu – 13.33333 Q3 + Q1 500.00 + 1 ⋅ (14. 4 4 3 ⋅ (500. 86 U ovome se primjeru isključivo radi ilustracije računanja koeficijenta kvartilne devijacije iz podataka grupiranih prema modalitetima koriste relacije za izračun kvartila koje se mogu naći u knjizi I. vrijednost u nizu) = 4 1 ⋅ (400. Šošića ''Primijenjena statistika''. 4 Tako je koeficijent kvartilne devijacije jednak Vq = Q3 − Q1 500.00 = = 0. vrijednost u nizu) = 4 3 3 ⋅ (n + 1) = ⋅ (52 + 1) = 39.00 – 500. 00 i zaključujemo da je varijabilitet središnjih 50% prosječnih mjesečnih neto–honorara relativno jak. Bojan Kovačić. 4 Analogno.ELEKTROTEHNIČKI ODJEL Poslovna statistika Odredimo koeficijent kvartilne devijacije i objasnimo njegovo značenje86.sc.00) = 250. pa je približna pozicija prvoga kvartila jednaka k1 = n + 1 52 + 1 = = 13. U ovom slučaju prvi i treći kvartil odre ujemo iz grupiranih podataka. 4 4 Vrijednost prvoga kvartila iz grupiranih podataka odre uje se iz izraza: Q1 = 13. pri čemu smo podatke već zapisali u obliku ure enoga niza. 00 + 250.00 – 200. vrijednost u nizu + = 200. približna pozicija trećega kvartila jednaka je k2 = pa je vrijednost trećega kvartila: Q3 = 39. vrijednost u nizu – 39.00 + 3 ⋅ (40.

00 88 801.2008. a širina uočenoga razreda je h1 = 650.50 28 400 ukupno: 400 Četvrtina ukupnoga broja djelatnika jednaka je 100. a 100.00 48 501.00 – 950.50.50 = 150.00 – 500.50 – 950. Bojan Kovačić. 00 ≈ 541.00 47 951. element ure enoga niza nalazi se u razredu 500. Stoga je prvi kvartil jednak n 400 − m1 − 48 Q1 = g1 + 4 ⋅ h1 = 500. Šošića ''Primijenjena statistika''. f1 189 87 U ovome se primjeru isključivo radi ilustracije računanja koeficijenta kvartilne devijacije iz podataka grupiranih u razrede koriste relacije za izračun kvartila koje se mogu naći u knjizi I.50 – 500. predavač 114 .sc.3.77.100.50.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 20.50 189 237 650.00 189 651.50 – 800.50 – 1. Zadana je razdioba svih djelatnika Sveleučilišta u Gaćelezima na dan 22. odgovarajuća apsolutna frekvencija f1 = 189.00 28 ukupno: 400 Odredimo koeficijent kvartilne devijacije i objasnimo dobiveni rezultat. Donja granica toga razreda je g1 = 500.00 – 650.00 – 1.50 – 500.50 47 372 950.50 48 48 500.100.87 Neprave razrede najprije pretvorimo u prave i izračunajmo pripadne kumulativne apsolutne frekvencije ''manje od''. prema iznosu primljene ''uskrsnice'': iznos ''uskrsnice'' broj (€) djelatnika 351.50 88 325 800. © mr. Dobivamo: iznos ''uskrsnice'' broj kumulativna apsolutna (€) djelatnika frekvencija ''manje od'' 350.50 – 650. kumulativna apsolutna frekvencija ''manje od'' prethodnoga razreda jednaka je m1 = 48.50 – 650.00 – 800.50 + 4 ⋅150.

Tipični primjeri takvih problema su: Problem 1. Q3 + Q1 757.00 kn. Stoga je treći kvartil jednak 3 3 ⋅ n − m2 ⋅ 400 − 237 ⋅ h3 = 650. Standardizirano obilježje U praksi se vrlo često postavljaju problemi usporedbe različitih nizova vrijednosti kvantitativnih obilježja iskazanima u istim mjernicm jedinicama. Prosječna godišnja neto–plaća zaposlenika s visokom stručnom spremom u nekoj tvrtki iznosi 62.100. a na pismenom ispitu iz Osnova računovodstva 75 boda. Prosječan broj bodova na pismenom ispitu iz Osnova računovodstva održanom 21.2008.1663 . problemi usporedbe raznorodnih numeričkih nizova.50 – 650.50 – 800.2008.000. Ćiro je na pismenom ispitu iz Gospodarske matematike ostvario 62 boda.3. predavač 115 .ELEKTROTEHNIČKI ODJEL Poslovna statistika Nadalje.89 + 541. iznosi 65 uz standardnu devijaciju 12 bodova. problemi usporedbe relativnoga položaja barem dvaju podataka u istom numeričkom nizu itd. element niza nalazi se u rauzredu 650.00 kn uz standardnu devijaciju od 7. Q3 = g3 + 4 88 f3 Stoga je koeficijent kvartilne devijacije jednak Vq = Q3 − Q1 757.89 − 541. kumulativna apsolutna frekvencija ''manje od'' prethodnoga razreda jednaka je m2 = 237. Može li se reći da je djelatnik koji ima visoku stručnu spremu i ukupnu godišnju neto–plaću 40. 77 pa zaključujemo da je varijabilitet središnjih 50% iznosa ''uskrsnica'' relativno slab. ali s različitim stupnjem varijabilnosti.50.77 = = 0.00. Bojan Kovačić. a 300.sc. tri četvrtine ukupnoga broja djelatnika jednake su 300.00 kn diskriminiran? Problem 2. odgovarajuća apsolutna frekvencija f3 = 88. Donja granica toga razreda je g3 = 650.50. 00 ≈ 757.02. Na kojemu je ispitu Ćiro ostvario bolji uspjeh? © mr. iznosi 55 uz standardnu devijaciju od 8 bodova. a širina uočenoga razreda je h3 = 850.50 = 15.89. Prosječan broj bodova na pismenom ispitu iz Gospodarske matematike održanom 25.000.02.50 + 4 ⋅150. 3.

 k  Posljedice: U segmentu [ x – 2 ⋅ σ. x + k ⋅ σ] nalazi najmanje 100 ⋅  1 − 2  % članova niza X. Može se pokazati da je aritmetička sredina svakoga standardiziranoga obilježja jednaka nuli. To znači da najviše 100% – 89% = 11% elemenata niza odstupa od prosjeka za više od tri 88 Pafnutij Lavovič Čebišev (1821.sc.100. Primjer 1.000. Prema Čebiševljevu pravilu. © mr. Riječ je o linearnoj transformaciji vrijednosti kvantitativnoga obilježja definiranoj formulom: z= 1 σ ⋅x− x σ = x−x σ . Izračunajmo vrijednost standardizirana obilježja za x = 40.00 kn odstupa od prosječne godišnje neto–plaće naniže za više od tri standardne devijacije.000.).100. x + 3 ⋅ σ] nalazi se najmanje 89% podataka bilo kojega niza numeričkih podataka.000. (Čebiševljevo88 pravilo) Neka je X niz vrijednosti kvantitativnoga obilježja čija je aritmetička sredina x . Pokažimo na nekoliko primjera primjenu standardiziranoga obilježja i Čebiševljeva pravila. koristi se sljedeće Pravilo 1.000. predavač 116 . 00 − 62. 7. Kako bi se mogli donijeti zaključci o raspršenosti elemenata polaznoga osnovnoga skupa.00: z= x−x σ = 40.0986 .000. x + 2 ⋅ σ] nalazi se najmanje 75% podataka. ruski matematičar. a u segmentu [ x – 3 ⋅ σ. a odgovarajuća standardna devijacija jednaka 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Ovakvi problemi rješavaju se izračunom vrijednosti tzv. x = 62. a standardna devijacija σ. Bojan Kovačić. – 1894.00 pa zaključujemo da ukupna godišnja plaća od 40. standardiziranoga obilježja (oznaka: z). najmanje 89% elemenata niza odstupa od prosječne vrijednosti niza za najviše tri standardne devijacije.00 = −3.00.00 i σ = 7. gdje je uobičajeno x aritmetička sredina. Tada se za svaki prirodan broj k > 1 u 1   segmentu [ x – k ⋅ σ. Riješimo Problem 1. a σ standardna devijacija vrijednosti varijable x.

© mr. 12 Budući da je vrijednost standardizirana obilježja za prvi pismeni ispit strogo veća od vrijednosti standardizirana obilježja za drugi pismeni ispit. Prosudba uspjeha na ispitima mora se temeljiti isključivo na standardiziranom obilježju jer je ono neovisno o mjernim jedinicama. Promatrani se djelatnik nalazi upravo u tih 11% elemenata. Odredimo koji se trgovac izlaže većem riziku donošenja pogrešne poslovne odluke o prodaji dionice. Dobiva se: x = 128.ELEKTROTEHNIČKI ODJEL Poslovna statistika standardne devijacije. a drugi da će cijena biti 139 kn. a eliminira i problem različitih raspona varijacije. σ = 4. Tečaj dionica (u kn) portfolia zabilježen na Frkljevačkoj burzi u razdoblju od 01.2008. pa je vrijednost standardizirana obilježja Ćirina uspjeha na tom ispitu z1 = x1 − x1 σ1 = 62 − 55 = 0. Najprije treba izračunati aritmetičku sredinu (prosječni tečaj dionice) i standardnu devijaciju iz negrupiranih podataka.875 . predavač 117 . Bojan Kovačić. Primjer 3. pa se može reći da je diskriminiran. pa je vrijednost standardizirana obilježja Ćirina uspjeha na tom ispitu z2 = x2 − x 2 σ2 = 75 − 65 = 0.2008. zaključujemo da je na pismenom ispitu iz Gospodarske matematike Ćiro postigao nešto bolji uspjeh (odstupanje naviše iznosi 87. 8 Za drugi je pismeni ispit x 2 = 65 i σ2 = 12.03.03. Riješimo Problem 2. Za prvi je pismeni ispit x 1 = 55 i σ1 = 8. do 25.5% standardne devijacije).00 kn. Pretpostavimo da je kretanje tečaja dionice ''normalno''.08 kn. Primjer 2.83333 .sc. Prvi trgovac procjenjuje da će cijena biti 140 kn. bio je sljedeći: 126 129 128 133 133 123 128 122 123 121 130 126 122 134 125 128 129 126 133 128 127 135 126 135 130 Dva trgovca dionicama procjenjuju tečaj dionice u vremenu predvi enom za prodaju.

Da bismo preračunali rezultate ispita u skladu s izmijenjenim parametrima. godinu: 3. Jednostavna aritmetička sredina procjenjenih vrijednosti godišnje stope inflacije iznosi 4. 4.26 4.59 3.19 4.018 – 2 ⋅ 0. a standardna devijacija 12.67 4.42 4.280546.579].66666 . Prosječan broj bodova iz matematike iznosio je 150 sa standardnom devijacijom 30 bodova. 4. najprije ćemo odrediti relativan položaj postignutoga rezultata od 130 bodova u prvotnom numeričkom nizu. predavač 118 .74 4. 4. traženi prognostički interval stope inflacije je [4.97 3.09 Primjenom Čebiševljeva pravila za k = 2 odredimo prognostički interval stope inflacije. Bojan Kovačić. (problem skaliranja) Prijamnom ispitu za upis na Ekonomski fakultet Sveučilišta u Banovoj Jaruzi pristupilo je ukupno 2000 kandidata. pa se dobije: z1 = x1 − x1 σ1 = 130 − 150 = −0. Primjer 4. Odredimo broj bodova (na novoj skali) kandidata koji je na ispitu osvojio točno 130 bodova.280546. Primjer 5. Taj se položaj svodi na izračun vrijednosti standardiziranoga obilježja za x = 130.25 3.52 3. x1 = 150 i σ1 = 30.ELEKTROTEHNIČKI ODJEL Poslovna statistika Izračunajmo vrijednost standardiziranoga obilježja za svaku pojedinu procjenu i odrediti koja od njih više odstupa od prosjeka: z1 = z2 = x1 − x σ x1 − x = = 140 − 128 = 2. 08 σ 139 − 128 = 2.32 3.94 .68 4. prvi trgovac se izlaže većem riziku donošenja pogrešne poslovne odluke o prodaji dionice.697 .12 4.73 3.36 4.92 3. a odgovarajuća standardna devijacija 0.018 + 2 ⋅ 0.457. 20 stručnjaka iz područja managementa i gospodarstva procjenjivalo je godišnju stopu inflacije u Republici Niškoristiji za 2007. 08 Prema tome.280546] = [3. Prema tome. Povjerenstvo za provedbu razredbenoga ispita odlučilo je skalirati rezultate tako da im aritmetička sredina bude 100. 30 © mr. 4.35 4.sc.85 3.018.28 4.05 4.

Bojan Kovačić. Gornje definicije zgodno je popratiti i grafički: © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika Dakle. 3. Ako skup vrijednosti obilježja elemenata statističkoga skupa sadrži barem jednu ekstremno malu vrijednost. Vrste razdioba (distribucija) Razdiobe statističkih skupova prema kvantitativnim obilježjima grupiramo prema tome kako su vrijednosti obilježja elemenata toga skupa raspore ene oko najvažnije srednje vrijednosti: aritmetičke sredine. govorimo o negativno asimetričnoj razdiobi (distribuciji). Kod simetrične razdiobe sve tri srednje vrijednosti su jednake ( X = Me = Mo). kandidat će na novoj skali imati ukupno 92 boda. rezultat kandidata odstupa od prvotnoga prosjeka za 0. Kod negativno asimetrične razdiobe vrijede nejednakosti: X < Me < Mo. govorimo o pozitivno asimetričnoj razdiobi (distribuciji). Prema tome. govorimo o simetričnoj razdiobi (distribuciji). Stoga i novi broj bodova mora odstupati od predefiniranoga prosjeka za 0.sc. pa je x2 = x 2 + z1 ⋅ σ2 = 100 + (–0. predavač 119 .66666) ⋅ 12 = 92.66666 prvotnih standardnih devijacija naniže. U skladu s tim razlikujemo tri osnovne vrste razdioba statističkoga skupa: Ako su vrijednosti obilježja elemenata statističkoga skupa ravnomjerno raspore ene oko aritmetičke sredine. Ako skup vrijednosti obilježja elemenata statističkoga skupa sadrži barem jednu ekstremno veliku vrijednost.66666 predefiniranih standardnih devijacija naniže.4. Kod pozitivno asimetrične razdiobe vrijede nejednakosti: X > Me > Mo.

a za negativno 89 Karl Pearson (1857.4. Sk = σ σ Ova je mjera zapravo standardizirano odstupanje medijana ili moda od aritmetičke sredine. odnosno moda podijeljena je sa standardnom devijacijom radi uklanjanja utjecaja mjernih jedinica kvantitativnoga obilježja na vrijednost pokazatelja. Razlika aritmetičke sredine i medijana. U praksi se najčešće koriste tri mjere asimetrije: 1.sc.).ELEKTROTEHNIČKI ODJEL Poslovna statistika 3.) Pearsonova89 mjera asimetrije (oznaka: Sk) je mjera asimetrije definirana kao omjer aritmetičke sredine x i medijana Me. Bojan Kovačić. 3]. koristimo i mjere asimetrije. Mjere asimetrije Pri opisu razdiobe vrijednosti obilježja elemenata odre enoga statističkoga skupa. britanski statističar. izražen u jedinicama standardne devijacije σ: Sk = 3⋅ (x − M e ) x − Mo . Za simetričnu razdiobu njegova je vrijednost Sk = 0. 90 Oznaka Sk potječe od engleske riječi skewness koja znači nagnutost. predavač 120 . za pozitivno asimetričnu Sk > 0. Tim mjerama nastoji se jednim numeričkim pokazateljem opisati način rasporeda kvantitativnih podataka prema aritmetičkoj sredini ili nekoj drugoj srednjoj vrijednosti.1. © mr. Koeficijent Sk90 može poprimiti točno sve vrijednosti iz segmenta [–3. – 1936. jedan od najzaslužnijih za razvoj statistike kao zasebne znanstvene discipline. odnosno moda Mo. osim srednjih vrijednosti i mjera raspršenja.

asimetričnost je izraženija.). Koeficijent α3 poprima točno sve vrijednosti iz segmenta [-2. za pozitivno asimetričnu α3 > 0. Valjda istaknuti da koeficijent asimetrije – kao potpuna mjera asimetrije – uvijek pruža najvjerniju sliku o asimetriji. x aritmetička sredina tih podataka.sc. 2]. Računamo je prema formuli: SkQ = Q1 + Q3 − 2 ⋅ M e . Za simetričnu razdiobu vrijednost toga koeficijenta je α3 = 0. Ovaj koeficijent u pravilu se računa za razdiobe prema kvantitativnim kontinuiranim varijablama. Za simetričnu razdiobu je SkQ = 0. za pozitivno asimetričnu SkQ > 0. a za negativno asimetričnu α3 < 0. predavač 121 . – 1957. Q3 − Q1 Koeficijent Skq poprima točno sve vrijednosti iz segmenta [-1.ELEKTROTEHNIČKI ODJEL Poslovna statistika asimetričnu Sk < 0. trećega (Q3) i medijana (Me).) Bowleyeva91 mjera asimetrije (oznaka: SkQ) računa se iz me usobnoga odnosa svih triju kvartila: prvoga (Q1). a njihova izravna usporedba nije moguća jer se odgovarajući izračuni temelje na različitim principima. a za negativno asimetričnu SkQ < 0. engleski ekonomist i statističar.) Koeficijent asimetrije (oznaka: α3) je potpuna i najčešće korištena mjera asimetrije definirana formulom: ( x − x )3 ∑ n k =1 n α3 = σ gdje je n ukupan broj elemenata statističkoga niza (odnosno podataka u odgovarajućem osnovnom skupu). dok s ostalim dvama mjerama to nije slučaj. Na temelju toga odnosa odre uje se asimetričnost središnje polovice (središnjih 50%) elemenata ure enoga statističkoga niza. Što je apsolutna vrijednost koeficijenta α3 bliža 2. 1]. © mr. zaslužan za razvoj teorije uzoraka. 3. 2. asimetričnost je izraženija. Bojan Kovačić. Što je apsolutna vrijednost od Sk bliža 3. a σ njihova standardna devijacija. Sve tri mjere obično se (ali ne i uvijek) podudaraju jedino u predznaku. 91 Arthur Lyon Bowley (1869. Što je apsolutna vrijednost koeficijenta SkQ bliža 1. asimetričnost je izraženija.

standardna devijacija: σ = 3. Prema tome. 3. 1. dobivamo: masa (g) 91 93 94 96 97 98 99 100 101 102 103 104 105 ukupno: Odgovarajućim izračunima lagano se dobiva: aritmetička sredina: x = 99. medijan: Me = 100 (grama). Prikažemo li dobivene podatke tablično. Mjerenjem mase (iskazane u gramima) dobiveni su sljedeći rezultati: 101 94 103 96 98 101 99 102 100 97 102 97 96 100 102 93 101 104 105 102 93 91 98 104 98 Odredimo vrijednost svih triju pokazatelja asimetrije.08 (grama).69778312 (grama). tražene vrijednosti mjera asimetrije su: © mr. ili gornji kvartil: Q3 = 102 (grama). Radi provjere deklarirane mase paketića bombona ''Kikić'' izabran je uzorak od ukupno 25 različitih paketića.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 1. ili donji kvartil: Q1 = 97 (grama). broj paketića 1 2 1 2 2 3 1 2 3 4 1 2 1 25 Za vježbu objasnite svaku od neposredno izračunatih vrijednosti. Bojan Kovačić. mod: Mo = 102 (grama). predavač 122 . objasnimo njihova značenja i prikažimo dobivenu razdiobu linijskim grafikonom.sc.

143 kWh. prosječna godišnja potrošnja električne energije po potrošaču iznosi 2422. Bowleyeva mjera asimetrije upućuje na zaključak da je razdioba središnjih 50% paketića blago negativno asimetrična. Primjer 2. Bojan Kovačić. predavač 123 .869183 kWh.789662321. Prema podacima Hrvatske elektroprivrede za 2006. polovica svih potrošača najviše 1766. dok koeficijent asimetrije upućuje na zaključak da je promatrana razdioba srednje negativno asimetrična. a 25% svih potrošača barem 3370.sc.319 kWh. Bowleyeva mjera asimetrije: SkQ = –0. te objasnimo dobivene rezultate.746393153. godinu.895 kWh. Odredimo vrijednosti odgovarajućih relativnih mjera raspršenja i mjera asimetrije.168207 kWh uz standardnu devijaciju 2383. koeficijent asimetrije: α3 = -0. Odgovarajući prikaz linijskim grafikonom dan je na sljedećoj slici.ELEKTROTEHNIČKI ODJEL Poslovna statistika - Pearsonova mjera asimetrije (odstupanje medijana): Sk = -0.2. Pearsonove mjere asimetrije upućuju na zaključak da je promatrana razdioba srednje negativno asimetrična (prevladavaju vrijednosti veće od aritmetičke sredine). To se vidi i iz dobivene tablice jer postoji ukupno 13 vrijednosti strogo većih od aritmetičke sredine i 12 vrijednosti manjih od nje. Pritom 25% svih potrošača godišnje potroši najviše 683. Pearsonova mjera asimetrije (odstupanje moda): Sk = -0. Iz zadanih podataka slijedi: 92 Podaci su preuzeti iz Statističkoga ljetopisa Republike Hrvatske za 2006.471860569. © mr. godinu92.

definirane su posebne mjere kojima se pojedine razdiobe uspore uju s normalnom. a σ standardna devijacija razdiobe. . normalnom razdiobom.Pearsonova mjera asimetrije (odstupanje medijana): Sk = 0. što znači da je promatrana razdioba potrošača prema godišnjoj potrošnji električne energije srednje pozitivno asimetrična. raspore ena je u skladu s tzv. pa su tražene vrijednosti: koeficijent varijacije: V = 98.Bowleyeva mjera asimetrije: SkQ = 0.4188124%. Bojan Kovačić.sc.168207 (kWh).824634017. Ovdje ćemo samo napomenuti da je riječ o potpuno simetričnoj unimodalnoj razdiobi takvoj da se otprilike svi podaci (točnije. standardna devijacija: σ = 2383.2846722%.895 (kWh). vrlo izraženo prevladavaju manje vrijednosti potrošnje električne energije.ELEKTROTEHNIČKI ODJEL Poslovna statistika - aritmetička sredina: x = 2422. što znači da je razdioba središnjih 50% potrošača blago pozitivno asimetrična. što znači da je razdioba potrošača prema godišnjoj potrošnji električne energije vrlo pozitivno asimetrična. medijan: Me = 1766. tj.73% njih) promatranoga obilježja nalaze u rasponu [ x – 3 ⋅ σ. 99. mjere zaobljenosti i ima ih točno © mr. što znači da je stupanj raspršenja (varijablitet) središnjih 50% potrošača električne energije vrlo jak. Ova je činjenica nerijetko vrlo korisna prigodom procjenjivanja je li neka razdioba (približno) normalna ili nije. - 3. Ova se razdioba vrlo precizno definira u matematičkoj statistici i za to je potreban nešto složeniji aparat teorije vjerojatnosti.319 (kWh). . gdje je x aritmetička sredina. .133.koeficijent kvartilne devijacije: Vq = 66. 3.4. To su tzv.869183 (kWh). ili donji kvartil: Q1 = 683. x + 3 ⋅ σ]. ili gornji kvartil: Q3 = 3370.2.143 (kWh). Mjere zaobljenosti Većina pojava u prirodi. Koeficijent asimetrije ne možemo izračunati na temelju zadanih podataka. 1.193414976. Spomenimo tek da iz originalnih podataka navedenih u referenciranoj literaturi slijedi α3 = 2. što znači da je stupanj raspršenja (varijabilitet) godišnje potrošnje električne energije vrlo jak. predavač 124 . raznim gospodarskim i tehničkim procesima i sl. S obzirom na veliki značaj normalne razdiobe u statistici.

Riječ eksces na latinskom znači prekoračenje ili pretjeranost. dok je eksces (oznaka: κ) jednak razlici koeficijenta zaobljenosti i broja 3: κ = α4 – 3. © mr. pa je na temelju te činjenice lako izvršiti usporedbu. Prema predznaku ekscesa razlikujemo tri vrste razdioba: – platikurtične čiji je eksces strogo manji od nule. tj. Od navedene dvije mjere jednostavnija je eksces jer eksces normalne razdiobe iznosi 0. κ > 0. 93 94 Riječ kurtosis na grčkom znači izbočenost. Bojan Kovačić. a leptikurtične ''šiljastije'' u odnosu na normalnu razdiobu. Koeficijent zaobljenosti (kurtosis) (oznaka: α4) je mjera zaobljenosti modalnoga vrha neke razdiobe. Slobodnije govoreći. tj.ELEKTROTEHNIČKI ODJEL Poslovna statistika dvije: koeficijent zaobljenosti (kurtosis93) i eksces94. Usporedba nekih značajnijih vrsta razdioba s normalnom razdiobom (krivulja nacrtana crnom bojom) navedena je na donjoj slici. κ = 0.sc. možemo reći da su platikurtične razdiobe ''plosnatije''. tj. κ < 0. – mezokurtične čiji je eksces jednak nuli. – leptikurtične čiji je eksces strogo veći od nule. predavač 125 .

08605128 3 2 5 104 30 © mr. Primjer takvog izvještaja prikazan je u donjoj tablici.16658456 1.5. opsegu i ukupnom zbroju svih članova promatranoga numeričkoga niza. SPSS i STATISTICA. i podatke o aritmetičkoj sredini. Najpoznatiji od njih su SAS. medijanu. Jedini potrebni ulazni podatak jest raspon ćelija u kojima su smješteni negrupirani numerički podaci. U MS EXCEL-u potpunu statističku analizu vrijednosti kvantitativnoga obilježja elemenata statističkoga skupa možemo dobiti rabeći alat Descriptive Statistics smještenu u izborniku Alati (Tools). najmanjoj i najvećoj vrijednosti. Bojan Kovačić. Ocjene iz matematike Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count 3. izlazni izvještaj (Summary Statistics) obavljene statističke analize sadrži. izme u ostalih. koeficijentu asimetrije. a stvara statistički izvještaj za podatke u ulaznom rasponu i daje podatke o tendenciji gomilanja podataka oko aritmetičke sredine i njihovoj promjenljivosti (varijabilitetu).ELEKTROTEHNIČKI ODJEL Poslovna statistika 3.4568278 0.46666667 0. Tzv.21298823 3 2 1. Programska potpora deskriptivnoj statističkoj analizi Danas je u uporabi više različitih računalnih programa namijenjenih statističkim analizama. opcija: Analiza podataka (Data Analysis).36091954 -1.sc. varijanci. Taj je alat dio Analysis ToolPak alata za analizu. standardnoj devijaciji. predavač 126 . modu.

Tada je veza izme u varijabli C0 i Cn funkcijska i može se opisati analitičkim izrazom (zatvorenom formulom): Cn = 2. Bojan Kovačić. © mr. stohastička). predavač 127 . a Cn ukupan iznos koji u tih 30 godina zajmoprimac treba vratiti banci.00 €.17713578 ⋅ C0.000. I u slučaju uvo enja dodatnih varijabli (npr. KORELACIJSKA I REGRESIJSKA ANALIZA U prethodnim smo se poglavljima bavili tzv.ELEKTROTEHNIČKI ODJEL Poslovna statistika 4. a Cn ukupan iznos koji treba izdvojiti za kupnju tih automobila. odnosno o me usobnoj povezanosti dviju ili više pojava.17713578 ⋅ C0 kn. ''Čitlučka banka'' odobrava stambene kredite uz 5.sc. U ovom ćemo poglavlju obratiti pozornost upravo na takve slučajeve. Neka nam n označava broj kupljenih automobila. U slučaju funkcijske povezanosti svakoj vrijednosti jedne varijable odgovara točno odre ena i jedinstvena vrijednost druge varijable. Primjer 1. Pri tome ćemo (radi analogije s matematikom) termin obilježja (koji se obično rabi u kvalitativnim slučajevima) zamijeniti ekvivalentnim nazivom varijabla (jer ćemo promatrati kvantitativna obilježja).000. To znači da će svaki kupac koji kupi točno n automobila za njih morati izdvojiti točno 50. dodatni popust na gotovinsko plaćanje) veza će i dalje ostati funkcijska.00 ⋅ n. Primjer 2. Pri tome nismo vodili računa o uzrocima i posljedicama tih pojava.000. jednodimenzionalnom analizom odre enih pojava. dok u slučaju statističke povezanosti odre enoj vrijednosti jedne varijable mogu odgovarati barem dvije vrijednosti druge varijable.00 ⋅ n €. To znači da svaki zajmoprimac koji dobije zajam u iznosu od C0 kn banci treba vratiti ukupno 2. Tada je veza izme u varijabli n i Cn funkcijska i može se opisati analitičkim izrazom (zatvorenom formulom): Cn = 50. Akcijska cijena jednoga automobila marke ''Ficho'' je 50. Neka je C0 iznos zajma koji se odobrava zajmoprimcu. Veza izme u dviju varijabli općenito može biti funkcijska (deterministička) ili statistička (slučajna.99% složenih dekurzivnih godišnjih kamata na 30 godina uz otplatu jednakim godišnjim postnumerando anuitetima.

a moguće utjecaje na nju samu zanemarujemo.) odre ivanje brojčanoga pokazatelja jakosti i smjera veze me u varijablama (koeficijent korelacije). predavač 128 .sc.1. obično razlikujemo nezavisnu varijablu (X) i zavisnu varijablu (Y). p – vrijednost). dok je zavisna © mr. svi ljudi koji mjesečno zara uju prosječno 3.00 € imaju jednaka prosječna mjesečna izdvajanja za prehranu. No.ELEKTROTEHNIČKI ODJEL Poslovna statistika Pojave koje istražuje statistika obično nisu tako ''čvrsto'' povezane kao varijable u prethodnim primjerima. Ekonomskim je analizama utvr eno da postoji veza izme u ukupnih prosječnih mjesečnih primanja i prosječnih mjesečnih izdvajanja za prehranu. dijagram raspršenja ili oblak raspršenja). regresijskom analizom razvija se odgovarajući analitički izraz ili algebarski model te veze kako bi se moglo prognozirati očekivanu vrijednost jedne varijable za unaprijed zadanu vrijednost druge varijable.000. Bojan Kovačić. Primjer 3. prvi korak se vrlo često izostavlja jer je prostorne analogone dijagrama rasipanja vrlo teško nacrtati čak i uz pomoć suvremenih računalnih programa. Govorimo li o odnosu izme u dviju varijabli. Korelacijska analiza primjenom posebnih metoda i tehnika ispituje stupanj povezanosti izme u barem dviju varijabli. sve paštete za čiju je promidžbu utrošeno 100. No. Stoga se dijagram rasipanja obično crta isključivo kod utvr ivanja povezanosti točno dviju varijabli. Ukoliko se utvr uje povezanost najmanje triju varijabli.) odre ivanje brojčanoga pokazatelja statističke značajnosti koeficijenta korelacije (tzv.) konstrukcija odgovarajućega grafičkog prikaza odnosa me u varijablama (tzv. Kako sugeriraju sami nazivi. 2.00 kn imaju jednake ukupne vrijednosti prodanih komada. Ekonomskim je analizama utvr eno da postoji veza izme u izdvajanja za marketing nekoga prehrambenoga proizvoda i ukupne vrijednosti prodanih komada toga proizvoda. nezavisna varijabla (X) je ''varijabla koja utječe'' na drugu varijablu. ne može se reći da npr. ne može se reći da npr. dijagram rasipanja. Korelacijska analiza Korelacijska analiza povezanosti dviju varijabli obično se provodi u tri koraka: 1. Ukoliko se utvrdi odre eni stupanj povezanosti izme u dviju varijabli. 3.000. 4. Tada govorimo o statističkoj ili stohastičkoj vezi me u varijablama. Primjer 4.

ne možemo potpuno precizno utvrditi koja varijabla je zavisna. kad god je to moguće. U tu se svrhu rabi već spomenuti dijagram rasipanja. tj. a koja zavisna. Iz oblika dijagrama rasipanja može se približno procijeniti postoji li uopće veza izme u dviju varijabli i. u slučajevima kada imamo varijable poput iznos mjesečne plaće i iznos mjesečnoga izdvajanja za prehranu jasno je da iznos mjesečnoga izdvajanja za prehranu ovisi o iznosu primljene mjesečne plaće. onda ocjena iz statistike može zavisiti o ocjeni iz matematike (dobar matematičar obično je i dobar statističar). kojega je oblika (pravocrtna (pravolinijska) ili krivocrtna (krivolinijska)). degustator). No. a da iznos primljene mjesečne plaće ne ovisi o iznosu mjesečnoga izdvajanja za prehranu (osim ako je posao djelatnika usko vezan za prehranu.sc. ali i ocjena iz matematike može zavisiti i o ocjeni iz statistike (ako netko na ispitu iz statistike dobije 5. odnos izme u zavisne i nezavisne varijable najprije je zgodno predočiti grafički. varijabla čije vrijednosti zavise o vrijednostima nezavisne varijable X. dakle. me utim. U takvim slučajevima. kao što je npr. Taj se dijagram konstruira tako da da točke s odgovarajućim vrijednostima varijabli X i Y nanesemo u pravokutni koordinatni sustav u ravnini. Bojan Kovačić. a koja nezavisna. nije uvijek točno odre eno koja varijabla je nezavisna. ako postoji. Primjer 1. to ga može motivirati da sjedne i nauči matematiku barem za 4).ELEKTROTEHNIČKI ODJEL Poslovna statistika varijabla (Y) ''varijabla na koju se utječe''. Primjeri potpune linearne (pravocrtne) veze izme u dviju varijabli: © mr. U praksi. Npr. predavač 129 . promatramo li varijable ocjena iz matematike i ocjena iz statistike. Kako je već istaknuto.

Primjeri potpune nelinearne (krivocrtne) veze izme u dviju varijabli: © mr. predavač 130 . Bojan Kovačić.sc.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 2.

Primjer slučajne (statistički beznačajne) veze izme u dviju varijabli: © mr. Bojan Kovačić. predavač 131 . Primjer postojanja statističke veze izme u dviju varijabli: Primjer 4.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primjer 3.sc.

95 © mr. pa je praktičnije promatrati povećanje bilo koje vrijednosti umjesto njezina smanjenja. Ako povećanje vrijednosti jedne varijable uzrokuje povećanje vrijednosti druge varijable. predavač 132 . kažemo da je veza negativna. yi) vrijednosti varijabli X i Y. kažemo da je veza me u varijablama pozitivna. – 1936. britanski statističar.sc. Bojan Kovačić.). jedan od najzaslužnijih za razvoj statistike kao zasebne znanstvene discipline. ali se taj kriterij praktično ne koristi jer su vrijednosti na svakoj od osi u dijagramu rasipanja poredane uzlazno (od najmanje do najveće). prelazi se na izračun odgovarajućega numeričkoga pokazatelja jakosti i smjera utvr ene veze.ELEKTROTEHNIČKI ODJEL Poslovna statistika Ukoliko se nakon konstrukcije dijagrama rasipanja utvr i postojanje veze me u promatranim varijablama. Treba napomenuti da je teorijski veza me u varijablama pozitivna (negativna) i ako smanjenje vrijednosti jedne varijable uzrokuje smanjenje (povećanje) vrijednosti druge varijable. Uz pretpostavku da imamo ukupno n ure enih parova (xi. Pritom odre ivanje smjera veze znači utvr ivanje uzrokuje li povećanje vrijednosti jedne varijable povećanje ili smanjenje vrijednosti druge varijable. Uzrokuje li. povećanje vrijednosti jedne varijable smanjenje vrijednosti druge varijable. pak. U takvim se slučajevima računa tzv. Pearsonov95 koeficijent jednostavne linearne korelacije (oznaka: r). koeficijent r računamo prema formuli: Karl Pearson (1857. Najjednostavniji slučaj analitičkoga opisivanja veze me u dvjema varijablama jest ukoliko iz dijagrama rasipanja utvrdimo da je ta veza linearna.

veza je slabija. za neki k ∈ R. vrijednost druge varijable će se smanjiti (povećati). to ne bi bilo matematički korektno: upravna razmjernost vrijednosti varijabli znači da ako se.sc. Kod linearne ovisnosti. za neki k ∈ 〈0. Bojan Kovačić. Grubo bismo mogli reći da su promatrane varijable upravno razmjerne. ali ne nužno za k% (nego najčešće za strogo manje od k%). vrijednost jedne varijable poveća (smanji) za k%. Jedan od mogućih kriterija jakosti veze naveden je u donjoj tablici. Kao i u slučaju pozitivnoga koeficijenta. vrijednost druge varijable će se svakako povećati (smanjiti). Negativan koeficijent jednostavne linearne korelacije ukazuje da povećanje vrijednosti jedne varijable uzrokuje smanjenje vrijednosti druge varijable. no. veza je jača. grubo bismo mogli reći da su promatrane varijable obrnuto razmjerne. a najveća –1. dakle.ELEKTROTEHNIČKI ODJEL Poslovna statistika r= n 2 i ∑ x ⋅ y − n ⋅∑ x ⋅∑ y i i i i =1 i =1 i =1 n 1 n n i 2 1  n  ∑ x − n ⋅  ∑ xi  ⋅ i =1  i =1  2 1  n  ∑ y − n ⋅  ∑ yi  i =1  i =1  n 2 i Može se pokazati da koeficijent r može poprimiti sve vrijednosti iz segmenta [–1. to općenito nije točno: ako se vrijednost jedne varijable poveća (smanji) za k%. njegova najmanja vrijednost jednaka –1. vrijednost jedne varijable poveća (smanji) za k%. onda se vrijednost druge varijable smanji (poveća) za k%. Pozitivan koeficijent jednostavne linearne korelacije (onaj koji je strogo veći od 0. to ne bi bilo matematički korektno: obrnuta razmjernost vrijednosti varijabli znači da ako se. pa je. a što je bliže jedinici. 1]. Korelacijska analiza zasebno interpretira predznak Pearsonova koeficijenta jednostavne linearne korelacije. ali i obrnuto: smanjenje vrijednosti jedne varijable uzrokuje povećanje vrijednosti druge varijable. a zasebno njegovu apsolutnu vrijednost. ali ne nužno za k% (nego najčešće za strogo više od k%). Što je│r│bliže nuli. © mr. +∞〉. to općenito nije točno: ako se vrijednost jedne varijable poveća (smanji) za k%. Apsolutna vrijednost koeficijenta korelacije (oznaka:│r│) ukazuje na jakost linearne veze me u varijablama. predavač 133 . odnosno onaj kojemu je predznak +) ukazuje da povećanje vrijednosti jedne varijable uzrokuje povećanje vrijednosti druge varijable. me utim. no. me utim. ali i obrnuto: smanjenje vrijednosti jedne varijable uzrokuje smanjenje vrijednosti druge varijable. Kod linearne ovisnosti. onda se i vrijednost druge varijable poveća (smanji) za k%.

Broj p je neki element segmenta [0. © mr. nekontroliranih uvjeta ili činitelja). U slučaju strožega kriterija odgovarajući uvjet je p < 0..80 ≤ │r│ < 1 srednje jaka 0. 1] i za njega odre ujemo gornju granicu do koje ćemo smatrati da je do promjene vrijednosti zavisne varijable došlo slučajno.50 ≤ │r│ < 0.sc.01 i tada kažemo da smo procjenu izvršili uz razinu pouzdanosti od 99%.0 < │r│ < 0.2 neznatna 0 potpuna odsutnost Ovdje odmah treba istaknuti najčešću pogrešku koja se javlja prigodom uporabe Pearsonova koeficijenta jednostavne linearne korelacije.ELEKTROTEHNIČKI ODJEL Poslovna statistika koeficijent korelacije jakost veze me u varijablama 1 potpuna jaka 0. u slučajevima kad je |r| ≈ 0.8 slaba 0. Naime.05 i tada kažemo da smo procjenu izvršili uz razinu pouzdanosti od 95%. Ekvivalentno. takvom procjenom želimo utvrditi je li promjena vrijednosti zavisne varijable doista uzrokovana utjecajem. Grubo govoreći. Veza me u varijablama može biti i eksponencijalna. odnosno promjenom vrijednosti nezavisne varijable ili je do promjene vrijednosti zavisne varijable došlo slučajno stjecajem drugih okolnosti (pod djelovanjem tzv.01. logaritamska. polinomna (takva da je stupanj odgovarajućega polinoma najmanje 2) itd. Posljednji korak korelacijske analize je procjenjivanje statističke značajnosti izračunatoga koeficijenta korelacije. prema blažem kriteriju smatramo da je promjena vrijednosti zavisne varijable doista uzrokovana promjenom vrijednosti nezavisne varijable. tj. potencijska. stroži kriterij: smatramo da je do promjene vrijednosti zavisne varijable došlo slučajno ako i samo ako je p ≥ 0.5 0. Zbog toga prigodom interpretacije ovoga koeficijenta uvijek treba imati na umu da on opisuje isključivo smjer i jakost linearne veze me u varijablama.05.20 ≤ │r│ < 0. Bojan Kovačić. često se pogrešno zaključuje da nema nikakve statističke veze me u promatranim varijablama. U tu svrhu s p označavamo vjerojatnost da je do promjene zavisne varijable došlo slučajno stjecajem drugih okolnosti i taj broj nazivamo p – vrijednost. Obično se razlikuju dva kriterija: blaži kriterij: smatramo da je do promjene vrijednosti zavisne varijable došlo slučajno ako i samo ako je p ≥ 0. a ne samo linearna. da je veza promatranih varijabli statistički značajna ako i samo ako je p < 0. predavač 134 .

Ukoliko se to ipak učini.sc. 97 Grubo govoreći. Studentovu t– razdiobu96 ili. Jedan od modificiranih algoritama za izračun p – vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije na temelju Studentove t – razdiobe u MS Excelu može se formulirati ovako: Korak 1. Pearsonov koeficijent jednostavne linearne korelacije je statistički značajan ako i samo ako je p < 0.01 (stroži kriterij) ili s 0. 1975. broj stupnjeva slobode može se definirati kao ukupan broj me usobno različitih ''slobodnih'' (nezavisnih) parametara čije vrijednosti treba zadati kako bi se potpuno odredila vrijednost neke veličine.) Ispituje se odnos izme u visine i mase žena u dobi od 30 do 40 godina. Izračunati p – vrijednost kao vrijednost Studentove t – razdiobe s parametrima |t|. prvi otkrio engleski statističar William Sealy Gosset (1876.01 (ili p < 0.05). ukupan broj elemenata u uzorku). Izračunati Pearsonov koeficijent jednostavne linearne korelacije (r). a koja nezavisna. Korak 5. Korak 2. (preuzeto iz The World Almanac and The Book of Fact. 1− r2 Korak 4. Izračunati pripadnu t – vrijednost prema formuli t = r⋅ d . Izračunati vrijednost broja d := N – 2. Usporediti p – vrijednost ili s 0. 300 elemenata) praktički podudara s normalnom razdiobom. d i 2.ELEKTROTEHNIČKI ODJEL Poslovna statistika Budući da ćemo raditi uglavnom s ''malim'' uzorcima (koji imaju najviše 30 elemenata).05 (blaži kriterij). Odabrano je ukupno 15 uzoraka žena navedene dobi i dobiveni su sljedeći podaci: Studentovu t-razdiobu je 1908.) U MS Excelu ta se vrijednost dobiva primjenom funkcije TDIST. Korak 3. Taj se pseudonim i danas koristi u nazivu razdiobe. – 1937. suradnik Karla Pearsona. govori se o jednosmjernoj vezi. pa je Gosset objavio članak o novoj razdiobi u Pearsonovu časopisu ''Biometrics'' pod pseudonimom Student. p – vrijednost koja odgovara Pearsonovu koeficijentu jednostavne linearne korelacije računat ćemo koristeći tzv. ne treba unaprijed zadati koja varijabla je zavisna. Vrijednost d obično se naziva broj stupnjeva slobode97. On je tada radio za pivovaru „Guiness“ koja je zahtijevala od njega da svoje radove objavljuje pod pseudonimom. Bojan Kovačić. (Broj 2 treba upisati jer kod korelacije uvijek promatramo dvosmjerne veze. tj. Pokažimo primjenu navedenih postupaka na primjerima. kako se često naziva. ''razdiobu malih uzoraka'' jer se u slučaju ''velikih“ uzoraka (koji imaju npr.). 96 © mr. gdje je N opseg uzorka (tj. predavač 135 . Primjer 5.

57 59.5 1.17 Odredimo Pearsonov koeficijent jednostavne linearne korelacije i procijenimo njegovu statističku značajnost uz razinu pouzdanosti od 95%.92 prosječna masa [kg] 72.48 55. a zavisna varijabla (Y) varijabla prosječna masa.78 prosječna visina [m] 1.46 931. predavač 136 .11 64.2 58. neka nezavisna varijabla (X) bude varijabla prosječna visina.47 66.1 69.8 1. Bojan Kovačić.84 57.60 1.52 1.65 1.29 63.47 1.93 61.73 1.7 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika uzorak 1 2 3 4 5 6 7 8 9 10 11 12 13 uzorak 14 15 ukupno: prosječna visina [m] 1.63 1.12 54. Radi odre enosti.98 Izračunajmo najprije sve potrebne pomoćne numeričke podatke: Suprotna bi pretpostavka (ovisnost visine o masi) bila daleko više motivirajuća npr.28 68.75 1.76 prosječna masa [kg] 52. 98 © mr.21 53.sc.19 74.68 1. za liječenje od anoreksije i bulimije.83 24.57 1.55 1.

4025 3118.28 114.6 58.942 3.84 86.93 97.46 136.6859 2.9929 4393.599 2.1056 1.56 3430.68 2.3809 1.19 129.52 54.25 2821.47 52.1285 2. 1 ⋅ 24.48 82.29 101. Izračunajmo najprije pripadnu t – vrijednost: © mr.994583794 Prije interpretacije dobivenoga koeficijenta procijenimo njegovu statističku značajnost.83 74.6049 1.61 1.4641 1.0704 1.5439 uzorak 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ukupno: Stoga je traženi Pearsonov koeficijent jednostavne linearne korelacije: r= ∑x ⋅ y i i =1 15 i − 15 1 15 ⋅∑ xi ⋅∑ yi 15 i =1 i =1 2 ∑x i =1 15 2 i − 1   ⋅  ∑ xi  ⋅ 15  i =1  1548.76 931.175 3.84 1.2 89.245 41.1 119.762 ⋅ 58498.6644 2.12 79.57 93.053 − ⋅ 24.172 15 15 r = 0.76 ⋅ 931.7225 3756.89 4156. predavač 137 .8096 2.92 124.78 69.5439 − ⋅ 931.1684 4888.552 2.2916 24.0248 2.053 58498.75 68.3104 2968.6569 3591.7 64.804 2.1609 2725.3489 5544.5 53.7487 2.63 59.68 63.0384 1.4449 1.sc.24 5211.57 57.8064 1.0625 4637.4649 3271.8841 1. Bojan Kovačić.8224 3982.55 55.4576 3.11 106.8 72.7344 1.73 66.245 − 15 ∑y i =1 15 2 i − 1   ⋅  ∑ yi  15  i =1  15 2 .17 1548.ELEKTROTEHNIČKI ODJEL Poslovna statistika prosječna prosječna visina [m] masa [kg] xi ⋅ yi (X) (Y) xi2 yi2 1.8721 1.65 61.17 15 r= 1 1 41.2618 3.3961 1.47 109.21 76.712 2.

tj.666666666666667 Odgovarajućim se izračunom dobiva da je vrijednost Pearsonova koeficijenta jednostavne linearne korelacije r = 0. Primjer 6. Očito je p < 0.15–2.8 16 20 30 50 70 90 120 600 yi 0.666666666329664 0.666666666666667 0. pa postoji statistički značajna linearna veza izme u prosječne visine i prosječne mase na promatranim uzorcima žena. a toj vrijednosti odgovarajuća p – vrijednost © mr.666666666666667 0.666666666666657 0. da će povećanje prosječne visine vrlo vjerojatno uzrokovati i povećanje prosječne mase (i obrnuto). pripadna t – vrijednost t ≈ 0.5016057 .602745504.60352E-14 = 0.ELEKTROTEHNIČKI ODJEL Poslovna statistika t = r⋅ 15 − 2 d = 0.666666666666667 0. I 1 2 3 4 5 6 7 8 9 10 xi 10 11. predavač 138 .5016057.sc. Iz vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zaključujemo da je ta veza pozitivna i jaka.208423.994583794 ⋅ ≈ 34.666666666666667 0.00000000000000360352. Dobivamo: p = TDIST(34.666666644193195 0.666654428469398 0. 2 1− r 0. Bojan Kovačić.05.2) ≈ 3.994583794 Pripadnu p – vrijednost izračunamo koristeći MS Excel. U sljedećoj je tablici navedeno ukupno 10 parova vrijednosti nezavisne varijable X i zavisne varijable Y.666664817791255 0.

ukoliko imamo dvije varijable od kojih je barem jedna redosljedna (varijabla ranga). Bojan Kovačić. engleski statističar i psiholog.05⋅ x Ovaj primjer još jednom ukazuje na činjenicu da se u primjeni Pearsonova koeficijenta jednostavne linearne korelacije uporno mora naglašavati riječ linearne jer se radi o pokazatelju isključivo linearne. niti da vrijednosti varijable (modaliteti) pripadaju intervalnoj ili omjernoj skali. modalitete možemo rangirati.563369789. Sukladno tome. logističke funkcije).1. normalnoj razdiobi). U takvim slučajevima za odre ivanje stupnja linearne veze obično se koristi Spearmanov koeficijent korelacije ranga (oznaka: rs) Spearmanov koeficijent korelacije ranga pripada u tzv. odnosno poredati od najslabijega prema najboljemu (uzlazno) ili od Charles Edward Spearman (1863.sc. ne moramo zahtijevati da odre ivanje stupnja linearne povezanosti. može se zaključiti da ne postoji statistički značajna linearna korelacija promatranih varijabli. naime. No. 4. funkcijska i dana je analitičkim izrazom: y= 1 (primjer tzv. 99 © mr.). jedan od začetnika ideje faktorske analize varijance. 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika p ≈ 0. pretpostavljamo da modaliteti pripadaju ordinalnoj skali. predavač 139 . No.5 + e −1. a već smo istakli da se ne zahtijeva utvr ivanje linearne veze i pripadnost modaliteta intervalnoj ili omjernoj skali. tj. zaključak da ne postoji bilo kakva korelacija promatranih varijabli potpuno je pogrešan: veza promatranih varijabli. Spearmanov99 koeficijent korelacije ranga Pearsonov se koeficijent jednostavne linearne korelacije u pravilu primjenjuje za utvr ivanje stupnja linearne povezanosti izme u numeričkih varijabli čije jedinice odgovaraju intervalnoj ili omjernoj skali. Pritom se ne pretpostavlja da vrijednosti varijable pripadaju nekoj od uobičajenih razdioba (npr. Uz razinu pouzdanosti od 95%. neparametarske mjere korelacije jer njegovo izračunavanje ovisi o poretku vrijednosti modaliteta promatranih varijabli. zapravo je potpuna.1. Napomenimo da se obično ne računa za pojave u bilo kakvom monotonom (rastućem ili padajućem) odnosu. – 1945. a ne izravno o samim vrijednostima varijabli. a ne bilo kakve veze izme u promatranih varijabli. Dakle.

pozicije) toga modaliteta u ''rang-listi''. rangiramo li neki uzorak studenata prema trenutnom prosjeku ocjena. i 5. a tri iste 3+ 4+ 5 vrijednosti 2 imaju zajednički rang = 4 jer se u trenutnom nizu nalaze na 3. 4. umjesto Spearmanova. Ovo obavezno treba imati na umu prigodom interpretacije Spearmanova koeficijenta korelacije ranga. odnosno zavisne varijable treba uzeti izračunate rangove modaliteta. Rang pojedinoga modaliteta zapravo možemo shvatiti kao broj položaja (mjesta. predavač 140 . tj. 2. Npr. pa treba odrediti rang svakoga od njih. Bojan Kovačić. pa se utvr uje tzv. preporučuje računanje Pearsonova koeficijenta jednostavne linearne korelacije. Pritom kao vrijednosti nezavisne. 3 mjestu. onda će student s najmanjim brojem izostanaka imati najbolji rang. u nizu ocjena 5. nema razloga preferirati bilo kojega od njih. Unatoč ovakvom načinu ''eliminiranja'' vezanih rangova. 4. Konkretno. Pri ovakvom rangiranju se prirodno pojavljuje problem odre ivanja ranga barem dvaju jednakih modaliteta.. Spearmanov koeficijent rs računa se prema formuli : 6 ⋅ ∑ di2 i =1 n rs = 1 − gdje su: n3 − n n – ukupan broj elemenata niza vrijednosti varijable X (ili varijable Y) © mr.sc. vezanim rangovima. Dogovorno ćemo modalitete rangirati silazno od najboljega prema najslabijemu tako da najbolji modalitet uvijek ima rang 1. rangiramo li isti uzorak studenata prema broju izostanaka s redovne nastave. No. tj. Povećanje ranga (s 1 na 2) u ovom slučaju znači uobičajeno smanjenje vrijednosti modaliteta. Oprez: Dogovorno modalitete rangiramo silazno. treba istaknuti da se u slučajevima pojave nezanemarivoga broja vezanih rangova (u odnosu na ukupan broj parova vrijednosti varijabli). vrijednost 5 ima rang 1 (najbolja ocjena). najbolji modalitet uvijek dobiva rang 1. U takvim slučajevima govorimo o tzv. Npr. vrijednost 4 ima rang 2. u ovome slučaju povećanje ranga povlači povećanje vrijednosti modaliteta. zajednički rang kao aritmetička sredina trenutnih pozicija istih modaliteta. No. 2 imamo 3 jednaka modaliteta (2). Nakon rangiranja modaliteta. onda će student s najboljim prosjekom imati rang 1. 2. Budući da su modaliteti me usobno jednaki. ovisno o promatranom obilježju. povećanje ranga ne mora nužno značiti smanjenje odgovarajuće vrijednosti modaliteta.ELEKTROTEHNIČKI ODJEL Poslovna statistika najboljega prema najslabijemu (silazno).

Zbroj svih razlika rangova jednak je 0.sc. Najprije rangirajmo modalitete. Na slučajno odabranom uzorku od 10 ljudi ispituje se veza kvocijenta inteligencije i ukupnoga tjednoga vremena provedenoga u gledanju TV programa. Bojan Kovačić. n. njihove su razlike jednake nuli. Navedimo neka korisna svojstva vezana uz Spearmanov koeficijent korelacije ranga: Svojstvo 1. Svojstvo 2. kao radna pretpostavka. Svojstvo 3. Ako je redoslijed rangova jedne varijable suprotan redoslijedu rangova druge varijable. Kod varijable IQ logično je da osoba (iz promatranoga uzorka) s najvećim količnikom inteligencije ima rang 1. a osoba s najmanjim koeficijentom © mr. …. Svojstvo 4. Kao kriterij jakosti veze me u varijablama ranga koristi se kriterij naveden kod Pearsonova koeficijenta jednostavne linearne korelacije. Ako su u svakom paru rangovi jednaki. Pritom se. predavač 141 .ELEKTROTEHNIČKI ODJEL Poslovna statistika di = r(xi) – r(yi) = razlika rangova odgovarajućega para vrijednosti varijable X i varijable Y . Primjer 1. količnik inteligencije (IQ) 106 86 100 101 99 103 97 113 112 110 vrijeme provedeno u gledanju TV [sati/tjedan] 7 0 27 50 28 29 20 12 6 17 Ispitajmo vezu promatranih varijabli pomoću Spearmanova koeficijenta korelacije ranga. vrijednost Spearmanova koeficijenta korelacije ranga jednaka je rs = –1 i tada govorimo o potpunoj (savršenoj) negativnoj korelaciji ranga. Dobiveni podaci prikazani su u donjoj tablici. 2. za svaki i = 1. uzima da je poželjno što manje vremena tjedno provoditi pred televizijskim prijamnikom. U tom je slučaju vrijednost Spearmanova koeficijenta korelacije ranga jednaka rs = 1 i tada govorimo o potpunoj (savršenoj) pozitivnoj korelaciji ranga.

dodijelit ćemo rang 1.sc.175757576. povećanje ranga znači smanjenje vrijednosti varijable.ELEKTROTEHNIČKI ODJEL Poslovna statistika inteligencije rang 10. Ovdje. Primjer 2. Bojan Kovačić. u skladu s polaznom temeljnom pretpostavkom. Spearmanov koeficijent korelacije ranga jednak je: 6 ⋅ ∑ d i2 10 − 10 i =1 3 10 rs = 1 − = 1− 6 ⋅136 ≈ 0. odnosno Poslovne statistike za svakoga od 8 slučajno izabranih studenata © mr. na temelju promatranoga uzorka može se zaključiti da postoji neznatna pozitivna korelacija količnika inteligencije i vremena provedenim u gledanju televizijskih programa. da izračunati Spearmanov koeficijent korelacije ranga nije statistički značajan pokazatelj. Napomenimo da se može pokazati da je pripadna p – vrijednost strogo veća od 0. dakle. Tako dobivamo sljedeću tablicu: količnik inteligencije (IQ) (xi) 106 86 100 101 99 103 97 113 112 110 ukupno: vrijeme provedeno u gledanju TV [sati/tjedan] (yi) 7 0 27 50 28 29 20 12 6 17 r(xi) 4 10 7 6 8 5 9 1 2 3 r(yi) 3 1 7 10 8 9 6 4 2 5 di 1 9 0 -4 0 -4 3 -3 0 -2 0 di2 1 81 0 16 0 16 9 9 0 4 136 Prema tome. tj. 990 Dakle. Kod varijable vrijeme provedeno u gledanju TV osobi koja tjedno najmanje vremena provede u gledanju televizijskih programa. odnosno smanjenje količnika inteligencije. U donjoj su tablici navedeni ukupni bodovi na pismenim ispitima iz Gospodarske matematike. a osobi koja tjedno najviše vremena provede u gledanju televizijskih programa rang 10. predavač 142 .05.

a bodovi na ispitu iz Poslovne statistike zavisna varijabla. mjesto. predavač 143 . tj.50 Uočimo da u vrijednostima varijable X imamo dvije me usobno jednake (50) koje dijele 3. Analogno. a koja nezavisna.5. Stoga je njihov zajednički rang jednak = 3.ELEKTROTEHNIČKI ODJEL Poslovna statistika stručnoga studija računovodstva i financija Veleučilišta u Frkljevcima u akademskoj godini 2006/2007.5 1 -1 -0. i 3+ 4 4. No. student koji je na ispitu iz Gospodarske matematike postigao 100 bodova bolji je od studenta koji je na istom ispitu postigao 50 bodova itd. kako ispitujemo isključivo stupanj veze me u promatranim varijablama.5 8 1 3. U ovom se zadatku radi o slučaju gdje nije potpuno jasno koja je varijabla zavisna. ta činjenica nije bitna.25 0 1 5.sc. U oba slučaja modalitete obilježja poredat ćemo silazno jer student s najvećim brojem bodova treba ima najveći rang. u varijabli Y imamo 2 © mr. Stoga ćemo pretpostaviti da su bodovi na ispitu iz Gospodarske matematike nezavisna. bodovi na ispitu iz bodovi na ispitu iz gospodarske matematike poslovne statistike 45 50 20 10 50 50 0 20 100 90 50 50 30 40 80 100 Odredimo Spearmanov koeficijent korelacije ranga i objasnimo njegovo značenje. Tako dobivamo sljedeću tablicu: bodovi na ispitu iz Gospodarske matematike (xi) 45 20 50 0 100 50 30 80 ukupno: bodovi na ispitu iz Poslovne statistike (yi) 50 10 50 20 90 50 40 100 r(xi) 5 7 3.5 0 1 0 di2 1 1 0.5 6 2 r(yi) 4 8 4 7 2 4 6 1 di 1 -1 -0. Bojan Kovačić.25 1 1 0. Navedene su varijable očito redosljedne.

Mužjaci sme okriloga brzana (Fregata maginificens) imaju crvenu grlenu vrećicu koju u doba svadbenoga plesa100 nadimaju kao svadbeno ruho (vidjeti sliku) i pomoću nje proizvode poseban zvuk kojim privlače ženke. i obrnuto. Bojan Kovačić.01. mjesto.ELEKTROTEHNIČKI ODJEL Poslovna statistika 3 takve vrijednosti (ponovno 50) koje dijele 3. U donjoj su tablici navedeni prikupljeni podaci.sc. 4. grupa ornitologa utvrdila je da ženke odabiru mužjake upravo na temelju veličine njihove grlene vrećice. pa je dobiveni koeficijent statistički značajan. Iz dobivena koeficijenta zaključujemo da povećanje ranga broja bodova iz Gospodarske matematike vrlo vjerojatno uzrokuje povećanje ranga broja bodova iz Poslovne statistike. Proučavajući opisano ponašanje. i 5. © mr.93 Zaključujemo da postoji jaka pozitivna korelacija izme u bodova na ispitu iz matematike i bodova na ispitu iz statistike. Stoga je njihov zajednički rang 3+ 4+5 jednak = 4.. 100 Svadbeni ples u biologiji je skupni naziv za sva ponašanja koja predstavljaju uvod u parenje životinja. Primjer 3. pa je provedeno dodatno istraživanje postoji li statistički značajna korelacija izme u obujma grlene vrećice i frekvencije zvuka kojim mužjaci privlače ženke. predavač 144 . To znači da će student koji ostvari visoki rezultat u jednom ispitu vrlo vjerojatno postići visoki rezultat i u drugom.50 83 − 8 ≈ 0. Može se pokazati da je pripadna p – vrijednost strogo manja od 0. Tako je traženi Spearmanov koeficijent korelacije ranga jednak: 3 rs = 1 − 6 ⋅ 5.

odnosno da će mužjak s većim obujmom grlene vrećice vrlo vjerojatno imati dublju frekvenciju zvuka kojim privlači ženke.5. a mužjak s najmanjim obujmom rang 18.ELEKTROTEHNIČKI ODJEL Poslovna statistika obujam grlene vrećice [cm3] 1760 2040 2440 2550 2730 2740 3010 3080 3370 3740 4910 5090 5090 5380 5850 6730 6990 7960 frekvencija zvuka [Hz] 529 566 473 461 465 532 484 527 488 485 478 434 468 449 425 389 421 416 mužjak sme okriloga brzana Korelacija promatranih varijabli utvr ena je na temelju Spearmanova koeficijenta korelacije ranga: mužjak s najvećim obujmom grlene vrećice ima rang 1. regresijskom jednadžbom: © mr. To znači da povećanje ranga obujma grlene resice vjerojatno uzrokuje povećanje ranga frekvencije zvuka. Bojan Kovačić. a mužjak s najvišom frekvencijom rang 18. pri čemu mužjaci s obujmom grlene vrećice 5090 cm3 imaju rang 6. Dakle. zaključak izveden iz promatranoga uzorka od 18 mužjaka može se primijeniti i na cjelokupnu populaciju sme okriloga brzana.sc.763158. Izračunom Spearmanova koeficijenta korelacije ranga dobiva se: rs = 0. tj. predavač 145 . postoji srednje jaka pozitivna korelacija izme u obujma grlene vrećice sme okriloga brzana i frekvencije zvuka kojim vabi ženke. Napomenimo da je na temelju odgovarajućega statističkoga pokazatelja utvr eno da je dobiveni rezultat statistički značajan. te da se ovisnost frekvencije zvuka (zavisne varijable Y) o obujmu grlene vrećice (nezavisnoj varijabli X) može relativno dobro opisati tzv. Za varijablu frekvencija zvuka primijenjen je suprotan kriterij: mužjak s najdubljom frekvencijom zvuka ima rang 1.

začetnik moderne korelacijske i statističke analize. Zaslugom Karla Pearsona.95 ⋅ e–0. On je 1886. – 1833. riječ regresija u statistici je dobila današnje značenje iako. Zadatak za vježbu: Unesite podatke iz gornje tablice u radni list MS Excela. U tom je istraživanju došao do zanimljiva zaključka: ukoliko je prosječna visina obaju roditelja veća od medijana ure enoga niza svih prosječnih visina roditelja. praktično. regresija općenito obuhvaća primjenu različitih metoda ispitivanja ovisnosti zavisne varijable (Y) o barem jednoj nezavisnoj varijabli (X). 103 Francis Galton (1822. francuski matematičar. odstupanje.0005 ⋅ X. regresijska101 analiza. kraće. pa provjerite valjanost izračuna Spearmanova koeficijenta korelacije ranga. Takav izraz omogućuje ne samo Riječ regresija potječe od latinske riječi regressio = povratak. 101 © mr. Me utim. sljedeći korak u istraživanju te veze je tzv. Objašnjenje uporabe ovoga naziva u statistici slijedi u daljnjem tekstu. Regresijska analiza ili.ELEKTROTEHNIČKI ODJEL Poslovna statistika Y = 563.). sâm pojam regresijska analiza u statistiku je uveo Sir Francis Galton103. – 1911. Ovakvu je pojavu Galton nazivao efekt nazadovanja ili regresijski efekt. visina njihova djeteta očekivano će biti veća od prosječne visine od prosječne visine obaju roditelja). mentor Karla Pearsona i Charlesa Edwarda Spearmana. bavio se matematičkom analizom. engleski znanstvenik. predavač 146 . koji je poopćio Galtonova razmatranja na opće statističke modele. Bojan Kovačić. Jedan od Mjesečevih kratera dobio je ime po njemu.2. Ukoliko se pomoću odgovarajućih statističkih pokazatelja utvrdi da postoji statistički značajna veza me u promatranim varijablama. Temeljni je cilj provedbe takvih metoda vezu izme u promatranih varijabli izraziti ili opisati odgovarajućim analitičkim izrazom (regresijskim modelom). nazadovanje. visina njihova djeteta će očekivano biti manja od prosječne visine obaju roditelja (i obrnuto: ukoliko je prosječna visina obaju roditelja manja od medijana. Regresijska analiza Korelacijska je analiza vrlo često tek prvi korak u utvr ivanju me usobne ovisnosti dviju ili više promatranih varijabli. nećak Charlesa Darwina.). u Glasniku antropološkoga instituta u Londonu objavio rad u kojemu je promatrao ovisnost visine djece o prosječnoj visini njihovih roditelja. 4.sc. Oprez: Rangove mužjaka s obujmom grlene vrećice 5090 cm3 morate upisati sami. Regresijsku su analizu u statistici prvi koristili matematičari Legendre102 i Gauss koji su početkom 19. s tim značenjem nema gotovo nikakvih dodirnih točaka. stoljeća objavili radove o metodi najmanjih kvadrata. 102 Adrien-Marie Legendre (1752. teorijom brojeva i algebrom. uzmak.

nego je smatra isključivo odstupanjima od funkcijskoga dijela regresijskoga modela104. Npr. statističkim istraživanjem (npr.o.) jednostavna (u modelu se pojavljuje točno jedna zavisna i točno jedna nezavisna varijabla). poglavlju.ELEKTROTEHNIČKI ODJEL Poslovna statistika objašnjavanje ovisnosti promatranih pojava. cilj nam je odrediti funkciju koja će svakoj vrijednosti varijable X pridružiti statističkim istraživanjima dobivenu vrijednost varijable Y. U ovakvom modelu varijabla e je tzv. Bojan Kovačić. Najčešće takva funkcija ne postoji jer je veza me u varijablama stohastička. slobodno govoreći. dok su kod statističkih veza one različite od nule. a s Y zavisnu varijablu izdvajanja za odjeću. U ovom ćemo se kolegiju baviti modelima jednostavne regresije. anketiranjem) dobivamo podatke o mjesečnim primanjima i izdvajanja za odjeću svakoga od zaposlenika. error = greška. ''mjeri'' stupanj nesustavnih utjecaja na zavisnu varijablu Y.'' iz Babine Grede ovisi o njihovim mjesečnim primanjima.) višestruka ili multipla (u modelu se pojavljuju točno jedna zavisna i barem dvije nezavisne varijable). Ovisno o broju zavisnih i nezavisnih varijabli koje se pojavljuju u odgovarajućem modelu. Te podatke sredimo i pregledno prikažemo tablično. To je potpuno u skladu s ranijom podjelom veza mo u varijablama na funkcijske i statističke: kod funkcijskih su veza vrijednosti varijable u jednake nuli. predavač 147 . kako smo to naučili u 2. statističkim istraživanjem dobivamo odre ene podatke o vrijednostima tih varijabli. želimo li utvrditi kako mjesečno izdvajanje za odjeću zaposlenika tvrtke ''Drpislavić d. a od primjera modela višestruke regresije kratko ćemo spomenuti samo najjednostavniji i najprimjenjivaniji model višestruke linearne regresije. zapravo. regresija općenito može biti: 1. nego i procjenjivanje vrijednosti zavisne varijable Y za odre ene vrijednosti barem jedne nezavisne varijable X. 2. Označimo li s X nezavisnu varijablu mjesečna primanja. radi? Kad istražujemo ovisnosti pojedinih varijabli. © mr.sc. Opći oblik modela jednostavne regresije jest: Y = f(X) + e ili Y = Y + e. Stoga želimo naći funkciju f(X) koja će što točnije ^ 104 Otuda dolazi i oznaka e: engl. Opisna statistika – kojom se bavimo u ovom kolegiju – ne bavi se posebnom analizom stohastičke varijable e.o. O čemu se. stohastička (slučajna) varijabla koja.

što znači da – kao i kod uvo enja pojma standardne devijacije (vidjeti poglavlje 3. U nastavku ćemo dati kratak opis nekoliko takvih regresijskih modela. a e.3. …) koja najbolje opisuje vezu izme u promatranih varijabli. eksponencijalna. kako je istaknuto u uvodu. Opći oblik toga modela je: Y = aX + b + e.ELEKTROTEHNIČKI ODJEL Poslovna statistika vrijednostima varijable X pridruživati vrijednosti varijable Y. residuum = ostatak.) – nije moguće minimizirati prosječno rezidualno odstupanje. U svakom takvom pridruživanju nužno će se javiti odre ena greška (tzv. b ∈ R parametri modela. Model jednostavne linearne regresije Ukoliko iz dijagrama rasipanja uvidimo da ravnomjerno povećanje vrijednosti nezavisne varijable X uzrokuje približno ravnomjerno povećanje (ili smanjenje) zavisne varijable Y. to praktično nije moguće: minimiziranje odstupanja nastaloga jednim pridruživanjem u pravilu uzrokuje povećanje odstupanja nastaloga drugim pridruživanjem. razlika © mr. gdje su a.sc. stohastička (slučajna) varijabla. predavač 148 . regresijski model koji najbolje opisuje promatranu vezu varijabli X i Y jest model jednostavne linearne regresije. 2) procijeniti osnovne parametre te funkcije tako da zbroj kvadrata svih rezidualnih odstupanja bude što manji. kvadratna. 4. dva su osnovna cilja koja se žele postići stvaranjem regresijskoga modela: 1) odrediti tip realne funkcije (linearna. Budući da je graf svake linearne funkcije pravac. Može se pokazati da je prosječna vrijednost svih rezidualnih odstupanja jednaka nuli. rezidualno105 odstupanje). Takvo razmatranje dovodi do definiranja pojmova varijanca regresije i standardna devijacija regresije o kojima ćemo nešto više reći u točki 4. logaritamska. 105 Lat. to praktično znači da tražimo jednadžbu pravca koji će najbolje aproksimirati skup točaka dobiven konstrukcijom dijagrama rasipanja. Prema tome.1. Stoga je potrebno analizirati i minimizirati varijancu svih rezidualnih odstupanja (koja je uvijek strogo veća od nule). Bojan Kovačić. Cilj nam je odrediti parametre a i b tako da varijanca svih rezidualnih odstupanja bude minimalna.2. Iako bi teorijski bilo najbolje da svako pojedino rezidualno odstupanje bude što manje.2.

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Svakim statističkim istraživanjem dobivamo ukupno n različitih ure enih parova vrijednosti varijable X i vrijednosti varijable Y, tj. dobivamo ure ene parove (x1, y1), (x2, y2), … (xn, yn). Za svaki od tih parova vrijedi jednakost: yi = a ⋅ xi + b + ei, i = 1, 2, …, n, pri čemu je ei rezidualno odstupanje, odnosno ''promašaj'' koji činimo zamijenimo li statističkim istraživanjem dobivenu vrijednost yi računski dobivenom vrijednošću a ⋅ xi + b.106 Time, zapravo, dobivamo sustav od n linearnih jednadžbi s n + 2 nepoznanice: a, b, e1, e2, …, en. Taj sustav ima beskonačno mnogo realnih rješenja, ali točno jedno od njih zadovoljava uvjet da varijanca svih rezidualnih odstupanja bude minimalna. Takvo se rješenje odre uje tzv. metodom najmanjih kvadrata. Osnovna ideja metode najmanjih kvadrata je postići da zbroj kvadrata odstupanja empirijskih vrijednosti zavisne varijable yi od očekivanih vrijednosti (oznaka: Ŷi) te varijable bude minimalan. Budući da se pri izvodu parametara koristi tzv. diferencijalni račun, u detalje cijeloga postupka nećemo nulaziti, nego ćemo samo navesti rezultat:

a=

∑ x ⋅ y −n⋅ x⋅ y
i i i =1

n

∑x
i =1

n

2 i

− n⋅ x

2

,

b = y −a⋅x,

pri čemu su x i y redom aritmetička sredina empirijskih vrijednosti varijable x, odnosno varijable y. Tako smo, dakle, dobili model jednostavne linearne regresije: y = a ⋅ x + b. (Oznaka y sugerira da je riječ o vrijednosti koja se izračunava na temelju jednadžbe regresijskoga modela, a ne o vrijednosti dobivenoj statističkim istraživanjem.) Navedimo ukratko nazive i značenje dobivenih parametara.
∧ ∧

106 Vrijednosti dobivene statističkim istraživanjem u nastavku ćemo zvati originalne ili empirijske vrijednosti, a vrijednosti dobivene računski (pomoću regresijskoga modela) zvat ćemo očekivane, procijenjene ili regresijske vrijednosti.

© mr.sc. Bojan Kovačić, predavač

149

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Vrijednost b naziva se naziva se konstantni član107. Njegova teorijska interpretacija je sljedeća: b je očekivana vrijednost zavisne varijable y kada je vrijednost nezavisne varijable x jednaka nuli. To se lako vidi uvrštavanjem x = 0 u jednadžbu y = a ⋅ x + b. Ovaj parametar nema veliko praktično značenje jer nerijetko nema praktičnoga smisla (npr. u modelima koji promaraju ovisnost izdvajanja za prehranu o ukupnim mjesečnim primanjima jer je u takvim slučajevima praktično besmisleno procjenjivati iznos izdvajanja za prehranu osobe bez ikakvih ukupnih mjesečnih primanja). Vrijednost a naziva se regresijski koeficijent i to je ujedno najvažniji parametar dobivenoga modela. Njegova teorijska interepretacija je sljedeća: vrijednost a je očekivana prosječna promjena zavisne varijable y kada se nezavisna varijabla x poveća za jednu jedinicu mjere. Strogo pozitivna vrijednost regresijskoga koeficijenta upućuje na to da jedinični porast vrijednosti nezavisne varijable X uzrokuje porast vrijednosti zavisne varijable Y (ili, kako se matematički netočno često ističe, da su varijable X i Y upravno razmjerne), a strogo negativna vrijednost regresijskoga koeficijenta upućuje na to da jedinični porast vrijednosti nezavisne varijable X uzrokuje smanjenje vrijednosti zavisne varijable Y (ili, kako se matematički netočno često ističe, da su varijable X i Y obrnuto razmjerne). Značenje regresijskoga koeficijenta nije isključivo u promjeni vrijednosti nezavisne varijable za jednu jedinicu mjere, nego je ono puno veće. Naime, vrijede sljedeća svojstva:
Svojstvo 1. Ukoliko se vrijednost nezavisne varijable X promijeni (poveća ili smanji) za k jedinica mjere, očekivana apsolutna prosječna promjena vrijednosti zavisne varijable Y iznosi k ⋅ a (jedinica mjere). Dokaz: Neka je x1 početna vrijednost nezavisne varijable X. Tada je pripadna očekivana vrijednost zavisne varijable Y jednaka
y1 = a ⋅ x1 + b.

Ukoliko se vrijednost x1 promijeni za k jedinica mjere, nova vrijednost varijable X je: x2 = x1 + k,

107

U osnovnoj i srednjoj školi tu vrijednost nerijetko (neprecizno!) nazivaju odsječak na osi y.

© mr.sc. Bojan Kovačić, predavač

150

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

pri čemu za k > 0 imamo povećanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je
y2 = a ⋅ x2 + b = a ⋅ (x1 + k) + b = a ⋅ x1 + b + a ⋅ k = y1 + a ⋅ k,
∧ ∧

a odatle slijedi:

y2 – y1 = a ⋅ k.
Dakle, apsolutna prosječna promjena vrijednosti zavisne varijable Y jednaka je a ⋅ k, što je i trebalo pokazati.
Svojstvo 2. (česta zabluda) Ukoliko se vrijednost nezavisne varijable x promijeni (poveća ili smanji) za k%, očekivana relativna prosječna promjena vrijednosti zavisne varijable y iznosi k% ako i samo ako je b = 0. Drugim riječima, promatrane varijable su upravno ili obrnuto razmjerne ako i samo ako je b = 0. Dokaz: Neka je x1 početna vrijednost zavisne varijable X. Tada je pripadna očekivana vrijednost zavisne varijable Y jednaka

y1 = a ⋅ x1 + b.
Ukoliko se vrijednost x1 promijeni za k%, pri čemu je k realan broj takav da je k ≠0 (za k = 0 početna vrijednost varijable X se ne mijenja), nova vrijednost varijable X je:

x 2 = x1 +

k k ⋅ x1 = (1 + ) ⋅ x1, 100 100

pri čemu za k > 0 imamo povećanje vrijednosti nezavisne varijable X, a za k < 0 smanjenje vrijednosti te varijable. Pripadna vrijednost zavisne varijable Y jednaka je:
y2 = a ⋅ x2 + b = a ⋅ (1 +
∧ ∧ k k k ) ⋅ x1 + b = a ⋅ x1 + b + a ⋅ ⋅ x1 = y1 + a ⋅ ⋅ x1. 100 100 100

Stoga je pripadna relativna prosječna promjena vrijednosti zavisne varijable Y jednaka:

© mr.sc. Bojan Kovačić, predavač

151

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

y2 − y1 y1

y1 + a ⋅ =

∧ k k k ⋅ x1 − y1 a ⋅ ⋅ x1 a ⋅ ⋅ x1 100 , = 100 = 100 ∧ ∧ a ⋅ x1 + b y1 y1

Ta će vrijednost biti jednaka k% ako i samo ako vrijedi jednakost:
y2 − y1 y1
∧ ∧ ∧

=

k , 100

odnosno jednakost a⋅ k ⋅ x1 k 100 . = a ⋅ x1 + b 100

Prema definiciji jednakosti dvaju razlomaka, gornja je jednakost ekvivalentna jednakosti a⋅ tj. jednakosti a ⋅ k ⋅ x1 = a ⋅ x1 ⋅ k + b ⋅ k, a odavde je b ⋅ k = 0. Prema pretpostavci je k ≠ 0, pa dijeljenjem s k dobivamo b = 0, što je i trebalo pokazati. Radi potpunosti, spomenimo da se grafički prikaz bilo kojega modela jednostavne regresije naziva regresijska krivulja. Regresijske krivulje mogu biti pravci, grafovi eksponencijalne i logaritamske funkcije, grafovi opće potencije itd. Grafički prikaz modela jednostavne linearne regresije uvijek je pravac (jer je grafički prikaz bilo koje linearne funkcije pravac), i taj se
© mr.sc. Bojan Kovačić, predavač 152

k ⋅ x1 ⋅100 = (a ⋅ x1 + b) ⋅ k , 100

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

pravac naziva regresijski pravac. Njegova jednadžba u pravokutnom koordinatnom sustavu u ravnini podudara se s jednadžbom regresijskoga modela, tj. ona glasi: y = a ⋅ x + b.
Primjer 1. Menadžment tvornice prehrambenih proizvoda ''Mljac-mljac d.d.'' iz Zvečaja razmatra vezu izme u opsega proizvodnje čokolade ''Fantazija'' i ukupne zarade dobivene prodajom te čokolade u proteklih 8 mjeseci. Dobiveni podaci prikazani su u donjoj tablici.

proizvodnja čokolade ukupna dobit [000 kom.] [000 kn] 20 220 25 280 32 520 28 500 40 1250 35 1000 36 980 30 600 Prikažimo dobivene podatke dijagramom rasipanja, izračunajmo Pearsonov koeficijent jednostavne linearne korelacije i procijenimo njegovu statističku značajnost na razini pouzdanosti od 95%. Potom procijenimo parametre modela jednostavne linearne regresije koji najbolje opisuje ovisnost ukupne dobiti o količini proizvedene čokolade, te, na temelju njega, ukupnu dobit ukoliko se proizvede 30 000 komada čokolade i ukupnu proizvodnju čokolade u mjesecu u kojemu je ostvarena dobit od 800.000,00 kn. Budući da ćemo u drugom dijelu zadatka promatrati ovisnost ukupne dobiti o količini proizvedene čokolade, količina proizvedene čokolade bit će nam nezavisna varijabla X, a ukupna zarada dobivena prodajom čokolade zavisna varijabla Y (za korelacijsku je analizu to nebitno). Odgovarajući dijagram rasipanja je:

© mr.sc. Bojan Kovačić, predavač

153

Regresijski pravac i njegova jednadžba. Dakle. koja je ujedno i jednadžba odgovarajućega modela jednostavne linearne regresije. da će povećanje proizvodnje čokolade vrlo vjerojatno uzrokovati povećanje ukupne dobiti. Iz vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije može se zaključiti da je ta veza pozitivna i jaka.000265976 < 0.ELEKTROTEHNIČKI ODJEL Poslovna statistika Izračunima analognima onima iz točke 4. tj. dobiveni koeficijent je statistički značajan.sc.1 dobiva se vrijednost Pearsonova koeficijenta jednostavne linearne korelacije: r = 0. © mr.05. predavač 154 . postoji statistički značajna linearna veza izme u proizvodnje čokolade i ukupne dobiti. Bojan Kovačić. a tom koeficijentu pripadna p – vrijednost jednaka je p = 0. tj.952039274. prikazani su na donjoj slici.

b = –1010.60276339 ⇒ Ukoliko se proizvodnja poveća za 1000 čokolada. zbog remonta strojeva) za 200 čokolada.602.76 kn.27 kn. Npr.2.3. Smanji li se mjesečna proizvodnja (npr. predavač 155 .010. očekivano prosječno smanjenje ukupne dobiti iznosit će © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika Osnovni parametri dobivenoga regresijskog modela jednostavne linearne regresije su: a = 54. ukoliko se mjesečna proizvodnja poveća za 100 čokolada.97 kn. procjenjuje (ili očekuje) se gubitak u iznosu od 1. No. (Opet pripazite na mjerne jedinice!) Teoretski gledano.) Značenje tih parametara je sljedeće: a = 54.284974 (Definiciju i značenje parametra R2 navodimo u točki 4. Bojan Kovačić. (Oprez s mjernim jedinicama!) b = –1010.284.60276339. očekivano prosječno povećanje ukupne dobiti iznosit će 5.sc. zbog pouzdanosti regresijskoga modela vrijednost navedene promjene ne bi trebala biti strogo veća od raspona varijacije uzorka nezavisne varijable X jer se procjenjivanjem vrijednosti izvan segmenta odre enoga najmanjom i najvećom vrijednosti nezavisne varijable X značajno gubi na pouzdanosti procjene. očekivano prosječno povećanje ukupne dobiti iznosi 54. na temelju dobivenoga regresijskoga koeficijenta a možemo procijeniti prosječnu promjenu ukupne dobiti u slučaju bilo koje promjene vrijednosti proizvodnje.284974 ⇒ Ukoliko tvornica ne proizvede niti jednu čokoladu.460.

dobivamo: x= ∧ ∧ ∧ 1 b ⋅y− .797.60276339 54. tj. Dobiveni regresijski model. decimala označava tisućiti dio kune koji u praksi ne postoji.797927 Dakle. u navedenu jednakost uvrstimo a = 54. poveća (smanji) li se proizvodnja za k čokolada mjesečno. U tu ćemo svrhu u dobivenu jednadžbu modela jednostavne linearne regresije uvrstiti x = 30. možemo iskoristiti i u obrnutom slučaju.55 kn.60276339 Dakle.ELEKTROTEHNIČKI ODJEL Poslovna statistika 10.284974 ⋅ 800 + ≈ 33.93 kn. pa ćemo dobiti: y = 54. Općenito. pa ne možemo reći npr.284974 = 627.sc. U konkretnom slučaju. da procijenjena proizvodnja iznosi 33153. tj.7 komada čokolade. a oznaka y da je vrijednost varijable y unaprijed poznata. očekivana ukupna dobit iznosi 627. Izrazimo li x iz jednadžbe modela jednostavne linearne regresije. (Oprez s interpretacijom: vrijednosti varijable proizvodnja su nužno prirodni brojevi ili nula. pa dobivamo da je tražena procijenjena mjesečna proizvodnja x= ∧ 1 –1010.000.284974. U ovom slučaju to znači da je nezavisna varijabla X statistički značajna. Slično vrijedi i za vrijednosti varijable y koje ima smisla računati na najviše 5 decimalnih mjesta jer 6.920.1537245 .60276 ⋅ k kn. y = 800 i b = –1010. procijenjena proizvodnja u mjesecu u kojemu je ostvarena dobit od 800.60276339 ⋅ 30 – 1010.00 kn približno iznosi 33154 komada čokolade.60276339. predavač 156 . Preostaje nam procijeniti ukupnu dobit ukoliko se mjesečno proizvede 30000 komada čokolade. Bojan Kovačić.) Napomenimo da se u slučaju modela jednostavne linearne regresije p – vrijednost koja odgovara nezavisnoj varijabli X i ukazuje na njezinu statističku značajnost podudara s p – vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije. naravno. 54. Ovaj pokazatelj ujedno je i pokazatelj statističke © mr. a a Ovdje oznaka x sugerira da vrijednost varijable x procjenjujemo. za procjenjivanje vrijednosti nezavisne varijable x u slučajevima u kojima nam je zadana vrijednost zavisne varijable y. da postoji statistički značajan utjecaj proizvodnje čokolade na ukupnu dobit. očekivano prosječno povećanje (smanjenje) ukupne dobiti iznosit će k ⋅ a = 54.

Odgovarajući grafički prikaz je dijagram raspršenja prikazan na donjoj slici. U sljedećoj su tablici navedeni podaci o prosječnom broju zaposlenih tijekom 2007. prosječan broj zaposlenih u jednoj prodavaonici bit će nam nezavisna varijabla X. godini imala prosječno 40 zaposlenih.o. te promjenu ukupnoga godišnjega prometa ukoliko se prosječan broj zaposlenih u jednoj prodavaonici smanji za 5. Bojan Kovačić. te utvrdimo njihovu statističku značajnost na razini pouzdanosti od 95%. Zbog drugoga dijela zadatka. godini ostvarila promet u iznosu od pola milijuna eura. dobiveni je model tako er statistički značajan. predavač 157 . Potom procijenimo jednadžbu i parametre modela jednostavne linearne regresije koji najbolje opisuje ovisnost ukupnoga godišnjega prometa o prosječnom broju zaposlenih. tj. © mr. prosječan broj zaposlenih ukupan godišnji promet [000 €] 22 250 31 300 90 920 82 850 43 400 65 680 59 630 16 180 61 670 46 420 35 350 50 460 Odnos ukupnoga godišnjega prometa i prosječnoga broja zaposlenih prikažimo grafički odgovarajućim dijagramom (uz kojega navedimo sve potrebne oznake). Primjer 2. a ukupan godišnji promet zavisna varijabla Y.o. Procijenimo i ukupan godišnji promet prodavaonice koja je u 2007.sc.ELEKTROTEHNIČKI ODJEL Poslovna statistika značajnosti cijeloga dobivenoga modela jednostavne linearne regresije. godine i ukupnom godišnjem prometu za svaku od ukupno 12 prodavaonica tvrtke ''Zumkon d. pa odredimo Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu statističku značajnost na razini pouzdanosti od 95%. prosječan broj zaposlenih u prodavaonici koja je u 2007.'' iz Kukače.

te osnovne parametre toga modela. da će povećanje prosječnoga broja zaposlenih vrlo vjerojatno uzrokovati i povećanje ukupnoga godišnjega prometa.05.0000000000426414 < 0.26414E-10 = 0. Bojan Kovačić. ti su podaci navedeni na sljedećoj slici. Prema tome.991128384. dobiva se vrijednost Pearsonova koeficijenta jednostavne linearne korelacije: r = 0. Zajedno s odgovarajućim regresijskim pravcem. Iz vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zaključujemo da je ta veza pozitivna i jaka. predavač 158 .1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Izračunima analognima onima iz točke 4. © mr. postoji statistički značajna linearna veza izme u prosječnoga broja zaposlenih i ukupnoga godišnjega prometa.sc. a tom koeficijentu odgovarajuća p – vrijednost iznosi p = 4. Koristeći gornji dijagram. možemo odrediti jednadžbu modela jednostavne linearne regresije koji najbolje opisuje promatranu ovisnost. tj. dobiveni koeficijent statistički je značajan. tj.

000.34 = 52.4023396. očekivano prosječno povećanje (smanjenje) ukupnoga godišnjega prometa iznosi k ⋅ a ⋅ 1.402.000. Općenito. Odavde izravno slijedi da ukoliko se prosječan broj zaposlenih smanji za 5.ELEKTROTEHNIČKI ODJEL Poslovna statistika Iz dobivene jednadžbe modela jednostavne linearne regresije slijedi da su osnovni parametri dobivenoga regresijskog modela: a = 10. Takva prodavaonica prirodno nije ostvarila nikakav ukupni godišnji promet.3396 ⋅ k €.00 = 10. očekivano prosječno povećanje ukupnoga godišnjega prometa iznosi 10.402. predavač 159 . očekivano prosječno smanjenje ukupnoga godišnjega prometa iznosi 5 ⋅ 10. b = –10.95031313 Njihova značenja su: a = 10. b = –10.011.4023396 ⋅ 1.sc. ukoliko se prosječan broj zaposlenih poveća (smanji) za k.34 €.00 = k ⋅ 10.95031313 ⇒ U ovom slučaju vrijednost x = 0 znači da u prodavaonici tijekom cijele godine nije radio niti jedan zaposlenik. Stoga konstantni član u ovom slučaju nema svojega značenja (ranije © mr. Bojan Kovačić.70 €.402.4023396 ⇒ Ukoliko se prosječan broj zaposlenih poveća za 1.

Dobivamo: x= ∧ 1 10.73 12 13 15 17 18 18 19 © mr.4023396. 10.1 2.95031313 = 405.4023396 Dakle. Dobiva se: y = 10. y = 500 i b = ––10.8 1. traženi procijenjeni prosječan broj zaposlenih približno iznosi 49.4023396 ⋅ 40 – 10. S druge strane. Dobiveni su podaci prikazani u sljedećoj tablici. Drugim riječima.118788 . Za 10 odabranih pokrajina Kraljevine Bušbumbuj utvr eni su narodni dohodak po stanovniku (per capita) i stopa mortalileta dojenčadi u 2007. traženi očekivani promet iznosi 405. prosječan godišnji broj zaposlenih u prodavaonici čiji je ukupan godišnji promet iznosio pola milijuna eura procijenit ćemo tako da u jednadžbu x= ∧ ∧ 1 b ⋅y− a a uvrstimo a = 10. Bojan Kovačić.sc.82 2 1.143. postoji statistički značajan utjecaj prosječnoga broja zaposlenih na ukupan godišnji promet u promatranim prodavaonicama.95031313.27 €.1432707 Dakle.ELEKTROTEHNIČKI ODJEL Poslovna statistika je istaknuto da se u praksi nerijetko javljaju ovakvi slučajevi i da je zbog toga regresijski koeficijent najvažniji parametar dobivenoga modela).) Iz p – vrijednosti izračunate za Pearsonov koeficijent jednostavne linearne korelacije slijedi da su varijabla X i dobiveni model jednostavne linearne regresije statistički značajni. narodni dohodak po stanovniku stopa mortaliteta dojenčadi [000 USD] [‰] 3. godini.5 3. (Opet oprez s interpretacijom: brojimo ljude. predavač 160 . Primjer 3.99 3. Analogno kao i u prethodnom primjeru. pa dobiveni rezultat nužno mora biti prirodan broj ili nula.95031313 ⋅ 500 + ≈ 49. očekivani ukupan godišnji promet prodavaonice u kojoj je prosječan godišnji broj zaposlenih jednak 40 dobijemo tako da u jednadžbu regresijskoga modela uvrstimo x = 40.4023396 10.

stopa mortaliteta dojenčadi bit će zavisna varijabla Y.00 USD. narodni dohodak po stanovniku u pokrajini koja je u 2007.sc. Bojan Kovačić.5 35 Odnos stope mortaliteta dojenčadi i narodnoga dohotka po stanovniku prikažimo grafički odgovarajućim dijagramom (uz kojega navedimo sve potrebne oznake). te promjenu stope mortaliteta dojenčadi ukoliko se narodni dohodak po stanovniku smanji za 800 USD. godini zabilježila stopu mortaliteta dojenčadi 20‰. Procijenimo i stopu mortaliteta dojenčadi pokrajine čiji je narodni dohodak po stanovniku u 2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika narodni dohodak po stanovniku stopa mortaliteta dojenčadi [000 USD] [‰] 1. Potom procijenimo jednadžbu i parametre modela jednostavne linearne regresije koji najbolje opisuje ovisnost stope mortaliteta dojenčadi o narodnom dohotku po stanovniku. © mr. godini bio 2.56 24 1 29 0. pa odredimo Pearsonov koeficijent jednostavne linearne korelacije promatranih varijabli i njegovu statističku značajnost uz razinu pouzdanosti od 95%. predavač 161 . Ponovo radi drugoga dijela zadatka. Odgovarajući grafički prikaz odnosa promatranih varijabli je dijagram rasipanja prikazan na sljedećoj slici. te statističku značajnost regresijskih varijabli i dobivenoga modela jednostavne linearne regresije uz razinu pouzdanosti od 95%. a narodni dohodak po stanovniku nezavisna varijabla X.500.

913291451. Bojan Kovačić.09751978. da postoji statistički značajna linearna veza izme u narodnoga dohotka i stope mortaliteta dojenčadi. kao i odgovarajući regresijski pravac prikazani su na donjoj slici. Parametri modela jednostavne linearne regresije.ELEKTROTEHNIČKI ODJEL Poslovna statistika Izračunima analognima onima iz točke 4. predavač 162 . a tom koeficijentu pripadna p – vrijednost iznosi p = 0.sc. a = –5. U ovome je slučaju.953418082. dobiva se vrijednost Pearsonova koeficijenta jednostavne linearne korelacije: r = -0. da će povećanje narodnoga dohotka vrlo vjerojatno uzrokovati smanjenje stope mortaliteta dojenčadi. pa zaključujemo da je dobiveni koeficijent statistički značajan.000222487 < 0. tj. dakle. Interpretacije tih parametara su: © mr. Iz vrijednosti Pearsonova koeficijenta jednostavne linearne korelacije zaključujemo da je ta veza negativna i jaka.05.1. b = 33. tj.

098 ⇒ I u ovom slučaju konstantni član nema značenja jer je praktički nemoguće da cjelokupni narodni dohodak po stanovniku (varijabla X) iznosi 0. traženi procijenjeni narodni dohodak po stanovniku iznosi približno 2.5 + 33. ukoliko se narodni dohodak po stanovniku poveća (smanji) za k USD. pa dobijemo: y = –5.00 USD. očekivano prosječno smanjenje stope mortaliteta dojenčadi iznosi približno 6‰.953418082 Dakle.sc.76‰.953418082.000. Dakle. © mr. Općenito.ELEKTROTEHNIČKI ODJEL Poslovna statistika a = –5. te narodni dohodak po stanovniku u pokrajini koja je u 2007. godini bio 2.8 ⋅ 5.953418082 ⋅ = 0.09751978 = 18. Zaključno istaknimo da iz p – vrijednosti izračunate za Pearsonov koeficijent jednostavne linearne korelacije slijedi da su i regresorska varijabla X i dobiveni model jednostavne linearne regresije statistički značajni. pa dobivamo: x=− ∧ 1 33. tj.5. očekivano prosječno povećanje stope mortaliteta dojenčadi iznosi približno 0. U drugom slučaju. približno 4.953418082 ≈ 4.00 USD. predavač 163 .500. y = 20 i b = 33.00 USD.762734465‰. dojenčadi iznosi k ⋅ |a| ⋅ 1000 1000 b = 33.09751978 ⋅ 20 + ≈ 2. Odatle izravno slijedi da ukoliko se narodni dohodak po stanovniku smanji za 800 USD.200.005953418082 ⋅ k ‰.2 5. u jednadžbu x= ∧ ∧ 1 b ⋅y− a a uvrstimo a = –5. tj. U prvom slučaju u dobivenu jednadžbu modela jednostavne linearne regresije uvrstimo x = 2. godini zabilježila stopu mortaliteta dojenčadi 20‰. Bojan Kovačić. da postoji statistički značajan utjecaj narodnoga dohotka po stanovniku na stopu mortaliteta dojenčadi.953418082 ⇒ Ukoliko se narodni dohodak po stanovniku poveća za 1.214‰. tražena procijenjena stopa mortaliteta iznosi približno 18. Preostaje procijeniti stopu mortaliteta dojenčadi pokrajine čiji je narodni dohodak po stanovniku u 2007. očekivano prosječno smanjenje (povećanje) stope mortaliteta 1 1 = k ⋅ 5.953418082 5.098.00 USD.953418082 ⋅ 2.21397458.

2. odnosno zavisne varijable Y. tj. Tu je analizu grafički zgodno prikazati donjom slikom. i =1 i =1 i =1 odnosno. Ona predstavlja temelj deskriptivne i inferencijalne statističke analize reprezentativnosti regresijskoga modela. za svaki i = 1. promatramo u kojoj mjeri vrijednosti zavisne varijable procijenjene dobivenim modelom odgovaraju empirijskim vrijednostima. Nadalje. Analiza varijance modela jednostavne linearne regresije Nakon što smo odredili jednadžbu modela jednostavne linearne regresije nameće se pitanje ''kvalitete'' dobivenoga modela. Neka su (xi. neka su y i procijenjene vrijednosti dobivene uvrštavanjem vrijednosti xi u jednadžbu modela jednostavne linearne regresije koji © mr.2. jednadžba analize varijance toga modela. Zapravo. predavač 164 ∧ . n. u razvijenom obliku. Procjena reprezentativnosti modela temelji se na već spomenutoj analizi varijance rezidualnih odstupanja empirijskih vrijednosti (yi) zavisne varijable od procijenjenih vrijednosti (ŷi) te varijable. yi) empirijski dobivene vrijednosti nezavisne varijable X.2.ELEKTROTEHNIČKI ODJEL Poslovna statistika 4. ∑y i =1 n 2 i n n n n 2 2   n  − n ⋅ y =  a ⋅ ∑ yi + b ⋅ ∑ xi ⋅ yi − n ⋅ y  +  ∑ yi2 − a ⋅ ∑ yi − b ⋅ ∑ xi ⋅ yi   i =1 i =1   i =1 i =1 i =1  Ova jednadžba je posljedica sljedećega netrivijalnoga svojstva modela jednostavne linearne regresije: Svojstvo 1. …. Bojan Kovačić. Prigodom ocjenjivanja reprezentativnosti modela jednostavne linearne regresije koristi se tzv. s kolikom točnošću možemo procijeniti vrijednost zavisne varijable za odre enu vrijednost nezavisne varijable. a glasi: ∑ ( y − y) = ∑ ( y − y) + ∑ ( y − y) 2 2 n n ∧ n ∧ 2 i i i .sc.

Budući da je prvi član jednak zbroju preostalih dvaju. SR = ∑ ( yi − y )2 = i =1 n ∧ ∑ yi2 − a ⋅ ∑ yi − b ⋅ ∑ xi ⋅ yi – ovaj se član naziva neprotumačeni dio i =1 i =1 i =1 n n n ukupnoga zbroja kvadrata odstupanja ili zbroj kvadrata rezidualnih odstupanja.ELEKTROTEHNIČKI ODJEL Poslovna statistika najbolje opisuje ovisnost varijable Y o varijabli X. mjere reprezentativnosti o kojima se govori u sljedećoj točki. ….sc. Tada je aritmetička sredina svih procijenjenih vrijednosti jednaka aritmetičkoj sredini svih empirijskih vrijednosti. predavač 165 . tj. ovaj član ''mjeri'' ukupnu pogrešku svih n procjenjivanja. Bojan Kovačić. dobiva se varijanca procijenjenih vrijednosti varijable Y.. Koristeći dobivene rezultate računaju se tzv. 2. i =1 i =1 n n ∧ Objasnimo pobliže svaki pojedini član u gornjoj jednadžbi: ST := ∑ ( y − y) i i =1 n ∧ n 2 = ∑y i =1 n n 2 i − n ⋅ y – ukupan zbroj kvadrata odstupanja svih empirijskih 2 vrijednosti zavisne varijable Y od aritmetičke sredine tih vrijednosti108. Podijeli li se navedeni član ukupnim brojem parova podataka (n). 109 Podijeli li se navedeni član ukupnim brojem parova (n). Slobodno govoreći. dobiva se varijanca empirijskih vrijednosti varijable Y. a zapravo je riječ o ukupnom zbroju kvadrata odstupanja svih procijenjenih vrijednosti zavisne varijable Y od aritmetičke sredine tih vrijednosti109 (zbog iskazanoga svojstva 1. SP = ∑ ( y − y )2 = a ⋅ ∑ yi + b ⋅ ∑ xi ⋅ yi − n ⋅ y i =1 i =1 i =1 n 2 – ovaj se član naziva protumačeni dio ukupnoga zbroja kvadrata odstupanja. i to za svaki i = 1. a zapravo je riječ o zbroju kvadrata odstupanja procijenjenih vrijednosti od odgovarajućih empirijskih vrijednosti. ta aritmetička sredina jednaka je onoj koja se pojavljuje u članu ST). n. praktično se obično računaju samo protumačeni i neprotumačeni dio ukupnoga zbroja kvadrata odstupanja. vrijedi jednakost: y = ∑ yi =∑ yi . 108 © mr.

sukladno oznakama iz točke 4. U relativne mjere reprezentativnosti ubrajamo koeficijent varijacije regresijskoga modela i koeficijent determinacije regresijskoga modela. a dijelimo ih na apsolutne i relativne. reprezentativnost regresijskoga modela je bolja.3. jednaka σ2 = ∧ y n n SR 1  n 2  = ⋅  ∑ yi − a ⋅ ∑ yi − b ⋅ ∑ xi ⋅ yi  n − 2 n − 2  i =1 i =1 i =1  Istaknimo da se u inferencijalnoj statistici procjena ovoga pokazatelj računa kao omjer veličine SR i broja (n – 2) koji. predavač 166 .1. Mjere reprezentativnosti modela jednostavne linearne regresije Za ocjenu reprezentativnosti nekoga regresijskoga modela rabe se pokazatelji analogni pokazateljima reprezentativnosti aritmetičke sredine u deskriptivnoj analizi. U nastavku ukratko opisujemo svaku od navedenih mjera reprezentativnosti.3. pa je. Za usporedbu reprezentativnosti dvaju različitih regresijskih modela najčešće se rabe upravo relativne mjere reprezentativnosti. U računanju ovih vrijednosti koriste se svi empirijski i svi procijenjeni podaci. Bojan Kovačić. S tim u vezi definira se pojam varijance regresijskoga modela.. označava ukupan broj stupnjeva © mr. Već smo istaknuli da je aritmetička sredina svih rezidualnih odstupanja uvijek jednaka nuli. Varijanca regresijskoga modela Osnova za mjerenje reprezentativnosti regresijskoga modela je raspršenje (disperzija) oko regresijskoga pravca koja se očituje na rezidualnim odstupanjima.2. Ona se računa kao aritmetička sredina kvadrata svih rezidualnih odstupanja. 2 Varijanca regresijskoga modela (oznaka: σ ∧ ) je apsolutna mjera reprezentativnosti y regresijskoga modela. 4. kako smo već vidjeli.ELEKTROTEHNIČKI ODJEL Poslovna statistika 4. Te pokazatelje nazivamo mjere reprezentativnosti regresijskoga modela. odnosno od analize njihove varijance.2. Što su odstupanja empirijskih vrijednosti zavisne varijable Y od odgovarajućih procijenjenih vrijednosti manja. U apsolutne mjere reprezentativnosti ubrajamo varijancu regresijskoga modela i iz nje izvedenu standardnu devijaciju regresijskoga modela.sc.2. pa se pri analizi raspršenja polazi od analize kvadrata rezidualnih odstupanja.2.

Radi potpunosti.2. n−2 n − 2  i =1 i =1 i =1  Napomenimo da se u inferencijalnoj statistici standardna devijacija definira na potpuno isti način. zbog različitosti izračuna varijance. Bojan Kovačić. Ona je.2. navodimo formulu prema kojoj se računa standardna devijacija regresijskoga modela: σ = ∧ y n n 1  n 2 SR  = ⋅  ∑ yi − a ⋅ ∑ yi − b ⋅ ∑ xi ⋅ yi  . Takav način izračuna primijenjuju gotovo svi statistički računalni programi. predavač 167 . ali je. 4.. Standardna devijacija regresijskoga modela Standardna devijacija regresijskoga modela (oznaka: σ ) ∧ y je apsolutna mjera reprezentativnosti regresijskoga modela. analogno standardnoj devijaciji cjelokupnoga osnovnoga skupa. možemo reći da koeficijent varijacije regresijskoga modela mjeri relativno prosječno odstupanje empirijskih vrijednosti zavisne varijable Y od procijenjenih vrijednosti © mr.3. matematički netočno interpretira kao prosječno odstupanje originalnih od regresijskih vrijednosti. 4. U tom se slučaju govori o procjeni standardne devijacije osnovnoga skupa. prema definiciji.ELEKTROTEHNIČKI ODJEL Poslovna statistika slobode. procijenjenih) vrijednosti zavisne varijable: Vy = ˆ ˆ σ yˆ y ⋅100 Ekvivalentno. Nerijetko se.3. prema Svojstvu 1. Koeficijent varijacije regresijskoga modela Koeficijent varijacije regresijskoga modela (oznaka: V∧ ) je relativna mjera reprezentativnosti y modela i predstavlja postotni udio standardne devijacije regresijskoga modela u odnosu na aritmetičku sredinu svih empirijskih (ili. drugi korijen iz varijance regresijskoga modela.3. pa je u takvim slučajevima nužno naglasiti da je riječ o procjeni varijance regresije osnovnoga skupa.sc. pripadna formula za izravni izračun drugačija od gore navedene.2.

Bojan Kovačić. 1]. a računa prema formuli: R2 = SP = ST ∑ ( y − y) i =1 n i i =1 n ∧ 2 a ⋅ ∑ yi + b ⋅ ∑ xi ⋅ yi − n ⋅ y = i =1 i =1 n n 2 ∑ ( y − y) 2 ∑y i =1 n 2 i −n⋅ y 2 Što je njegova vrijednost bliža 1. 4. y reprezentativnost regresijskoga modela je bolja. utvrdimo li da je Pearsonov koeficijent linearne korelacije izme u varijabli količnik inteligencije i prosječna ocjena na studiju iznosi r = 0.5. pri čemu je predznak Pearsonova koeficijenta linearne korelacije jednak predznaku regresijskoga koeficijenta a.52 = 0.25.ELEKTROTEHNIČKI ODJEL Poslovna statistika te varijable i iskazuje rezultat u postotcima. Objašnjava se kao postotni udio modelom protumačenoga dijela zbroja kvadrata svih odstupanja u odnosu na ukupan zbroj kvadrata svih odstupanja. a može poprimiti sve vrijednosti iz segmenta [0.. onda je pripadna vrijednost koeficijenta determinacije modela jednostavne linearne regresije kojim se najbolje može opisati promatrana veza jednaka R2 = 0.2. predavač 168 .4 Koeficijent determinacije regresijskoga modela Koeficijent determinacije (oznaka: R2) je relativna mjera reprezentativnosti regresijskoga modela.3. Npr.sc. Koeficijent determinacije općenito se može objasniti i kao razmjer varijance zavisne varijable objašnjen nezavisnom varijablom. © mr. Definira se kao omjer protumačenoga dijela ukupnoga zbroja kvadrata odstupanja (SP) i ukupnoga zbroja kvadrata odstupanja (ST). Napomenimo da su u slučaju jednostavne linearne regresije koeficijent determinacije i Pearsonov koeficijent jednostavne linearne korelacije vezani relacijom: r = ± R2 . Što je vrijednost koeficijenta V∧ bliža nuli. reprezentativnost regresijskoga modela je bolja (donekle suprotno od koeficijenta varijacije).

Istaknimo da u MS EXCEL-u jednadžbu.775 736. dobivena je sljedeća jednadžba modela jednostavne linearne regresije: y = 54. Na temelju podataka iz Primjera 1. Objasnimo značenje dobivenih vrijednosti.sc. izračunajmo koeficijent varijacije i koeficijent determinacije dobivenoga modela jednostavne linearne regresije.3. U Primjeru 1.584 1.996 518.79 5.] (xi) 20 25 32 28 40 35 36 30 ukupno: © mr.76 354.349. te zbrojimo dobivene rezultate. predavač ukupna dobit [000 kn] (yi) 220 280 520 500 1250 1000 980 600 5.2841 89154. Tako dobivamo treći i četvrti stupac sljedeće tablice: proizvodnja čokolade [000 kom. slobodno govoreći. znači da se približno 25% uspjeha na studiju može objasniti inteligencijom studenata.392 9839.648 604.7665 772.173. Izračunajmo najprije vrijednost koeficijenta varijacije toga modela. Primjer 4. Koristeći navedenu jednadžbu najprije za svaku empirijsku vrijednost nezavisne varijable X računamo odgovarajuću procijenjenu vrijednost zavisne varijable Y.3651 5803.ELEKTROTEHNIČKI ODJEL Poslovna statistika što. te vrijednost koeficijenta determinacije bilo kojega od ponu enih regresijskih modela možemo dobiti uključivanjima podopcija Prikaži jednadžbu na grafikonu i Prikaži R-kvadratnu vrijednost na grafikonu u podopciji Mogućnosti opcije Dodaj crtu trenda.350 169 procijenjena ukupna dobit [000 kn] ( yi ) 81.3 5591. Bojan Kovačić.26 345.805 955. Potom izračunamo kvadrat razlike svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajuće procijenjene vrijednosti te varijable.603 ⋅ x – 1010.82 900.301 47087.408 627.938 19110.32 ∧ ∧ (yi – y i )2 ∧ .

Na temelju podataka iz Primjera 2. i ona iznosi R2 = 0. Vrijednost koeficijenta determinacije već smo dobili u Primjeru 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika Tako je vrijednost koeficijenta varijacije jednaka: SR SR 89. Kao i u Primjeru 4.64% ukupnih odstupanja. izračunajmo koeficijent varijacije i koeficijent determinacije dobivenoga modela jednostavne linearne regresije.9064. Koristeći navedenu jednadžbu najprije za svaku empirijsku vrijednost nezavisne varijable X računamo odgovarajuću procijenjenu vrijednost zavisne varijable Y. Prema obama pokazateljima. predavač 170 . možemo zaključiti da je model reprezentativan. Potom izračunamo kvadrat razlike svake pojedine empirijske vrijednosti zavisne varijable Y i njoj odgovarajuće procijenjene vrijednosti te varijable. izračunajmo najprije vrijednost koeficijenta varijacije toga modela.. Primjer 5.23%.154. te zbrojimo dobivene rezultate. Objasnimo značenje dobivenih vrijednosti.sc. da se 90. dobivena je sljedeća jednadžba modela jednostavne linearne regresije: y = 10. odnosno. Bojan Kovačić. Vy = ⋅100 = n n 2 ⋅ 100 = ˆ n 1 5350 y ⋅∑ y ∑ yi n i =1 i i =1 ˆ σ yˆ pa možemo reći da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca relativno slab.64% ovisnosti ukupne dobiti o proizvodnji čokolade može objasniti modelom jednostavne linearne regresije. To znači da je modelom jednostavne linearne regresije protumačeno 90. 32 n⋅ 8⋅ − n − 2 ⋅ 100 = 8 − 2 ⋅ 100 ≈ 18.402 ⋅ x – 10. Tako dobivamo treći i četvrti stupac sljedeće tablice: ∧ © mr.95. U Primjeru 2.

Objasnite značenje dobivenih vrijednosti.15 6109.894 311.7762 1320.sc. Vrijednost koeficijenta determinacije već smo dobili u Primjeru 2.35977 Tako je vrijednost koeficijenta varijacije jednaka: SR SR 10978.3049 219.58182 601.542 353. predavač 171 . Dakle.8 ∧ (yi – y i )2 ∧ 1030.79524 132.23% veze izme u ukupnoga godišnjega prometa i prosječnoga broja zaposlenika može se objasniti modelom jednostavne linearne regresije. © mr.9823.512 925. Bojan Kovačić.23 842. Vy = ⋅100 = n n 2 ⋅ 100 = ˆ n 1 6110 y ⋅∑ y ∑ yi n i =1 i i =1 ˆ σ yˆ pa možemo reći da je varijabilitet empirijskih vrijednosti oko regresijskoga pravca vrlo slab.12 509.014 436.55918 2260.13232 2155.52614 27.768 155.7225 10978.24176 9.35977 n⋅ 12 ⋅ − n − 2 ⋅ 100 = 12 − 2 ⋅ 100 ≈ 6.3529 63.336 665. odnosno da je model reprezentativan. i ona iznosi R2 = 0.18 602.507631929%. Zadatak za vježbu: Izračunajte koeficijent varijacije i koeficijent determinacije modela jednostavne linearne regresije iz Primjera 3.482 623.6324 741.572 467.ELEKTROTEHNIČKI ODJEL Poslovna statistika prosječan broj zaposlenih (xi) 22 31 90 82 43 65 59 16 61 46 35 50 ukupno: ukupan godišnji promet [000 €] (yi) 250 300 920 850 400 680 630 180 670 420 350 460 6110 procijenjeni ukupan godišnji promet [000 €] ( yi ) 217.7344 2415. 98.

logaritamska funkcija i opća potencija. poseban slučaj modela jednostavne linearne regresije. Ove nejednakosti su posljedice činjenice da eksponencijalna funkcija nije definirana za A ≤ 0. I za ovaj model navodimo interpretacije obaju njegovih parametara (A i B). Zbog toga ovaj parametar nije od osobite važnosti u dodatnim analizama. Primjeri nelinearnih modela jednostavne regresije Odnos zavisne i nezavisne varijable često nije linearan (ravnomjerne promjene nezavisne varijable ne uzrokuju ravnomjerne promjene zavisne varijable). (U istinitost ove tvrdnje lako se možete uvjeriti uvrstite li X = 0 u gornju jednadžbu modela jednostavne eksponencijalne regresije i primijenite činjenicu da za svaki strogo pozitivan realan broj A vrijedi jednakost A0 = 1.sc. te da za A = 1 dobivamo konstantnu funkciju Y = B koja je.3. predavač 172 ∧ . ali to nećemo učiniti budući da MS Excel omogućuje rad i s takvim vrstama modela jednostavne regresije. Ti se modeli odgovarajućim zamjenama varijabli uvijek mogu svesti na model jednostavne linearne regresije. 4. © mr. A ≠ 1. zapravo. odmah treba napomenuti da interpretacija toga parametra nerijetko ne odgovara realnoj situaciji.3. U takvim je slučajevima potrebno je pronaći neku drugu (nelinearnu) funkciju koja najbolje pokazuje ovisnost zavisne o nezavisnoj varijabli. Model jednostavne eksponencijalne regresije Standardni oblik regresijske jednadžbe modela jednostavne eksponencijalne regresije je: Y = B ⋅ AX ∧ pri čemu dodatno vrijede nejednakosti: A. Zbog nešto kompliciranije interpretacije parametra A navodimo i odgovarajući matematički izvod te interpretacije. B → procijenjena (ili očekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne varijable X jednaka 0.) Kao i kod modela jednostavne linearne regresije. Bojan Kovačić.ELEKTROTEHNIČKI ODJEL Poslovna statistika 4. B > 0.1. U nastavku se razmatraju modeli jednostruke regresije u kojima su te funkcije eksponencijalna funkcija.

Pripadna regresijska vrijednost zavisne varijable y je: y1 = B ⋅ A x1 . A ≠ 1. predavač 173 . svaka očekivana vrijednost zavisne varijable y strogo veća od nule (što slijedi i iz činjenice da je područje vrijednosti bilo koje eksponencijalne funkcije skup R+ = 〈0.ELEKTROTEHNIČKI ODJEL Poslovna statistika Interpretacija parametra A u ovom slučaju nije izravna kao kod modela jednostavne linearne regresije. vrijedi sljedeće: Svojstvo 1. Ako se vrijednost nezavisne varijable X promijeni za k jedinica mjere. Bojan Kovačić. zbog uvjeta A. nego posredna. pa posebno i različita od nule. odnosno. Dokaz: Neka je x1 početna vrijednost nezavisne varijable x. ∧ Odmah primijetimo da je.   ∧ © mr. Pritom predznak broja k označava povećanje ili smanjenje vrijednosti nezavisne varijable X. Naime. ∆ y = 100 ⋅ ( Ak − 1)  % . ∧ ∧ Stoga je relativna promjena vrijednosti zavisne varijable y jednaka: ∆y= ∧ y2 − y1 y1 ∧ ∧ ∧ = Ak ⋅ y1 − y1 y1 ∧ ∧ ∧ = y1⋅ ( Ak − 1) y1 ∧ ∧ = Ak − 1 .sc. a predznak parametra Ak – 1 označava prosječno povećanje ili smanjenje očekivane vrijednosti zavisne varijable Y. (Pritom za k > 0 imamo povećanje vrijednosti varijable x1. Ako se vrijednost x1 promijeni za k jedinica mjere.+∞〉 ). B > 0.) Pripadna regresijska vrijednost zavisne varijable y je y2 = B ⋅ A x2 = B ⋅ A x1 + k = B ⋅ A x1 ⋅ Ak = Ak ⋅ ( B ⋅ Ax1 ) = Ak ⋅ y1 . u postotcima. onda će se očekivana vrijednost zavisne varijable Y promijeniti za prosječno 100 ⋅ (Ak – 1)%. a za k < 0 smanjenje njezine vrijednosti. nova vrijednost te varijable je: x2 = x1 + k.

4.sc. umjesto originalnih vrijednosti uvrštavaju logaritmi tih vrijednosti. Primjer 1. Naposljetku.193 18 1.] 549 60 582 54 618 50 700 45 748 36 817 32 900 25 998 23 1.2.3.2. Ako model jednostavne eksponencijalne regresije reprezentativno opisuje vezu izme u zavisne i nezavisne varijable. ukupne jedinične troškove pri opsegu proizvodnje od 40 000 komada i opseg proizvodnje u slučaju kad ukupni jedinični troškovi iznose 800.ELEKTROTEHNIČKI ODJEL Poslovna statistika što je i valjalo pokazati. Bojan Kovačić. I za model jednostavne eksponencijalne regresije mogu se računati koeficijent varijacije i koeficijent determinacije tako da se u formule navedene u točkama 4.540 10 Prikažimo dobivene podatke odgovarajućim grafikonom (uz kojega navedimo sve potrebne oznake). Ilustrirajmo to na primjerima.'' iz Bibinja razmatra ovisnost ukupnih jediničnih troškova o opsegu proizvodnje jednoga od zamjenskih dijelova. za k = 1 vrijednost S1 = 100 ⋅ (A – 1) uobičajeno se naziva prosječna stopa promjene (očekivanih) vrijednosti zavisne varijable Y. predavač 174 .d. Istraživanjem dobiveni podaci navedeni su u sljedećoj tablici: jedinični troškovi opseg proizvodnje [kn] [000 kom. približno jednaka stopa promjene vrijedi i za empirijske vrijednosti zavisne varijable Y. Uprava tvornice zamjenskih dijelova za željeznička vozila ''Grudelj d. Dakle. i 4. Posebno. Koeficijent determinacije može se dobiti izravno pomoću MS Excela. kod modela jednostavne eksponencijalne regresije dodatno se računa i interpretira broj Sk = Ak – 1.3. dok koeficijent varijacije moramo izračunati ''klasično''.3. pa odredimo jednadžbu modela jednostavne eksponencijalne regresije koji najbolje opisuje promatranu ovisnost i interpretirajmo parametre toga modela.00 kn © mr. procijenimo reprezentativnost dobivenoga modela pomoću koeficijenta determinacije.

Bojan Kovačić. predavač 175 ∧ . zajedno s pripadnom krivuljom. dok je vrijednost parametra A jednaka © mr.sc. U ovome je slučaju B = 1624.ELEKTROTEHNIČKI ODJEL Poslovna statistika Odgovarajući grafički prikaz empirijskih podataka je dijagram raspršenja prikazan na sljedećoj slici: Odgovarajuća jednadžba modela jednostavne eksponencijalne regresije. dana je na sljedećoj slici: Zapišimo je najprije u standardnom obliku Y = B ⋅ AX.

Odgovarajuće interpretacije parametara su: B = 1624 ⇔ očekivana vrijednost jediničnih troškova u slučaju kad nema proizvodnje iznosi 1.) A = 0.sc. Budući da je navedeni koeficijent relativno blizu 1. Bojan Kovačić. Dakle. a ukoliko se opseg proizvodnje smanji za 200 komada.18982%. pa jednadžba modela jednostavne eksponencijalne regresije zapisana u standardnom obliku glasi: Y = 1624 ⋅ 0. (Ova interpretacija nema smisla jer se jedinični troškovi uvijek računaju u odnosu na jedinicu proizvedenoga proizvoda.380723% itd. Procijenjeni iznos ukupnih jediničnih troškova u slučaju kad opseg proizvodnje iznosi 40 000 komada dobit ćemo tako da u jednadžbu regresijskoga modela uvrstimo x = 40: © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika A = e–0.981180.66% ovisnosti jediničnih troškova o opsegu proizvodnje može objasniti modelom jednostavne eksponencijalne regresije. odnosno nezavisne varijable.624.1 = 100 ⋅ (A0.882. da ukoliko se opseg proizvodnje poveća za 100 komada. predavač 176 ∧ . što znači da se 94.98118 – 1) = –1.98118X.9466.1 – 1) = 100 ⋅ (0. očekivano prosječno smanjenje jediničnih troškova iznosi S0. nema smisla govoriti o jediničnim troškovima.019 ≈ 0.2 = 100 ⋅ (A–0. očekivano prosječno povećanje jediničnih troškova iznosi S–0. možemo reći da je dobiveni model reprezentativan.2 – 1) = 100 ⋅ (0. Odatle slijedi npr.2 – 1) = 0. Preostaje nam procijeniti po jednu vrijednost zavisne.1 – 1) = 0. ukoliko se opseg proizvodnje poveća za 1000 komada.882%. a ako nije proizveden niti jedan proizvod. jedinični troškovi će se očekivano smanjiti za prosječno 1.98118 ⇔ ovu ćemo vrijednost najlakše interpretirati računajući prosječnu stopu promjene: S1 = 100 ⋅ (A – 1) = 100 ⋅ (0.00 kn.98118. Koeficijent determinacije dobivenoga modela je R2 = 0.98118–0.

] 0 5 8 11 15 18 22 25 30 34 38 42 45 50 temperatura [°C] 82 76 70 65 61 57 52 51 47 45 43 41 39 38 110 Preciznije rečeno. predavač 177 . procijenjena vrijednost opsega proizvodnje u slučaju kad ukupni jedinični troškovi iznose 800.98118 Dakle.00 kn jednaka je 37265 komada. ln 0. ln 0. Nadalje. Podaci su dani u donjoj tablici.51. procijenjeni ukupni jedinični troškovi u slučaju kad opseg proizvodnje iznosi 40 000 komada iznose 759.98118 pa procijenjenu vrijednost opsega proizvodnje u slučaju kad ukupni jedinični troškovi iznose 800. © mr. nakon ulijevanja kave iz džezve ili kavokuhala u šalicu. Bojan Kovačić.9811840 = 759.51 kn.sc. Primjer 2. vrijeme [min. iz dobivene jednadžbe regresijskoga modela slijedi X= ∧ ∧ ln y − ln1624 .ELEKTROTEHNIČKI ODJEL Poslovna statistika Y = 1624 ⋅ 0.00 kn dobivamo tako da u navedenu jednadžbu uvrstimo y = 800: X = ∧ ln 800 − ln1624 ≈ 37.265 . Dakle. Promatramo ovisnost temperature netom skuhane kave o vremenu proteklom nakon ulijevanja kave u šalicu110.

Na temelju rezultata b) podzadatka procijenimo koliko dugo treba čekati da se netom skuhana kava ohladi na temperaturu od 68°C. c) Na temelju koeficijenta determinacije procijenimo reprezentativnost modela. Vještak na su enju tada je posvjedočio da tekućina temperature 82°C koja je u dodiru s ljudskom kožom bila barem pet sekundi izaziva teške opekotine i ustvrdio da bi se takve posljedice izbjegle da se kava poslužuje pri temperaturi ne većoj od 68°C.700.00 USD. Žena je dobila spor i odštetu od 2.000. Što se može reći o temperaturi kave nakon točno 2 sata na temelju dobivenoga modela jednostavne eksponencijalne regresije? Objasnimo svoj odgovor. Bojan Kovačić. predavač 178 . b) Odredimo jednadžbu modela jednostavne eksponencijalne regresije koji najbolje opisuje promatranu ovisnost i objasnimo značenje parametara dobivenoga modela. Jedna od posljedica toga poznatoga sudskoga procesa bila je da većina restorana u SAD danas poslužuje kavu čija je temperatura približno 68°C. Ovisnost temperature kave o vremenu prikazana je donjim dijagramom rasipanja: © mr. jedna od gošći restorana ''McDonald's'' tužila je restoran jer je slučajnim prolijevanjem kave temperature 82°C po svojim rukama zaradila teške opekotine.sc. g) Pretpostavimo da temperatura sobe u kojoj se nalazi poslužena kava iznosi 23°C. e) Na temelju rezultata b) podzadatka procijenimo kolika će biti temperatura kave točno 1 sat nakon ulijevanja u šalicu.ELEKTROTEHNIČKI ODJEL Poslovna statistika a) Ovisnost temperature kave o vremenu grafički prikažimo odgovarajućim grafikonom (uz kojega navedimo sve potrebne oznake). f) 1992. d) Na temelju rezultata b) podzadatka procijenimo početnu temperaturu kave i odredimo relativnu pogrešku u odnosu na empirijski dobivenu vrijednost.

98413X.159 ⋅ 0. Dakle.159 ⋅ 100 ≈ 4.68%. 82 © mr.159.159°C.98413.159 ⇔ procijenjena početna temperatura kave iznosi 78. ∧ ∧ Parametre dobivenoga modela interpretiramo na sljedeći način: B = 78. predavač 179 .sc. jednadžba dobivenoga modela jednostavne eksponencijalne regresije je Y = 78. dok je vrijednost parametra A jednaka A = e–0. prikazana je na donjoj slici: Dobivenu jednadžbu najprije zapišimo u standardnom obliku Y = B ⋅ AX. Bojan Kovačić. Budući da empirijska početna temperatura kave iznosi 82°C.ELEKTROTEHNIČKI ODJEL Poslovna statistika Jednadžba modela jednostavne eksponencijalne regresije. U ovome je slučaju B = 78.016 ≈ 0. relativna pogreška procjene početne temperature je: p= 82 − 78. zajedno s pripadnom krivuljom.

98413 ⇔ izračunat ćemo očekivanu prosječnu stopu promjene temperature kave: S1 = 100 ⋅ (A – 1) = –1.159 ln 0. dok ćemo vrijeme potrebno da se kava ohladi na temperaturu 68°C procijeniti tako da iz jednadžbe Y = 78. Bojan Kovačić.ELEKTROTEHNIČKI ODJEL Poslovna statistika A = 0. predavač 180 .9841360 ≈ 30°C.159 ≈ 76. Temperaturu kave nakon jednoga sata (= 60 minuta) procijenit ćemo tako da u jednadžbu modela jednostavne eksponencijalne regresije uvrstimo x = 60: Y = 78.159 ≈ 8.5873.159 ⋅ 0. Dakle. Stoga će stvarna temperatura kave za 120 minuta biti jednaka 23°C. ln 0. Prognostička temperatura kave za 120 minuta je dvostruko manja: © mr.7 minuta = 8 minuta i 42 sekunde.5873% u jednoj minuti.5 minuta = 76 minuta i 30 sekundi.159 ⋅ 0. temperatura kave će se očekivano smanjiti za 1.98413 Potom se kava prestaje hladiti i zadržava temperaturu okoline (sobe) od 23°C.sc. ln 0.98413 Temperatura kave bit će jednaka sobnoj temperaturi.98413X ∧ ∧ izrazimo nepoznaznicu X: X= i u dobiveni izraz uvrstimo Y = 68: X= ∧ ∧ ln Y − ln 78. odnosno 23°C.98413 ln 68 − ln 78. nakon X= ∧ ln 23 − ln 78.

Kao i kod svih prethodnih modela. pa se za tu vrijednost dobiva loša procjena odgovarajuće vrijednosti zavisne varijable Y. Na ovom smo primjeru ukazali na tzv. +∞〉. problem ekstrapolacije u regresijskim modelima. prirodnom logaritmu: baza logaritma je broj e ≈2. ∧ 111 U promatranom je primjeru opisani problem ekstrapolacije dodatno izražen zbog fizikalne neuskla enosti dobivenoga modela s realnim stanjem: prema fizikalnim zakonima.98413120 ≈ 11. treba izbjegavati procjenu vrijednosti zavisne varijable za vrijednosti nezavisne varijable izvan segmenta ome enoga najmanjom i najvećom empirijski dobivenom vrijednošću. značaj parametara A i B u analizi regresijskoga modela nije jednak: parametar A je bitno značajniji od parametra B.sc. kad god je to moguće. 112 U ovome je slučaju riječ o tzv. Stoga. Bojan Kovačić. pri čemu vrijednosti nezavisne varijable X nužno moraju biti strogo pozitivne jer je prirodno područje definicije bilo koje logaritamske112 funkcije skup 〈0.ELEKTROTEHNIČKI ODJEL Poslovna statistika Y = 78. (U promatranom primjeru riječ je o segmentu [0.111 ∧ 4.) Me utim. regresijski model može davati dobre procjene za vrijednosti nezavisne varijable X koje se nalaze unutar segmenta ome enoga najmanjom i najvećom empirijskom vrijednošću te varijable. 50]. 50]. za vrijednosti izvan toga segmenta kvaliteta procjene opada što je vrijednost udaljenija od donje ili gornje granice segmenta.7182818284590452353603. za velike vrijednosti nezavisne varijable x temperatura kave bit će sve bliža 0°C zbog asimptotskoga približavanja odgovarajućega grafa osi Ox.159 ⋅ 0.3. Npr.46°C. kava se ne može ohladiti na temperaturu manju od temperature okoline. Ova se tvrdnja lako provjeri uvrštavanjem x = 1 u jednadžbu regresijskoga modela i korištenjem činjenice da je ln 1 = 0. predavač 181 . © mr. Model jednostavne logaritamske regresije Standardni oblik regresijske jednadžbe ovoga modela je: Y = A ⋅ ln x + B. a prema dobivenom regresijskom modelu. ali x = 120 je vrijednost više nego dvostruko veća od gornje granice segmenta [0. Grubo govoreći.2. U nastavku navodimo njihove interpretacije u obliku dvaju svojstava: B → procijenjena (ili očekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne varijable X jednaka 1 jedinici mjere. u promatranom bismo primjeru za x = 51 još mogli očekivati relativno dobru procjenu temperature kave.

riječ je o povećanju vrijednosti x1 za p%. Ako se vrijednost nezavisne varijable X promijeni za p%. a ako je p < 0. 100   © mr. a takve vrijednosti ne mogu biti obuhvaćene regresijskim modelom. otkuda slijedi da je ukupna prosječna promjena vrijednosti zavisne varijable Y jednaka ∧ ∧ p   y2 − y1 = A ⋅ ln 1 + . Dokaz: Analogno kao i kod modela jednostavne eksponencijalne regresije.82818284590452353603  100  procijenjena prosječna promjena vrijednosti zavisne varijable Y iznosi točno A. Neka je p > –100 proizvoljan.ELEKTROTEHNIČKI ODJEL Poslovna statistika Interpretacija varijable A. za p = 171. Posebno. nova vrijednost te varijable je: x2 = x1 + p p   ⋅ x1 =  1 +  ⋅ x1 . Uvjet p > –100 postavljen je zbog zahtjeva da vrijednost nezavisne varijable X mora biti strogo pozitivna: smanjenje konkretne vrijednosti nezavisne varijable X za barem 100% povlačilo bi da je nova vrijednost te varijable nepozitivna (strogo negativna ili nula). predavač 182 . ∧ Nakon promjene vrijednosti x1 za p%. Pripadna očekivana vrijednost zavisne varijable Y jednaka je: y1 = A ⋅ ln x1 + B . nego ''zaobilazna'' (neizravna) i temelji se na sljedećem svojstvu: Svojstvo 1. neka je x1 početna vrijednost varijable X i neka je p postotak promjene te varijable. nije izravna. procijenjena (ili očekivana) prosječna promjena vrijednosti p   zavisne varijable Y iznosi A ⋅ ln  1 +  . ali fiksiran realan broj. Bojan Kovačić. Ako je p > 0. kao i kod modela jednostavne eksponencijalne regresije.sc. 100  100  Pripadna očekivana vrijednost zavisne varijable Y jednaka je ∧  p   p  p  ∧   y2 = A ⋅ ln x2 + B = A ⋅ ln  1 +  ⋅ x1  + B = A ⋅ ln 1 +  + A ⋅ ln x1 + B = A ⋅ ln 1 +  + y1  100   100   100   . riječ je o smanjenju vrijednosti x1 za p%.

pa je i sâm parametar A pokazatelj prosječne promjene. b) Odredimo jednadžbu modela jednostavne logaritamske regresije koji najbolje opisuje promatranu ovisnost. c) Procijenimo reprezentativnost modela dobivenoga u rješenju b) podzadatka pomoću koeficijenta determinacije. Prije točno 10 godina istodobno je posa eno ukupno 12 jednogodišnjih sadnica odre ene vrste višnje.sc. Napomenimo da se pridjev prosječna navodi zbog izvoda formule za procijenjenu vrijednost parametra A u kojemu se koriste prosjeci vrijednosti nezavisne i zavisne varijable. Objasnimo značenje svih parametara dobivenoga modela. Podaci o prosječnoj visini stabala tijekom svake od minulih 10 godina navedeni su u donjoj tablici. Ovisnost prosječne visine svih stabala o njihovoj starosti grafički prikazujemo donjim dijagramom rasipanja: © mr. Promatra se ovisnost prosječne visine izraslih stabala o njihovoj starosti. Bojan Kovačić. U trenutku sadnje prosječna visina jedne sadnice bila je 182.] prosječna visina [cm] 7 563. f) Koristeći rezultat b) podzadatka procijenimo prosječnu visinu svih posa enih stabala točno 20 godina nakon sadnje i utvrdimo realističnost dobivene procjene.2 5 502.504 a) Prikažimo ovisnost prosječne visine stabala o njihovoj starosti odgovarajućim grafikonom uz kojega navedimo sve potrebne oznake.36 10 600. e) Koristeći rezultat b) podzadatka procijenimo trenutak (računajući od trenutka sadnje) u kojemu će prosječna visina svih stabala biti 3 metra.] prosječna visina [cm] 1 182. d) Koristeći rezultat b) podzadatka procijenimo prosječnu visinu svih stabala četiri i pol godine nakon sadnje.12 9 594.ELEKTROTEHNIČKI ODJEL Poslovna statistika što je i trebalo pokazati. predavač 183 . starost [god.88 cm. Primjer 1.456 11 603.92 6 533.4 starost [god.88 2 289.56 3 396.88 8 579.24 4 457.

91 cm.  100  B = 185. procijenjeno (očekivano) povećanje njihove prosječne visine iznosi 10   186. Dakle. ako se starost svih sadnica poveća za 10%.ELEKTROTEHNIČKI ODJEL Poslovna statistika Jednadžba modela jednostavne logaritamske regresije. zajedno s pripadnom krivuljom.91 ⇔ Procijenjena (očekivana) prosječna visina svih jednogodišnjih sadnica u trenutku sadnje iznosi 185.sc. predavač 184 . © mr.74485 cm.18 ⇔ Ovaj ćemo parametar interpretirati pomoću p = 10. Bojan Kovačić. navedena je na donjoj slici: Najvažniji parametri dobivenoga modela jednostavne logaritamske regresije su: A = 186.18 ⋅ ln  1 +  ≈ 17.

5 do čak 9 metara.91 ≈ 503.3 cm.91 ∧ izrazimo x: X =e ∧ y −185. ∧ Trenutak u kojemu će prosječna visina svih stabala biti 3 metra (= 300 cm) odredit ćemo tako da iz dobivene jednadžbe modela jednostavne logaritamske regresije Y = 186.18 ⋅ ln x + 185. predavač 185 .sc. tim više što logaritamska funkcija za sve veće i veće vrijednosti nezavisne varijable x raste sve ''sporije''. procijenjeno vrijeme u kojemu će prosječna visina svih stabala biti točno 3 metra iznosi 10 mjeseci i 5 dana.91 186. računajući od trenutka sadnje.91 ≈ 752.18 ≈ 1.18 ⋅ ln 21 + 185. 11] u kojemu smo radili procjene parametara.5 + 185.74 cm. Točno 20 godina nakon sadnje procijenjena prosječna visina svih stabala (čija će starost tada biti 1 + 20 = 21 godinu) iznosi Y = 186. pa će njihova procijenjena prosječna visina u tom trenutku biti Y = 186. Ipak.5 = 5.91 186.18 i u dobivenu formulu uvrstimo y = 300. ∧ © mr. pa ova procjena ne mora biti realistična.9863. Bojan Kovačić.8455 godina = 1 godina 10 mjeseci i 5 dana.18 ⋅ ln 5. Vrijednost x = 21 je gotovo dvostruko veća od gornje granice segmenta [1. Stoga procijenjenu vrijednost ne treba unaprijed odbaciti kao potpuno pogrešnu. Četiri i pol godine nakon sadnje sva stabla bit će stara ukupno 1 + 4.ELEKTROTEHNIČKI ODJEL Poslovna statistika Koeficijent determinacije dobivenoga modela iznosi R2 = 0. u praksi se pokazalo da stabla višnje prosječno narastu u rasponu od 4. što znači da je model reprezentativan. Dobivamo: X =e ∧ 300 −185. Dakle.5 godina. otkuda slijedi da je 98.63% ovisnosti prosječne visine stabala o njihovoj starosti objašnjeno modelom jednostavne logaritamske regresije.

Njezino je prirodno područje definicije skup 〈0. 113 © mr. a jedno od njih je i potencija.3. Neka je p > –100 proizvoljan.  100       Dokaz: Analogno ranijim dokazima. ali fiksiran realan broj a ∈ R.3. funkcija f(x) = xa naziva opća potencija. Bojan Kovačić. ali – kao u svim prethodnim modelima – navodimo interpretacije obaju parametara modela: B → procijenjena (očekivana) vrijednost zavisne varijable Y kada je vrijednost nezavisne varijable X jednaka 1 jedinici mjere.ELEKTROTEHNIČKI ODJEL Poslovna statistika 4. linearizaciji modela (svo enju modela odgovarajućim zamjenama na model jednostavne linearne regresije) vrijednosti nezavisne i zavisne varijable pojavljuju kao logaritmandi.sc. Ako se vrijednost nezavisne varijable X promijeni za p%. procijenjena (očekivana) promjena vrijednosti zavisne varijable A    p    Y iznosi 100 ⋅  1 +  − 1  % . Pripadna očekivana vrijednost zavisne varijable Y jednaka je: Engleska riječ power ima više značenja. ali fiksiran realan broj. a lako se provjeri tako da se u jednadžbu modela jednostavne potencijske regresije uvrsti x = 1 i primijeni činjenica da za svaki realan broj a ∈ R vrijedi jednakost: 1a = 1. Uobičajeni hrvatski prijevod naziva modela (dvostruko logaritamski) potječe od činjenice da se u tzv. Interpretacija parametra A se temelji na sljedećem svojstvu: Svojstvo 1. Model jednostavne potencijske regresije (POWER)113 Standardni oblik jednadžbe modela potencijske regresije je: ˆ Y = B⋅ X A . neka je x1 početna vrijednost nezavisne varijable X. predavač 186 . Za analizu regresijskoga modela ponovno je značajniji parametar A. +∞〉. pa – analogno kao i u modelu jednostavne logaritamske regresije – vrijednosti nezavisne varijable X ne mogu biti nepozitivni realni brojevi (strogo negativni realni brojevi i nula). za proizvoljan. Ova je interpretacija jednaka interpretaciji istoga regresijskoga parametra u modelu jednostavne logaritamske regresije. Podsjetimo da se. Stoga je naziv ovoga modela preveden kao potencijski.

A    p    s = 100 ⋅ 1 +  − 1  % . s= 2∧ 1 = =   ∧ ∧  100  y1 y1 y1 ∧ ∧ odnosno. . nova vrijednost nezavisne varijable bit će: x2 = x1 + p p   ⋅ x1 =  1 +  ⋅ x1 . a samim tim i različite od nule. Koristeći razvoj u binomni red p  p A ⋅ ( A − 1) p 2 A ⋅ ( A − 1) ⋅ ( A − 2) p3  1+ = 1+ ⋅ A+ ⋅ + ⋅ + . predavač 187 . Bojan Kovačić..   100 2 10000 6 1000000  100  A © mr.  100   100   100   ∧ A A A A 2 Već smo utvrdili da je područje vrijednosti svake opće potencije skup svih strogo pozitivnih realnih brojeva. što znači da su obje vrijednosti y1 i y2 strogo veće od nule. 100  100  ∧ Pripadna vrijednost zavisne varijable Y jednaka je  p   p  p  ∧   A y2 = B ⋅ x = B ⋅   1 +  ⋅ x1  = B ⋅  1 +  ⋅ x1 = 1 +  ⋅ y1 .sc.ELEKTROTEHNIČKI ODJEL Poslovna statistika y1 = B ⋅ x1A . iskazano u postotcima.  100       što je i trebalo pokazati.. Ukoliko se vrijednost x1 promijeni za p%. Zbog toga je dobro definirana relativna promjena vrijednosti zavisne varijable Y i ona je jednaka A A ∧   p   p  ∧ ∧  y1⋅  1 + ∧ ∧  − 1 A 1 +  ⋅ y1 − y1 y −y  100    100    = 1 + p  −1.

Dobiveni podaci navedeni su u sljedećoj tablici. A Dakle. predavač 188 .9 36. p ∈ [–1.3 42. za p = ±1 ta promjena iznosi ±A%. Ilustrirajmo primjenu modela jednostavne potencijske regresije na dvama primjerima.ELEKTROTEHNIČKI ODJEL Poslovna statistika pokazuje se da za relativno male vrijednosti broja p (npr.2 37.sc. Istaknimo da se u ekonomskim analizama ovim regresijskim modelom omogućava tzv. pri interpretaciji parametra A obično ćemo uzimati p = 1. pri čemu je p relativno mali realan broj i A > 0.2 48. ukupan (kumulativni) broj montiranih vagona 10 20 30 40 50 60 70 80 rad neposrednih radnika [000 sati/vagon] 59. procijenjena (očekivana) promjena vrijednosti zavisne varijable Y iznosi (p ⋅ A)%. Ako se vrijednost nezavisne varijable X promijeni za p%.1 40. b) Odredimo jednadžbu modela jednostavne potencijske regresije koji najbolje opisuje promatranu ovisnost i objasnimo značenje parametara dobivenoga modela. Primjer 1. mjerenje elastičnosti zavisne varijable u odnosu na nezavisnu varijablu.7 46. Bojan Kovačić.9 35. 1]) i A > 0 vrijedi aproksimacija: p  p  ⋅A 1 +  ≈ 1+ 100  100  Odavde slijedi sljedeće Svojstvo 2.7 a) Promatranu ovisnost grafički prikažimo odgovarajućim grafikonom uz kojega navedimo sve potrebne oznake. Posebno. © mr. c) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije. Tvornica željezničkih vagona “Šlamperajević” iz Piškorevaca razmatra ovisnost utrošenih radnih sati neposrednih radnika na montaži vagona o ukupnom (kumulativnom) broju montiranih vagona.

zajedno s pripadnom krivuljom.sc. navedena je na sljedećoj slici: © mr. Ovisnost utrošenih radnih sati neposrednih radnika na montaži o ukupnom (kumulativnom) broju montiranih vagona grafički prikazujemo donjim dijagramom rasipanja: Jednadžba modela jednostavne potencijske regresije. e) Na temelju rezultata b) podzadatka procijenimo ukupan (kumulativni) broj montiranih vagona ako utrošeni radni sati neposrednih radnika iznose 41 000 radnih sati po vagonu.ELEKTROTEHNIČKI ODJEL Poslovna statistika d) Na temelju rezultata b) podzadatka procijenimo ukupno vrijeme rada neposrednih radnika po jednom vagonu ako je montirano ukupno 45 vagona. predavač 189 . Bojan Kovačić.

traženo procijenjeno vrijeme montaže po jednom vagonu iznosi 40 966.53 ⋅ x–0.53 ⋅ 45–0.241 ∧ izrazimo x:  102.9663 ∧ Dakle. predavač 190 . Ukupan (kumulativni) broj montiranih vagona u slučaju kad se za montažu jednoga vagona utroši 41 000 radnih sati dobit ćemo tako da iz jednadžbe Y = 102. utrošeni radni sati neposrednih radnika po jednom vagonu očekivano će se smanjiti za 0. što znači da se 99.53 ⋅ x–0.241%.52  X =   y  ∧ 0. tj.241 ⇔ (uzimamo p = 1) Ako se ukupan (kumulativni) broj montiranih vagona poveća za 1%. dobiveni je model vrlo reprezentativan. Bojan Kovačić. A = –0.241 = 40.3 sati.9938.ELEKTROTEHNIČKI ODJEL Poslovna statistika Najvažniji parametri dobivenoga modela su: B = 102.241 ∧ uvrstimo x = 45: Y = 102. Koeficijent determinacije dobivenoga regresijskoga modela je R2 = 0.sc.241 i u dobivenu jednadžbu uvrstimo y = 41: © mr. Ukupno vrijeme rada neposrednih radnika na montaži ukupno 45 vagona procijenit ćemo tako da u jednadžbu dobivenoga regresijskoga modela Y = 102.53 ⇔ Procijenjeni rad neposrednih radnika na montaži prvoga vagona iznosi 102 530 radnih sati.38% ovisnosti rada neposrednih radnika o ukupnom (kumulativnom) broju montiranih vagona može objasniti modelom jednostavne potencijske regresije.

funkcijâ učenja (engl.8 269.).6 323.8 82. Navedimo sve parametre toga modela i objasnimo njihovo značenje.ELEKTROTEHNIČKI ODJEL Poslovna statistika  102.9 236.52  241 X = ≈ 45.9 300.9 duljina [mm] 159.1 437.9 45. Stoga se modeli jednostavne potencijske regresije često primijenjuju pri ugovaranju dinamike izvo enja radova ili isporuke serije odre enih proizvoda (npr. Bojan Kovačić. procijenjeni ukupan (kumulativni) broj montiranih vagona jednak je 45.7 377.2 444. aviona. ramenih kostiju. srednji promjer [mm] 17.sc.9 206.2 58.7 80. Napomenimo da realna funkcija dobivena kao jednadžba modela jednostavne potencijske regresije pripada tipu tzv. © mr. b) Odredimo jednadžbu modela jednostavne potencijske regresije koji najbolje opisuje promatranu ovisnost. brodova i sl.9 38. Primjer 2. Dobiveni podaci prikazani su u donjoj tablici. Na uzorku od ukupno 11 afričkih antilopa (gazela) ispituje se ovisnost izme u duljine i srednjega promjera tzv.1 64.6 384.6 351.7 66.8 51. željezničkih vagona.7 a) Ovisnost duljine ramenih kosti o njihovu srednjem promjeru grafički prikažimo odgovarajućim grafikonom uz kojega navedimo sve potrebne oznake. learning function). predavač 191 . c) Procijenimo reprezentativnost dobivenoga regresijskoga modela na temelju koeficijenta determinacije. a temelji se na pretpostavci da se utrošak radnih sati smanjuje s ponavljanjem iste radne operacije.   41  ∧ 1000 Dakle.6 26 31.

ELEKTROTEHNIČKI ODJEL
Poslovna statistika d) Na temelju rezultata b) podzadatka procijenimo duljinu ramenih kostiju čiji je srednji promjer 84 mm. e) Na temelju rezultata b) podzadatka procijenimo srednji promjer ramenih kostiju čija je duljina 40 cm. Ovisnost duljine ramenih kostiju o njihovu srednjem promjeru grafički je prikazana donjim dijagramom rasipanja:

Jednadžba modela jednostavne potencijske regresije, zajedno s pripadnom krivuljom, navedena je na donjoj slici:

© mr.sc. Bojan Kovačić, predavač

192

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Najvažniji parametri dobivenoga modela jednostavne potencijske regresije su: B = 24.13 ⇔ Procijenjena duljina ramenih kostiju čiji je srednji promjer 1 mm iznosi 24.13 mm. (Interpretacija ovoga parametra ne odgovara realnoj situaciji jer su druga istraživanja pokazala da je najmanja zabilježena duljina ramenih kostiju približno 140 mm = 14 cm.) A = 0.6595 ⇔ (uzimamo p = 1) Ako se srednji promjer ramenih kostiju poveća za 1%, očekivano relativno prosječno povećanje duljine ramenih kostiju iznosi 0.6595%. Koeficijent determinacije dobivenoga modela jednostavne potencijske regresije iznosi R2 = 1, što ukazuje na činjenicu da se dobivenim regresijskim modelom potpuno može objasniti ovisnost duljine ramenih kostiju antilope o njihovu srednjem promjeru. Taj je rezultat posljedica zaokruživanja izračuna koeficijenta determinacije na 4 decimalna mjesta. Izračuna li se R2 na 10 decimalnih mjesta, dobiva se R2 = 0.9999874242. U svakom slučaju, riječ je o vrlo reprezentativnom modelu jednostavne regresije. Procijenjenu duljinu ramenih kostiju čiji je srednji promjer 84 mm dobit ćemo tako da u jednadžbu dobivenoga modela jednostavne potencijske regresije
Y = 24.13 ⋅ x0.6595

uvrstimo x = 84:
Y = 24.13 ⋅ 840.6595 ≈ 448.4 mm.

Stoga tražena procijenjena duljina ramenih kostiju iznosi 448.4 mm. Srednji promjer ramenih kostiju čija je duljina 40 cm (= 400 mm) procijenit ćemo tako da iz dobivene jednadžbe modela jednostavne potencijske regresije izrazimo x:
 y  1319 X =   24.13 
∧ 2000

pa u dobivenu jednakost uvrstimo y = 400:  400  1319 X = ≈ 70.7.   24.13 
∧ 2000

© mr.sc. Bojan Kovačić, predavač

193

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

Stoga traženi procijenjeni srednji promjer ramenih kostiju iznosi 70.7 mm.

afrička antilopa (gazela)

4.4. Primjer modela višestruke (multiple) regresije: model višestruke linearne regresije
U ovoj se točki ukratko opisuje najjednostavniji primjer modela višestruke ili multiple regresije, a to je model višestruke linearne regresije. Podsjetimo da općenito modeli višestruke regresije imaju jednu zavisnu i barem dvije nezavisne varijable. U slučajevima u kojima se pojavljuju najmanje tri nezavisne varijable nemoguće je dati grafički prikaz. No, i u takvim se slučajevima mogu računati odgovarajući analogoni koeficijenata linearne korelacije, koeficijenata determinacije itd., te dati interpretacije parametara dobivenoga modela višestruke regresije. Rečeno ćemo pokazati na primjeru modela višestruke linearne regresije. Opći oblik modela višestruke linearne regresije je: Y = A1 ⋅ X1 + A2 ⋅ X2 + … + An ⋅ Xn + B + e, a odgovarajuća jednadžba toga modela je Y = A1 ⋅ x1 + A2 ⋅ x2 + … + An ⋅ xn + B. U objema jednakostima su, analogno kao i u modelu jednostavne linearne regresije, A1, A2, …, An regresijski koeficijenti modela, B slobodni član, a e stohastička (slučajna) varijabla © mr.sc. Bojan Kovačić, predavač 194

ELEKTROTEHNIČKI ODJEL
Poslovna statistika

koja ''mjeri'' pogrešku procjene. Za svaki i = 1, 2, …, n interpretacija regresijskoga koeficijenta Ai glasi: Ai je procijenjena (očekivana) prosječna promjena vrijednosti varijable Xi u slučaju kada se vrijednost te varijable poveća za 1 jedinicu mjere, a vrijednosti svih ostalih varijabli ostanu nepromijenjene. Navedena se interpretacija može poopćiti za bilo koji realan broj k ∈ R: k ⋅ Ai je procijenjena (očekivana) prosječna promjena vrijednosti varijable Xi u slučaju kad se vrijednost te varijable promijeni za k jedinica mjere, a vrijednosti svih ostalih varijabli ostanu nepromijenjene. Slobodni član B je manje važan parametar modela, ali radi potpunosti navodimo i njegovu interpretaciju: B je procijenjena (očekivana) vrijednost zavisne varijable Y u slučaju kad su vrijednosti svih nezavisnih varijabli X1, …, Xn jednake nuli. (Ova interpretacija, naročito u ekonomiji, vrlo često ne odgovara realnoj situaciji.)
Primjer 1. (izbori za kanadski parlament) Ispituje se ovisnost ukupnoga postotka dobivenih glasova (a time i mandata) relativnoga pobjednika na svakim pojedinim parlamentarnim izborima o postotcima glasova dobivenih u četiri kanadske regije: R1, R2, R3 i R4. Dobiveni podaci su prikazani u sljedećoj tablici.

© mr.sc. Bojan Kovačić, predavač

195

ELEKTROTEHNIČKI ODJEL
Poslovna statistika
izborna godina 1949. 1953. 1957. 1958. 1962. 1963. 1965. 1968. 1972. 1974. 1979. 1980. 1984. 1988. 1993. 1997. 2000. 2004. postotak na državnoj razini 73 64 42 79 44 49 50 59 41 54 48 52 75 57 60 52 57,5 43,8 postotak u regiji R1 74 34 64 76 55 61 45 22 31 41 56 63 78 34 97 34 60 69 postotak u regiji R2 78 78 52 73 49 62 69 74 56 71 58 74 74 63 67 72 77 53 postotak u regiji R3 58 35 29 95 88 6 2 25 7 11 78 4 80 67 39 17 17 11 postotak u regiji R4 61 38 32 82 27 32 32 70 17 35 68 0 68 38 19 18 15 22

a) Odredimo jednadžbu modela višestruke linearne regresije i objasnimo značenje parametara dobivenoga modela. b) Procijenimo reprezentativnost dobivenoga modela na temelju koeficijenta determinacije, te statističku značajnost pojedinih regresorskih varijabli i cijeloga modela (uz razinu pouzdanosti od 95%). c) Relevantne predizborne ankete (provedene od strane neovisnih agencija) pokazuju da će stranka S u regiji R1 osvojiti 51% glasova, u regiji R2 67% glasova, u regiji R3 12% glasova i u regiji R4 15% glasova. Na temelju rezultata a) podzadatka utvrdimo može li ta stranka računati na relativnu izbornu pobjedu. d) Na temelju rezultata a) podzadatka procijenimo najmanji postotak glasova koji stranka S treba dobiti u njoj tradicionalno sklonoj regiji R2 tako da bude relativni pobjednik izbora ako se na temelju predizbornih anketa procjenjuje da će ta stranka u regiji R1 osvojiti 55% glasova, u regiji R3 38% glasova, a u regiji R4 41% glasova.

Za dobivanje i analizu modela višestruke linearne regresije u MS Excelu koristimo proceduru Regression u okviru alata Analiza podataka (Data Analysis). Primjenom te procedure dobivamo sljedeće vrijednosti:

© mr.sc. Bojan Kovačić, predavač

196

koeficijent uz varijablu Postotak u regiji R3: 0.011263866 ⇔ uz razinu pozdanosti od 95%. © mr.3211733 (teoretski.00900155 ⇔ uz razinu pozdanosti od 95%. predavač 197 . koeficijent determinacije: 0. postoji statistički značajan utjecaj postotka glasova dobivenih u regiji R1 na ukupan postotak dobivenih glasova na državnoj razini.857302 ⇔ Ako se postotak dobivenih glasova u regiji R2 poveća za 1. koeficijent uz varijablu Postotak u regiji R4: 0.112526063 ⇔ Ako se postotak dobivenih glasova u regiji R4 poveća za 1.sc.25% ovisnosti zavisne varijable o svim četirima nezavisnim varijablama).13.86. p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R2: 3. otkuda slijedi da je dobiveni model višestruke linearne regresije reprezentativan (objašnjava približno 93. kao zavisne varijable. očekivano prosječno povećanje postotka dobivenih glasova na državnoj razini iznosi (približno) 0.049511477 ⇔ uz razinu pozdanosti od 95%. slobodni član: -17. postoji statistički značajan utjecaj postotka glasova dobivenih u regiji R4 na ukupan postotak dobivenih glasova na državnoj razini. i postotaka na regionalnoj razini.96556752. očekivano prosječno povećanje postotka dobivenih glasova na državnoj razini iznosi (približno) 0. otkuda slijedi da postoji jaka linearna veza izme u postotka na državnoj razini. postoji statistički značajan utjecaj postotka glasova dobivenih u regiji R2 na ukupan postotak dobivenih glasova na državnoj razini. p – vrijednost koeficijenta višestruke linearne korelacije (p – vrijednost modela višestruke linearne regresije): 1.000000176512 ⇔ dobiveni koeficijent višestruke linearne korelacije i dobiveni model višestruke linearne regresije su statistički značajni. ali takva interpretacija ne odgovara realnoj situaciji) koeficijent uz varijablu Postotak u regiji R1: 0.117393926 ⇔ Ako se postotak dobivenih glasova u regiji R3 poveća za 1.932320637. očekivano prosječno povećanje postotka dobivenih glasova na državnoj razini iznosi (približno) 0.ELEKTROTEHNIČKI ODJEL Poslovna statistika koeficijent višestruke linearne korelacije (Multiple R): 0. to je ukupan postotak mandata na državnoj razini u slučaju da pobjednička stranka niti u jednoj regiji ne osvoji niti jedan glas. koeficijent uz varijablu Postotak u regiji R2: 0. Bojan Kovačić. očekivano prosječno povećanje postotka dobivenih glasova na državnoj razini iznosi (približno) 0. p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R4: 0.000000396069 ⇔ uz razinu pozdanosti od 95%. p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R3: 0. p –vrijednost koja odgovara koeficijentu uz varijablu Postotak u regiji R1: 0.12. postoji statistički značajan utjecaj postotka glasova dobivenih u regiji R3 na ukupan postotak dobivenih glasova na državnoj razini. kao nezavisnih varijabli.129717918 ⇔ Ako se postotak dobivenih glasova u regiji R1 poveća za 1.96069E-07 = 0.76513E-07 = 0.11.

x3 = 12 i x4 = 15: Y = 0. ∧ ∧ © mr.857302 ⋅ 67 + 0.112526063 ⋅ 41 – 17.857302 ⋅ x2 + 0. pa se može zaključiti da bi stranka S u njoj tradicionalno sklonoj regiji R2 trebala dobiti najmanje 60% ukupnih glasova birača u toj regiji tako da može računati na relativnu pobjedu na parlamentarnim izborima. tj.83029292.112526063 ⋅ x4 – 17.129717918 ⋅ x1 + 0. ∧ Y = 49.3211733 ≥ 50 Odavde je x2 ≥ 59.62.3211733.129717918 ⋅ 55 + 0. tako da po x2 riješimo nejednadžbu 0. Budući da procijenjeni rezultat nije strogo veći od 50 [%]. 2.117393926 ⋅ 38 + 0.sc. x2 = 52. u regiji R3 12% glasova i u regiji R4 15% glasova računati na relativnu izbornu pobjedu napravit ćemo tako da u gornju jednadžbu uvrstimo x1 = 67. ∧ Procjenu može li stranka koja u regiji R1 osvoji 51% glasova. 3. stranka ne bi trebala računati na relativnu pobjedu na parlamentarnim izborima. Tada jednadžba modela višestruke linearne regresije koji opisuje promatranu ovisnost glasi: Y = 0.3211733. Najmanji postotak glasova koji stranka S treba dobiti u njoj tradicionalno sklonoj regiji R2 tako da bude relativni pobjednik izbora u drugom podslučaju procijenit ćemo tako da riješimo nejednadžbu Y ≥ 50.112526063 ⋅ 15 – 17.117393926 ⋅ x3 + 0.129717918 ⋅ 51 + 0. Bojan Kovačić. predavač 198 . 4 označimo s xi postotak glasova koje je pobjednička stranka dobila u regiji Ri.ELEKTROTEHNIČKI ODJEL Poslovna statistika Primijetimo da prema strožem kriteriju (uz razinu pouzdanosti od 99%) utjecaj postotka glasova dobivenih u regijama R1 i R4 ne bi bio statistički značajan Za svaki i = 1.857302 ⋅ x2 + 0. u regiji R2 67% glasova.117393926 ⋅ 12 + 0.

siječanj 7. U ovome je primjeru tekuće ili izvještajno razdoblje 2006. 2008.00 2008. godine.604.00 rujan 6. 22 337 4 934 2004.460. 22 806 4 496 2003. Promatramo ukupan broj sklopljenih i razvedenih brakova u Republici Hrvatskoj u razdoblju od 2002.sc.00 prosinac 6. Primjer 2. Državni zavod za statistiku.00 2007. 22 092 2 651 izvor: Mjesečno statističko izvješće 3/08.. 2003.00 studeni 8. a neposredno prethodno razdoblje je 2005. Sva razdoblja prije tekućega u kojima smo odre ivali vrijednost promatrane pojave nazivaju se prethodna razdoblja. vremensko razdoblje u kojemu smo pretposljednji put odredili vrijednost promatrane pojave. Vremensko razdoblje u kojemu smo posljednji put odredili vrijednost neke pojave naziva se tekuće ili izvještajno razdoblje. do 2006. Državni zavod za statistiku.00 izvor: Mjesečno statističko izvješće 3/08. godina © mr. Promatramo kretanje prosječne mjesečne isplaćene neto-plaće po jednom zaposleniku u svim pravnim osobama u Republici Hrvatskoj koje se bave financijskim posredovanjem za razdoblje od siječnja 2007. godine do siječnja 2008.569. 22 138 4 883 2006. 2004. predavač 199 . godina. listopad 6. prema navedenoj tablici. godina. godine. brakovi godina sklopljeni razvedeni 2002. INDIVIDUALNI BROJČANI POKAZATELJI RAZVOJA VREMENSKOGA NIZA Vrijednosti neke pojave u vremenu obično odre ujemo i uspore ujemo u odre enim vremenskim razdobljima.. 22 700 4 985 2005. Bojan Kovačić. i 2005. Zagreb. a sama odre ena vrijednost tekuća vrijednost te pojave. zapravo.00 veljača 6. Zagreb. mjesec prosječna neto-plaća [kn] siječanj 6. u toj godini posljednji put izvršeno brojanje sklopljenih.567.228. Prethodna razdoblja su 2002. Od svih njih najznačajnije je neposredno prethodno razdoblje: to je.152. Primjer 1.ELEKTROTEHNIČKI ODJEL Poslovna statistika 5. odnosno razvedenih brakova. godina jer je.709. 2008.

do 2007.6% više korisnika novčane naknade nego u 2007.sc. X2]. veljača. izraz tipa ''razdoblje od 2000. godinu i cijelu 2007. godini bilo za 35. Jedan od najčešćih razloga je političke prirode: npr. do 31.12. pa npr. godina. prosječan godišnji broj korisnika novčane naknade 67 977 70 467 72 802 66 407 59 603 izvor: Mjesečno statističko izvješće 3/08. a razdoblje u kojemu je odre ena bazno razdoblje. Državni zavod za statistiku. cijene. 114 © mr. U ovome je primjeru bazno razdoblje 2007. nego isključivo da ti podaci nisu navedeni u tablici. do 2007. Bojan Kovačić. No. u svakoj godini obnašanja vlasti sa stanjem u godini neposredno prije prošlih parlamentarnih izbora na kojima je preuzela obnašanje vlasti. tj.ELEKTROTEHNIČKI ODJEL Poslovna statistika U ovome je primjeru tekuće ili izvještajno razdoblje siječanj 2008. vanjski dug itd. možemo zaključiti (kako?) da je u 2003.2000.01. a bazna vrijednost 59 603 (vrijednost promatrane pojave u baznom razdoblju). jedna te ista vrijednost naziva se bazna vrijednost. godini itd. radi jednostavnosti. godine. i Primjera 3. Primjer 3. 2004.2007. Naslov takvoga grafikona obično je izraz tipa ''Kretanje pojave X u razdoblju od… do…''. listopad. godine'' . u 2004. u to ćemo razdoblje ''uključiti'' cijelu 2000. godini. godine: godina 2003. 2005. to ne znači da se u razdoblju od ožujka do kolovoza 2007. 2006. 2007. Promatramo prosječan godišnji broj korisnika novčane naknade na Hrvatskom zavodu za zapošljavanje u razdoblju od 2003. godine nije pratilo kretanje promatrane prosječne neto-plaće. Uobičajeni grafički prikaz vremenskoga niza jest linijski grafikon. godine mjesec veljača 2007. godinu115. u predizbornoj kampanji trenutno vladajuća stranka obično uspore uje prosječne plaće. Grafički prikazi podataka iz Primjera 1. Stanje u svakoj pojedinoj godini možemo usporediti sa stanjem u 2007. godine. pod pojmom ''razdoblje izme u trenutka X1 i trenutka X2'' podrazumijevat ćemo zatvoreni interval (segment) [X1. interpretirati kao ''vremensko razdoblje od 01. Neposredno prethodno razdoblje je prosinac 2007. rujan. godine. 2008. predavač 200 . Ta.. godine. Uočimo da je razdoblje neposredno prethodno mjesecu rujnu 2007. a ne mjesec kolovoz 2007. 115 Matematički precizno. Nerijetko se vrijednosti promatrane pojave iz različitih razloga114 uspore uju s jednom te istom vrijednošću pojave odre enom u nekomu razdoblju. Zagreb. godini. studeni i prosinac 2007. godini za 14% više korisnika novčane naknade nego u 2007. Pritom ćemo. godine. Prethodna razdoblja su siječanj. su sljedeće dvije slike.

© mr.sc. shvatiti vrijeme kao nezavisnu varijablu (X). Bojan Kovačić. nezavisnu vremensku varijablu označavat ćemo s Xt. predavač 201 . Dakle.ELEKTROTEHNIČKI ODJEL Poslovna statistika Budući da kretanje vrijednosti neke pojave pratimo u vremenu. sukladno razmatranjima iz 4. promatranu pojavu možemo shvatiti kao funkciju vremena. odnosno. Uobičajenoj oznaci nezavisne varijable (X) pridodat ćemo indeks t kako bismo naglasili da je riječ o posebnom tipu nezavisne varijable. poglavlja. a promatranu pojavu kao zavisnu varijablu (Y).

tj. zapravo. 2004. početnom vremenskom razdoblju dodijelit ćemo vrijednost vremenske varijable t = 0. Osnovni razlog takvom pridruživanju jest korištenje modela jednostavne linearne regresije i jednostavne eksponencijalne regresije u analizi vremenskih nizova: ti modeli pretpostavljaju da se vrijednost zavisne varijable Y može izračunati u slučaju kad je vrijednost nezavisne varijable jednaka nuli118. Kako bismo što više pojednostavnili statističku analizu. Preciznije. predavač 202 . početnom razdoblju (odnosno. Definicija i vrste vremenskih nizova (Konačan) Vremenski niz je niz od ukupno n ∈ N odre enih. Stoga ćemo. posljednjem od njih – a to je. t = 0 ne znači da je prva vrijednost pojave izmjerena u godini Kristova ro enja. Smatramo intuitivno prihvatljivim pretpostaviti da vrijednost promatrane pojave ne ovisi o broju vezanom uz razdoblje u kojemu je izmjerena vrijednost pojave117. Imamo li ukupno n vremenskih razdoblja u kojima smo odre ivali vrijednost neke pojave. vrijednosti vremenske varijable početi brojati od nule119. njemu neposredno sljedećem vremenskom razdoblju vrijednost t = 1. tekuće razdoblje – dodijelit Navedeni je naziv svojevrstan vremenski analogon naziva apsolutna frekvencija kojega smo susreli u 2. poglavlju. 2005. jedan od parametara svakoga od tih modela interpretira se upravo kao vrijednost odgovarajuće funkcije za x = 0. Tako npr. astrologa i njima sličnih ''-loga''. razdoblju u kojemu smo prvi put odredili vrijednost promatrane pojave) dodijelit ćemo vrijednost vremenske varijable Xt = 0. Stoga ćemo za prirodno područje definicije (domenu) nećemo uzimati npr. Vrijednosti koje tvore vremenski niz obično nazivamo frekvencije116. itd. točno jednom godišnje svake godine itd. a što područje vrijednosti (kodomena) takvoga pridruživanja.sc. 119 Za sve vjernike: oprez.1. 5.). u Primjeru 1. ali pojednostavljuje daljnju statističku analizu. poglavlje). broj razvedenih brakova u 2003. promatrat ćemo slučajeve kada se vrijednosti neke pojave odre uju u jednakim (pravilnim) vremenskim intervalima (npr.ELEKTROTEHNIČKI ODJEL Poslovna statistika Radi jednostavnosti. 117 Javno iznošenje navedene pretpostavke našu malu visoku školu ozbiljno izlaže žestokim prosvjedima numerologa. skup vrijednosti promatrane pojave ćemo kronološki urediti radi pojednostavljivanja daljnje statističke analize. kronološki ure enih vrijednosti neke pojave. točno jednom mjesečno svakoga mjeseca. 118 Štoviše. godini (4 934) ne smatramo na bilo koji način povezanim s brojem 2002. 2006}. skupove tipa {2002. 116 © mr. Bojan Kovačić. broj sklopljenih brakova u 2004. Te vrijednosti poredat ćemo sukladno kronološkoj skali modaliteta (vidjeti 1. Budući da smo istakli kako ćemo kretanje neke pojave promatrati kao funkciju vremena. potrebno je precizno definirati što će biti prirodno područje definicije (domena). slobodno govoreći. godini (22 700) ne smatramo na bilo koji način povezanim s brojem 2004 itd. 2003.

prirodno područje definicije (domena) svake funkcije vremena koju budemo razmatrali bit će konačan skup {0. Zaključno spomenimo da sve vremenske nizove možemo podijeliti u dvije skupine: 1. pa se njihova reprezentativnost može procjenjivati na isti način kao i za sve druge regresijske modele. odnosno vrijednost pojave u početnom razdoblju (jer je t = 0 vrijednost nezavisne varijable dodijeljena početnom vremenskom razdoblju) a Yn – 1 vrijednost pojave pridružena vrijednosti vremenske varijable t = n – 1. tj. odnosno vrijednost pojave u tekućem razdoblju (jer je t = n – 1 vrijednost vremenke varijable dodijeljena tekućem razdoblju). Me utim. Područje vrijednosti (kodomena) svake funkcije vremena bit će skup frekvencija. nakon definiranja prirodnoga područja definicije (domene) i područja vrijednosti (kodomene). analitički izraz u zatvorenoj formi) pomoću koje se za svaku pojedinu vrijednost nezavisne varijable računa pripadna vrijednost zavisne varijable. Tako je npr. Tablični i grafički prikaz naročito su pogodni načini zadavanja funkcije ukoliko je njezino prirodno područje definicije (domena) relativno ''mali'' konačan skup. broj vozila na autocesti Zagreb – Lipovac u razdoblju od 08:00 do 20:00 sati itd. 1. u matematici se funkcija može potpuno definirati na tri načina: već opisanom ''formulom''. analitički izraz kojim možemo definirati istu tu funkciju. zadamo ''formulu'' (preciznije. a u analizi vremenskih nizova imamo upravo takav slučaj. Ovakav dogovor svakako treba imati na umu prigodom provedbe statističke analize. broj noćenja u svratištu ''Zlatna kokoš'' u Škrabutniku u razdoblju od 2001. n – 1}. godine. a potom ćemo – potpuno analogno kao u regresijskoj analizi – nastojati pronaći najbolju ''formulu''. s Yk označavat ćemo frekvenciju pridruženu vrijednosti vremenske varijable Xt = k. predavač 203 . © mr.sc. Radi jednostavnosti. broj stanovnika mjesta Sveti Petar u Šumi u razdoblju od 1971. Iz toga se razloga statistički modeli korišteni u analizi vremenskih nizova mogu ubrojiti u regresijske modele. Prema tome. Bojan Kovačić. Naime. Y0 vrijednost pojave pridružena vrijednosti vremenske varijable t = 0. Stoga ćemo spomenutu funkciju vremena uvijek najprije definirati tablično. 2.) intervalni vremenski niz – to je niz frekvencija dobivenih mjerenjem u odre enomu vremenskom intervalu (npr. naše dosadašnje shvaćanje pojma funkcije pretpostavlja da. godine do 2007. trenutačni vremenski niz – to je niz frekvencija dobivenih mjerenjem ili promatranjem u odre enomu trenutku (npr. Taj će izraz praktički uvijek biti približno točan jer je korelacija vremena i promatrane pojave vrlo rijetko funkcijska. tablično i grafički. …. U prvi mah nam se možda čini da smo pogriješili kad smo rekli da ćemo kretanje pojave u vremenu opisati kao funkciju vremena.ELEKTROTEHNIČKI ODJEL Poslovna statistika ćemo vrijednost vremenske varijable t = n – 1.).

Imamo redom: Y0 – Y4 = 67 977 – 59 603 = 8 374. Te se vrijednosti dobiju tako da se od vrijednosti pojave u tekućemu razdoblju oduzmemo vrijednost pojave u neposredno prethodnomu razdoblju. 3. ∆Yt = Yt – Yt – 1. godine prosječan godišnji broj korisnika novčane naknade bio za 8 374 manji nego 2003. pridružimo vrijednosti vremenske varijable (t) prema formuli: t = x – 2003. Godinama (x) iz Primjera 3.ELEKTROTEHNIČKI ODJEL Poslovna statistika godine do 2001.. n – 1. Nadalje. 5.. U praksi se najčešće računaju vrijednosti niza uzastopnih apsolutnih promjena (oznaka: ∆Yt) neke pojave. 2004. godine – stanje na dan 30. godine (ili. Apsolutna promjena može biti pozitivna ili negativna: ako je njezin predznak +. tj.6. ekvivalentno. Y3 – Y1 = 66 407 – 70 467 = – 4 060. godini pridružimo t = 1 itd. Primjer 5. što znači da je 2006.). godine prosječan godišnji broj korisnika novčane naknade bio za 4 060 manji nego 2004. a ako je njezin predznak –. godine prosječan godišnji broj korisnika novčane naknade bio za 8 374 veći nego 2007.2. 2003. godine). godini pridružimo t = 0. govorimo o povećanju vrijednosti pojave. predavač 204 . da je 2004. u 12:00 sati itd. da je 2007. . godine (ili. Bojan Kovačić. ekvivalentno.svibnja 2008. što znači da je 2003. Drugim riječima. godine prosječan godišnji broj korisnika novčane naknade bio za 4 060 veći nego 2006. Primjer 4..).sc.. 2. Pokazatelji pojedinačnih apsolutnih promjena Bilo koja razlika vrijednosti dviju frekvencija promatrane pojave naziva se apsolutna promjena te pojave. za svaki t = 1. Izračunajmo vrijednosti uzastopnih apsolutnih promjena prosječnoga broja korisnika novčane pomoći (podaci iz Primjera 3. godine). Izračunajmo razlike Y0 – Y4 i Y3 – Y1 i objasnimo njihovo značenje. govorimo o smanjenju vrijednosti pojave. Dobivamo: © mr. broj vozila na autocesti Zagreb – Lipovac dana 15.

Odgovarajući se pokazatelji dobiju tako da se od frekvencije pojave u tekućemu razdoblju oduzme frekvencija pojave u baznomu razdoblju (b): ∆*Yt = Yt – Yb. Budući da je b = 1. tj. 2006. 2004. OPREZ! Pogrešno je kao vrijednost uzastopne apsolutne promjene za početno razdoblje (t = 0) navesti broj 0 (nula) jer broj 0. Istaknimo i da se apsolutne promjene mogu računati u odnosu na isto (bazno) vremensko razdoblje. 1. Vrijednost uzastopne apsolutne promjene za početno razdoblje (t = 0) uvijek je nepoznata. godini bio za 2 490 veći nego u 2003. 2007. godinu (∆*Yt) -2 490 0 2 335 -4 060 -10 864 © mr. da je prosječan broj korisnika novčane naknade u 2004. Bojan Kovačić. godini. Yb = Y1 = 70 467. a ne da taj pokazatelj ne možemo efektivno izračunati. godini itd. 2006. 2004. Iz dobivenoga stupca tablice vidimo npr. godinu za podatke iz Primjera 3. a potonji podatak nemamo naveden u tablici. n – 1. kao pokazatelj apsolutne promjene. t 0 1 2 3 4 prosječan godišnji broj korisnika novčane naknade 67 977 70 467 72 802 66 407 59 603 uzastopne apsolutne promjene (∆Yt) nepoznata 2 490 2 335 -6 395 -6 804 U presjeku drugoga retka i trećega stupca gornje tablice upisali smo riječ nepoznata jer se vrijednost uzastopne apsolutne promjene prosječnoga godišnjega broja korisnika novčane naknade za 2003. za svaki t = 0. godinu dobije tako da se od prosječnoga godišnjega broja korisnika novčane naknade u 2003. t 0 1 2 3 4 prosječan godišnji broj korisnika novčane naknade 67 977 70 467 72 802 66 407 59 603 pojedinačne apsolutne promjene u odnosu na 2004. predavač 205 . godini bio je za 6 395 manji nego u 2005. 2005. Ovo pravilo vrijedi pri svakom računanju apsolutnih promjena: Pravilo 1. prosječan broj korisnika novčane naknade u 2006. 2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika godina 2003. dobivamo: godina 2003. godini oduzme prosječan godišnji broj korisnika novčane naknade u 2002. …. godini. Izračunajmo pokazatelje apsolutnih promjena u odnosu na 2004. znači jednakost vrijednosti pojave u odgovarajućim razdobljima.sc. Primjer 6. 2005.

2.sc. tj. da je prosječan broj korisnika novčane pomoći u 2005. Modeli trenda Ukoliko postoji odre ena pravilnost u promjenama vrijednosti promatrane pojave u odre enom vremenskom razdoblju (tj. Grubo govoreći. ukoliko za svaki t = 1. godini. kažemo da vremenski niz ima trend. samo što se u slučaju modela eksponencijalnoga trenda vrijednost parametra A interpretira kao očekivana relativna prosječna promjena vrijednosti varijable Y u jedinici vremena. Ukoliko se promatrana pojava mijenja za približno jednake apsolutne iznose u svakoj jedinici vremena. a ukoliko vrijedi nejednakost ∆Yt ≥ ∆Yt + 1. a prosječan broj korisnika novčane pomoći u 2006. samo što se u slučaju modela linearnoga trenda vrijednost parametra A interpretira kao očekivana prosječna promjena vrijednosti varijable Y u jedinici vremena. Odgovarajuća jednadžba modela linearnoga trenda i pripadni parametri isti su kao i kod modela jednostavne linearne regresije. zapravo. Odgovarajuća jednadžba i pripadni parametri toga modela trenda isti su kao i kod modela jednostavne eksponencijalne regresije. nisu ništa drugo negoli ''obični'' regresijski modeli u kojima ''ulogu'' nezavisne varijable X preuzima vremenska varijabla t.3. n – 2 vrijedi nejednakost ∆Yt ≤ ∆Yt + 1. ali se za procjenu može koristiti i koeficijent determinacije. promatrana pojava ne mijenja linearno. …. Formule za izračun © mr. modeli trenda. godini bio za 2 335 veći. Reprezentativnost modela trenda obično se procjenjuje na temelju koeficijenta varijacije toga modela. Bojan Kovačić. Ukoliko se. ukoliko vremenski niz ima tendenciju rasta ili pada). njezino kretanje možemo opisati modelom eksponencijalnoga trenda. njezino kretanje možemo opisati modelom linearnoga trenda. Tendencija rasta ili pada se vrlo dobro može ''očitati'' izračunavanjem vrijednosti uzastopnih apsolutnih apsolutnih promjena: ako je dobiveni niz rastući. kažemo da vremenski niz ima tendenciju rasta.ELEKTROTEHNIČKI ODJEL Poslovna statistika Iz posljednjega stupca dobivene tablice možemo zaključiti npr. pak. U takvim se slučajevima kretanje promatrane pojave može opisati pomoću odgovarajućega modela trenda. godini za 4 060 manji nego u 2004. predavač 206 . kažemo da vremenski niz ima tendenciju pada. nego sve brže (ili sporije) ovisno o vrijednosti vremenske varijable. 5.

svibanj 2007. godine.98 1 63.12 4 72. U donjoj je tablici prikazano kretanje prosječne cijene nafte u SAD u razdoblju od 1. prosinac 2008. i 4.58 Izvor: Energy Information Administration – službena energetska statistika Vlade SAD a) Prikažimo kretanje prosječne cijene nafte u promatranom razdoblju linijskim grafikonom s ishodištem u početnoj godini razdoblja promatranja. Uz grafikon navedimo sve potrebne oznake. prosječna cijena nafte [USD/barel] 0 63. travnja 2007.69 9 92. siječanj 2008.36 5 79.46 12 112.2. srpanj 2007.2. d) Ukoliko se kretanje prosječne cijene nafte nastavi prema modelu odabranom u c) podzadatku. travanj 2008. Potom na temelju reprezentativnijega modela trenda prognozirajmo kretanje prosječne cijene nafte u svakom pojedinom mjesecu do kraja 2008. listopad 2007. mjesec i godina t travanj 2007. do 31. Ilustrirajmo primjenu modela trenda na sljedećem primjeru: Primjer 1.45 2 67. veljača 2008. treba izračunati oba navedena pokazatelja. odnosno eksponencijalnoga trenda koji najbolje opisuje kretanje promatrane pojave.sc.4. odredimo u kojem mjesecu možemo očekivati da cijena nafte prvi put dosegne 200 USD/barel. Kad god je to moguće. ožujak 2008. travnja 2008. Objasnimo značenje parametara trenda i prikažimo dobivene modele grafički. godine.80 7 94. kolovoz 2007. © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika navedenih pokazatelja jednake su odgovarajućim formulama iz podtočaka 4. predavač 207 . c) Na temelju koeficijenata determinacije procijenimo koji od navedenih modela trenda bolje opisuje kretanje prosječne cijene nafte. studeni 2007.49 3 74.3.3.91 6 85. lipanj 2007.39 11 105. b) Odredimo jednadžbu modela linearnoga.97 10 95.77 8 91.3. Bojan Kovačić. rujan 2007.

Bojan Kovačić. predavač 208 . odnosno eksponencijalnoga trenda zajedno s pripadajućim krivuljama trenda i koeficijentima determinacije navedene su na sljedećoj slici: Zasebno ćemo analizirati svaki model trenda: – model linearnoga trenda: njegovi parametri su: © mr.ELEKTROTEHNIČKI ODJEL Poslovna statistika Kretanje prosječne cijene nafte na američkom tržištu u promatranom razdoblju grafički je prikazano sljedećim linijskim grafikonom: Jednadžbe modela linearnoga.sc.

14 USD 154.61% periodičnih promjena prosječne cijene nafte može objasniti modelom linearnoga trenda.865%.33 USD 132.30 USD 136.81 USD 140.0475 = 1.) (u MS Excelu) korištenjem funkcije TREND za prognozu pomoću modela linearnoga trenda. t 13 14 15 16 17 18 19 20 prognoza pomoću modela linearnoga trenda 112. x = 14.614 ⇔ procijenjena prosječna cijena nafte u travnju 2007. srpanj 2008. Bojan Kovačić. studeni 2008.) uvrštavanjem x = 13.38 USD 124.09% periodičnih promjena prosječne cijene nafte može objasniti modelom eksponencijalnoga trenda. prosinac 2008.77 USD – model eksponencijalnoga trenda: njegovi parametri su: A = e0. što znači da se 95. x = 19 i x = 20 u svaku od dobivenih jednadžbi.25 USD prognoza pomoću modela eksponencijalnoga trenda 116. U oba slučaja dobivamo: mjesec i godina svibanj 2008. odnosno GROWTH za prognozu pomoću modela eksponencijalnoga trenda. kolovoz 2008. ….9561.69 USD 127. godine iznosi približno 62.43 USD 116.61 USD Koeficijent determinacije modela linearnoga trenda iznosi 0.sc.29 USD 161. predavač 209 . rujan 2008.36 USD 128.32 USD 147. listopad 2008. S druge strane. trebamo riješiti jednadžbu © mr. što znači da se 96.865 ⇔ očekivani prosječan mjesečni rast prosječne cijene nafte iznosi 4.767 ⇔ procijenjena prosječna cijena nafte u travnju 2007.41 USD 120. Prema kriteriju koeficijenata determinacije. godine možemo prognozirati na dva načina: 1.79 USD Da bismo procijenili kada će prosječna cijena nafte prvi puta dosegnuti 200 USD po barelu. godine iznosi približno 60. Prosječnu cijenu nafte u svakom pojedinom mjesecu preostalom do kraja 2008.28 USD 140.05 USD 121.ELEKTROTEHNIČKI ODJEL Poslovna statistika A = 3.9743 ⇔ očekivano mjesečno prosječno povećanje prosječne cijene nafte iznosi približno 4 USD po barelu.61 USD 133. B = 62.9609.048646 ⇒ 100 ⋅ (A – 1) ≈ 4. B = 60. koeficijent determinacije modela eksponencijalnoga trenda iznosi 0. lipanj 2008. 2. model eksponencijalnoga trenda je reprezentativniji.

2. ln1. izračunavaju i interpretiraju relativni pokazatelji promjena tih pojava.ELEKTROTEHNIČKI ODJEL Poslovna statistika 62.sc. 2. Ona iskazuje relativnu promjenu vrijednosti pojave u dvaju uzastopnim razdobljima. Zbog toga se u takvim slučajevima.048646 Vrijednost vremenske varijable t = 24 odgovara travnju 2009. Koeficijent dinamike jednak je omjeru apsolutne promjene frekvencija dvaju uzastopnih razdoblja i frekvencije pojave u kronološki prvom od tih dvaju razdoblja: Kt = ∆Yt Y = t − 1 za svaki t = 1. Prema tome. 120 © mr. ukoliko se kretanje prosječne cijene nafte nastavi prema modelu eksponencijalnoga trenda. predavač 210 . umjesto apsolutnih promjena. značajno razlikuju po svojoj veličini.  Yt −1  Svima kojima rješavanje eksponencijalno-logaritamskih jednadžbi predstavlja težak i zahtjevan matematički problem preporučuje se da navedenu jednadžbu riješe korištenjem procedure Traženje rješenja (Goal Seek). ….4. Bojan Kovačić. Jedna od najčešćih mjera relativnih promjena je koeficijent dinamike (oznaka: Kt). n – 1. za svaki t = 1. Osnovni brojčani pokazatelji relativnih promjena U praksi se često pojavljuje problem analiziranja i usporedbe dinamike kretanja najmanje dviju različitih pojava. pak.614 ≈ 24. a dobije se množenjem koeficijenta dinamike sa 100:  Y  St = Kt ⋅ 100 = 100 ⋅  t − 1 . Yt −1 Yt −1 Usko vezana uz koeficijent dinamike je pojedinačna stopa promjene (oznaka: St) neke pojave.614 ⋅ 1. godine dosegnuti 200 USD/barel. 5.048646t = 200 Njezino je rješenje120: t= ln 200 − ln 62. …. Vrijednosti tih pojava obično su iskazane u različitim mjernim jedinicama ili se. godine. n – 1. može se očekivati da će prosječna cijena nafte u travnju 2009.

broj osnovanih registriranih pravnih osoba 3 724 3 567 3 240 3 500 3 783 izvor: Broj i struktura poslovnih subjekata u Republici Hrvatskoj. Zagreb. Stoga se uz numeričku vrijednost pojedinačne stope promjene uvijek piše znak %. ali fiksiranom razdoblju. Osim za dva uzastopna razdoblja. pa objasnimo značenje dobivenih rezultata za 3.sc. 11. kvartal 2007. Državni zavod za statistiku. 2. razdoblje 1.2008. pojedinačna stopa promjene može se računati i prigodom uspore ivanja vrijednosti neke pojave tijekom svakoga od n razdoblja s vrijednošću te pojave u proizvoljno odabranom. godine. 1. kvartal 2007. godine i 1. Izračunajmo koeficijente dinamike promjene broja osnovanih registriranih pravnih osoba u uzastopnim vremenskim razdobljima. Potom usporedimo brojeve osnovanih registriranih pravnih osoba u svakom pojedinom kvartalu s brojem osnovanih registriranih pravnih osoba u posljednjem kvartalu 2007. U takvim slučajevima pojedinačnu stopu promjene vrijednosti pojave u tekućemu razdoblju u odnosu na vrijednost te pojave u (proizvoljnom. kvartal 2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika Pojedinačna stopa promjene zapravo predstavlja postotak promjene frekvencije neke pojave u tekućemu razdoblju u odnosu na prethodno razdoblje. 2. 9. 1. godine. te odgovarajuće pojedinačne stope promjene. kvartal 2007. za svaki t = 0. kvartal 2008. godine i objasnimo značenje pokazatelja koji odgovara 1. priopćenje br.1. 3. 4. U sljedećoj su tablici prikazani podaci o kretanju broja osnovanih registriranih pravnih osoba u Republici Hrvatskoj u proteklih godinu dana.5. …. kvartal 2007. Yb  Yb  Primjer 1. kvartalu 2007.1/1. kvartal 2008. Najprije izračunavamo koeficijente dinamike i njima odgovarajuće stope promjene: © mr. ali fiksiranom) baznom razdoblju dobivamo iz izraza: St∗ = Y  ∆*Yt ⋅100 =  t − 1 ⋅100 . predavač 211 . n – 1. Bojan Kovačić.

kvartalu 2008. kvartalu 2007. godine bio za približno 8. te da je broj osnovanih registriranih pravnih osoba u 1. 3.sc. godine. tj. t 0 1 2 3 4 broj osnovanih registriranih Kt St pravnih osoba 3 724 nepoznat nepoznata 3 567 -0.17% manji nego u 2. Bojan Kovačić.080247 8. kvartal 2007.5.16737 % 3 500 0. 2. indeksi. kvartal 2008. t 0 1 2 3 4 broj osnovanih registriranih St* pravnih osoba 3 724 6. kvartal 2007. predavač 212 .04216 -4.09% veći nego u 4. kvartal 2007. kvartal 2007.ELEKTROTEHNIČKI ODJEL Poslovna statistika razdoblje 1. u različitim gradovima. kvartala 2006.080857 8.4% 3 567 1. godine jednak je 6. kvartalu iste godine. iz 4. 4. godine kao bazno razdoblje: razdoblje 1. Sada izračunavamo pojedinačne stope promjene uzimajući 4.4%. kvartalu neposredno prethodnoga razdoblja. Individualni indeksi Jedna od najčešće rabljenih relativnih promjena vrijednosti neke pojave su tzv. kvartal 2007.2159 % 3 240 -0. što znači da je broj osnovanih registriranih pravnih osoba u 1. kvartalu 2007. odnosno 4. stupca upisali smo riječi nepoznat i nepoznata jer nam za izračunavanje vrijednosti odgovarajućega pokazatelja nedostaju podaci iz 1. 1. kvartalu 2007.4% veći nego u posljednjem kvartalu 2007. 5.. 4. kvartal 2007. retka i 3. 1. skupinama država itd.91429% 3 240 -7. Iz dobivene tablice vidimo da je broj osnovanih registriranih pravnih osoba u 3. kvartal 2007. Pomoću njih uspore ujemo odnos stanja jedne ili više pojava u različitim vremenskim razdobljima (''vremenskim točkama'') ili u istim vremenskim razdobljima.085714 % U presjecima 2. državama. godine.42857% 3 500 0% 3 783 8.) © mr. godine bio za približno 9. ali na različitim mjestima (tj. godine. kvartal 2008.09167 -9.024691 % 3 783 0. godine bio za 6. kvartalu 2007. regijama. 3. kvartal 2007. kvartal 2007.08571% Pokazatelj koji odgovara 1. 2.

dakle. n – 1. pokazatelj relativne promjene stanja neke pojave u tekućemu razdoblju u odnosu na tekućem razdoblju neposredno prethodno razdoblje.5. …. niti jedna niti druga posljedica nisu istinite. Očito. za svaki t = 1.1. te se uobičajeno dijele na verižne (lančane) indekse i indekse na stalnoj bazi (bazne indekse). pa se u takvim slučajevima obično stavlja riječ nepoznat. onda ukupno n – 1 verižnih indeksa računamo pomoću relacije: Vt = Yt ⋅ 100. 2. ekvivalentno. predavač 213 . verižni indeks nije definiran za početno razdoblje (t = 0). skupni indeksi prate razvoj barem dvije različite pojave u vremenu ili prostoru. na temelju koeficijenata dinamike: Vt = (Kt + 1) ⋅ 100. On je. U nastavku se ukratko opisuje svaka pojedina vrsta indeksa. ….121 121 Ova činjenica znači da je pogrešno kao verižni indeks za početno razdoblje definirati broj 0.sc. U ovom bi slučaju vrijednost 0 povlačila da znamo vrijednost promatrane pojave u razdoblju koje neposredno prethodi početnom razdoblju i da je ta vrijednost jednaka nuli. Ako je Vt = A. n – 1. Verižni (lančani) indeksi Verižni (lančani) indeks (oznaka: Vt) predstavlja pokazatelj relativne promjene stanja neke pojave u dvama uzastopnim vremenskim razdobljima. © mr. Svaki verižni indeks zapravo predstavlja postotni udio vrijednosti promatrane pojave u tekućemu razdoblju u odnosu na vrijednost te pojave u neposredno prethodnomu razdoblju. Za razliku od jednostavnih. kao i koeficijent dinamike. 2. 5. Ukoliko kretanje pojave promatramo tijekom n razdoblja.ELEKTROTEHNIČKI ODJEL Poslovna statistika Opća podjela razlikuje dvije vrste indeksa: individualne i skupne. za svaki t = 1. Yt −1 ili. Bojan Kovačić. Istaknimo da. Individualni indeksi prate razvoj točno jedne pojave u vremenu ili prostoru. onda opća interpretacija toga indeksa glasi: Na svakih 100 jedinica mjere promatrane pojave u razdoblju (t – 1) dolazi A jedinica mjere te pojave u razdoblju t.

za b < t. Pomoću svih n – 1 verižnih indeksa kojima mjerimo dinamiku promjene vrijednosti neke pojave u n razdoblja. te zadane vrijednosti te pojave u bilo kojem od tih n razdoblja (označimo ga s b) možemo izračunati vrijednosti pojave u svakom od preostalih n – 1 razdoblja na temelju sljedećih relacija: Yt −1 = Yt = © mr. mj