STATISTIKA ZA PRAVNIKE

Slides:



Advertisements
Similar presentations
Primijenjena matematika Damir Krstinic
Advertisements

1 Lekcija 6 - Nizovi Pregled 6.1Uvod 6.2Nizovi 6.3Deklaracija niza 6.4Primjeri upotrebe nizova 6.5Nizovi kao argumenti funkcije 6.6Sortiranje niza 6.7Primjer:
Rješenje za izradu obiteljskog stabla
FrontPage program za izradu web stranica
STATISTIKA 2. CIKLUS (STRUČNI STUDIJ) Korelacijska analiza
Stabilnost, promjena i koherentnost ličnosti
Damir Zec Pomorski fakultet u Rijeci
Petlje WHILE – WEND.
u organskoj poljoprivredi
4.1 Vizualni (grafički) HTML uređivači
Osnove (i još malo više) statistike
MICROSOFT WORD 2010.
Algoritamske/programske strukture
Nadgradnja klasa i nasljeđivanje – 3
Opis podataka Doc. dr. sc. Ana Jerončić
Programiranje - Blokovi naredbi i logički tipovi –
OSNOVE PROGRAMIRANJA U PROGRAMSKOM JEZIKU
Pojam DBMS. Relacione baze podataka
STATISTIČKI TESTOVI (TESTOVI ZNAČAJNOSTI)
CheckBox RadioButton RadioGroup
Naredbe ciklusa.
Opis podataka Doc. dr. sc. Ana Jerončić
Petlje FOR - NEXT.
Analiza brojčanih podataka, korelacija i regresija
KREIRANJE OBJEKATA.
RAZGRANATA STRUKTURA Zadaci i rešenja
Reference ćelije i opsega
Elementi programskog jezika PASCAL
Arrays and strings -1 (nizovi i znakovni nizovi)
Mere položaja z vrednost (ili statndardna vrednost)
Struktura MAC adrese i Ethernet okvira
STATISTIKA Metoda uzoraka.
Naredba Case Višestruko grananje.
M-datoteke.
MessageBox.
KORELACIJSKA I REGRESIJSKA ANALIZA
Analitička statistika Testiranje hipoteze
OSNOVE STATISTIČKE OBRADE PODATAKA
DISKRETNI DINAMIČKI SUSTAVI –LOGISTIČKI MODEL -KAOS-
Prikupljanje podataka Planiranje istraživanja
Internet FTP usluga.
Kvantitativne metode istraživanja dr. sc. Dario Pavić
1.6. Pohrana podataka.
PROGRAMSKI JEZIK PASCAL
Osnovni simboli jezika Pascal
JEDNOSTAVNA LINEARNA REGRESIJA UTJECAJA VARIJABLI NA GODINE ŽIVOTA
Do While ... Loop struktura
PROJEKTIRANJE PROIZVODNIH SUSTAVA
Analiza varijance prof. dr. sc. Nikola Šakić.
Klasifikacija i stablo odlučivanja uz r
Sustavi za pracenje i vođenje procesa STATEFUL INSPECTION FIREWALL
Strukture podataka i algoritmi 5. VRIJEME IZVRŠAVANJA ALGORITMA
Nizovi.
DINAMIČKI MODEL LJUBAVI
Skup instrukcija procesora
Analiza varijance prof. dr. sc. Nikola Šakić.
- metodom zamjene susjednih elemenata niza
Tanja Buzina Nacionalna i sveučilišna knjižnica, Zagreb
Naredbe u php-u.
Programski jezik C++ - Vježbe - 5. dio
Programiranje - Naredbe za kontrolu toka programa – 1. dio
Programski jezik C++ - Vježbe - 1. dio
STATISTIKA (STRUČNI STUDIJ) Korelacijska analiza Regresijska analiza.
Analiza varijance prof. dr. sc. Nikola Šakić.
Programiranje - Naredbe za kontrolu toka programa – 1. dio
Utvrđivanje kvalitete oblikovanih pričuva šteta – run off analiza
INTERPOLACIJA PO DIJELOVIMA POLINOMIMA
Vježbenica 2: struktura grananja – 2.dio
Programski jezik C++ - Vježbe - 2. dio
Iracionalni brojevi
Presentation transcript:

STATISTIKA ZA PRAVNIKE Prof.dr.sc. Nihada Mujić Mr.sc. Jelena Legčević Mr.sc. Martina Mikrut Sveučilište Josipa Jurja Strossmayera Pravni fakultet u Osijeku Godina 2009

STATISTIKA ZA PRAVNIKE Autori: Prof.dr.sc. Nihada Mujić Mr.sc. Jelena Legčević Mr.sc. Martina Mikrut Recenzenti: Prof.dr.sc. Ivana Barković Prof.dr.sc. Jasna Horvat Lektorica: Nataša Balaban, prof. ISBN 978-953-6072-47-7

Sadržaj Pojam i predmet proučavanja statistike Izvori podataka i metode prikupljanja podataka Faze rada statističke metode Statističko tabeliranje Grafičko prikazivanje nominalnih i redoslijednih nizova Relativni brojevi kvalitativnih nizova Numerički nizovi Grafičko prikazivanje numeričkih nizova Srednje vrijednosti Aritmetička sredina Medijan Mod Mjere disperzije Standardizirano obilježje Analiza vremenskih nizova Indeksna metoda Individualni indeksi stalne baze Verižni indeksi Preračunavanje individualnih indeksa Srednje vrijednosti vremenskih nizova Skupni indeksi Linearni trend Regresija i korelacija Metoda uzoraka

Pojam i predmet proučavanja statistike

“Statistički način mišljenja jednog će dana za svakodnevni život građana postati jednako neophodan kao znanje čitanja i pisanja.” H.G.Wells (1866. – 1946.)

Definicija statistike Preko 100 definicija pojma “statistika” “Nijedna definicija ne znači mnogo tako dugo dok nismo proučili ono na čemu radimo – a tada je svaka definicija gotovo nepotrebna”; Mainland Statistika je znanstvena disciplina koja se bavi prikupljanjem, analizom i tumačenjem podataka masovnih pojava U svakodnevnom govoru, riječ statistika koristi se i za već prikupljenje i uređene podatke, brojčane pokazatelje, koji su objavljeni u obliku tablica, grafikona i sl.

Statistika u svakodnevnom životu Pojam statistike ne odnosi se isključivo na statističke podatke, već uz način proučavanja pojava koje nas okružuju, a u svakodnevnom životu susrećemo se s njom kroz: Prosjek ocjena Stopu inflacije Postotak porasta nezaposlenih Prosječnu starost stanovnika RH ...

Podjela statistike Deskriptivna statistika Inferencijalna statistika Temelji se na potpunom obuhvatu statističkog skupa, koristi brojčane (numeričke) i grafičke metode kako bi opisala populaciju (N) mjere centralne tendencije, mjere disperzije, mjere asimetrije, mjere zaobljenosti... Inferencijalna statistika Temelji se na dijelu (uzorku (n)) jedinica izabranih iz statističkog skupa, radi donošenja zaključaka o parametrima populacije procjene parametara, testiranje hipoteza, neparametrijski testovi (hi-kvadrat test)...

Predmet proučavanja statistike Varijacije (različitost, promjenjivost) i kovarijacije (sličnost, povezanost, međuovisnost) podataka koji prikazuju različite pojave u prirodi i društvu ili su rezultat mjerenja Zakonitosti koje se javljaju u masovnim pojavama Masovne pojave su skupine istovrsnih, ali ujedno i varijabilnih elemenata koje imaju jedno ili više zajedničkih svojstava i nazivamo ih statističkom masom ili statističkim skupom

Definiranje statističkog skupa Statistički skup potrebno je definirati: ŠTO: Pojmovno GDJE: Prostorno KADA: Vremenski u jednom trenutku u intervalu Opseg statističkog skupa je broj njegovih elemenata Skup može biti konačan (jer ima konačan opseg) i beskonačan (jer ima beskonačno mnogo članova)

Elementi statističkog skupa Sastav statističkog skupa ovisi o pojedinačnom slučaju – ovisi o pojavama koje se istražuju STATISTIČKA JEDINICA STATISTIČKA MASA 1.) osoba 2.) stvar 3.) ustanove i poduzeća 4.) usluge 5.) događaji 6.) djelovanje 1.) stanovništvo, studenti 2.) knjige,vozila 3.) bolnice, sudovi, škole 4.) u zdravstvu, 5.) rođenje, nezgode 6.) krivična djela, djela socijalne zaštite

Statističko obilježje Svojstvo po kojemu jedinice statističkog skupa međusobno nalikuju i međusobno se razlikuju (npr. spol, dob, visina, ocjene...) Statističko obilježje naziva se i varijabla Pojavljuje se u različitim oblicima ili stupnjevima Obilježja mogu biti: KVALITATIVNA (izražavaju se opisno) KVANTITATIVNA (izražavaju se brojčano)

Statističko obilježje Kvalitativna obilježja mogu biti: Nominalna Atributivna (spol, zanimanje) Geografska (mjesto rođenja, mjesto studiranja) Redoslijedna (ocjena, školska sprema, stupanj zadovoljstva studiranjem) Kvantitativna (numerička) obilježja mogu biti: Prekidna ili diskontinuirana (broj studenata na godini, broj počinjenih kaznenih djela) Neprekidna ili kontinuirana (visina, težina, duljina, cijena)

Podaci prema izvoru Podaci su osnova svake statističke analize Pribavljanje podataka ovisi o cilju i predmetu istraživanja, prirodi pojava, raspoloživim resursima... Prema izvoru, podatke dijelimo na: Sekundarni podaci: podaci prikupljeni u skladu s nekim ciljem i na određen način, opseg i vrsta ne izviru neposredno iz potreba danog istraživanja Primarni podaci: podaci koji se prikupljaju u skladu s ciljem istraživanja, za sve članove skupa ili dio njih

Zavodi za istraživanje tržišta Sekundarni podaci Sekundarni podaci su u pravilu lako dostupni, a njihovo pribavljanje nije povezano uz velike troškove, no ponekad su nedovoljni Mogu biti interni i eksterni: EKSTERNI PODACI INTERNI PODACI Računovodstvo Referada Knjižnica ... Statistički uredi Zavodi za istraživanje tržišta Državne institucije ...

Primarni podaci Metode prikupljanja podataka dijele se na: Osobno– F2F (uz pomoć papirnatog upitnika PAPI ili računala CAPI) Telefonsko (uz pomoć računala CATI) Poštansko (klasična pošta ili fax) Internet (web, mail, chat, …) Opažanja (mjerenje) Ili ovisno o tome gdje se anketira npr. Upitnicima u kućanstvu Anketiranje na centralnoj lokaciji... Za sve metode i mjesta postoje prednosti i nedostatci, potreban je odabir metode s najpovoljnijim odnosom uloženog i dobivenog

Faze rada statističke metode Statističko promatranje Grupiranje ili klasifikacija Statistička analiza Tumačenje rezultata

Statističko promatranje S obzirom na vrijeme: Periodično Jednokratno Tekuće S obzirom na obuhvat: Sveobuhvatno (iscrpno) Reprezentativno (uzorak)

Grupiranje ili klasifikacija Uređivanje izvornih podataka na temelju utvrđenog pravila Veliki broj podataka uređuje se grupiranjem prema određenom pravilu razvrstavanja podataka Broj podataka u jednoj grupi naziva se frekvencijom grupe, koja može biti apsolutna ili relativna Zbroj svih frekvencija čini opseg skupa

Grupiranje ili klasifikacija Formiranje grupa: Iscrpno Isključivo Raspoređivanje podataka u grupe ili razrede koji mogu biti: Jednaki ili nejednaki Zatvoreni ili otvoreni

Statistička analiza Uređivanjem izvornih podataka na temelju utvrđenog pravila kreira se statistički niz Statistički niz = suma frekvencija svih grupa statističkog skupa,čine ga grupe poredane po određenom principu...

Vrste statističkih nizova (skupova): Vrste statičkih nizova s obzirom na grupiranje: NEGRUPIRANI Xi: X1, X2, X3,..., XN GRUPIRANI statističke tablice Negrupirani statistički niz - podaci su zapisani slijedom kojim su i prikupljani Xi: X1, X2, X3,...., XN studenti prema ocjeni iz statistike: 5, 5, 5, 5, ..., 5

Spol xi Broj studenata fi M 40 Ž 60 Ukupno 100 Grupirani statistički niz podaci se prikazuju u tablicama distribucije frekvencija STATISTIČKE SKUPINE - modaliteti obilježja (redovi) FREKVENCIJE - broj jedinica modaliteta obilježja (stupci) Spol xi Broj studenata fi M 40 Ž 60 Ukupno 100

Statistički nizovi Vrste statičkih nizova s obzirom na obilježje: NOMINALNI NIZ - prema veličini frekvencija, abecedno,nomenklaturno REDOSLIJEDNI NIZ – prema intenzitetu NUMERIČKI NIZ – prema vrijednosti num. obilježja VREMENSKI NIZ – kronološki

Tumačenje rezultata Statistički ispravno U skladu s pravilima struke Nužno izbjeći manipulaciju rezultatima

Statističko tabeliranje Postupak svrstavanja podataka u tablice prema određenom pravilu Cilj tabeliranja je olakšati praćenje i analizu podataka Tablice mogu biti izvještajne (veliki broj redova i stupaca, kao tablice DZS-a) i analitičke (u pravilu manjih dimenzija)

ZBIRNI RED (sume stupaca) Elementi statističke tablice Naslov tablice: Ukupno Z A G L A V LJ E P R E T S U A C Brojčani dio tablice: prosjek … ne raspolaže se nema podatka ( ) nepotpun podatak * ispravljen podatak Z B I R N S T U P A C ZBIRNI RED (sume stupaca) Izvor:

Vrste statističkih tablica Vrste statističkih tablica su Jednostavne tablice: samo jedna pojava, jedan statistički niz kada je grupiranje provedeno prema jednom obilježju Skupne ili složene tablice: dva ili više statističkih nizova grupiranih prema jednom obilježju Kombinirane tablice: jedan statistički niz promatran prema dva ili više obilježja. Sadrži i zbirni red i zbirni stupac

Grafičko prikazivanje nominalnih i redoslijednih nizova

Grafičko prikazivanje Grafički prikazani statistički podaci razumljiviji su i pregledniji u odnosu na njihovo predstavljanje tablicom Veća preglednost grafičkog prikaza i snaga prvog vizualnog utiska o karakteristikama promatrane pojave prednosti su grafičkih prikaza Danas se grafički prikazi konstruiraju pomoću računalnih programa koji u sebi sadrže predefinirana načela opisne statistike

Skupine grafičkih prikaza Grafički je moguće prikazati jedan ili više kvalitativnih nizova Skupine grafičkih prikaza: Površinski grafikoni Linijski grafikoni Kartogrami

Površinski grafikoni podaci se prikazuju površinama geometrijskih likova, površine likova su upravno razmjerne brojevima koji se tim površinama prikazuju Jednostavni stupci (P = a * b) Razdijeljeni (strukturni) stupci Dvostruki stupci Površina kvadrata (P = a²)

Površinski grafikoni Površina kruga (P = r²π) Površina polukruga Varzarov znak ( RBK ili RBS ) (baza= nazivnik odnosa , visina= rel. broj) Histogram

Linijski grafikoni Koriste se za prikazivanje nizova a) NUMERIČKIH (kontinuirani i diskontinuirani) b) VREMENSKIH (trenutačni i intervalni) Apscisa - A.M. za obilježje Ordinata - A.M. za frekvenciju

Kartogrami Grupiranje jedinica prema geografskom obilježju gdje sve grupe zajedno predstavljaju cjelovito geografsko područje VRSTE: Dijagramske karte Piktogrami Statističke karte

Grafičko prikazivanje redoslijednih nizova Grupiranje se vrši na isti način kao i grupiranje prema nominalnom obilježju s tim da je redoslijed modaliteta ili grupa uvijek određen rangom intenziteta obilježja koji pojedina grupa predstavlja, i to polazeći od najnižeg prema najvišem ili obratno

Relativni brojevi RELATIVNI BROJ je logičan izraz mjerenja kada se neka veličina mjeri drugom veličinom (nazivnik=baza usporedbe) Ova posljednja veličina postaje time mjera za veličinu koja se uspoređuje (mjeri) Zadatak relativnih brojeva je: Brojčano izraziti odnose među pojavama Omogućiti i olakšati usporedbu

Vrste relativnih brojeva Relativni brojevi strukture (D/C) proporcije, postoci, promili (p, %, ‰) Relativni brojevi dinamike (indeksi) bazni, verižni individualni, skupni 3. Relativni brojevi koordinacije (RBK)

Relativni brojevi strukture Ako se stavi u odnos broj elemenata dijela skupa prema broju elemenata u skupu, dobiva se relativan broj koji se zove PROPORCIJA tog dijela u skupu Proporciju označavamo s p Budući da je dio uvijek manji od cjeline, onda je: 0 < p < 1 Relativna frekvencija modaliteta ai je omjer apsolutne frekvencije fi tog modaliteta i zbroja apsolutnih frekvencija N:

Svojstva Relativne frekvencije su upravno proporcionalne apsolutnim frekvencijama Relativne frekvencije se radi lakšeg tumačenja množe sa sto (%) ili sa tisuću (‰) 0 < fi < N ... fi=N 0 < pi <N ... pi=1 0 < Pi <N ... Pi=100 Ekstremni slučajevi: Dio pojave koji se uspoređuje = 0, tada je i p=0 Dio pojave koji se uspoređuje = C (cjelina), tada je p=1

Kutno sto, vodoravno sto, okomito sto Analiziranje podataka u kombiniranoj tablici relativnim brojevima strukture: vodoravno 100, okomito 100, kutno 100 Primjer 1. Upisani studenti na stručni i sveučilišni studij prema spolu i načinu strudiranja u ak. g. 2008./2009 Upisani studenti Studenti Studentice Ukupno Redovni 36.681 44.721 81.402 Izvanredni 8.180 16.360 24.540 44.861 61.081 105.942 Izvor: Statistički ljetopis 2009., str.467

Kutno sto stavljanje u odnos svih brojeva u tablici prema ukupnoj statističkoj masi Upisani studenti Studenti Studentice Ukupno Redovni 36.681 44.721 81.402 Izvanredni 8.180 16.360 24.540 44.861 61.081 105.942 Upisani studenti Studenti Studentice Ukupno Redovni 34,62 42,21 76,84 Izvanredni 7,72 15,44 23,16 42,34 57,66 100,00 + +

Vodoravno sto stavljanje u odnos svih brojeva u tablici prema vrijednostima iz zbirnog stupca Upisani studenti Studenti Studentice Ukupno Redovni 36.681 44.721 81.402 Izvanredni 8.180 16.360 24.540 44.861 61.081 105.942 Upisani studenti Studenti Studentice Ukupno Redovni 45,06 54,94 100,00 Izvanredni 33,33 66,67 42,34 57,66 +

Okomito sto stavljanje u odnos svih brojeva u tablici prema vrijednostima iz zbirnog reda Upisani studenti Studenti Studentice Ukupno Redovni 36.681 44.721 81.402 Izvanredni 8.180 16.360 24.540 44.861 61.081 105.942 Upisani studenti Studenti Studentice Ukupno Redovni 81,77 73,22 76,84 Izvanredni 18,23 26,78 23,16 100,00 +

Relativni brojevi dinamike Nazivaju se INDEKSI Pokazuju odnos između stanja jedne te iste pojave ili skupine pojava na različitim mjestima ili u različitim vremenskim razdobljima Vrste indeksa: individualni (dinamika jedne pojave) skupni (odnosi stanja heterogene skupine pojava)

Relativni brojevi koordinacije Koristi se za uspoređivanje dvije pojave (P1 i P2), npr. broja studenata prema broju nastavnika, broj optuženih u odnosu na broj prijavljenih ... Izračunavaju se stavljanjem u odnos frekvencije pojave koja se uspoređuje, s frekvencijom pojave prema kojoj se provodi usporedba RBK se grafički prikazuje površinskim grafikonom Varzarovim znakom RBK= P2 P1 RBK 1 P1 P2 =

Numerički niz Numerički nizovi konstruiraju se uređenjem vrijednosti kvantitativnih varijabli Vrste: - NUMERIČKI KONTINUIRANI NIZOVI - NUMERIČKI DISKONTINUIRANI NIZOVI GRUPIRANJE – raščlanjivanje statističkog skupa prema modalitetima obilježja Grupiranje podataka: ISKLJUČIVO ISCRPNO

fi=N Numerički niz DISTRIBUCIJA FREKVENCIJA = skup: (xi,fi) gdje je k N - broj jedinica statističkog skupa i=1,2,...,k k – broj modaliteta obilježja xi – vrijednosti modaliteta obilježja f(i) APSOLUTNA FREKVENCIJA p(i) RELATIVNA FREKVENCIJA k i=1 fi=N

Broj jedinica modaliteta obilježja Numerički niz Pojedinačni par u distribuciji frekvencija predstavlja NUMERIČKU GRUPU, tj. broj jednakih vrijednosti modaliteta obilježja varijable x Obilježje (xi) Broj jedinica modaliteta obilježja (fi) X1 f1 X2 f2 ... Xk fk fi = N Distribucija frekvencije (x1, f1) (x2, f2) ... (Xk, fk) Modaliteti obilježja

Sturgesovo pravilo Xmax-Xmin ΔX = k = RV za određivanje broja razreda k za N podataka k  1 + 3,3 log N Uobičajeni broj k numeričkih grupa kreće se od 5 do 15 (maximalno 25) Ako su razredi jednaki, širina im se aproksimativno određuje diobom raspona varijacija i broja razreda: Xmax-Xmin ΔX = k = RV

Granice razreda 1.) NOMINALNE GRANICE (zadane) za izračunavanje parametara diskontinuiranog numerickog niza 2.) PRAVE GRANICE (“popravljene”) za izračunavanja parametara kontinuiranog numerickog niza crtanje kontinuiranog numerickog niza 3.) PRECIZNE GRANICE samo za crtanje diskontinuiranih numerickih nizova

Formiranje razreda kod kontinuiranog n.o. PRAVILO: Gornja granica prethodnog razreda jednaka je donjoj granici idućeg razreda Formiranje razreda kod diskontinuiranog n.o. PRAVILO: Donja granica idućeg razreda za 1 jedinicu je veća od gornje granice prethodnog razreda

Veličina razreda Oznaka za veličinu razreda je “i” i = L1i +1 – L1i i = 1,2,...k VELIČINA RAZREDA – od donje granice idućeg razreda oduzmemo donju granicu prethodnog razreda

Razredna sredina L1i+L2i xi= 2 za kontinuirane i diskontinuirane nizove RAZREDNA SREDINA – jednaka je poluzbroju donje (L1) i gornje (L2) prave granice i-tog razreda xi= L1i+L2i 2

Korigirane frekvencije Ako su veličine razreda međusobno različite, podijeliti originalne frekvencije pripadajućim veličinama razreda ili njima proporcionalnim vrijednostima Frekvencije se obavezno korigiraju: za crtanje poligona frekvencija za crtanje histograma pri izračunavanju moda

Korigirane frekvencije Fc = apsolutne korigirane frekvencije Pc = relativne korigirane frekvencije fc= fi i pc= pi i

Grafičko prikazivanje numeričkih nizova

Grafičko prikazivanje numeričkih nizova Numerički nizovi prikazuju se slijedećim vrstama grafikona: LINIJSKIM GRAFIKONOM poligon frekvencija specifičnim vrstama POVRŠINSKOG GRAFIKONA Histogram S-L dijagram

1. Linijski grafikon POLIGON FREKVENCIJA (MNOGOKUTNIK) - distribucija frekvencija (ili kretanje neke pojave) se prikazuje linijama - ako je prethodno nacrtan histogram: polovice vrhova stupaca (tj. sredine razreda Xi) spojiti linijama - ucrtana linija: oblik distribucije frekvencija - površina ispod linije: ukupan broj elemenata statističkog skupa ili opseg stat. skupa

os X – vrijednost numeričkog obilježja izraženog sredinom razreda (xi ) os Y – frekvencija: - apsolutna (fi), - relativna (pi), za razrede nejednakih veličina: - korigirati frekvencije! aps. korigirana (fc) rel. korigirana (pc)

2. Površinski grafikon grafikon kontura stupaca stupci se crtaju bez razmaka visina pravokutnika – frekvencija ( fi, fc, pi, pc ) baza pravokutnika – veličina razreda površina svih pravokutnika jednaka je zbroju apsolutnih frekvencija, tj. relativnih frekvencija (1 ili 100 ili 1000)

Grafičko prikazivanje kumulativnih nizova Kumulativni nizovi se UVIJEK tvore od originalnih vrijednosti KN “manje od” X : gornja granica promatranog razreda Y: frekvencija kumulativnog niza KN “više od” X: donja granica promatranog razreda

Srednje vrijednosti

Vrste srednjih vrijednosti Srednje vrijednosti ili mjere centralne tendencije Vrste srednjih vrijednosti: POTPUNE SREDNJE VRIJEDNOSTI POLOŽAJNE SREDNJE VRIJEDNOSTI SPECIFIČNE SREDNJE VRIJEDNOSTI

Potpune srednje vrijednosti Aritmetička sredina – ( A.S.) X aritmetička sredina relativnih brojeva strukture – P aritmetička sredina relativnih brojeva koordinacije – R Harmonijska sredina – H Geometrijska sredina – G Aritmetička sredina aritmetičkih sredina X

Položajne srednje vrijednosti medijan – Me (ordinalni niz) mod - Mo (nominalni niz, ordinalni niz) Specifične srednje vrijednosti momenti distribucije frekvencija

Osnovne značajke srednjih vrijednosti Utjecaj ekstremnih obilježja na srednje vrijednosti Utjecaj frekvencija u distribuciji frekvencija na srednje vrijednosti Utjecaj svih obilježja koja su različita od srednje vrijednosti na tu srednju vrijednost Odnos promatrane srednje vrijednosti i drugih obilježja

Zahtjevi srednjih vrijednosti Mogućnost utvrđivanja srednje vrijednosti objektivnim računskim pravilom na jedinstven način Srednja vrijednost mora biti sadržana između najmanje i najveće vrijednosti obilježja Ako su sve srednje vrijednosti obilježja jednake, i srednja vrijednost mora biti jednaka toj vrijednosti

Aritmetička sredina

Aritmetička sredina (MEAN), X, x prosjek N-ti dio totala vrijednosti N.O. osnovnog skupa (N – broj jedinica osnovnog skupa) X1,X2,Xi,...XN i=1,2,...,N vrijednosti N.O. uzorka (n – broj jedinica uzorka) x1,x2,xi,...xn i=1,2,...n

Aritmetička sredina osnovnog skupa X= suma vrijednosti num. obilježja osnovnog skupa broj jedinica osnovnog skupa = Total N Aritmetička sredina uzorka x= suma vrijednosti num. obilježja uzorka broj jedinica uzorka = total n

Jednostavna aritmetička sredina Jednostavna, neponderirana A.S. osnovnog skupa Koristi se za negrupirani niz podataka Ako obiježje X od N elemenata ima vrijednosti mjerene na svakom elementu: X: X1,X2,X3,...XN X= X1+X2+X3+...+Xk N =

Ponderirana, vagana aritmetička sredina A.S. vagana frekvencijama Koristi se za grupirani niz podataka Ako je zabilježeno k modaliteta obilježja, podaci predstavljaju distribuciju frekvencija sa: X= f1X1+ f2X2+ f3X3+ ... + fkXk f1 + f2 + f3 + ... + fk =

Ponderirana aritmetička sredina relativnih frekvencija Relativne i apsolutne frekvencije su upravno proporcionalne! X: X1,X2,Xi, ... , Xk i= 1,2, ..., k p: p1,p2, pi, ..., pk i=1,2, ..., k X= p1X1 + p2X2 + piXi+ ... +pkXk f1 + f2 + f3 + ... + fk =

Svojstva aritmetičke sredine 1. svojstvo Algebarski zbroj odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine jednak je nuli Σ(Xi – X) = 0 2. svojstvo Zbroj kvadrata odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine jednak je minimumu Σ(Xi – X)2 = min.

3. svojstvo Aritmetička sredina uvijek se nalazi između najmanje i najveće vrijednosti numeričkog obilježja varijable Xi Xmin  X  Xmax 4.svojstvo Ako je vrijednost numeričke varijable Xi jednaka konstanti c, aritmetička sredina te varijable jednaka je konstanti c. X = c X1 = X2 = ... = Xk = c 5. svojstvo Aritmetička sredina je sklona ekstremima

Medijan

Medijan Medijan (Me) je srednja pozicijska vrijednost numeričkog obilježja ili redoslijednog obilježja Medijan je srednja vrijednost redoslijednog ili numeričkog obilježja koja elemente osnovnog skupa (statističkog niza) dijeli na dva jednaka dijela, tako da se u jednom dijelu nalaze elementi koji imaju vrijednost obilježja manju ili jednaku Me ,a u drugom dijelu se nalaze elementi koji imaju vrijednost obilježja jednaku ili veću od Me

Izračunavanje medijana Određivanje medijana Određivanje medijana moguće je kod: Individualnog numeričkog obilježja Redoslijednog numeričkog obilježja Diskontinuiranog numeričkog obilježja i=1 Izračunavanje medijana Medijan se izračunava kod: Kontinuiranog numeričkog obilježja Diskontinuiranog numeričkog obilježja gdje su razredi različiti od 1 Grafičko određivanje medijana Medijan se može grafički odrediti uz pomoć: Kumulativnog niza “manje od” Kumulativnog niza “manje od” i kumulativnog niza “više od”

Određivanje medijana za individualne vrijednosti Ako je broj elemenata u skupu: NEPARAN N=(2k+1) onda je Me=k+1 PARAN N=2k onda je Me= polusuma dva srednja elementa POSTUPAK: vrijednosti obilježja poredati po veličini odrediti centralnu jedinicu

Izračunavane Me kod grupiranih vrijednosti Medijan se ne može odrediti nego se mora izračunati prilikom: Kontinuiranog numeričkog obilježja Diskontinuiranog numeričkog obilježja kada je i>1 jer nije poznata vrijednost NO za svaki element, odnosno statističku jedinicu POSTUPAK: KORAK 1: Formirati kumulativni niz KORAK 2: Naći N/2 KORAK 3: Odrediti medijalni razred

KORAK 4a: Uvrstiti podatke u formulu za korištenje kumulativnog niza “manje od” Me= l1 N/2 - fi + fmed *i l1 – donja granica medijalnog razreda fi – zbroj frekvencija odozgo prema dolje do medijalnog razreda i – veličina medijalnog razreda fmed – originalna frekvencija medijalnog razreda

KORAK 4b: Uvrstiti podatke u formulu za korištenje kumulativnog niza “više od” Me= l2 N/2 - fi - fmed *i l2 – gornja granica medijalnog razreda fi – zbroj frekvencija odozgo prema dolje do medijalnog razreda i – veličina medijalnog razreda fmed – originalna frekvencija medijalnog razreda

Grafičko određivanje medijana Aritmetičko mjerilo za frekvencije Aritmetičko mjerilo za obilježje

Uporaba medijana Kod redoslijednog obilježja medijan je prihvatljivija mjera od aritmetičke sredine Za vrlo asimetrične distribucije, te distribucije s ekstremno visokim i/ili niskim krajnjim vrijednostima Za distribucije s otvorenim razredima gdje procjena donje odnosno gornje granice bitno utječe na aritmetičku sredinu

Mod

MOD (Mo) Mod je vrijednost redoslijednog ili numeričkog obilježja koja se najčešće javlja u statističkom nizu Mod je vrijednost obilježja oko koje se elementi statističkog skupa najgušće gomilaju Mod dijeli distribuciju frekvencija na lijevu (rastuću-uzlaznu) i desnu (opadajuću-silaznu) stranu

Utvrđivanje moda Primjer: Mod se utvrđuje ako su jedinice numeričkog obilježja grupirane u razrede veličine 1, tada je modalna vrijednost, vrijednost razreda koji ima najveću frekvenciju Primjer: Ocjena na ispitu Br. studenata 1 12 2 18 3 31 4 11 5 9  81

Izračunavanje moda fi fc= i Mod se izračunava kada su elementi statističkog skupa (niza) grupirani prema: diskontinuirnom numeričkom obilježju s razredima i>1 kontinuiranom numeričkom obilježju Kod distribucija koje su grupirane u razrede nejednakih veličina, izračunavanju moda prethodi korigiranje frekvencija: fc= fi i

Na temelju određenog Mo razreda (b) te dva susjedna razreda: lijevog (a) i desnog (c), izračunava se vrijednost Mo l1 – donja granica modalnog razreda b – frekvencija modalnog razreda (najveća frekvencija) a – frekvencija razreda ispred Mo razreda c – frekvencija razreda iza Mo razreda i – veličina modalnog razreda

U distribuciji frekvencija može postojati: jedna Mo vrijednost - UNIMODALNA DISTRIBUCIJA dvije Mo vrijednosti - BIMODALNA DISTRIBUCIJA više Mo vrijednosti - MULTIMODALNA DISTRIBUCIJA Grafički se Mo može odrediti kada se na krivulji distribucije frekvencija (poligon frekvencija) pronađe najveća ordinata (ili tjeme) iz kojeg se spušta okomica na apscisu, gdje se potom pročita vrijednost Mo

Nedostaci i prednosti Mo ovisan je načinu formiranja razreda nema smisla ako se distribucija približava pravokutnoj sporan je kod bimodalne ili multimodalne distribucije PREDNOSTI kod distribucija s ekstremno malim ili velikim vrijednostima NO Me i x imaju težnju njihovom približavanju, pri čemu će primicanje Me biti značajno manje od primicanja x Mo neće imati tu tendenciju jer ga određuje najveća frekvencija

Mjere disperzije

Mjere disperzije Osim značajke distribucije frekvencija dane u srednjoj vrijednosti, nastaje potreba za drugom značajkom distribucije frekvencija koja će izražavati stupanj varijabilnosti vrijednosti obilježja Ta se značajka zove MJERA DISPERZIJE ili MJERA RASPRŠENOSTI

Mjere disperzije Osim značajke distribucije frekvencija dane u srednjoj vrijednosti, nastaje potreba za drugom značajkom distribucije frekvencija koja će izražavati stupanj varijabilnosti vrijednosti obilježja Ta se značajka zove MJERA DISPERZIJE ili MJERA RASPRŠENOSTI

Mjere disperzije mogu biti: apsolutne (istorodne distribucije) relativne (raznorodne distribucije) APSOLUTNE M.D. RELATIVNE M.D. Raspon varijacija Interkvartil Kvartilna devijacija Srednje apsolutno odstupanje Varijanca Standardna devijacija Koeficijent varijacije kvartilne devijacije

Apsolutne mjere disperzije prikladne za uspoređivanje disperzije samo istorodnih distribucija Raspon varijacija Interkvartil Kvartilna devijacija Srednje apsolutno odstupanje Varijanca Standardna devijacija

1. Raspon varijacije (R) ili raspon disperzije je gruba informacija o veličini disperzije između najveće i najmanje vrijednosti numeričkog obilježja R= Xmax- Xmin Raspon varijacije za distribucije frekvencija s razredima određuje se kao razlika gornje granice posljednjeg i donje granice prvog razreda, ili izračunavanjem razlike razrednih sredina posljednjeg i prvog razreda Nepouzdana mjera disperzije jer promatra razliku između ekstremnih vrijednosti, a ne uzima u obzir raspoređivanje ostalih podataka

2. Interkvartil (Iq) KVANTILI – vrijednosti NO koje niz uređen po veličini dijele na q jednakih dijelova KVARTILI – niz uređen po veličini dijele na 4 jednaka dijela Q1 – prvi ili donji kvartil Me – drugi kvartil ili medijan Q3 – treći ili gornji kvartil

Donji kvartil (Q1) – je vrijednost redosljednog ili numeričkog obilježja, koja sve elemente u distribuciji frekvencija dijeli na ¼ (25%) elemenata koji imaju vrijednost obilježja jednaku ili manju od vrijednosti donjeg kvartila i na ¾ (75%) elemenata koji imaju vrijednost obilježja jednaku ili veću od donjeg kvartila Gornji kvartil (Q3) – je vrijednost redosljednog ili numeričkog obilježja koja sve elemente u distribuciji frekvencija dijeli na ¾ (75%) elemenata koji imaju vrijednost obilježja jednaku ili manju od gornjeg kvartila i na ¼ (25%) elelmenata koji imaju vrijednost obilježja jednaku ili veću od gornjeg kvartila

IQ = Q3-Q1 Q1 Me Q3 N/4 N/2 3N/4 Iq predstavlja raspon između Q3 i Q1 25% 25% N/4 N/2 3N/4 50% elemenata Izražen je u jedinicama u kojima je izraženo i obilježje Što je interkvartil brojčano manji to će polovica svih elemenata statističkog skupa biti više nagomilana oko Me, a to znači da će disperzija biti manja i obratno

Q1 i Q3 za grupirane vrijednosti izračunavaju se prema formulama: Prvi kvartil Q1 Treći kvartil Q3 N – ukupan broj elemenata L1 – donja granica kvartilnog razreda fi – suma frekvencija KN “m.o.” do kvartilnog razreda fQ – originalna frekvencija kvartilnog razreda i – veličina kvartilnog razreda

4. Srednje apsolutno odstupanje 3. Kvartilna devijacija Rang polu-interkvartila 4. Srednje apsolutno odstupanje prosječna veličina odstupanja pojedinačnih rezultata (bez obzira na smjer odstupanja) Za negrupirane vrijednosti Za grupirane vrijednosti

5. Varijanca (ơ²) je aritmetička sredina kvadrata odstupanja vrijednosti numeričkog obilježja od x za... Za individualne vrijednosti: X: x1, x2, ...,xN Za grupirane vrijednosti: X: x1, x2, ...,xN f: f1, f2, ..., fN

6. Standardna devijacija (ơ) je drugi korijen iz varijance, standardno odstupanje od prosjeka

Relativne mjere disperzije prikladne i za uspoređivanje disperzije raznorodnih distribucija Koeficijent varijacije Koeficijent kvartilne devijacije

1. Koeficijent varijacije relativna mjera disperzije i služi za uspoređivanje varijabilnosti različitih pojava i svojstava Postotni omjer standardne devijacije i aritmetičke sredine

2. Koeficijent kvartilne devijacije Disperzija središnjih 50% jedinica Može biti u intervalu od 0 do 1

Standardizirano obilježje

Standardizirano obilježje Odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine u raznorodnim distribucijama frekvencija izračunavaju se s pomoću standardiziranog obilježja: Izračunata odstupanja vrijednosti num. obilježja od aritmetičke sredine su izražena u jedinicama standardnih devijacija, te je na taj način osigurana mogućnost usporedbe za raznorodne distribucije

Svojstva standardiziranog obilježja aritmetička sredina standardiziranog obilježja jednaka je nuli standardna devijacija standardiziranog obilježja je jednaka 1 Pravilo Čebiševa Standardizirana varijabla može poprimiti i pozitivne i negativne vrijednosti One će rijetko odstupati od aritmetičke sredine za više od +3 -3 -2 2 3 -  116

Pravilo Čebiševa Za zvonolike distribucije (posebice normalne distribucije): +1 približno 68% podataka, +2 približno 95% podataka (najmanje 75% svih podataka), +3 približno 99,7% podataka (najmanje 88,89% svih podataka). oko

Analiza vremenskih nizova

Vremenski nizovi su nizovi istovrsnih podataka prikupljenih u uzastopnim vremenskim razmacima ili trenucima namjena analize VN je promatrati vremenski razvoj pojava, tražiti zakonitosti pojava i predviđati dalji razvoj pojava ZADATAK DINAMIČKE ANALIZE: ispitati promjene pojava kao funkciju vremena y = f(t)

utvrđivanje homogenosti podataka tijekom promatranog razdoblja PROBLEM: utvrđivanje homogenosti podataka tijekom promatranog razdoblja KOMPONENTE: trend komponenta ciklička komponenta sezonska komponenta slučajna komponenta sistematske, determinističke komp. – kovarijacije pojave koje se daju izraziti nekom funkcijom vremena

Formiranje vremenskih nizova Vremenski niz je skup kronološki uređenih veličina koje su odraz razine intenziteta neke pojave u izabranim vremenskim točkama ili intervalima Dvije vrste vremenskih nizova: INTERVALNI i TRENUTAČNI

Intervalni vremenski niz Pojave s jednim smjerom kretanja Intervalno promatranje čijim grupiranjem nastaje INTERVALNI NIZOVI Intervali promatranja: godina, mjesec, tjedan, dan, sezona, školska (akademska) godina, kazališna ili športska sezona i sl. Vremenski intervalni nizovi imaju svojstvo kumulativnosti

Trenutačni vremenski niz Pojave s dva smjera kretanja Promatraju se u presjeku vremena ili određenom trenutku ("kritičnom trenutku"), a nizanjem rezultata takvih promatranja formirat će se TRENUTAČNI VREMENSKI NIZ Frekvencije trenutačnog vremenskog niza nemaju svojstvo kumulativnsti

Usporedivost frekvencija vremenskoga niza Pojmovna i prostorna definicija ne smiju se mijenjati Jednakost intervala vremena promatranja Ako su vremenska razdoblja različita, potrebno je korigirati frekvencije prije uspoređivanja Kod trenutačnih vremenskih nizova razmaci između vremenskih točaka promatranja nisu bitni za usporedbu frekvencija

Grafičko prikazivanje vremenskih nizova INTERVALNI Površinski grafikon Linijski grafikon TRENUTAČNI Linijski grafikon

Intervalni vremenski niz a) površinski (pomoću stupaca) izgledom i konstrukcijom nalikuje histogramu na X-osi se nanosi vremensko razdoblje svakog člana vremenskog niza na Y-osi se unosi član vremenskog niza za određeno razdoblje (uz napomenu da mjerilo na ordinati mora UVIJEK započinjati s 0) NAPOMENA: ako razdoblja nisu jednaka potrebno ih je svesti na zajedničko razdoblje, a na ordinatu nanositi korigirane vrijednosti članova vremenskog niza

b) linijski na X-osi se ucrtava sredina vremenskog razdoblja na Y-osi se unosi određena vrijednost pripadajućeg člana vremenskog niza, odnosno korigirana vrijednost ako se radi o različitim razdobljima linijski grafikon pokazuje SMJER i INTENZITET promjene pojave u jednom rasponu vremena postupnim zbrajanjem članova vremenskog INTERVALNOG NIZA odozgo prema dolje, nastaje kumulativni vremenski niz

Trenutačni vremenski niz samo LINIJSKIM GRAFIKONOM na X-os - trenutak promatranja na Y-os - pripadajući član vremenskog niza (frekvenciju- koja je UVIJEK originalna) podizanje ordinate na onom mjestu apscise koje odgovara trenutku promatranja pojave jakost apsolutne promjene – strmina lin.graf. razlika dvije susjedne ordinate- apsolutna promjena pojave u dva trenutka promatranja mogući prekidi (i vodoravni i okomiti) aritmetičkog mjerila

Grafičko uspoređivanje vremenskih nizova Dva se VN mogu usporediti linijskim grafikonom s aritmetičkim mjerilom samo ako su: izražena u istim jedinicama mjere približnih brojčanih vrijednosti odnose se na isto vremensko razdoblje

Indeksna metoda

Indeksi relativni brojevi dinamike koji pokazuju relativan odnos između dva ili više stanja jedne te iste pojave na dva različita mjesta ili u dva različita vremenska intervala pomoću indeksnih brojeva mogu se analizirati i trenutačni i intervalni vremenski nizovi

Podjela indeksa Prema obuhvatu promatranih pojava: a) individualni indeksi S obzirom na bazu usporedbe: a) indeksi stalne i b) indeksi promjenjive baze b) skupni ili grupni indeksi a) indeksi cijena b) indeksi količina c) indeksi vrijednosti

Individualni indeksi stalne baze

Individualni indeksi stalne baze Dinamika samo jedne pojave pomoću indeksnih brojeva kroz nekoliko vremenskih razdoblja Baznim indeksima izražavaju se relativne varijacije između dva stanja istog VN, od kojih je jedna pojava bazna veličina Yt It = Yb Vrijednost kvocjenta pokazuje koliko jedinica uspoređenih pojava odgovara svakoj jedinici baznog stanja

POSTUPAK: 1. Izabiranje baze usporedbe: Jedan član vremenskog niza kod određivanja stalne baze, treba izabrati reprezentativan član (npr. najčešći član u nizu), a ne najnižu ili najvišu vrijednost u nizu Neka druga vrijednost: Veličina promatrane pojave iz proteklog vremenskog razdoblja koje nije obuhvaćeno intervalom promatranja AS vrijednosti pojave kada su varijacije pojave znatne (u oba smjera); baza usporedbe – prosjek varijacija vremenskog niza 2. Svi članovi originalnog VN se stavljaju u odnos prema izabranoj bazi usporedbe 3. Kvocjente pomnožiti sa 100 (radi tumačenja)

Pokazatelji Yt Yb Koeficijent promjene Yt Yb *100 = It Indeks promjene It – 100 = St Stopa promjene (+ rast, - pad)

Ako je: Yt = Yb It=100 Yt > Yb It>100 Yt < Yb It<100 It je uvijek pozitivan

Individualni indeksi na bazi srednje vrijednosti promatrane pojave uspoređivanje dva ili više VN mjerenih raznorodnim obilježjima grafički se prikazuju i površinskim i linijskim grafikonima baza usporedbe – srednja vrijednost promatrane pojave I yi = Yi Y *100 i=1,2,...,N

Pravila za indekse na stalnoj bazi Niz originalnih vrijednosti VN upravno je proporcionalan nizu indeksa na stalnoj bazi Prikazuju se uglavnom površinskim grafikonima (ordinata-indeksi u artm. mjerilu; ishodište = 100 na ordinati) Grafikon se čita u odnosu na bazu Usporedba varijacija različitih VN, ako svi VN imaju jednaku bazu Izražavaju relativne promjene VN, neovisne o sustavima i brojčanim razinama mjerenja u kojima su izražene originalne vrijednosti originalnih VN

Individualni indeksi s promjenjivom bazom (verižni ili lančani indeksi)

Verižni ili lančani indeksi ako Y1, Y2, Y3, ... Yn, predstavljaju frekvencije nekog vremenskog niza ,i potrebito je saznati kako se pojava mjenjala iz razdoblja u razdoblje, koriste se VERIŽNI ILI LANČANI INDEKSI to su indeksi na PROMJENJIVOJ BAZI ,a dobiju se dijeljenjem svakog člana vremenskog niza prethodnim članom te množenjem dobivenog rezultata sa 100 svaka originalna vrijednost javlja se kao: - tekuća vrijednost koja se uspoređuje - baza uspoređivanja iznimke: prva i posljednja orig. vrijednost VN - prva orig. vrij.–samo baza uspoređivanja - posljednja orig.vrij.–samo kao tekuća vrij.

Verižni indeksi ne mogu biti negativne veličine, jer su frekvencije vremenskog niza uvijek pozitivne Za verižne indekse vrijede sljedeće relacije: Yt > Y t-1 Vt > 100 Yt < Y t-1 Vt < 100 Yt = Y t-1 Vt = 100 Verižni indeks Vt pokazuje koliko jedinica pojave u vremenu t dolazi na svakih 100 jedinica u vremenu t-1 Govori o relativnoj promjeni neke pojave uvijek u odnosu na pojavu iz prethodnog perioda. Intenzitet promjene izražen u postotku dobije se kao razlika indeksa Vt i veličine 100 ( St=Vt-100 )

Grafičko prikazivanje verižnih indeksa specifična vrsta linijskog grafikona promjenjiva baza verižnih indeksa zahtjeva prikazivanje svakog verižnog indeksa posebnom linijom ishodište apscise (koja označava vrijeme) je na ordinati označeno vrijednošću 100 verižni indeksi >100: od apscise prema vrhu ordinate, unutar ili u sredini intervala jedne godine verižni indeksi < 100: od apscise prema nižim vrijednostima ordinate nagib ucrtane linije – intenzitet relativne promjene

Preračunavanje individualnih indeksa

Preračunavanje baznih indeksa u verižne postupnim dijeljenjem baznih indeksa (*100) kao da je riječ o originalnim frekvencijama VN

Preračunavanje verižnih u bazne ako je bazno razdoblje prvo u nizu– postupnim množenjem: I t-1 * Vt It = 100 t=2,3,..., N ako bazno razdoblje nije prvo u nizu - bazni indeks za razdoblja koja prethode baznom: It = ; kada je t > b I t I t-1 = *100 ; kada je t < b V t I t = 100 ; kada je t = b

Srednje vrijednosti vremenskih nizova

Srednje vrijednosti vremenskih nizova neke pojave su statičkog karaktera nemaju opću razvojnu tendenciju analiziraju se statičnim srednjim vrijednostima VRSTE: - AS intervalnog VN - kronološka sredina trenutačnog VN - geometrijska sredina (upotrebljava se u analizi intervalnog i trenutačnog VN)

Kronološka sredina Vremenski trenutačni niz je sastavljen od frekvencija čije se vrijednosti u pravilu ne mogu zbrajati te iz toga proizlazi da se za VTN ne bi mogla izračunati srednja vrijednost Stoga se VTN transformira u IVN te se pomoću kronološke sredine računa srednja vrijednost

Geometrijska sredina - srednja vrijednost verižnih indeksa (prosječan tempo promjene) Primjena: u analizi VN negrupiranih i grupiranih podataka (“prosječan tempo promjene”) kao srednja vrijednost numeričkih nizova za nizove sa asimetričnim rasporedom podataka

Jednostavna, neponderirana geometrijska sredina Za N individualnih vrijednosti varijable X (numeričkog ili vremenskog niza): rješava se logaritmiranjem: Logaritam geometrijske sredine jednak je aritmetičkoj sredini logaritama promatrane varijable, odnosno, aritmetičke sredine logaritama elemenata vremenskog niza ili numeričkog niza.

Vagana, ponderirana geometrijska sredina Podaci grupirani u distribuciju frekvencija: ne računa se za nizove koji sadrže vrijednost 0 na njenu veličinu utjecati će vrijednost svih elemenata promatranoga niza manja je od aritmetičke sredine istoga niza (osim u slučajevima kada su sve vrijednosti promatranoga niza međusobno jednake)

Skupni indeksi

Skupni indeksi Skupnim indeksima se mjeri dinamika skupine pojava ili se utvrđuju varijacije heterogene skupine pojava na različitim mjestima (npr. potrošnja, izvoz, uvoz,industrijska proizvodnja ) Najčešće se dinamika heterogenih pojava prati kroz vrijednosni način izražavanja Razlikujemo: -    skupni indeksi količina -   skupni indeksi cijena -    skupni indeks vrijednosti

Simboli p0 = cijene baznoga razdoblja p1 = cijene izvještajnoga razdoblja q0 = količine baznoga razdoblja q1 = količine izvještajnoga razdoblja p0q0 = ponder vrijednosti baznoga razdoblja p1q1 = ponder vrijednosti izvještajnoga razdoblja

Zapamtiti kod izračunavanja skupnih indeksa Sve nizove koji su zadani svesti na istu bazu (stalnu ili promjenjivu) Indekse na stalnoj bazi svesti na isto bazno razdoblje

Linearni trend

Trend Ovisno o karakteru čimbenika koji djeluju u vremenu na neku pojavu, vremenski niz čine slijedeće komponente: trend ili osnovna tendencija kretanja neke pojave kroz vrijeme sezonske oscilacije, koje se pojavljuju unutar jedne godine ciklične komponente slučajne komponente, koje čine slučajni, teško predvidivi događaji

Metode utvrđivanja trenda Za utvrđivanje trenda mogu se primijeniti: neparametrijske i parametrijske metode

Neparametrijske metode - ne rezultiraju matematičkom jednadžbom trenda. - dobra prethodnica parametrijskim metodama metoda prostom rukom metoda poluprosjeka metoda pomičnih prosjeka Prednost: jednostavno izračunavanje Nedostatak: ne postojanje trend vrijednosti za početna i završna razdoblja niza; osjetljivost aritmetičke sredine na ekstremne vrijednosti

Parametrijske metode Najčešća: metoda najmanjih kvadrata Izračunava se jednadžba linije kod koje će suma odstupanja između originalnih vrijednosti vremenskog niza i utvrđenih trend podataka biti jednaka nuli (model linearnog trenda jednak je modelu jednostavne linearne regresije)

Metoda najmanjih kvadrata izračunava se jednadžba linije kod koje će suma odstupanja između originalnih vrijednosti vremenskog niza i utvrđenih trend podataka biti jednaka 0 Označe li se podaci sa Yi, a trend podatke sa Yci, te primjeni li se metoda najmanjih kvadrata, vrijedi sljedeće: Nadalje vrijedi sljedeće:

osnovna tendencija je linearna, linearni trend je polinom prvog Da bi se uočila tendencija razvoja pojave dobro je: imati što veći vremenski niz (više frekvencija) grafički prikazati pojavu – gdje se iz približnog izgleda nacrtane funkcije donosi sud o mogućem obliku osnovne tendencije razvoja ili tipu trenda Ako su promatranja po: osnovna tendencija je linearna, linearni trend je polinom prvog stupnja f(x) = a+bx - jednakim intervalima i - ako su prve diferencije frekvencija približno konstantne (u apsolutnom izrazu)

Linearni trend Jednadžba linearnog trenda je jednadžba pravca: Yci=a+bx , i=1,2,...k gdje su: Yci – zavisna varijabla (trend vrijednosti) Xi – oznaka za vrijeme (nezavisna varijabla) parametar a – vrijednost trenda u ishodištu parametar b – koeficijent smjera pravca, te kazuje koliko se pojava mijenja u jedinici vremena

Kada se izračunava linearni trend kojemu je ishodište u prvoj godini vremenskog niza, parametri se izračunavaju na sljedeći način: parametar b: parametar a: Suma trend vrijednosti mora biti jednaka sumi originalnih vrijednosti promatranog niza

Izračunavanje parametara a i b za jednadžbu linearnog trenda može se pojednostaviti tako da se ishodište jednadžbe premjesti u sredinu čitavog promatranog razdoblja Formule za izračunavanje parametara a i b su sljedeće:

Preračunavanje godišnjih jednadžbi u kraća vremenska razdoblja Trend se može izračunati i za vremenske nizove u kojima su podaci dati u vremenskim razdobljima koja nisu godišnje vrijednosti – npr. u polugodištima, kvartalima, mjesecima i dr. Pri preračunavanju godišnje jednadžbe trenda u trend s kraćim vremenskim razdobljima treba paziti da li se radi o trenutačnom ili intervalnom vremenskom nizu

TRENUTAČNI NIZ – preračunavanje godišnje jednadžbe u mjesečnu parametar “a” ostaje jednak godišnjem ukoliko se nije promijenilo ishodište jednadžbe B) INTERVALNI NIZ – preračunavanje godišnje jednadžbe u mjesečnu

Regresija i korelacija

Korelacija utvrđivanje međusobne povezanosti pojava koje se proučavaju te na osnovi jedne pojave predviđaju promjene i zbivanja u drugoj pojavi POVEZANOST MEĐU POJAVAMA MOŽE BITI uzročno-posljedična (regresijski model y=a+bx) korelativna (korelacijski model x=f(y) ili y=f(x))

Uzročno - posljedična povezanost jednostavna - jedan uzrok jedna posljedica složena - jedan uzrok - više posljedica - više uzroka - jedna posljedica - više uzroka i više posljedica

Korelativna povezanost pojava postoji kada promjene u jednoj i drugoj pojavi mogu postojati paralelno ,a da jedno nisu uzrok drugima proučavanjem korelativnih odnosa ne utvrđuju se uzročno-posljedični odnosi ,ali se pridonosi boljem razumjevanju pojava i događaja koje istražujemo i njihovom boljem predviđanju

indikator povezanosti između pojava je KOEFICIJENT KORELACIJE ili KOEFICIJENT ASOCIJACIJE između varijabli pokazuje smjer i intenzitet povezanosti između promatranih, registriranih i mjerenih pojava koef. korelacije vrlo rijetko ukazuje na uzročno-posljedičnu povezanost,a puno češće ukazuje na korelativni odnos između promatranih pojava

Korelacijska analiza 1. Utvrđivanje postojanja veze između pojava ili varijabli (A i B) 2. Utvrđivanje intenziteta i smjera povezanosti među varijablama 3. Utvrđivanje oblika veze među varijablama - funkcionalna 4. Utvrđivanje jakosti veze među pojavama - stohastička (statistička)

Linearna korelacija postoji kada je porast jedne pojave (Y) praćen linearnim porastom ili padom druge pojave DIJAGRAM RASIPANJA (scatter diagram) – pruža informacije o obliku, smjeru i jakosti veze UKUPNA VARIJANCA= PROTUMAČENI DIO + NEPROTUMAČENI DIO

Koeficijent determinacije (r2) protumačeni dio odstupanja Koeficijent determinacije= ukupna odstupanja Kako je r2 dan u drugom stupnju češće se koristi PEARSONOV KOEFICIJENT KORELACIJE (r) r = ± 1 (mjera jakosti samo za LINEARNU korelaciju)

kod tumačenja koeficijenta korelacije (r) treba imati u vidu da je nastao iz koeficijenta determinacije (r2), te da npr. r=0,70 znači r2=0,49, da je tek 50 % ukupnih odstupanja objašnjivo s promatrane dvije pojave

Krivolinijska kada se veza među pojavama najbolje ilustrira krivom linijom prva orjentacija o krivolinijskoj regresiji se dobiva preko dijagrama rasipanja na temelju kojeg se odlučuje koja se matematička krivulja najbolje prilagođuje nacrtanim originalnim vrijednostima.Jakost krivolinijske veze mjeri se INDEKSOM KORELACIJE  (ro)

Odnos koeficijenta determinacije i koeficijenta linearne korelacije Tumačenje odsutnost korelacije 0,00-0,25 0,00-0,50 slaba korelacija 0,25-0,64 0,50-0,80 korelacija srednje jakosti 0,64-1,00 0,80-1,00 čvrsta korelacija 1 potpuna (perfektna) korelacija

Parcijalna korelacija koristi se u slučaju utvrđivanja povezanosti između dviju pojava, eliminirajući utjecaj npr. neke treće zajedničke varijable KORELACIJA RANGA jakost veze između pojava promatranih po redoslijednom obilježju mjeri se koeficijentom korelacije ranga

Postupak izračunavanja: upare se vrijednosti redoslijednog obilježja za svaku statističku jedinicu jednom obilježju odredi se rang i poreda ga se po redoslijedu – drugo obilježje mu se pridružuje ne rasparujući prethodno stvorene parove ako se u nizu pojavi više jednakih vrijednosti njihovi se rangovi zbroje i podijele s brojem pojavljivanja, te se tako izračunana vrijednost pridružuje jednakim članovima niza

4) najniži rang pripada najnižoj vrijednosti obilježja, najviši rang najvišoj vrijednoati obilježja 5) izračuna se di=xri – yri kao razlika ranga za svaku statističku jedinicu 6) izračuna se kvadrat razlika di2

Nedostaci: nije osobito precizna mjera primjenom ovog koeficijenta korelacije ne mogu se izračunati ostali pokazatelji kao što su koeficijent regresije, koeficijent determinacije, jednadžba analize varijance, jednadžba regresije.

Opis koeficijenata korelacije prema jačini veze Koeficijent korelacije Tumačenje 0,00–0,10 Nema povezanosti 0,11-0,25 Jako slaba veza 0,26-0,40 Slaba veza 0,41-0,50 Srednje jaka veza 0,51-0,75 Jaka veza 0,76-0,90 Veoma jaka veza 0,91-1,00 Izuzetno jaka veza

Korelacijsko-regresijska analiza KORELACIJA ispitivanje veze i zavisnosti između dvije pojave ili promjenjive veličine Pokazatelji: koeficijent korelacije koeficijent determinacije koeficijent nedeterminacije REGRESIJA omogućava sagledavanje očekivane vrijednosti zavisno promjenjive veličine na osnovi vrijednosti nezavisno promjenjive veličine Pokazatelji: jednadžba regresije standardna pogreška procjene regresije

Analiza regresijskih modela Osnovicu za analizu reprezentativnosti regresijskih modela čine sljedeći statistički pokazatelji i metode: Rezidualna odstupanja Relativna rezidualna odstupanja Standardizirana odstupanja Koeficijent determinacije Koeficijent korelacije Standardna greška regresije Analiza varijance (ANOVA) Testiranje razine signifikantnosti regresijskih koeficijenata Određivanje intervala povjerenja regresijskih koeficijenata Određivanje intervala povjerenja prognoziranih vrijednosti Testiranje razine signifikantnosti koeficijenta korelacije

Koeficijent multiple determinacije R2 i koeficijent multiple korelacije R Koristi se prosudbu valjanosti i primjenjivosti modela višestruke regresije

Metoda uzoraka

ORIGINALNE, EMPIRIJSKE, OPAŽENE DISTRIBUCIJE su formirane grupiranjem opažanja ili elemenata skupa prema nekom obilježju. TEORIJSKE DISTRIBUCIJE očekivane distribucije u skladu s našim iskustvom ili na temelju teorijskih postavki. Pretpostavljamo ih u nekom statističkom modelu ili ih postavljamo kao hipotezu koju treba ispitati. Pojavljuju se u funkciji distribucije vjerojatnosti

Teorijske distribucije diskontinuirane slučajne varijable 1. BINOMNA DISTRIBUCIJA 2. POISSONOVA DISTRIBUCIJA

2. POISSONOVA DISTRIBUCIJA 1. BINOMNA DISTRIBUCIJA najjednostavnija teorijska distribucija distribucija za alternativna obilježja 2. POISSONOVA DISTRIBUCIJA koristi se za opis rijetkih događaja, tj. događaja s malom vjerojatnošću (br. kvarova strojeva:mjesečni (tjedni), broj dolazaka po min. , broj ˇpadovaˇračunala u jednom mjesecu)

Teorijske distribucije kontinuirane slučajne varijable najpoznatije: NORMALNA (GAUSSOVA) DISTRIBUCIJA STUDENTOVA (t) DISTRIBUCIJA HI-KVADRAT DISTRIBUCIJA F DISTRIBUCIJA

1. Normalna (gaussova) distribucija Ima oblik zvona Unimodalna je Proteže se od - do +  Simetrična je, pa je 3=0 Mjera zaobljenosti je 4=3 Egzaktan oblik normalne krivulje bit će poznat ako su poznate arit.sred. i stand.devij.

2. Studentova (t) distribucija Kod uzoraka koji broje više od 30 jedinica približava se oblikom i svojstvima normalnoj distribuciji Kod n<30 razvučena je po apscisi (u odnosu na normalnu)

4 . Hi-kvadrat distribucija 3. F distribucija Odnos dviju varijanci 4 . Hi-kvadrat distribucija Primjenjuje se kada treba donijeti odluku o signifikantnosti razlika između stvarnih (opaženih) i teorijskih (očekivanih) frekvencija Može zauzeti vrijednosti od 0 do 

Osnovni skup i uzorak Populacija (odluka, koje jedinice sudjeluju u populaciji ) Okvir uzorka (popis jedinica, iz kojeg se izabiru jedinice u uzorak npr.popis zaposlenih, lista pretplatnika )

Zadaća metode uzoraka Na osnovi uzorka procijene karakteristike osnovnog skupa Na osnovi podataka donosi se odluka o prihvaćanju, odnosno odbacivanju hipoteze koja se odnosi na neku karakteristiku osnovnog skupa

Koraci u procesu izabiranja uzorka Određivanje populacije Izabiranje primjerenog okvira uzorka Izabiranje plana uzorka (metode za izbor uzorka ) Određivanje potrebne veličine uzorka

Vrste planova uzorka 1. UZORCI BEZ PRIMJENE VJEROJATNOSTI Prigodni uzorci Namjerni uzorci Kvotni uzorci

2. UZORCI UZ PRIMJENU VJEROJATNOSTI Jednostavni slučajni uzorak Stratificirani uzorak proporcionalan neproporcionalan Uzorak skupina sustavan područni

Pitanja: nmujic@pravos.hr legcevic@pravos.hr mmikrut@pravos.hr

Sve tekuće informacije bit će objavljene na Literatura: Kazmier, Leonard J.: Business Statistics. McGraw-Hill, 2004. Neufeld, J. L.: Learning Business Statistics with Microsoft Excel, Prentice Hall, New Jersey, 1997. Newbold, Paul / Carlson, William L. / Thorne, Betty M.: Statistics for Business and Economics. Prentice-Hall, 2002. Petz, Boris: Osnovne statističke metode za nematematičare. Slap, Jastrebarsko, 2004. Sekulić, Branko et al.: Primjena matematike za ekonomiste. Informator, Zagreb 1996. Spiegel, Murray R. / Stephens, Larry J.: Statistics. McGraw-Hill, 1999. Studenmund, A. H.: Using Econometrics: A Practical Guide, HarperCollins Publishers Inc., New York, 1996. Šošić, I.: Pregled formula iz statistike, Mikrorad, Zagreb Šošić, Ivan / Serdar, Vladimir: Uvod u statistiku. Školska knjiga, Zagreb, 2002. Šošić, Ivan: Primijenjena statistika. Školska knjiga, Zagreb, 2004. Šošić, Ivan: Zbirka zadataka iz statistike. Mikrorad, Zagreb, 1998. Wonnacott, Thomas H. / Wonnacott, Ronald J.: Introductory Statistics. Wiley, 1990. Sve tekuće informacije bit će objavljene na www.pravos.hr

Sve tekuće informacije bit će objavljene na Literatura: Internet: http://www.efos-statistika.com/ HyperStat Online (David M. Lane) Statistics: Power from Data! (Statistics Canada) Introductory Statistics: Concepts, Models and Applications (David W. Stockburger) Introduction to Probability (Charles M. Grinstead, J. Laurie Snell) Virtual Laboratories in Probability and Statistics The R Project for Statistical Computing Sve tekuće informacije bit će objavljene na www.pravos.hr