Statistika je grana matematike koja prikuplja, analizira, tumači i prikazuje podatke.
Skup iz kojeg uzimamo podatke zove se populacija.
Frekvencija je broj pojavljivanja nekog podatka u promatranoj skupini (npr. broj učenika koji sviraju neki instrument). Udio podatka u cijeloj populaciji naziva se njegovom relativnom frekvencijom. Zbroj vrijednosti svih relativnih frekvencija u nekom skupu iznosi 1.
Podatke možemo prikazivati:
Neka su nam dani podatci: $x_1, x_2, x_3, ... , x_n$.
Artimetička sredina ili prosječna vrijednost je zbroj svih podataka podijeljen s ukupnim brojem podataka. Oznaka je $\overline{x}$.
Da bismo lakše shvatili pojmove u ovom poglavlju, koristit ćemo sljedeći niz podataka:
Aritmetička sredina danog niza je:
Mod je najčešći podatak u nekom nizu podataka.
Mod danog niza je:
Medijan ili "srednji podatak" je broj koji sortirani niz brojeva dijeli na dva jednako duga podniza. Dakle, kada imamo neki niz podataka, podatke ćemo poredati po veličini. Ako je broj podataka neparan, medijan će biti točno srednji podatak u tom nizu, a ako je broj podataka paran, medijan će biti aritmetička sredina dvaju središnjih podataka. Oznaka za medijan je $M_e$.
Za navedeni niz podataka vrijedi:
Rekli smo da medijan dijeli niz podataka na dva jednakobrojna niza. Na taj način dobivamo i kvartile:
Kvartili dijele niz podataka na četiri jednaka dijela.
Razlika između trećeg i prvog kvartila zove se interkvartilni raspon.
Ako želimo bolje prikazati skup podataka, možemo ih prikazati brkatom kutijom. Za to su nam potrebni sljedeći podatci:
Neka su nam dani podatci: $x_1, x_2, x_3, ... , x_n$.
Raspon je razlika između najveće i najmanje vrijednosti u tom skupu podataka, tj. $R=x_{max}-x_{min}$.
Neka je aritmetička sredina danih podataka $\overline{x}$. Broj $x_i-\overline{x}$ je odstupanje vrijednosti podatka $x_i$ od aritmetičke sredine.
Varijanca je mjera rasipanja podataka oko aritmetičke sredine te se definira kao prosječno kvadratno odstupanje od prosjeka. Oznaka je $\sigma^2$.
Standardna devijacija je korijen prosječnog kvadratnog odstupanja vrijednosti podataka od aritmetičke sredine. To je zapravo drugi korijen iz varijance. Oznaka je $\sigma$.
Za dani niz podataka varijancu i standardnu devijaciju računamo kao:
Isprobaj potpuno besplatno!
Registracijom dobivaš besplatan*
pristup dijelu lekcija za svaki predmet.