Statistika je grana matematike koja prikuplja, analizira, tumači i prikazuje podatke.
Skup iz kojeg uzimamo podatke zove se populacija.
Frekvencija je broj pojavljivanja nekog podatka u promatranoj skupini (npr. broj učenika koji sviraju neki instrument). Udio podatka u cijeloj populaciji naziva se njegovom relativnom frekvencijom. Zbroj vrijednosti svih relativnih frekvencija u nekom skupu iznosi 1.
Prikaz podataka
Podatke možemo prikazivati:
- tablicom ( Prikazivanje podataka u obliku redaka i stupaca. Svaki redak predstavlja jedan podatak ili skup podataka, a svaki stupac kategoriju.)


- piktogramom (Prikaz podataka pomoću slika ili simbola, gdje svaki simbol predstavlja određenu količinu. Koristi se kad želimo prikazati podatke na vizualno jednostavan i razumljiv način.)


- stupičastim dijagramom (Prikaz podataka pomoću vertikalnih ili horizontalnih stupaca. Svaki stupac predstavlja jednu kategoriju ili skupinu, a visina ili dužina stupca pokazuje veličinu podataka. Često se koristi za usporedbu različitih skupina podataka.)


- dijagramom stablo - list (Grafički prikaz podataka koji se koristi za prikazivanje brojčanih podataka u formi stabla, gdje su listovi brojevi ili statistički podaci. Koristi se za organiziranje podataka u hijerarhiji i za prikazivanje odnosa među njima.)


- kružnim dijagramom (Dijagram u obliku kruga koji je podijeljen na sektore, gdje svaki sektor predstavlja udio nekog dijela u odnosu na cijeli skup podataka. Koristi se za prikazivanje relativnih udjela.)


- linijskim dijagramom (Dijagram koji koristi linije povezane točkama za prikazivanje promjena podataka kroz vrijeme. Najčešće se koristi za prikazivanje trendova ili kretanja podataka tijekom vremena.)


- histogramom (Slično stupičastom dijagramu, ali koristi se za prikazivanje distribucije podataka unutar određenih intervala. Podaci se grupiraju u intervalima, a visina svakog stupca pokazuje koliko podataka spada u taj interval.)


Srednje vrijednosti
Neka su nam dani podatci: $x_1, x_2, x_3, ... , x_n$.
Artimetička sredina ili prosječna vrijednost je zbroj svih podataka podijeljen s ukupnim brojem podataka. Oznaka je $\overline{x}$.
$ \overline{x} = \frac{x_1 + x_2 + x_3 + \dots + x_n}{n} $
Da bismo lakše shvatili pojmove u ovom poglavlju, koristit ćemo sljedeći niz podataka:
$ 8, 7, 4, 3, 7, 6, 1, 2, 3, 7 $
Aritmetička sredina danog niza je:


Mod je najčešći podatak u nekom nizu podataka.
Mod danog niza je:
$ 8, \underline{7}, 4, 3, \underline{7}, 6, 1, 2, 3, \underline{7} \Rightarrow 7 $
Medijan ili "srednji podatak" je broj koji sortirani niz brojeva dijeli na dva jednako duga podniza. Dakle, kada imamo neki niz podataka, podatke ćemo poredati po veličini. Ako je broj podataka neparan, medijan će biti točno srednji podatak u tom nizu, a ako je broj podataka paran, medijan će biti aritmetička sredina dvaju središnjih podataka. Oznaka za medijan je $M_e$.
Za navedeni niz podataka vrijedi:


Rekli smo da medijan dijeli niz podataka na dva jednakobrojna niza. Na taj način dobivamo i kvartile:
- prvi (donji) kvartil = medijan prve polovice niza odnosno "srednji" član tog dijela, $Q_1$
- drugi (srednji) kvartil = medijan početnog niza, $Q_2$
- treći (gornji) kvartil = medijan druge polovice niza podataka odnosno "srednji" član tog dijela, $Q_3$
Kvartili dijele niz podataka na četiri jednaka dijela.
Razlika između trećeg i prvog kvartila zove se interkvartilni raspon.
Brkata kutija
Ako želimo bolje prikazati skup podataka, možemo ih prikazati brkatom kutijom. Za to su nam potrebni sljedeći podatci:
- minimalna vrijednost svih podataka, $X_{min}$
- prvi kvartil, $Q_1$
- medijan (odnosno drugi kvartil), $M_e$ ($Q_2$)
- treći kvartil, $Q_3$
- maksimalna vrijednost svih podataka, $X_{max}$


Mjere raspršenosti
Neka su nam dani podatci: $x_1, x_2, x_3, ... , x_n$.
Raspon je razlika između najveće i najmanje vrijednosti u tom skupu podataka, tj. $R=x_{max}-x_{min}$.
Neka je aritmetička sredina danih podataka $\overline{x}$. Broj $x_i-\overline{x}$ je odstupanje vrijednosti podatka $x_i$ od aritmetičke sredine.
Varijanca je mjera rasipanja podataka oko aritmetičke sredine te se definira kao prosječno kvadratno odstupanje od prosjeka. Oznaka je $\sigma^2$.
$ \sigma^2= \frac{(x_1-\overline{x})^2 + (x_2-\overline{x})^2 + (x_3-\overline{x})^2 + ... + (x_n-\overline{x})^2}{n} $
Standardna devijacija je korijen prosječnog kvadratnog odstupanja vrijednosti podataka od aritmetičke sredine. To je zapravo drugi korijen iz varijance. Oznaka je $\sigma$.
$ \sigma=\sqrt{ \frac{(x_1-\overline{x})^2 + (x_2-\overline{x})^2 + (x_3-\overline{x})^2 + ... + (x_n-\overline{x})^2}{n} } $
Za dani niz podataka varijancu i standardnu devijaciju računamo kao:



