Prikazivanje i analiziranje podataka

Statistika je grana matematike koja prikuplja, analizira, tumači i prikazuje podatke.

Skup iz kojeg uzimamo podatke zove se populacija.

Frekvencija je broj pojavljivanja nekog podatka u promatranoj skupini (npr. broj učenika koji sviraju neki instrument). Udio podatka u cijeloj populaciji naziva se njegovom relativnom frekvencijom. Zbroj vrijednosti svih relativnih frekvencija u nekom skupu iznosi 1.

Prikaz podataka

Podatke možemo prikazivati:

  • tablicom
  • piktogramom
  • stupičastim dijagramom
  • dijagramom stablo - list
  • kružnim dijagramom
  • linijskim dijagramom
  • histogramom

Srednje vrijednosti

Artimetička sredina ili prosječna vrijednost je zbroj svih podataka podijeljen s ukupnim brojem podataka. Oznaka je $\overline{x}$.

Mod je najčešći podatak u nekom nizu podataka.

Medijan ili "srednji podatak" je broj koji sortirani niz brojeva dijeli na dva jednako duga podniza. Dakle, kada imamo neki niz podataka, podatke ćemo poredati po veličini. Ako je broj podataka neparan, medijan će biti točno srednji podatak u tom nizu, a ako je broj podataka paran, medijan će biti aritmetička sredina dvaju središnjih podataka. Oznaka za medijan je $M_e$.

Rekli smo da medijan dijeli niz podataka na dva jednakobrojna niza. Na taj način dobivamo i kvartile:

  • prvi (donji) kvartil = medijan prve polovice niza odnosno "srednji" član tog dijela, $Q_1$
  • drugi (srednji) kvartil = medijan početnog niza, $Q_2$
  • treći (gornji) kvartil = medijan druge polovice niza podataka odnosno "srednji" član tog dijela, $Q_3$

Kvartili dijele niz podataka na četiri jednaka dijela.
Razlika između trećeg i prvog kvartila zove se interkvartilni raspon.

Brkata kutija

Ako želimo bolje prikazati skup podataka, možemo ih prikazati brkatom kutijom. Za to su nam potrebni sljedeći podatci:

  • minimalna vrijednost svih podataka, $X_{min}$
  • prvi kvartil, $Q_1$
  • medijan (odnosno drugi kvartil), $M_e$ ($Q_3$)
  • treći kvartil, $Q_3$
  • maksimalna vrijednost svih podataka, $X_{max}$

Mjere raspršenosti

Neka su nam dani podatci: $x_1, x_2, x_3, ... , x_n$.

Raspon je razlika između najveće i najmanje vrijednosti u tom skupu podataka, tj. $R=x_{max}-x_{min}$.

Neka je aritmetička sredina danih podataka $\overline{x}$. Broj $x_i-\overline{x}$ je odstupanje vrijednosti podatka $x_i$ od aritmetičke sredine.

Varijanca je mjera rasipanja podataka oko aritmetičke sredine te se definira kao prosječno kvadratno odstupanje od prosjeka. Oznaka je $\sigma^2$.

$ \sigma^2= \frac{(x_1-\overline{x})^2 + (x_2-\overline{x})^2 + (x_3-\overline{x})^2 + ... + (x_n-\overline{x})^2}{n} $

Standardna devijacija je korijen prosječnog kvadratnog odstupanja vrijednosti podataka od aritmetičke sredine. To je zapravo drugi korijen iz varijance. Oznaka je $\sigma$.

$ \sigma=\sqrt{ \frac{(x_1-\overline{x})^2 + (x_2-\overline{x})^2 + (x_3-\overline{x})^2 + ... + (x_n-\overline{x})^2}{n} } $
ONLINE INSTRUKCIJE

Instrukcije cijeli mjesec, 5 predmeta,

13 eura!

ŠTO ČEKAŠ?

Isprobaj potpuno besplatno!

Registracijom dobivaš besplatan*
pristup dijelu lekcija za svaki predmet.

*Besplatan pristup ne zahtijeva unos kartice.
Online pripreme za maturu i instrukcije za srednju školu. Dostupno 24/7.
© 2023, Gradivo.hr