CMD + K

Kapittel 1Begreper & formler · Utforskende dataanalyse
Referanseside · Kapittel 1

Begreper & formler

Alle nøkkelbegrepene og formlene fra Utforskende dataanalyse, samlet på én side. Bruk denne som oppslag når du leser, øver flashcards eller tar quiz.

Øv med flashcards12 kort fra dette kapittelet

Begreper

Sentrale begreper fra kapittelet med korte definisjoner.

01Stolpediagram

Grafisk fremstilling som viser frekvensen til diskrete kategorier.

02Histogram

Søylediagram som viser fordelingen av kontinuerlige data over intervaller.

03Boksplott

Visualiserer median, kvartiler og mulige uteliggere i et datasett.

04Kvantil

Verdien som deler et sortert datasett i bestemte prosentandeler.

05Empirisk kumulativ fordeling

Stegfunksjon som viser andelen observasjoner som er mindre enn eller lik en verdi.

06Interkvartil bredde

Avstanden Q_3 - Q_1 mellom øvre og nedre kvartil. Robust mål på spredning.

07Uteligger

Observasjon som ligger uvanlig langt fra resten av datasettet, typisk mer enn 1,5·IQR utenfor kvartilene.

Formler

Hver formel: hva den heter, hvordan den ser ut, og hva symbolene betyr.

gjennomsnitt

Utvalgsgjennomsnitt

Logg inn for forklaring

Gir gjennomsnittet av observasjonene og beskriver datasettets sentrale tendens.

utvalgsgjennomsnitt
nantall observasjoner
x_iden i-te observasjonen
median-odd

Median for oddetall

Logg inn for forklaring

Medianen er den midterste observasjonen i et sortert datasett og robust mot uteliggere.

x_(m)den m-te observasjonen i sortert rekkefølge
nantall observasjoner (oddetall)
emp-varians

Empirisk varians

Logg inn for forklaring

Måler spredningen i data og bruker Bessel-korreksjonen for å være upartisk for populasjonsvariansen.

empirisk varians
n-1Bessel-korreksjonen
utvalgsgjennomsnittet
emp-std

Empirisk standardavvik

Logg inn for forklaring

Kvadratroten av variansen, slik at spredningen får samme enhet som dataene.

sempirisk standardavvik
empirisk varians
iqr-formel

Interkvartil bredde (IQR)

Logg inn for forklaring

Spennet som dekker den midterste halvparten av observasjonene. Robust mot uteliggere.

Q_1nedre kvartil (25-persentil)
Q_3øvre kvartil (75-persentil)

Læringsmål

Hva du skal kunne etter å ha lest kapittelet.

  1. 01Velge passende grafisk fremstilling (stolpediagram, histogram, boksplott) ut fra om dataene er kategoriske eller kontinuerlige
  2. 02Regne ut utvalgsgjennomsnitt, median, empirisk varians og standardavvik for et lite datasett
  3. 03Tolke et boksplott i form av kvartiler, IQR og potensielle uteliggere
  4. 04Skissere en empirisk kumulativ fordeling og lese av kvantiler grafisk