Begreper & formler
Alle nøkkelbegrepene og formlene fra Utforskende dataanalyse, samlet på én side. Bruk denne som oppslag når du leser, øver flashcards eller tar quiz.
Begreper
Sentrale begreper fra kapittelet med korte definisjoner.
Grafisk fremstilling som viser frekvensen til diskrete kategorier.
Søylediagram som viser fordelingen av kontinuerlige data over intervaller.
Visualiserer median, kvartiler og mulige uteliggere i et datasett.
Stegfunksjon som viser andelen observasjoner som er mindre enn eller lik en verdi.
Avstanden Q_3 - Q_1 mellom øvre og nedre kvartil. Robust mål på spredning.
Observasjon som ligger uvanlig langt fra resten av datasettet, typisk mer enn 1,5·IQR utenfor kvartilene.
Formler
Hver formel: hva den heter, hvordan den ser ut, og hva symbolene betyr.
Utvalgsgjennomsnitt
Gir gjennomsnittet av observasjonene og beskriver datasettets sentrale tendens.
Median for oddetall
Medianen er den midterste observasjonen i et sortert datasett og robust mot uteliggere.
Empirisk varians
Måler spredningen i data og bruker Bessel-korreksjonen for å være upartisk for populasjonsvariansen.
Empirisk standardavvik
Kvadratroten av variansen, slik at spredningen får samme enhet som dataene.
Interkvartil bredde (IQR)
Spennet som dekker den midterste halvparten av observasjonene. Robust mot uteliggere.
Læringsmål
Hva du skal kunne etter å ha lest kapittelet.
- 01Velge passende grafisk fremstilling (stolpediagram, histogram, boksplott) ut fra om dataene er kategoriske eller kontinuerlige
- 02Regne ut utvalgsgjennomsnitt, median, empirisk varians og standardavvik for et lite datasett
- 03Tolke et boksplott i form av kvartiler, IQR og potensielle uteliggere
- 04Skissere en empirisk kumulativ fordeling og lese av kvantiler grafisk