10 ting du bør vite om statistikk for å bruke Excel

Excel er et fantastisk verktøy når du trenger å bruke statistikk. Hvis du aldri har vært utsatt for statistikk i skole eller det har vært et tiår eller to siden du var, la disse tipsene hjelpe deg å bruke noen av de statistiske verktøy som Excel gir.

Beskrivende statistikk er grei Anmeldelser

Det første du bør vite er at noen statistisk analyse og noen statistiske mål er ganske utrolig grei. Beskrivende statistikk, som inkluderer ting som de pivottabeller krysstabeller, samt noen av de statistiske funksjoner, gir mening selv til noen som er ikke alt som er kvantitativ.

Gjennomsnitts er ikke så enkelt noen ganger

Når noen bruker begrepet gjennomsnitt
hva han vanligvis refererer til er den vanligste gjennomsnittlig måling, som er en mener Forståelse
. at begrepet gjennomsnitt
er upresis gjør mye av Excel statistiske funksjonalitet mer forståelig

For å gjøre denne diskusjonen mer konkret, antar at du ser på et lite sett med verdier:. 1, 2, 3, 4 og 5. Som du kanskje vet, var gjennomsnittlig i dette lite sett med verdier er 3. Du kan beregne middelverdien ved å legge sammen alle tallene i settet (1 + 2 + 3 + 4 + 5) og deretter dele denne summen (15) av Totalt antall verdier i settet (5).

medianverdien
er verdien som skiller de største verdiene fra de minste verdiene. I datasettet 1, 2, 3, 4 og 5, er medianen 3. Verdien 3 skiller de største verdiene (4 og 5) fra de minste verdier (1 og 2).

Du don 't trenger å forstå ulike gjennomsnittsmålinger, men du bør huske at begrepet gjennomsnitt
er ganske upresis.

Standardavvik beskrive spredning

Formelen for standardavvik og Logikken er ganske lett å forstå.

En standardavvik
beskriver hvordan verdiene i et datasett varierer rundt gjennomsnittet. Den pene ting om statistiske mål som et standardavvik, du ofte få ekte innsikt i hva som kjennetegner de data som du ser på. En annen ting er at med disse to biter av data, kan du ofte trekke slutninger om data ved å se på prøvene.

En observasjon er en observasjon

Observasjon
er en av de vilkår som du vil støte på hvis du leser noe om statistikk. En observasjon er bare en observasjon. En måte å definere begrepet observasjon er som dette: Når du faktisk tilordne en verdi til en av dine tilfeldige variabler, du oppretter en observasjon

Et eksempel er en undergruppe av verdier

En <. i> prøve
er en samling av observasjoner fra en populasjon. For eksempel, hvis du oppretter et datasett som registrerer daglig høy temperatur i nabolaget ditt, er din lille samling av observasjoner en prøve.

Til sammenligning en prøve er ikke en befolkning. En befolkning
inkluderer alle mulige observasjoner.

Slutningsstatistikk er kult, men komplisert

Hvis du ser på et utvalg av verdier fra en populasjon og utvalget er representativt og stort nok, kan du trekke konklusjoner om populasjonen basert på egenskapene til prøven

Slutningsstatistikk, men svært kraftig, har to kvaliteter som du trenger å vite:.

Nøyaktighet problemer


Bratt læringskurve

sannsynlighetsfordeling funksjoner er ikke alltid forvirrende

P
robability fordelingsfunksjon
høres ganske vanskelig; men du kan faktisk forstår intuitivt hva en sannsynlighetsfordeling funksjonen er med et par nyttige eksempler.

En vanlig fordeling som du hører om i statistikk klasser, for eksempel, er en T distribusjon. En T distribusjon
er egentlig en normalfordeling unntatt med tyngre, fetere haler.

En vanlig sannsynlighetsfordelingsfunksjonen er en jevn fordeling. I en jevn fordeling, etter hvert arrangement har samme sannsynlighet for forekomst. Det unike med denne fordelingen er at alt er ganske utrolig nivå.

En annen vanlig type sannsynlighetsfordelingsfunksjon er normalfordeling, etter også kjent som en klokkekurve Anmeldelser eller en Gaussian distribusjon.

En normalfordeling forekommer naturlig i mange situasjoner. For eksempel er etterretnings quotients (IQs) fordeles normalt.

Parametere er ikke så komplisert

En parameter
er et innspill til sannsynlighetsfordelingen funksjonen. Med andre ord, med formelen eller funksjon eller ligning som beskriver en sannsynlighetsfordelingskurve må innganger. I statistikken er disse inngangene kalt parametre.

Noen sannsynlighetsfordelingsfunksjoner trenger bare én enkelt parameter. For eksempel, for å jobbe med en jevn fordeling, alt du egentlig trenger er antall verdier i datasettet. En seks-sided dø, for eksempel, har bare seks muligheter.

Skjevhet og kurtose beskrive en sannsynlighetsfordeling form

Et par andre nyttige statistiske begreper å vite er skjevhet og kurtose. Skjevhet
kvantifiserer mangel på symmetri i en sannsynlighetsfordeling. I en perfekt symmetrisk fordeling, i likhet med normalfordeling, er lik null skjevhet. Hvis en sannsynlighetsfordeling lener seg mot høyre eller venstre, men lik skjevhet noen verdi annet enn null, og verdien kvantifiserer mangel på symmetri.

kurtose
kvantifiserer tyngde av haler i en fordeling. I en normalfordeling, lik kurtose null. hale
er ting som når ut til venstre eller høyre. Hvis imidlertid en hale i en fordeling er tyngre enn en normal fordeling, er det kurtose et positivt tall. Hvis de haler i en distribusjon er tynnere enn i en normalfordeling, er kurtose et negativt tall.

Konfidensintervallene virke komplisert i starten, men er nyttige

Sannsynlig ofte forvirre folk. En viktig ting å forstå om tillit nivåer er at de er knyttet til feilmarginen.

En annen viktig ting å forstå om tillit nivåer er at jo større du gjør ditt utvalgsstørrelsen, jo mindre din feilmargin skal bruke den samme sikkerhetsnivå.

Som bare ett eksempel si at du hadde noen Google Analytics-data på to forskjellige web annonser du kjører for å fremme en liten bedrift, og ønsker du å vite hvilken annonse er mer effektiv. Du kan bruke konfidensintervall formelen for å finne ut hvor lenge annonsene må kjøre før Googles samlet inn nok data for deg å vite hvilken annonse er egentlig bedre. Anmeldelser