Wat zijn Statistieken?
Statistiek is een tak van de toegepaste wiskunde die zich bezighoudt met het verzamelen, beschrijven, analyseren en afleiden van conclusies uit kwantitatieve gegevens. De wiskundige theorieën achter de statistiek leunen zwaar op differentiaal- en integraalrekening, lineaire algebra, en waarschijnlijkheidsrekening. Statistici, mensen die zich met statistiek bezighouden, houden zich vooral bezig met de vraag hoe betrouwbare conclusies kunnen worden getrokken over grote groepen en algemene verschijnselen uit de waarneembare kenmerken van kleine steekproeven die slechts een klein deel van de grote groep vertegenwoordigen of een beperkt aantal gevallen van een algemeen verschijnsel.
De twee belangrijkste gebieden van de statistiek staan bekend als de beschrijvende statistiek, die de eigenschappen van steekproef- en populatiegegevens beschrijft, en de inferentiële statistiek, die deze eigenschappen gebruikt om hypothesen te toetsen en conclusies te trekken.
Een aantal veelgebruikte statistische instrumenten en procedures zijn onder meer de volgende:
- Descriptieve
- Gemiddelde
- Variantie
- Skewness
- Kurtosis
- Inferentiële
- Liner regressieanalyse
- Analyse van variantie (ANOVA)
- Logit/Probit modellen
- Null hypothesis testing
Key Takeaways
- Statistiek is de studie en manipulatie van gegevens, inclusief manieren om gegevens te verzamelen, te beoordelen, te analyseren en er conclusies uit te trekken.
- De twee belangrijkste gebieden van de statistiek zijn beschrijvende en inferentiële statistieken.
- Statistiek kan worden gebruikt om beter geïnformeerde zakelijke en investeringsbeslissingen te nemen.
Statistiek
Inzicht in statistiek
Statistiek wordt in vrijwel alle wetenschappelijke disciplines gebruikt, zoals de natuurwetenschappen en sociale wetenschappen, maar ook in het bedrijfsleven, de geesteswetenschappen, de overheid en de industrie. Statistiek is in wezen een tak van de toegepaste wiskunde die zich heeft ontwikkeld uit de toepassing van wiskundige hulpmiddelen, waaronder calculus en lineaire algebra, op de waarschijnlijkheidsrekening.
In de praktijk is statistiek het idee dat we meer te weten kunnen komen over de eigenschappen van grote groepen objecten of gebeurtenissen (een populatie) door de kenmerken van een kleiner aantal soortgelijke objecten of gebeurtenissen (een steekproef) te bestuderen. Omdat het verzamelen van uitgebreide gegevens over een hele populatie in veel gevallen te duur, te moeilijk of helemaal onmogelijk is, begint de statistiek met een steekproef die gemakkelijk of betaalbaar kan worden geobserveerd.
Twee soorten statistische methoden worden gebruikt bij het analyseren van gegevens: beschrijvende statistiek en inferentiële statistiek. Statistici meten en verzamelen gegevens over de individuen of elementen van een steekproef, en analyseren deze gegevens vervolgens om beschrijvende statistieken te genereren. Vervolgens kunnen zij deze waargenomen kenmerken van de steekproefgegevens, die terecht “statistiek” worden genoemd, gebruiken om gevolgtrekkingen of gefundeerde gissingen te maken over de ongemeten (of ongemeten) kenmerken van de bredere populatie, bekend als de parameters.
Beschrijvende statistiek
Descriptieve statistiek richt zich meestal op de centrale tendens, variabiliteit, en distributie van steekproefgegevens. Centrale tendens betekent de schatting van de kenmerken, een typisch element van een steekproef of populatie, en omvat beschrijvende statistieken zoals gemiddelde, mediaan, en modus. Variabiliteit verwijst naar een reeks statistieken die laten zien hoeveel verschil er is tussen de elementen van een steekproef of populatie met betrekking tot de gemeten kenmerken, en omvat meeteenheden als bereik, variantie en standaardafwijking.
De verdeling verwijst naar de algemene “vorm” van de gegevens, die kan worden afgebeeld op een grafiek zoals een histogram of dot plot, en omvat eigenschappen als de kansverdelingsfunctie, scheefheid, en kurtosis. Beschrijvende statistieken kunnen ook verschillen beschrijven tussen de waargenomen kenmerken van de elementen van een gegevensverzameling. Beschrijvende statistieken helpen ons de collectieve eigenschappen van de elementen van een gegevenssteekproef te begrijpen en vormen de basis voor het testen van hypothesen en het doen van voorspellingen met behulp van inferentiële statistieken.
Inferentiële statistieken
Inferentiële statistieken zijn hulpmiddelen die statistici gebruiken om uit de kenmerken van een steekproef conclusies te trekken over de kenmerken van een populatie en om te bepalen hoe zeker zij kunnen zijn van de betrouwbaarheid van die conclusies. Op basis van de steekproefgrootte en de verdeling van de steekproefgegevens kunnen statistici berekenen hoe groot de kans is dat de statistiek, die de centrale tendens, de variabiliteit, de verdeling en de relaties tussen kenmerken binnen een gegevenssteekproef meet, een nauwkeurig beeld geeft van de overeenkomstige parameters van de gehele populatie waaruit de steekproef is getrokken.
Inferentiële statistieken worden gebruikt om generalisaties te maken over grote groepen, zoals het schatten van de gemiddelde vraag naar een product door onderzoek te doen naar de koopgewoonten van een steekproef van consumenten, of om te proberen toekomstige gebeurtenissen te voorspellen, zoals het voorspellen van het toekomstige rendement van een effect of een activaklasse op basis van rendementen in een steekproefperiode.
Regressieanalyse is een veelgebruikte methode van statistische gevolgtrekking die probeert de sterkte en de aard van het verband (of de correlatie) te bepalen tussen een afhankelijke variabele (gewoonlijk aangeduid met Y) en een reeks andere variabelen (bekend als onafhankelijke variabelen). De output van een regressiemodel kan worden geanalyseerd op statistische significantie, waarmee wordt bedoeld dat een resultaat van bevindingen uit tests of experimenten waarschijnlijk niet willekeurig of toevallig is ontstaan, maar kan worden toegeschreven aan een specifieke oorzaak die door de gegevens wordt opgehelderd. Het hebben van statistische significantie is belangrijk voor academische disciplines of beoefenaars die zwaar leunen op het analyseren van gegevens en onderzoek.
Veelgestelde vragen
Wat is het verschil tussen beschrijvende en inferentiële statistiek?
Descriptieve statistieken worden gebruikt om de kenmerken van een steekproef of gegevensverzameling te beschrijven of samen te vatten, zoals het gemiddelde, de standaardafwijking of de frequentie van een variabele. Inferentiële statistieken daarentegen maken gebruik van een aantal technieken om variabelen in een gegevensreeks aan elkaar te relateren, bijvoorbeeld met behulp van correlatie- of regressieanalyse. Deze kunnen vervolgens worden gebruikt om voorspellingen te doen of causaliteit af te leiden.
Wie gebruikt statistiek?
Statistiek wordt in tal van toepassingen en beroepen gebruikt. Telkens wanneer gegevens worden verzameld en geanalyseerd, wordt aan statistiek gedaan. Dit kan variëren van overheidsinstellingen tot academisch onderzoek tot het analyseren van investeringen.
Hoe worden statistieken gebruikt in de economie en de financiële wereld?
Economen verzamelen en bekijken allerlei soorten gegevens, variërend van consumentenbestedingen tot woningbouwstarts en van inflatie tot BBP-groei. In de financiële wereld verzamelen analisten en beleggers gegevens over bedrijven, bedrijfstakken, sentimenten en marktgegevens over prijzen en volumes. Samen staat het gebruik van inferentiële statistieken op deze gebieden bekend als econometrie. Verscheidene belangrijke financiële modellen, van CAPM tot Modern Portfolio Theory (MPT) en het Black-Scholes optiewaarderingsmodel, berusten op statistische gevolgtrekkingen.