Descriptieve statistieken zijn nuttig voor het beschrijven van de basiskenmerken van gegevens, bijvoorbeeld de samenvattende statistieken voor de schaalvariabelen en de maten van de gegevens. In een onderzoek met grote gegevens kunnen deze statistieken ons helpen de gegevens te beheren en in een samenvattende tabel te presenteren. In een cricketwedstrijd bijvoorbeeld kunnen ze ons helpen om de records van de speler te beheren en ook om de records van de ene speler te vergelijken met die van een andere speler.
Typen beschrijvende statistieken
1. Meting van de centrale tendens: De meting van de centrale tendens meet de gemiddelde waarde van de steekproef. In de beschrijvende statistiek zijn er twee soorten gemiddelden: de eerste zijn de wiskundige gemiddelden en de tweede zijn de positionele gemiddelden.
Bij de wiskundige gemiddelden gaat het om drie soorten: het rekenkundig gemiddelde, het meetkundig gemiddelde en het harmonisch gemiddelde. Het rekenkundig gemiddelde is de meest gebruikte maat voor de centrale tendens; het kan worden verkregen door alle items van de reeks op te tellen en dit totaal te delen door het aantal items. In de beschrijvende statistiek wordt het meetkundig gemiddelde gedefinieerd als de n-de wortel uit de producten van alle n waarden van de variabele. In de beschrijvende statistiek wordt het meetkundig gemiddelde gebruikt wanneer de items in de reeks zeer groot zijn. Het harmonisch gemiddelde wordt gedefinieerd als de reciproke van het item. Het harmonisch gemiddelde is nuttig bij het vinden van gemiddelden die betrekking hebben op snelheid, tijd, prijs en verhouding.
Er zijn twee soorten positionele gemiddelden: de mediaan en de modus. De mediaan is de gemiddelde waarde van de reeks waarin de helft van de waarden kleiner is dan de mediaan en de helft van de waarden groter dan de mediaan. De modus, het tweede positionele gemiddelde, vertoont een hogere frequentie in de reeks.
2. Maatstaf voor de spreiding: In de beschrijvende statistiek kunnen we de gegevens verder uitwerken door de spreiding te meten. Gewoonlijk wordt het bereik van de standaardafwijking en de variantie gebruikt om de spreiding te meten. In de beschrijvende statistiek wordt het bereik gedefinieerd als het verschil tussen de hoogste en de laagste waarde. De standaardafwijking en de variantie worden gewoonlijk gebruikt om de spreiding te meten. Standaardafwijking wordt ook wel de kwadratisch gemiddelde afwijking genoemd. Variantie wordt ook gebruikt om de spreiding te meten, die eenvoudig kan worden afgeleid uit het kwadraat van de standaardafwijking. Bezoek onze blogpost over dispersie op deze link voor meer informatie.