Was ist Statistik?
Die Statistik ist ein Zweig der angewandten Mathematik, der sich mit der Erfassung, Beschreibung, Analyse und Ableitung von Schlussfolgerungen aus quantitativen Daten beschäftigt. Die mathematischen Theorien hinter der Statistik stützen sich stark auf die Differential- und Integralrechnung, die lineare Algebra und die Wahrscheinlichkeitsrechnung. Statistiker beschäftigen sich insbesondere damit, wie man aus den beobachtbaren Merkmalen kleiner Stichproben, die nur einen kleinen Teil der großen Gruppe oder eine begrenzte Anzahl von Instanzen eines allgemeinen Phänomens repräsentieren, verlässliche Schlussfolgerungen über große Gruppen und allgemeine Phänomene ziehen kann.
Die beiden Hauptbereiche der Statistik sind bekannt als deskriptive Statistik, die die Eigenschaften von Stichproben- und Populationsdaten beschreibt, und als inferenzielle Statistik, die diese Eigenschaften nutzt, um Hypothesen zu testen und Schlussfolgerungen zu ziehen.
Zu den gängigen statistischen Werkzeugen und Verfahren gehören die folgenden:
- Deskriptiv
- Mittelwert (Durchschnitt)
- Varianz
- Skewness
- Kurtosis
- Inferentiell
- Linienregressionsanalyse
- Analyse der Varianzanalyse (ANOVA)
- Logit/Probit-Modelle
- Nullhypothesentest
Key Takeaways
- Statistik ist das Studium und die Verarbeitung von Daten, einschließlich der Methoden zum Sammeln, Überprüfen, Analysieren und Ziehen von Schlussfolgerungen aus Daten.
- Die zwei Hauptbereiche der Statistik sind die deskriptive und die inferentielle Statistik.
- Statistik kann verwendet werden, um besser informierte Geschäfts- und Investitionsentscheidungen zu treffen.
Statistik
Statistik verstehen
Statistik wird in praktisch allen wissenschaftlichen Disziplinen wie den Natur- und Sozialwissenschaften sowie in der Wirtschaft, den Geisteswissenschaften, der Regierung und der Produktion eingesetzt. Statistik ist im Grunde ein Zweig der angewandten Mathematik, der sich aus der Anwendung mathematischer Werkzeuge wie Kalkül und linearer Algebra auf die Wahrscheinlichkeitstheorie entwickelt hat.
In der Praxis ist Statistik die Idee, dass wir etwas über die Eigenschaften großer Mengen von Objekten oder Ereignissen (einer Population) lernen können, indem wir die Eigenschaften einer kleineren Anzahl ähnlicher Objekte oder Ereignisse (einer Stichprobe) untersuchen. Da es in vielen Fällen zu kostspielig, schwierig oder schlichtweg unmöglich ist, umfassende Daten über eine gesamte Population zu sammeln, beginnt die Statistik mit einer Stichprobe, die bequem oder kostengünstig beobachtet werden kann.
Zwei Arten von statistischen Methoden werden bei der Analyse von Daten verwendet: die deskriptive Statistik und die inferentielle Statistik. Statistiker messen und sammeln Daten über die Individuen oder Elemente einer Stichprobe und analysieren dann diese Daten, um deskriptive Statistiken zu erstellen. Sie können dann diese beobachteten Merkmale der Stichprobendaten, die korrekt als „Statistik“ bezeichnet werden, verwenden, um Rückschlüsse oder Vermutungen über die nicht gemessenen (oder ungemessenen) Merkmale der breiteren Grundgesamtheit, die als Parameter bezeichnet werden, anzustellen.
Deskriptive Statistik
Die deskriptive Statistik konzentriert sich meist auf die zentrale Tendenz, die Variabilität und die Verteilung der Stichprobendaten. Zentrale Tendenz bedeutet die Schätzung der Merkmale, ein typisches Element einer Stichprobe oder Population, und umfasst deskriptive Statistiken wie Mittelwert, Median und Modus. Die Variabilität bezieht sich auf eine Reihe von Statistiken, die zeigen, wie viel Unterschied zwischen den Elementen einer Stichprobe oder Grundgesamtheit entlang der gemessenen Merkmale besteht, und umfasst Messgrößen wie Bereich, Varianz und Standardabweichung.
Die Verteilung bezieht sich auf die allgemeine „Form“ der Daten, die in einem Diagramm wie einem Histogramm oder Punktdiagramm dargestellt werden kann, und umfasst Eigenschaften wie die Wahrscheinlichkeitsverteilungsfunktion, Schiefe und Kurtosis. Deskriptive Statistiken können auch Unterschiede zwischen beobachteten Merkmalen der Elemente eines Datensatzes beschreiben. Deskriptive Statistiken helfen uns, die kollektiven Eigenschaften der Elemente einer Datenstichprobe zu verstehen und bilden die Grundlage für das Testen von Hypothesen und das Treffen von Vorhersagen mit Hilfe der Inferenzstatistik.
Inferenzstatistik
Inferenzstatistiken sind Werkzeuge, die Statistiker verwenden, um aus den Merkmalen einer Stichprobe Rückschlüsse auf die Merkmale einer Grundgesamtheit zu ziehen und zu entscheiden, wie sicher sie hinsichtlich der Zuverlässigkeit dieser Rückschlüsse sein können. Basierend auf dem Stichprobenumfang und der Verteilung der Stichprobendaten können Statistiker die Wahrscheinlichkeit berechnen, dass die Statistik, die die zentrale Tendenz, die Variabilität, die Verteilung und die Beziehungen zwischen den Merkmalen innerhalb einer Datenstichprobe misst, ein genaues Bild der entsprechenden Parameter der gesamten Grundgesamtheit liefert, aus der die Stichprobe gezogen wurde.
Inferenzstatistiken werden verwendet, um Verallgemeinerungen über große Gruppen zu treffen, wie z. B. die Schätzung der durchschnittlichen Nachfrage nach einem Produkt durch Befragung einer Stichprobe der Kaufgewohnheiten von Verbrauchern, oder um zu versuchen, zukünftige Ereignisse vorherzusagen, wie z. B. die Projektion der zukünftigen Rendite eines Wertpapiers oder einer Anlageklasse auf der Grundlage der Renditen in einem Stichprobenzeitraum.
Die Regressionsanalyse ist eine gängige Methode der statistischen Inferenz, die versucht, die Stärke und den Charakter der Beziehung (oder der Korrelation) zwischen einer abhängigen Variable (normalerweise mit Y bezeichnet) und einer Reihe anderer Variablen (bekannt als unabhängige Variablen) zu bestimmen. Die Ausgabe eines Regressionsmodells kann auf statistische Signifikanz analysiert werden, was sich auf die Behauptung bezieht, dass ein Ergebnis von Befunden, die durch Tests oder Experimente generiert wurden, wahrscheinlich nicht zufällig oder durch Zufall aufgetreten ist, sondern stattdessen wahrscheinlich auf eine bestimmte Ursache zurückzuführen ist, die durch die Daten aufgeklärt wurde. Die statistische Signifikanz ist wichtig für akademische Disziplinen oder Praktiker, die stark auf die Analyse von Daten und Forschung angewiesen sind.
Häufig gestellte Fragen
Was ist der Unterschied zwischen deskriptiver und inferentieller Statistik?
Deskriptive Statistiken werden verwendet, um die Merkmale einer Stichprobe oder eines Datensatzes zu beschreiben oder zusammenzufassen, wie z. B. den Mittelwert, die Standardabweichung oder die Häufigkeit einer Variable. Die Inferenzstatistik hingegen verwendet eine Vielzahl von Techniken, um Variablen in einem Datensatz miteinander in Beziehung zu setzen, z. B. durch Korrelations- oder Regressionsanalysen. Diese können dann verwendet werden, um Vorhersagen zu schätzen oder Kausalität abzuleiten.
Wer verwendet Statistik?
Statistiken werden in einer Vielzahl von Anwendungen und Berufen eingesetzt. Jedes Mal, wenn Daten gesammelt und analysiert werden, wird Statistik betrieben. Dies kann von Regierungsbehörden über akademische Forschung bis hin zur Analyse von Investitionen reichen.
Wie wird Statistik in der Wirtschafts- und Finanzwelt eingesetzt?
Ökonomen sammeln und betrachten alle Arten von Daten, von Verbraucherausgaben über Wohnungsbau bis hin zu Inflation und BIP-Wachstum. Im Finanzwesen sammeln Analysten und Investoren Daten über Unternehmen, Branchen, Stimmungen und Marktdaten über Preise und Volumen. Die Verwendung von inferentieller Statistik in diesen Bereichen wird als Ökonometrie bezeichnet. Mehrere wichtige Finanzmodelle, vom CAPM über die Moderne Portfoliotheorie (MPT) bis hin zum Black-Scholes-Optionspreismodell, beruhen auf statistischer Inferenz.