Co to jest statystyka?
Statystyka jest dziedziną matematyki stosowanej, która zajmuje się zbieraniem, opisem, analizą i wnioskowaniem na podstawie danych ilościowych. Teorie matematyczne stojące za statystyką w dużym stopniu opierają się na rachunku różniczkowym i całkowym, algebrze liniowej i teorii prawdopodobieństwa. Statystycy, ludzie zajmujący się statystyką, są szczególnie zainteresowani ustaleniem, jak wyciągać wiarygodne wnioski na temat dużych grup i ogólnych zjawisk na podstawie obserwowalnych cech małych próbek, które reprezentują tylko niewielką część dużej grupy lub ograniczoną liczbę przypadków ogólnego zjawiska.
Dwa główne obszary statystyki są znane jako statystyka opisowa, która opisuje właściwości próbki i danych populacji, oraz statystyka wnioskowania, która wykorzystuje te właściwości do testowania hipotez i wyciągania wniosków.
Niektóre popularne narzędzia i procedury statystyczne obejmują następujące elementy:
- Opisowe
- Średnia
- Wariancja
- Skośność
- Kurtoza
- Inferencyjne
- Analiza regresji
- Analiza wariancji (ANOVA)
- Modele logit/Probit
- Testowanie hipotez zerowych
Key Takeaways
- Statystyka jest badaniem i manipulowaniem danymi, w tym sposoby gromadzenia, przeglądania, analizowania i wyciągania wniosków z danych.
- Dwa główne obszary statystyki to statystyka opisowa i wnioskowa.
- Statystyka może być wykorzystywana do podejmowania bardziej świadomych decyzji biznesowych i inwestycyjnych.
Statystyka
Zrozumienie statystyki
Statystyka jest wykorzystywana praktycznie we wszystkich dyscyplinach naukowych, takich jak nauki fizyczne i społeczne, a także w biznesie, naukach humanistycznych, rządzie i produkcji. Statystyka jest zasadniczo gałęzią matematyki stosowanej, która rozwinęła się z zastosowania narzędzi matematycznych, w tym rachunku i algebry liniowej do teorii prawdopodobieństwa.
W praktyce statystyka jest ideą, że możemy dowiedzieć się o właściwościach dużych zbiorów obiektów lub zdarzeń (populacja) poprzez badanie cech mniejszej liczby podobnych obiektów lub zdarzeń (próbka). Ponieważ w wielu przypadkach zebranie wyczerpujących danych o całej populacji jest zbyt kosztowne, trudne lub wręcz niemożliwe, statystyka zaczyna się od próbki, która może być wygodnie lub tanio obserwowana.
Dwa rodzaje metod statystycznych są wykorzystywane w analizie danych: statystyka opisowa i statystyka wnioskowania. Statystycy mierzą i gromadzą dane o osobach lub elementach próby, a następnie analizują te dane w celu wygenerowania statystyk opisowych. Mogą oni następnie wykorzystać te zaobserwowane cechy danych z próby, które są właściwie nazywane „statystykami”, aby wnioskować lub zgadywać na temat niezmierzonych (lub niemierzonych) cech szerszej populacji, zwanych parametrami.
Statystyki opisowe
Statystyki opisowe koncentrują się głównie na tendencji centralnej, zmienności i dystrybucji danych z próby. Tendencja centralna oznacza oszacowanie charakterystyki, typowy element próbki lub populacji, i obejmuje statystyki opisowe, takie jak średnia, mediana i tryb. Zmienność odnosi się do zbioru statystyk, które pokazują, jak duża jest różnica pomiędzy elementami próbki lub populacji wzdłuż mierzonych cech, i obejmuje takie wskaźniki, jak zakres, wariancja i odchylenie standardowe.
Rozkład odnosi się do ogólnego „kształtu” danych, który może być przedstawiony na wykresie, takim jak histogram lub wykres kropkowy, i obejmuje właściwości, takie jak funkcja rozkładu prawdopodobieństwa, skośność i kurtoza. Statystyki opisowe mogą również opisywać różnice pomiędzy obserwowanymi cechami elementów zbioru danych. Statystyki opisowe pomagają nam zrozumieć zbiorowe właściwości elementów próby danych i stanowią podstawę do testowania hipotez i tworzenia przewidywań przy użyciu statystyk inferencyjnych.
Statystyki inferencyjne
Statystyki inferencyjne są narzędziami, które statystycy wykorzystują do wyciągania wniosków na temat cech populacji na podstawie cech próby i do decydowania, jak pewni mogą być wiarygodności tych wniosków. Na podstawie wielkości próbki i rozkładu danych z próbki statystycy mogą obliczyć prawdopodobieństwo, że statystyki, które mierzą tendencję centralną, zmienność, rozkład i relacje między cechami w obrębie próbki danych, dają dokładny obraz odpowiadających im parametrów całej populacji, z której próbka jest pobierana.
Statystyki wnioskowania są wykorzystywane do dokonywania uogólnień na temat dużych grup, takich jak szacowanie średniego popytu na produkt poprzez badanie próbki zwyczajów zakupowych konsumentów, lub do prób przewidywania przyszłych zdarzeń, takich jak prognozowanie przyszłego zwrotu z papierów wartościowych lub klasy aktywów na podstawie zwrotów w okresie próbnym.
Analiza regresji jest powszechną metodą wnioskowania statystycznego, która próbuje określić siłę i charakter związku (lub korelacji) między jedną zmienną zależną (zwykle oznaczaną jako Y) a szeregiem innych zmiennych (zwanych zmiennymi niezależnymi). Dane wyjściowe modelu regresji mogą być analizowane pod kątem istotności statystycznej, która odnosi się do twierdzenia, że wynik ustaleń uzyskanych w wyniku badań lub eksperymentów prawdopodobnie nie wystąpił przypadkowo lub przez przypadek, ale że można go przypisać konkretnej przyczynie wyjaśnionej przez dane. Posiadanie istotności statystycznej jest ważne dla dyscyplin akademickich lub praktyków, którzy w dużym stopniu polegają na analizie danych i badaniach.
Często zadawane pytania
Jaka jest różnica między statystyką opisową a wnioskowaniem?
Statystyki opisowe są używane do opisywania lub podsumowywania cech próbki lub zestawu danych, takich jak średnia, odchylenie standardowe lub częstotliwość zmiennej. Statystyka wnioskowania, w przeciwieństwie do tego, wykorzystuje dowolną liczbę technik do powiązania zmiennych w zbiorze danych ze sobą, na przykład przy użyciu analizy korelacji lub regresji. Mogą być one następnie wykorzystane do oszacowania prognoz lub wnioskowania o przyczynowości.
Kto korzysta z danych statystycznych?
Statystyka jest szeroko wykorzystywana w wielu zastosowaniach i zawodach. Statystyka jest wykorzystywana w każdym przypadku, gdy dane są zbierane i analizowane. Może to dotyczyć zarówno agencji rządowych, badań akademickich, jak i analizowania inwestycji.
Jak statystyki są wykorzystywane w ekonomii i finansach?
Ekonomiści zbierają i analizują wszelkiego rodzaju dane, począwszy od wydatków konsumenckich, poprzez rozpoczęcie budowy domów, inflację, aż po wzrost PKB. W finansach, analitycy i inwestorzy zbierają dane o firmach, branżach, nastrojach, a także dane rynkowe dotyczące cen i wolumenu. Łącznie, zastosowanie statystyki wnioskowania w tych dziedzinach znane jest jako ekonometria. Kilka ważnych modeli finansowych, od CAPM do Nowoczesnej Teorii Portfelowej (MPT) i modelu wyceny opcji Blacka-Scholesa, opiera się na wnioskowaniu statystycznym.