Que sont les statistiques ?
Les statistiques sont une branche des mathématiques appliquées qui implique la collecte, la description, l’analyse et la déduction de conclusions à partir de données quantitatives. Les théories mathématiques qui sous-tendent les statistiques reposent en grande partie sur le calcul différentiel et intégral, l’algèbre linéaire et la théorie des probabilités. Les statisticiens, c’est-à-dire les personnes qui font de la statistique, s’attachent particulièrement à déterminer comment tirer des conclusions fiables sur de grands groupes et des phénomènes généraux à partir des caractéristiques observables de petits échantillons qui ne représentent qu’une petite partie du grand groupe ou un nombre limité d’occurrences d’un phénomène général.
Les deux grands domaines de la statistique sont connus sous le nom de statistique descriptive, qui décrit les propriétés des données de l’échantillon et de la population, et de statistique inférentielle, qui utilise ces propriétés pour tester des hypothèses et tirer des conclusions.
Certains outils et procédures statistiques courants comprennent les éléments suivants :
- Descriptive
- Moyenne (average)
- Variance
- Skewness
- Kurtosis
- Inférentielle
- Analyse de régression linéaire
- Analyse de la variance (ANOVA)
- L’analyse de la variance (ANOVA)
- Modèles Logit/Probit
- Test d’hypothèse nulle
. variance (ANOVA)
Principaux enseignements
- Les statistiques sont l’étude et la manipulation des données, y compris les moyens de recueillir, examiner, analyser et tirer des conclusions des données.
- Les deux principaux domaines des statistiques sont les statistiques descriptives et inférentielles.
- Les statistiques peuvent être utilisées pour prendre des décisions commerciales et d’investissement mieux informées.
Statistiques
Comprendre les statistiques
Les statistiques sont utilisées dans pratiquement toutes les disciplines scientifiques telles que les sciences physiques et sociales, ainsi que dans les affaires, les sciences humaines, le gouvernement et la fabrication. La statistique est fondamentalement une branche des mathématiques appliquées qui s’est développée à partir de l’application d’outils mathématiques, notamment le calcul et l’algèbre linéaire, à la théorie des probabilités.
En pratique, la statistique est l’idée que nous pouvons apprendre les propriétés de grands ensembles d’objets ou d’événements (une population) en étudiant les caractéristiques d’un plus petit nombre d’objets ou d’événements similaires (un échantillon). Parce que dans de nombreux cas, la collecte de données complètes sur une population entière est trop coûteuse, difficile ou carrément impossible, les statistiques commencent par un échantillon qui peut être observé de manière pratique ou abordable.
Deux types de méthodes statistiques sont utilisés pour analyser les données : les statistiques descriptives et les statistiques inférentielles. Les statisticiens mesurent et recueillent des données sur les individus ou les éléments d’un échantillon, puis analysent ces données pour générer des statistiques descriptives. Ils peuvent ensuite utiliser ces caractéristiques observées des données de l’échantillon, appelées à juste titre « statistiques », pour faire des inférences ou des suppositions éclairées sur les caractéristiques non mesurées (ou non mesurables) de la population plus large, appelées paramètres.
Statistiques descriptives
Les statistiques descriptives se concentrent surtout sur la tendance centrale, la variabilité et la distribution des données de l’échantillon. La tendance centrale désigne l’estimation des caractéristiques, un élément typique d’un échantillon ou d’une population, et comprend des statistiques descriptives telles que la moyenne, la médiane et le mode. La variabilité fait référence à un ensemble de statistiques qui montrent la différence entre les éléments d’un échantillon ou d’une population le long des caractéristiques mesurées, et comprend des métriques telles que l’étendue, la variance et l’écart type.
La distribution fait référence à la « forme » globale des données, qui peut être représentée sur un graphique tel qu’un histogramme ou un graphique en points, et comprend des propriétés telles que la fonction de distribution de probabilité, l’asymétrie et l’aplatissement. Les statistiques descriptives peuvent également décrire les différences entre les caractéristiques observées des éléments d’un ensemble de données. Les statistiques descriptives nous aident à comprendre les propriétés collectives des éléments d’un échantillon de données et constituent la base pour tester des hypothèses et faire des prédictions à l’aide des statistiques inférentielles.
Statistiques inférentielles
Les statistiques inférentielles sont des outils que les statisticiens utilisent pour tirer des conclusions sur les caractéristiques d’une population à partir des caractéristiques d’un échantillon et pour décider du degré de certitude de la fiabilité de ces conclusions. En fonction de la taille de l’échantillon et de la distribution des données de l’échantillon, les statisticiens peuvent calculer la probabilité que les statistiques, qui mesurent la tendance centrale, la variabilité, la distribution et les relations entre les caractéristiques au sein d’un échantillon de données, donnent une image précise des paramètres correspondants de l’ensemble de la population dont l’échantillon est tiré.
Les statistiques inférentielles sont utilisées pour faire des généralisations sur de grands groupes, comme l’estimation de la demande moyenne d’un produit en interrogeant un échantillon des habitudes d’achat des consommateurs, ou pour tenter de prédire des événements futurs, comme la projection du rendement futur d’un titre ou d’une classe d’actifs sur la base des rendements d’une période échantillon.
L’analyse de régression est une méthode courante d’inférence statistique qui tente de déterminer la force et le caractère de la relation (ou corrélation) entre une variable dépendante (généralement désignée par Y) et une série d’autres variables (appelées variables indépendantes). Le résultat d’un modèle de régression peut être analysé pour déterminer la signification statistique, qui fait référence à l’affirmation selon laquelle un résultat obtenu par des tests ou des expériences n’est pas susceptible d’avoir été obtenu de manière aléatoire ou par hasard, mais est plutôt susceptible d’être attribuable à une cause spécifique élucidée par les données. Avoir une signification statistique est important pour les disciplines universitaires ou les praticiens qui s’appuient fortement sur l’analyse des données et la recherche.
Foire aux questions
Quelle est la différence entre les statistiques descriptives et inférentielles ?
Les statistiques descriptives sont utilisées pour décrire ou résumer les caractéristiques d’un échantillon ou d’un ensemble de données, telles que la moyenne, l’écart-type ou la fréquence d’une variable. Les statistiques inférentielles, en revanche, emploient un certain nombre de techniques pour relier les variables d’un ensemble de données les unes aux autres, par exemple en utilisant la corrélation ou l’analyse de régression. Celles-ci peuvent ensuite être utilisées pour estimer les prévisions ou déduire la causalité.
Qui utilise les statistiques ?
Les statistiques sont largement utilisées dans un éventail d’applications et de professions. Chaque fois que des données sont collectées et analysées, on fait des statistiques. Cela peut aller des agences gouvernementales à la recherche universitaire en passant par l’analyse des investissements.
Comment les statistiques sont-elles utilisées en économie et en finance ?
Les économistes collectent et examinent toutes sortes de données, allant des dépenses de consommation aux mises en chantier, en passant par l’inflation et la croissance du PIB. En finance, les analystes et les investisseurs recueillent des données sur les entreprises, les industries, le sentiment, et les données du marché sur les prix et les volumes. Ensemble, l’utilisation de statistiques déductives dans ces domaines est connue sous le nom d’économétrie. Plusieurs modèles financiers importants, du CAPM à la théorie moderne du portefeuille (MPT) et au modèle d’évaluation des options de Black-Scholes, reposent sur l’inférence statistique.
.