Nous, ici à The Athletic Philadelphia, sommes ravis que notre couverture du baseball tire sur tous les cylindres avec l’entraînement de printemps en cours. Notre personnel est dédié à vous fournir la couverture des Phillies de la plus haute qualité disponible. Une chose que nous n’hésiterons pas à faire est le contenu analytique. Dans le paysage du baseball du XXIe siècle, où les organisations et vous, les fans, êtes plus informés que jamais, il est important pour nous de comprendre et d’adopter les progrès de la sabrologie qui ont un impact sur le jeu. Compte tenu à la fois de la prédilection du front office des Phillies et du nouveau personnel d’entraîneurs pour l’analytique, cela sera encore plus crucial pour couvrir la franchise cette saison et à l’avenir.
Les histoires et les aspects humains du baseball sont toujours aussi essentiels. En plus d’un reportage et d’un aperçu convaincants, nous visons à distinguer notre couverture par un regard attentif sur l’analytique et une capacité à mailler ces chiffres avec des histoires qui vont au cœur du jeu. Dans le climat actuel, la plupart des histoires les plus intéressantes du baseball se trouvent à l’intersection de l’humanité du jeu et de ses vastes archives statistiques. De nombreux fans ne veulent plus seulement savoir qu’un lanceur lance bien, ils veulent savoir pourquoi il lance bien, et si ce succès est durable, en plus d’entendre les opinions du lanceur, de l’entraîneur et du directeur général sur le sujet. Ces fans veulent consommer le jeu d’une manière plus approfondie et mieux informée.
Ce qui m’amène au sujet de cette pièce. La communauté analytique du baseball continue de croître, tout comme les outils sur lesquels elle s’appuie. Ici, nous voulons exposer plusieurs des sujets et des statistiques qui animent la communauté analytique et auxquels nous ferons référence dans les articles. Nous n’adapterons pas notre couverture aux seuls initiés à la sabrologie et n’ostraciserons pas ceux qui ne le sont pas, mais si ces concepts vous intéressent, nous voulons vous aider à les comprendre et à approfondir votre connaissance du jeu. Nous ne sommes pas là pour vous dire que vous êtes stupide si vous n’êtes pas un expert en statistiques ; nous sommes là pour vous fournir des informations qui vous permettront de vous immerger pleinement dans certaines de nos histoires et de mieux les apprécier. Si vous avez des questions ou des commentaires après la lecture, faites-le moi savoir dans les commentaires, où nous pourrons poursuivre la discussion.
Sans plus attendre…
Les gains au-dessus du remplacement
Vraisemblablement le concept sabermétrique le plus utilisé, les gains au-dessus du remplacement (WAR) est une métrique qui tente de distiller les contributions d’un joueur en un seul chiffre. Ce nombre compare les actions d’un joueur aux contributions attendues d’un joueur de niveau de remplacement facilement disponible – pensez à votre agent gratuit typique de ligue mineure ou à un joueur de niveau quad A. Bien que la base de la statistique soit les victoires ajoutées par rapport à celles d’un joueur de remplacement, son calcul est centré sur le nombre de courses qu’un joueur ajoute offensivement et le nombre de courses qu’il sauve à son équipe en défense ou sur le monticule. Comme l’objectif universel du jeu est de gagner des matchs, ces totaux de points sont convertis en victoires. Chaque 10 runs ajoutés ou sauvés équivaut à 1,0 WAR – par exemple, 20 runs correspondent à 2,0 WAR.
Comme dans la vie, il est difficile de produire une valeur significative sans y consacrer le temps nécessaire. Contrairement à la moyenne au bâton, par exemple, un jeu solide ne produit pas une WAR parfaite – 4 pour 4 est une moyenne de 1,000, mais un jeu de baseball incroyable ne produira pas une WAR de haut calibre. Il s’agit d’une statistique qui accumule les contributions au fil du temps. Plus les contributions soutenues sont longues, plus la WAR est élevée.
Différents points de vente utilisent différentes statistiques et méthodes pour calculer leurs versions de la WAR, mettant légèrement l’accent sur divers aspects du jeu. Par exemple, les calculs de Baseball Prospectus incluent une valeur ajoutée aux receveurs qui cadrent bien les lancers et volent des prises. La WAR de Fangraph base la partie de sa métrique consacrée aux lanceurs sur le Fielding Independent Pitching (FIP), une métrique (expliquée plus loin dans cet article) qui tente de retirer les contributions défensives d’une équipe des statistiques d’un lanceur.
Les trois principaux types de WAR proviennent de Baseball Reference (bWAR ou rWAR), de Fangraphs (fWAR) et des Wins Above Replacement Player (WARP) de Baseball Prospectus. Ils incluent également des ajustements de position, car, par exemple, jouer à l’arrêt-court est plus difficile que de jouer à la première base et les positions plus difficiles devraient être récompensées dans une métrique qui compare les joueurs de toutes les positions.
Comme fourni par Fangraphs, voici une échelle de WAR approximative qui suit assez bien les différents calculs avec un exemple d’un joueur dans chaque gamme de la saison 2017 (selon les chiffres de Fangraphs):
wOBA : Weighted On-Base Average
La moyenne pondérée sur base est une métrique offensive fourre-tout qui répond aux déficiences des autres statistiques offensives. Alors que nous utiliserons souvent la slashline (moyenne de frappe/pourcentage de base/pourcentage de glissade), la wOBA fournit un chiffre qui est plus facile à lire et permet de gagner du temps. Au lieu de dire que Rhys Hoskins a frappé .259/.396/.618 en 2017, nous pouvons dire qu’il avait un wOBA de .417. En termes d’échelle, le wOBA est formaté selon une échelle similaire à celle du pourcentage sur base. L’année dernière, le OBP moyen de la ligue était de .324, tandis que le wOBA moyen de la ligue était de .321.
Le wOBA se sépare des métriques de slashline ou de l’OPS (On-base plus slugging), par exemple, en attribuant des valeurs uniques aux différentes méthodes pour atteindre les bases. C’est intuitif, et c’est l’une des principales raisons pour lesquelles certaines mesures simplifient trop les choses – les homers ont plus de valeur que les triples, qui ont plus de valeur que les doubles, etc. Elle crédite également les joueurs pour les marches non intentionnelles. Un frappeur qui fait 3 pour 10 avec trois home runs a une moyenne de 0,300, car la moyenne de frappe traite tous les coups comme s’ils étaient égaux. Cependant, ce même frappeur détient un énorme .585 wOBA.
wRC+ : Weighted Runs Created Plus
Comme le wOBA, il s’agit d’une métrique offensive tout-en-un très utile. Ce qui rend wRC+ encore plus utile est son échelle. wRC+, et toutes les autres statistiques qui se terminent par un +, sont mises à l’échelle autour d’une moyenne de ligue de 100, chaque point au-dessus ou en dessous de 100 correspondant à un pourcentage au-dessus ou en dessous de la moyenne de la ligue. Voici quelques exemples de gars proches de chacun des repères wRC+ suivants en 2017 :
180 : 80 pour cent au-dessus de la moyenne (Mike Trout)
160 : 60 pour cent au-dessus de la moyenne (Jose Altuve)
140 : 40 pour cent au-dessus de la moyenne (Paul Goldschmidt)
120 : 20 pour cent au-dessus de la moyenne (Carlos Santana)
100 : moyenne de la ligue (Ender Inciarte)
90 : 10 pour cent en dessous de la moyenne (Jordy Mercer)
80 : 20 pour cent en dessous de la moyenne (Freddy Galvis)
La métrique tient également compte des facteurs de parc pour égaliser le terrain de jeu, car certains stades sont plus favorables aux lanceurs ou aux frappeurs que d’autres. Cependant, elle n’applique pas d’ajustements positionnels comme WAR.
OPS+ : On-Base Plus Slugging Plus
Si vous êtes familier avec l’OPS, et que vous venez de lire le paragraphe ci-dessus expliquant le wRC+, alors l’OPS+ devrait être simple. L’OPS est la somme des pourcentages on-base et slugging d’un joueur, mis à l’échelle pour que la moyenne de la ligue soit de 100. Bien que l’OPS ne soit pas une statistique parfaite parce qu’elle traite l’OBP et le SLG comme égaux (ils ne le sont pas), elle n’est pas follement inexacte.
Le principal défaut de l’OPS est qu’il additionne ces deux statistiques, l’OBP et le SLG, qui ont deux dénominateurs différents. Au lieu d’ajuster pour cette différence, les deux nombres sont juste écrasés ensemble. En outre, les recherches de Tom Tango ont montré que l’OBP est presque deux fois plus important pour la production de courses que le SLG.
BB% et K%
Un point central d’une grande partie de l’analyse sabermétrique est une aversion pour les statistiques de comptage traditionnelles (pensez aux RBI ou aux hits) en faveur de statistiques basées sur le taux (comme l’OBP) ou, dans ce cas, le taux de marche (BB%) et le taux de strikeout (K%). Les statistiques de comptage, comme les simples totaux de marches et de strikeouts, peuvent être trompeuses car elles ne tiennent pas compte du contexte. Par exemple : L’année dernière, Rich Hill a éliminé 166 frappeurs, tandis que Marcus Stroman en a éliminé 164. Bien que leurs totaux de retraits soient à peu près identiques, Hill a affronté 552 frappeurs et a retiré plus d’un frappeur par manche. Stroman, quant à lui, a affronté plus de 800 frappeurs et en a retiré moins d’un par manche.
En divisant le total de strikeouts d’un joueur par son total de batteurs affrontés (ou d’apparitions au marbre, s’il s’agit d’un frappeur), on obtient le K%. Le taux de strikeout de Hill de 30,1% était environ 50% au-dessus de la moyenne de la ligue, tandis que le K% de Stroman de 19,7 était un peu en dessous de la moyenne, malgré leurs totaux de strikeout pratiquement identiques. Il n’est pas aussi important de savoir combien de gars un lanceur élimine que de savoir quelle est la probabilité qu’il élimine quelqu’un.
BABIP : Batting Average on Balls In Play
Un concept sabermétrique de base, le BABIP mesure la fréquence à laquelle une balle mise en jeu tombe pour un hit (excluant les strikeouts, les walks et les homers car ils ne sont pas techniquement mis en jeu et affectés par la défense). Cette statistique est généralement utilisée pour déterminer la part de chance impliquée lorsqu’un lanceur ou un frappeur frappe/permet une balle en jeu. Les valeurs aberrantes du BABIP régressent généralement vers la moyenne. Bien qu’il soit souvent un bon indicateur de la chance, il ne fait pas autorité. De nombreux facteurs peuvent avoir un impact sur le BABIP d’un frappeur ou d’un lanceur. Par exemple, les frappeurs dotés d’une vitesse d’élite sont plus susceptibles d’envoyer des balles au sol que le frappeur moyen, et leur BABIP devrait en bénéficier. Si un lanceur est entouré d’une défense lamentable ou qu’il autorise régulièrement des contacts durs, ses joueurs de champ sont moins susceptibles de se rendre à l’endroit où la balle va atterrir, ce qui augmente le BABIP du lanceur.
ISO : Puissance isolée
La puissance isolée est une mesure différente de la capacité de slugging d’un joueur qui la différencie du pourcentage de slugging d’une manière majeure. L’ISO isole les coups extra-base qui constituent le pourcentage de slugging. Alors que le slugging percentage est une mesure des bases totales (provenant des hits) par at-bat, l’ISO s’intéresse aux bases supplémentaires par at-bat. Le calcul est simplement SLG-AVG.
Par exemple, un joueur qui est 6 pour 10 avec six simples détient un pourcentage de slugging de .600. C’est énorme, et cela suggérerait que le joueur est un frappeur de puissance de premier ordre. L’ISO ne tient pas compte des simples dans l’équation. Ce même joueur, qui est à 6 contre 10 avec six simples, a un ISO de 0,000, car la puissance isolée ne tient compte que des bases supplémentaires. Bien que cet exemple soit sûrement extrême, il démontre l’utilité de l’ISO pour séparer le signal du bruit lorsqu’on essaie d’identifier des joueurs avec une bonne puissance brute.
FIP : Fielding Independent Pitching
Alors que l’ERA a longtemps été le roi des métriques de lancer, le FIP a été créé pour capturer ce que l’ERA ignore largement. Le FIP examine juste les taux de strikeout, de walk et de home run autorisés d’un lanceur, trois domaines principaux sur lesquels le lanceur a le plus de contrôle. Pour en revenir à l’explication du BABIP ci-dessus, vous vous souviendrez que la défense peut avoir un impact considérable sur la prévention des courses d’un lanceur. Historiquement, le BABIP autorisé des lanceurs fluctue souvent d’une année à l’autre, ce qui témoigne de la chance et du caractère aléatoire des balles en jeu qui se transforment en hits.
Le FIP vise à décrypter la valeur d’un lanceur en fonction des éléments sur lesquels il a le plus de contrôle, d’où le surnom de Fielding Independent, tout en annulant les effets de la défense derrière lui. Il est utilisé sur une échelle ERA, donc tout ce que vous penseriez typiquement être une bonne ERA est un bon FIP.
Valeurs des lancers de Fangraphs
Dans un effort pour identifier les lancers réussis ou en difficulté dans son répertoire, Fangraphs a des chiffres qui attribuent des valeurs aux offres individuelles de chaque lanceur. Ils sont également disponibles pour voir comment un frappeur s’est comporté contre un certain type de lancer sur l’ensemble des apparitions au sol.
Chaque lancer modifie le compte, et chaque balle en jeu modifie l’état du jeu. Chacun de ces éléments modifie ce que nous appelons l’espérance de course. Essentiellement, des décennies de données de jeu ont déterminé les augmentations/diminutions attendues du nombre de runs marqués lorsque le compte, le nombre d’outs et le nombre de baserunners changent. Les valeurs des lancers additionnent tous les changements dans l’espérance de points entre le moment où un lancer est effectué et le moment où il est effectué, créant ainsi une valeur cumulative pour un lancer donné. Pour un lanceur, un lancer qui laisse régulièrement l’attaque dans une moins bonne position pour marquer accumulera une valeur plus élevée qu’un lancer qui est souvent frappé fort ou lancé en dehors de la zone.
Discipline de plaque
Fangraphs possède des métriques de discipline de plaque phénoménales qui sont très utiles pour apprendre ce qui se passe réellement dans les matchs frappeur-lanceur. Lorsqu’elles sont utilisées pour les batteurs, les métriques détaillent quand ils s’élancent et à quelle fréquence ils font contact. Pour les lanceurs, elles détaillent les mouvements de leurs adversaires. Voici les concepts importants .
Swing% : Pourcentage de swings sur tous les lancers
O-Swing% : Pourcentage de swings sur les lancers en dehors de la zone
Z-Swing% : Pourcentage de swings sur les lancers à l’intérieur de la zone
Contact% : Pourcentage de swings résultant en un contact équitable
O-Contact% : Pourcentage de lancers balancés à l’extérieur de la zone qui entraînent un contact franc
Z-Contact% : Pourcentage de lancers frappés à l’intérieur de la zone qui donnent lieu à un contact équitable
Zone% : Pourcentage de lancers dans la zone de strike
F-Strike% : Pourcentage de premiers lancers qui sont des strikes
SwStr% : Pourcentage de lancers résultant en des swings et des misses (différent du whiff rate, qui calcule le pourcentage de swings dans lesquels un batteur fait un whiff)
Plusieurs de ces statistiques sont très complexes. Pour les non-initiés qui n’étaient auparavant pas familiers avec ces métriques, ces définitions suffiront pour le moment. Si cela vous a mis en appétit et que vous souhaitez creuser davantage, il y a beaucoup plus à apprendre sur toutes ces statistiques. Fangraphs a des descriptions phénoménales et approfondies sur ces métriques et bien d’autres encore.
Pour la majorité des statistiques ci-dessus, les définitions de travail fournies vous donneront ce dont vous avez besoin pour comprendre leur utilisation générale et leur importance. Pour les statistiques plus complexes (comme WAR, BABIP ou FIP), qui ont des calculs cachés sous le capot ou des implications plus importantes sur des concepts sabermétriques plus larges comme la chance, il y a toujours plus de recherches à faire et de discussions à avoir.
Photo du haut : Jonathan Dyer/USA TODAY Sports
COMMENCEZ UN ESSAI GRATUIT