Aquí en The Athletic Philadelphia estamos encantados de tener nuestra cobertura de béisbol disparando en todos los cilindros con el entrenamiento de primavera en marcha. Nuestro personal está dedicado a proporcionarle la cobertura de los Phillies de la más alta calidad disponible. Una cosa que no vamos a rehuir es el contenido analítico. En el panorama del béisbol del siglo XXI, en el que las organizaciones de arriba abajo y ustedes, los aficionados, están más informados que nunca, es importante que entendamos y adoptemos los avances sabermétricos que afectan al juego. Dada la predilección por la analítica tanto de la oficina principal de los Phillies como del nuevo cuerpo técnico, esto será aún más crucial a la hora de cubrir la franquicia esta temporada y en el futuro.
Las historias y los aspectos humanos del béisbol siguen siendo tan vitales como siempre. Además de una información convincente, nuestro objetivo es diferenciar nuestra cobertura con un ojo agudo hacia la analítica y la capacidad de engranar esos números con historias que lleguen al corazón del juego. En el clima actual, muchas de las historias más interesantes del béisbol se encuentran en la intersección entre la humanidad del juego y sus vastas estadísticas. Muchos aficionados ya no quieren limitarse a saber que un lanzador está lanzando bien, sino que quieren saber por qué está lanzando bien y si ese éxito es sostenible, además de escuchar las opiniones del lanzador, el entrenador y el director general sobre el asunto. Estos aficionados quieren consumir el juego de una forma más profunda y con más conocimientos.
Lo que me lleva al tema de este artículo. La comunidad analítica del béisbol sigue creciendo, al igual que las herramientas en las que se apoya la comunidad. Aquí queremos exponer muchos de los temas y estadísticas que impulsan a la comunidad analítica y a los que haremos referencia en las historias. No vamos a adaptar nuestra cobertura sólo a los versados en sabermetría y condenar al ostracismo a los que no lo son, pero si usted está interesado en estos conceptos, queremos ayudarle a entenderlos y hacer crecer su conocimiento del juego. No estamos aquí para decirte que eres tonto si no eres un experto en estadísticas; estamos aquí para proporcionarte información que te permita sumergirte completamente y apreciar mejor algunas de nuestras historias. Si tienes preguntas o comentarios después de leer, por favor, házmelo saber en los comentarios, donde podemos continuar la discusión.
Sin más preámbulos …
Ganancias por encima del reemplazo
Probablemente el concepto sabermétrico más ampliamente utilizado, Ganancias por encima del reemplazo (WAR) es una métrica que intenta destilar las contribuciones de un jugador en un solo número. Este número compara las acciones de un jugador con las contribuciones esperadas de un jugador de nivel de reemplazo fácilmente disponible – piense en el típico agente libre de la liga menor o en un jugador de la categoría quad-A. Aunque la base de la estadística son las victorias añadidas en comparación con las de un jugador de nivel de reemplazo, su cálculo se centra en el número de carreras que un jugador añade ofensivamente y el número de carreras que salva a su equipo, ya sea defensivamente o en el montículo. Dado que el objetivo universal del juego es ganar partidos, estos totales de carreras se convierten en victorias. Cada 10 carreras añadidas o salvadas equivalen a 1,0 WAR – por ejemplo, 20 carreras son 2,0 WAR.
Como en la vida, es difícil producir un valor significativo sin dedicar el tiempo necesario. A diferencia de, por ejemplo, el promedio de bateo, un juego sólido no produce una WAR perfecta – 4 de 4 es un promedio de 1.000, pero un juego increíble de béisbol no producirá una WAR de alto calibre. Es una estadística que acumula contribuciones a lo largo del tiempo. Cuanto más largas sean las contribuciones sostenidas, mayor será la WAR.
Diferentes puntos de venta utilizan diferentes estadísticas y métodos para calcular sus versiones de WAR, poniendo un énfasis ligeramente diferente en varios aspectos del juego. Por ejemplo, los cálculos de Baseball Prospectus incluyen el valor añadido de los receptores que enmarcan bien los lanzamientos y roban strikes. El WAR de Fangraph basa la parte de su métrica correspondiente a los lanzamientos en el Fielding Independent Pitching (FIP), una métrica (explicada más adelante en este artículo) que intenta eliminar las contribuciones defensivas de un equipo de las estadísticas de un lanzador.
Los tres tipos principales de WAR son los de Baseball Reference (bWAR o rWAR), Fangraphs (fWAR) y el de Baseball Prospectus, Wins Above Replacement Player (WARP). También incluyen ajustes posicionales, ya que, por ejemplo, jugar de campocorto es más difícil que jugar de primera base y las posiciones más difíciles deben ser recompensadas en una métrica que compara a los jugadores de todas las posiciones.
Según lo proporcionado por Fangraphs, a continuación se muestra una escala de WAR aproximada que se rastrea bastante bien a través de los diferentes cálculos con un ejemplo de un jugador en cada rango de la temporada 2017 (según los números de Fangraphs):
wOBA: Weighted On-Base Average
El promedio ponderado de bases es una métrica ofensiva global que aborda las deficiencias de otras estadísticas ofensivas. Aunque a menudo utilizaremos la línea de golpeo (promedio de bateo/porcentaje de bases/porcentaje de bateo), el wOBA proporciona un número que es más fácil de ver y ahorra tiempo. En lugar de decir que Rhys Hoskins bateó .259/.396/.618 en 2017, podemos decir que tuvo un wOBA de .417. En términos de escala, el wOBA está formateado en una escala similar a la del porcentaje de base. El año pasado, el OBP promedio de la liga fue de .324, mientras que el wOBA promedio de la liga fue de .321.
El wOBA se separa de las métricas de slashline u OPS (On-base más slugging), por ejemplo, al asignar valores únicos a los diferentes métodos para alcanzar la base. Esto es intuitivo, y una de las principales razones por las que algunas métricas simplifican demasiado las cosas – los jonrones son más valiosos que los triples, que son más valiosos que los dobles, etc. También acredita a los jugadores por las caminatas no intencionales. Un bateador que tiene 3 de 10 con tres jonrones está bateando .300, porque el promedio de bateo trata todos los golpes como iguales. Sin embargo, ese mismo bateador tiene un enorme wOBA de .585.
wRC+: Weighted Runs Created Plus
Al igual que el wOBA, esta es una métrica ofensiva muy útil todo en uno. Lo que hace que el wRC+ sea aún más útil es su escala. El wRC+, y todas las demás estadísticas que terminan con un +, se escalan en torno a una media de la liga de 100, y cada punto por encima o por debajo de 100 corresponde a un porcentaje por encima o por debajo de la media de la liga. Aquí hay algunos ejemplos de tipos cercanos a cada uno de los siguientes puntos de referencia de wRC+ en 2017:
180: 80 por ciento por encima del promedio (Mike Trout)
160: 60 por ciento por encima del promedio (José Altuve)
140: 40 por ciento por encima de la media (Paul Goldschmidt)
120: 20 por ciento por encima de la media (Carlos Santana)
100: media de la liga (Ender Inciarte)
90: 10 por ciento por debajo de la media (Jordy Mercer)
80: 20 por ciento por debajo de la media (Freddy Galvis)
La métrica también tiene en cuenta los factores del parque para igualar el campo de juego, ya que algunos estadios son más amigables para los lanzadores o bateadores que otros. Sin embargo, no aplica ajustes posicionales como WAR.
OPS+: On-Base Plus Slugging Plus
Si estás familiarizado con el OPS, y acabas de leer el párrafo anterior que explica el wRC+, entonces el OPS+ debería ser sencillo. OPS es la suma de los porcentajes de on-base y slugging de un jugador, escalados de manera que el promedio de la liga sea 100. Mientras que OPS no es una estadística perfecta porque trata OBP y SLG como iguales (no lo son), no es tremendamente inexacta.
El principal defecto de OPS es que suma esas dos estadísticas, OBP y SLG, que tienen dos denominadores diferentes. En lugar de ajustar esa diferencia, los dos números se mezclan. Además, la investigación de Tom Tango ha demostrado que el OBP es casi dos veces más importante para la producción de carreras que el SLG.
BB% y K%
Un punto focal de una gran parte del análisis sabermétrico es una aversión a las estadísticas de conteo tradicionales (piense en RBIs o hits) a favor de las estadísticas basadas en la tasa (como OBP) o en este caso, la tasa de caminatas (BB%) y la tasa de ponchados (K%). Las estadísticas de conteo, como los totales de caminatas y ponchados, pueden ser engañosas porque eliminan el contexto vital. Por ejemplo: El año pasado, Rich Hill ponchó a 166 bateadores, mientras que Marcus Stroman ponchó a 164. Aunque sus totales de ponchados son casi idénticos, Hill se enfrentó a 552 bateadores y ponchó a más de uno por entrada. Stroman, en cambio, enfrentó a más de 800 bateadores y ponchó a menos de uno por entrada.
Dividiendo el total de ponchados de un jugador entre el total de bateadores a los que se ha enfrentado (o apariciones en el plato, si es un bateador), encontramos el K%. La tasa de strikeout de Hill, del 30,1%, fue aproximadamente un 50% superior a la media de la liga, mientras que el 19,7% de K de Stroman estuvo un poco por debajo de la media, a pesar de que sus totales de strikeout fueron prácticamente idénticos. No es tan importante saber cuántos tipos golpea un lanzador como lo es saber qué probabilidad tiene de golpear a alguien.
BABIP: Promedio de bateo en bolas en juego
Un concepto básico de la Sabermetría, el BABIP mide la frecuencia con la que una bola puesta en juego cae para un hit (excluyendo los strikeouts, las caminatas y los jonrones porque no son técnicamente golpeados en juego y afectados por la defensa). La estadística se utiliza normalmente para analizar la suerte involucrada cuando un lanzador o bateador batea/permite una bola en juego. Los valores atípicos de BABIP suelen volver a la media. Aunque a menudo es un buen indicador de la suerte, no es un dato fidedigno. Muchas cosas pueden influir en el BABIP de un bateador o lanzador. Por ejemplo, los bateadores con una velocidad de élite son más propensos a lanzar bolas de tierra que el bateador medio, y su BABIP debería beneficiarse de ello. Si un lanzador está rodeado de una pésima defensa o permite rutinariamente el contacto duro, sus jardineros son menos propensos a llegar al lugar donde caerá la bola, aumentando así el BABIP del lanzador.
ISO: Potencia Aislada
La potencia aislada es una medida diferente de la capacidad de slugging de un jugador que la diferencia del porcentaje de slugging de una manera importante. El ISO aísla los hits extra-base que conforman el porcentaje de slugging. Mientras que el porcentaje de bateo es una medida de las bases totales (provenientes de los hits) por bateo, el ISO mira las bases extra por bateo. El cálculo es simplemente SLG-AVG.
Por ejemplo, un jugador que está 6 por 10 con seis sencillos tiene un porcentaje de slugging de .600. Eso es enorme, y sugeriría que el jugador es un bateador de poder de primera. Lo que hace el ISO es eliminar los sencillos de la ecuación. Ese mismo jugador, que tiene 6 de 10 con seis sencillos, tiene un ISO de 0,000, porque la potencia aislada sólo tiene en cuenta las bases extra. Si bien este es un ejemplo extremo, demuestra la utilidad del ISO para separar la señal del ruido cuando se trata de identificar a los jugadores con buena potencia bruta.
FIP: Fielding Independent Pitching
Mientras que el ERA ha sido durante mucho tiempo el rey de las métricas de lanzamiento, el FIP fue creado para capturar lo que el ERA ignora en gran medida. El FIP sólo mira las tasas de strikeout, walk y home run permitido de un lanzador, tres áreas principales sobre las que el lanzador tiene el mayor control. Volviendo a la explicación del BABIP anterior, recordarás que la defensa puede tener un gran impacto en la prevención de carreras de un lanzador. Históricamente, el BABIP permitido de los lanzadores a menudo fluctúa de un año a otro, señalando la suerte y la aleatoriedad de las pelotas en juego que se convierten en hits.
El FIP pretende descifrar el valor de un lanzador basándose en aquellas cosas sobre las que tiene más control, de ahí el apelativo de independiente del campo, mientras que anula los efectos de la defensa que tiene detrás. Se utiliza en una escala de ERA, por lo que todo lo que normalmente se considera un buen ERA es un buen FIP.
Valores de lanzamiento de Fangraphs
En un esfuerzo por identificar los lanzamientos exitosos o con problemas en el repertorio de uno, Fangraphs tiene números que asignan valores a las ofertas individuales de cada lanzador. También están disponibles para ver cómo le fue a un bateador contra un determinado tipo de lanzamiento a través de todas las apariciones en el plato.
Cada lanzamiento cambia la cuenta, y cada bola en juego altera el estado del juego. Cada uno de ellos altera lo que llamamos la expectativa de carrera. En esencia, décadas de datos de juego han determinado los aumentos/disminuciones esperados en las carreras anotadas a medida que cambia la cuenta, el número de outs y el número de corredores de base. Los valores de los lanzamientos suman todos los cambios en la expectativa de carrera desde antes de que se lance un lanzamiento hasta después, creando un valor acumulativo para un determinado lanzamiento. Para un lanzador, un lanzamiento que rutinariamente deja a la ofensiva en una peor posición para anotar acumulará un valor más alto que uno que a menudo es golpeado con fuerza o lanzado fuera de la zona.
Disciplina del plato
Fangraphs tiene métricas de disciplina del plato fenomenales que son muy útiles para aprender lo que realmente está sucediendo en los emparejamientos bateador-pitcher. Cuando se utiliza para los bateadores, las métricas detallan cuándo hacen swing y con qué frecuencia hacen contacto. En el caso de los lanzadores, detallan los swings que realizan sus oponentes. Aquí hay conceptos importantes.
Swing%: Porcentaje de swings en todos los lanzamientos
O-Swing%: Porcentaje de swings en lanzamientos fuera de la zona
Z-Swing%: Porcentaje de swings en lanzamientos dentro de la zona
Contacto%: Porcentaje de swings que resultan en un contacto justo
O-Contact%: Porcentaje de lanzamientos bateados fuera de la zona que resultan en un contacto justo
Z-Contact%: Porcentaje de lanzamientos bateados dentro de la zona que resultan en un contacto justo
Zona%: Porcentaje de lanzamientos en la zona de strike
F-Strike%: Porcentaje de primeros lanzamientos que son strikes
SwStr%: Porcentaje de lanzamientos que resultan en swings y misses (diferente de la tasa de whiff, que calcula el porcentaje de swings en los que un bateador hace un whiff)
Muchos de estos son estadísticas muy complejas. Para los no iniciados que no estaban familiarizados con estas métricas, estas definiciones serán suficientes por ahora. Si esto le abre el apetito y está interesado en profundizar, hay mucho más que aprender sobre todas estas estadísticas. Fangraphs tiene fenomenales descripciones en profundidad sobre estas y muchas más métricas.
Para la mayoría de las estadísticas anteriores, las definiciones de trabajo proporcionadas le darán lo que necesita para entender su uso general y su importancia. Para las estadísticas más complejas (como WAR, BABIP o FIP), que tienen cálculos ocultos bajo el capó o mayores implicaciones en conceptos sabermétricos más amplios como la suerte, siempre hay más investigación por hacer y discusiones por tener.
Foto superior: Jonathan Dyer/USA TODAY Sports