¿Puede predecir la curva de recuperación de nuestro pulso nuestro grado de fatiga? #Colaboración

Estimados amigos, tras un par de semanas en el dique seco pero con muchos artículos en el horno, comenzamos a lanzar nuevos contenidos en el blog de datos y deporte.

En esta ocasión nos estrenamos con una colaboración externa, que seguro que no será la última.

Como comentaba en el primer artículo del blog sobre los objetivos del mismo, pretende ser un punto de encuentro y d contacto de profesionales y aficionados al mundo del análisis de datos deportivos y aquí fructifica otra de las colaboraciones que han surgido a través del mismo.

En primer lugar os haré una sucinta presentación de Marcos y a continuación dejaré que sea él mismo el que os proponga una colaboración que seguro que os gustará.

Marcos Matabuena contactó conmigo comentando las primeras publicaciones del blog a través de facebook. Graduado en matemáticas y realizando un master oficial en estadística en la Universidad de Santiago de Compostela, Marcos siempre ha tenido clara la relación entre las matemáticas y el deporte. Deportista desde edad escolar con tan solo 16 años se dio cuenta de que las matemáticas serían el futuro que guiarían el entrenamiento deportivo y por ello decidió que sería su objetivo profesional y que las utilizaría tanto como deportista como en su faceta de entrenador o preparador físico.

En la actualidad, con el uso de matemáticas avanzadas y técnicas como el análisis de datos predictivo y otras muchas Marcos ve relativamente cercana la posibilidad de desarrollar métodos y aplicaciones que ayuden a entrenadores y deportistas a ajustar las cargas de entrenamiento y a cuantificar tanto dichas cargas como la recuperación y asimilación de las mismas.

En esta colaboración que os va a presentar a continuación, su objetivo es dar una vuelta de tuerca, matemática, a los datos del pulso que, por ahora, no parece que estén dando una información muy valiosa a deportistas y entrenadores, siendo superadas en algunas disciplinas, como el ciclismo, por los datos de potencia.

Pero no me enrollo más y os dejo con Marcos y ya sabéis que podéis realizar consultas o enviar datos a través de mi cuenta villalobos@bigml.com o con comentarios en el blog:

IMG_20150210_224729

“Mi nombre es Marcos Matabuena y soy estudiante del master de estadística de la universidad de Santiago de Compostela. Aparte de mi papel como estudiante, soy un apasiado del rendimiento deportivo y en mis tiempos libres me dedico a la investigación deportiva (https://www.youtube.com/watch?v=k5cc7irlA4k) en la que me encuentro colaborando con diversos investigadores extranjeros.

El tema central de mis investigaciones se centran en poder predecir los cambios de forma física inducidos por el entrenamiento de manera individualizada y en la que he creado una nueva versión del “modelo de Banister” con retardos.
Actualmente tengo en mente un nuevo proyecto, que consiste en introducir una nueva rama de la estadística (functional data analysis) con los datos de frecuencia cardiaca y necesito vuestra colaboración para la adquisión de vuestros datos de entrenamiento.

El estudio tiene como finalidad ver si con la “curva de frecuencia cardiaca” y su recuperación podemos predecir la valoración subjectiva percibida por el atleta con el esfuerzo. Además intentaremos construir una herramienta matemática para determinar el riesgo de sobreentrenamiento del atletismo en función de su curva de recuperación en parado en los 3 primeros minutos en la parte más intensa del entrenamienta. Si alguien cree que esta sobreentrenado, sus datos serán de valiosa importancia.”

Si queréis colaborar con este estudio necesitaría los siguientes datos:

hiit_treadmill


Pulso basal de siempre (Pulso más bajo en reposo)
Pulso máximo de siempre (Pulso más alto en actividad)

Datos completos de entrenamiento del archivo del pulsometro (Archivo GPX con pulso)

Descripción del entrenamiento. (por ejemplo: 6x1km con 1’30 de pausa a tal intensidad)

Datos subjetivos de valoración del grado de fatiga de 0 a 10:

  • antes de comenzar el entrenamiento.
  • Tras cada una de las partes del entrenamiento: Calentamiento, parte principal y vuelta a la calma.
  • después de los 3 min de recuperación del entrenamiento principal (Al final del rodaje o series).

Seguro que si recogemos un buen número de curvas y de entrenamiento de diferentes deportistas Marcos nos podrá instruir en un nuevo artículo sobre qué podemos ver en nuestras curvas de recuperación.

Ya tenemos Big Data en el tenis, ¿lo hacemos predictivo?

tenis

El Proyecto de este blog, Datos y Deporte, como os comenté en la primera entrada, tiene entre sus objetivos presentar o descubrir a muchos amantes de los datos, de las estadísticas y el deporte, cómo una herramienta de análisis predictivo y de aprendizaje automático puede ayudarles a exprimir vuestros datos deportivos de una forma diferente o, al menos, con un objetivo más.

Por ello de vez en cuando me haré eco de proyectos o bases de datos en otros deportes que crea que son interesantes de cara a abrir la mente a los aficionados a los mismos y que puedan experimentar en primera persona, a través del acceso gratuito a BigML para pequeños archivos o Datasets, cómo podr trabajar con ellos.

Este es el caso del artículo de esta semana, mi primera incursión en un deporte diferente al mío, en concreto al TENIS. Un deporte con un gran seguimiento mundial gracias a desarrollo de la ATP y la WTA, circuitos profesionales masculinos y femenino respectivamente.

Todos estamos acostumbrados a ver datos de tenis, los juegos, los sets ganados por los jugadores, el porcentaje de primeros saques, de errores no forzados, son buenas estadísticas pero yo buscaba algo más, un punto mayor de extracción de datos como pueda ser el paso de saber los tiempos de mis series a tener el registro cada 3 segundos de posición, velocidad, pulso, etc.

Este punto de análisis existe en otros deportes como los deportes USA ( fútbol americano o béisbol) e incluso el vóley que ha especializado mucho el trabajo de análisis de datos incluyendo en sus equipos técnicos la figura del estadístico desde hace ya bastantes años.

Pero en tenis no me sonaba nada así que me puse a bucear por la red y no tardé encontrar lo que buscaba, un proyecto puesto en marcha a finales de 2013 por Jeff Sackmann denominado “The Match Charting Project” o, traducido, el “proyecto de cartografiado de partidos”, incluído dentro de un gran proyecto como es Tennis Abstract que debe ser la Biblia de los estadísticos del tenis mundial.

En dicho proyecto Jeff Sackmann desarrolla unas planillas en EXCEL para registrar o cartografiar partidos de tenis con gran cantidad de datos, más allá de los puntos, como la dirección y profundidad de los saques y de los golpeos de ambos contendientes, categorizando los golpes, trayectorias, errores forzados y no forzados, y, por tanto, generando una cantidad de datos de cara partido muy grande.

En su Web os podéis descargar la planilla, que él considera que con el registro de dos partidos completos tendréis habilidad suficiente para ir bastante rápido registrando partidos casi en tiempo real mientras los veis en la TV o Youtube, y también existe una App en Android para ello.

Jeff recopila los registros de decenas de colaboradores voluntarios que cumplimentan los datos y se los envían compartiendo posteriormente  la información con todo el mundo. Actualmente de más de 1000 partidos de tenis desde los años 80 y de multitud de torneos, superficies y, por supuesto, jugadores, aunque resta mucho trabajo por hacer. Supongo que el futuro, si la ATP/WTA y la asociación de entrenadores de tenis, se pone con ello, sería la automatización del registro de datos a través de un sistema de cámaras en las pistas de los torneos de todo el mundo (Puede ser un buen proyecto a presentar a la ATP/WTA y ser pionero como lo fue PROZONE Sports en fútbol).

Aquí os dejo el enlace al GitHub dónde os podéis descargar los diferentes CSVs con muchísima información extraída d ls partidos codificados hasta la fecha: https://github.com/JeffSackmann/tennis_MatchChartingProject

Creo que es un buen momento para proponeros, a los que os queráis mojar, os guste o no el tenis, a trabajar con esos datos y desarrollar un análisis o visualización de datos que podamos presentar en el Blog: Modelos, anomalías o predicciones, aunque sean simples, con los que dentro de un mes podamos armar un artículo sencillo con las mejores o más clarificantes.

Seréis protagonistas y coautores de un nuevo artículo en el blog con los puntos más interesantes y quién sabe si alguna sorpresa más.

Por mi parte ya me he puesto a trabajar sobre los datos para construirme un dataset del que extraer información relevante con la que responder a preguntas como: ¿Qué golpeos de Nadal son más determinantes para ganar puntos? ¿Cómo evoluciona el % de efectividad respecto al aumento de peloteo en los puntos? ¿Comportammiento del primer servicio respecto a situaciones adversas de marcador o qué diferencia de efectividad tienen los tenistas entre el primer saque de cada juego y el saque cuando el marcador es adverso (Puntos de break)? Y miles de preguntas que os podéis hacer.

¿Tienes datos? ¿Los ponemos en marcha?

Uno de los objetivos de este blog, como os proponía en el artículo de presentación de la pasada semana, es que este blog tenga un perfil colaborativo. No serán únicamente mis datos y mis inquietudes las que muevan sus contenidos ya que estoy convencido de que vuestra curiosidad nos ofrecerá estupendas posibilidades de descubrir lo que el análisis predictivo de datos nos puede dar en el ámbito del deporte.

El mundo del deporte está lleno de datos, de información y muchos la guardamos, incluso sin darnos cuenta, en nuestros diarios de entrenamiento, en nuestros gadgets, sobre todo los últimos “wereables”, en nuestro día a día de trabajo como entrenadores, técnicos o como meros aficionados al deporte.

En la mayoría de ocasiones tenemos muchos más datos de los que necesitamos o somos capaces de manejar por lo que solemos simplificar con aquellos que consideramos que nos ayudan, de forma más o menos intuitiva, a tomar las decisiones adecuadas en nuestro entrenamiento, sin embargo, estoy convencido de que con herramientas como BigML y el análisis predictivo de datos podemos “atrevernos” a exprimir todos esos datos.

runners_data

Por ejemplo, cuando llegáis a casa tras vuestro entrenamiento de carrera ¿Qué información miráis o cuál es la que os pide el entrenador? Los tiempos de las series, el ritmo medio del rodaje, pulso medio o la recuperación, el parcial más rápido, … tenemos a nuestra disposición decenas de datos diferentes que, en la mayoría de ocasiones no sabemos cómo interpretar: tiempo de apoyo, cadencia, índices de entrenamiento o fatiga, …

Toda esa información y más la tenemos en nuestra mano pero nos es muy complicado poderla procesar y que nos den una información relevante de nuestro entrenamiento, si hemos trabajado lo suficiente, si nos hemos pasado, si mañana estaremos mejor o peor, si tenemos mayor riesgo de sobrecarga o lesión, etc.

Además, esto no sólo ocurre en nuestros deportes, en deportes colectivos como el fútbol, y otros también, se han desarrollado sistemas para el análisis completo del juego mediante imágenes que permiten una recogida de datos exahustiva tanto en entrenamientos como en competición.

Por ejemplo en el fútbol, una empresa como PROZONE Sports desarrolla, a través de una plataforma de captación de imágenes con 8 cámaras en un campo de fútbol, un software que es capáz de medir y analizar una inmensa cantidad de información sobre cada partido, de uno y otro equipo, desde la posición de cada jugador en cada instante de juego, su velocidad, sus posiciones relativas, desarrollo de acciones tácticas defensivas y ofensivas y un largo etcétera que suponen, para los equipos técnicos y entrenadores, una auténtica revolución.

Una ingente cantidad de información que hay que analizar y saber aprovechar en beneficio de tu equipo tanto para correcciones tácticas como para el trabajo físico para evaluar y optimizar el trabajo antes y después de los partidos.

futbool

Con herramientas como BigML y un conocimiento específico de esa información que puede ser relevante podríamos trabajar en base a esos datos en busca un análisis predictivo de patrones, anomalías o información relevante que nos ayude o, incluso, si se pudiera volcar en tiempo real a través de alguna APP, obtener información inmediata que nos permita mejorar en nuestra toma de decisiones, desde la optimización de los entrenamientos para nuestra maratón de primavera como para el próximo equipo campeón de la Champions League.

Esta próxima semana, los días 15 y 16 de septiembre, participaré en el Valencia Summer School in Machine Learning dónde espero desarrollar mis conocimientos sobre esta herramienta y sobre el tratamiento de los datos.

Llevo ya en la recámara varios archivos de datos con los que trabajar, y a finales de septiembre espero colgaros por aquí algún ejemplo de lo que se puede hacer con ellos.

Sin embargo, estoy seguro de que alguno de vosotros no le importaría que exprimiéramos un poco sus datos con un gran número de expertos que se darán cita en Las Naves, en Valencia, por lo que no tenéis más que poneros en contacto conmigo y me los llevo bajo el brazo para contaros lo que hemos podido hacer con ellos.

Si quieres sólo tienes que ponerte en contacto