Preparando los datos para analizar #Doityourself

Desde que comencé esta aventura de con www.datosydeporte.com cada semana algunos de vosotros os habéis ofrecido a enviarme todos los datos que tenéis de vuestros entrenamientos. Os lo agradezco y para algún trabajo específico de análisis como los que me gustaría hacer sobre entrenamientos de tiradas de maratón etc, probablemente lo haga, pero el objetivo principal es mostraros cómo lo podéis hacer vosotros mismos con vuestros datos y a través de un registro gratuito en www.bigml.com podáis analizar vuestros entrenamientos en busca de información relevante que os haga poder mejorar esos entrenamientos.

IMG-20150225-WA0005

En los artículos anteriores os he intentado mostrar cómo descargaros vuestros datos, archivos GPX, desde diferentes plataformas dónde los podemos tener recopilados. También cómo transformar esos datos a través de diferentes herramientas para obtener más datos con los que “jugar” en un análisis.

Screenshot_2014-12-10-20-12-42

Y ahora lo que os voy a proponer es qué datos podemos tomar para organizarlos en un Excel/googlesdoc/csv para poder analizarlos en Bigml.

Cómo el movimiento se demuestra andando, os dejo mi propuesta de datos que trasladaré a un archivo y que la próxima semana os mostraré la información y espero que os animéis a hacerlo vosotros y a compartirlo.

Para este proyecto voy a utilizar los datos de preparación del maratón de Berlín hasta que me lesioné,  7 semanas de entrenamiento en #Objetivo42k del 8 de junio al 26 de julio de 2015 que son púlicas ya que tengo los tracks publicados en Strava y en mi Blog:

Semana 1Semana 2Semana 3Semana 4Semana 5Semana 6Semana 7

También incluiré los datos de los dos meses anteriores de entrenamiento, desde el 4 de abril de 2015 al 7 de junio. En total serán unos 160 tracks de entrenamiento (Hay más que días porque en ocasiones doblo sesión mañana y tarde y en otras tomo en archivos diferentes el calentamiento y las series) que podéis ver en mi perfil de Strava

IMG_20150210_224729

¿Qué datos tomaré?

Una vez tenemos los Tracks ¿qué datos tomamos que podamos manejar? Creo que hay que ser práctico y cada uno conoce los datos extra que registra a parte de los entrenamiento y que le pueden interesar: Peso, horas de sueño, sensaciones (Escala subjetiva), condiciones climatológicas, …

2015-07-22 13.06.20

En mi caso esta vez voy a utilizar la web www.ibpindex.com con su índice IBP y algo más de información extra que nos aporta de cadas Track:

  • Fecha del entrenamiento
  • Hora de inicio (Importante si queremos apreciar diferencias entre los entrenamientos entre madrugada, mañana, tarde, noche, etc)
  • Índice IBP (Dureza o dificultad del recorrido)
  • Distancia del entrenamiento
  • Altitud inicial (Nos da info de la cota a la que estamos entrenando por si variamos de lugar de entrenamiento y queremos ver si las diferencias de altitud son soignificativas)
  • Tiempo de entrenamiento (Cojo el tiempo en movimiento)
  • Velocidad media en movimiento (km/h)
  • Velocidad máxima sostenida (Km/h)
  • % del track entre +1-(-1)% de desnivel (O sea, plano)
  • Tipo de entrenamiento. Categorízo si es entrenamiento de series, rodaje, Tirada, calentamiento, Doble sesión.

¿Qué otro datos podemos incluir?

Ahí ya entra lo que cada uno quiera exprimirse la cabeza o los datos, o las rutinas de registro de datos o acceso a datos automatizados que podáis tener. Os dejo unos ejemplos con la aportación que pueden hacer al análisis:

  • Si tenemos teléfono móvil con App de salud un una pulsera tipo FitBit es fácil que podamos incluir los datos del podómetro que toma día a día y puede ser un índice de actividad.
  • Horas de sueño o la hora a la que nos levantamos. Puede ser interesante para analizar cómo afectan las horas de sueño o, si nos afectan los madrugones.
  • Si nos preocupa el tema “comidas” un primer acercamiento es registrar la hora a la que comenzamos a comer y ver cómo afecta a los entrenamientos que hacemos después. Si nos metemos con el tipo de comidas podemos analizar qué comidas nos sientan mejor o cuales nos sientan mal.
  • Peso, acordaros registrarlo a la misma hora siempre para evitar la variabilidad intradiaria.
  • Escala de Borg. Es una escala en la que valoramos de 0 a 10 cómo nos hemos encontrado de energía ese día, por ejemplo 10 sería que te has encontrado genial y el entrenamiento los has completado perfectamente y 0 para un día en el que tienes malas sensaciones, te molesta todo (Agujetas o dolores por enfermedad) y no has sido capaz de completar el entrenamiento.
  • Si hemos entrenado solos o en grupo. Podemos valorar si se nota a mejor o a peor cuando entrenamos en grupo si solemos alternar.
  • Lugar de entrenamiento o circuito. Puede que tengamos la impresión de que los rodajes nos salen mejor en ese parque determinado pero no estamos seguros.
  • Día de la semana. Así podemos detectar qué días nos encontramos mejor o con más energía dentro del ciclo de la semana.
  • Datos climatológicos. Esto quizás sea más complicado ya que hay que buscar a posteriori información sobre temperaturas, humedad o vientos en la zona donde entrenes, pero si lo vamos anotando día a día nos dará información real sobre si nos afecta o no el frío, calor, humedad y hasta qué punto.
  • Zapatillas. Si cambiamos a menudo de calzado del mismo tipo nos puede dar información sobre qué zapatilla nos ajusta mejor. Por ejemplo si para rodar varío entre Asics Nimbus y Asics Cúmulus pudo intentar detectar si con una de las dos entreno mejor o no.
  • Entrenamiento de los días anteriores. Una vez registrados todos los datos podemos añadir columnas con el tipo de entrenamiento o la escala de borg de los días anteriores a cada entrenamiento y así poder detectar patrones y predecir cuándo vamos a tener un día bueno o un día malo.
  • Días que pasamos por el fisioterapeuta. A muchos nos asalta la duda de cuándo darnos masaje, antes o después de las series, en un día de descanso o no. Si añadimos el dato de los días que han pasado desde que visitamos a nuestro físio podremos analizar ese parámetro y ver qué día es el que mejor nos encontramos tras un masaje de descarga. Por ejemplo, el día que recibimos el tratamiento sería el día CERO y a partir de ahí vamos sumando 1, 2, 3, 4 hasta que vayamos de nuevo al fisioterapeuta.
  • Si tenemos una lesión no invalidante pero que nos molesta y queremos detectar cómo evoluciona por la sensación subjetiva de molestia podemos utilizar una escala subjetiva de 0 a 10 dónde 0 es que no molestó nada y 10 es que no te dejó entrenar. Podremos analizar a posteriori la evolución de la lesión respecto a la cargas de entrenamiento.

IMG-20150329-WA0002

Y seguro que se os ocurren a vosotros muchos más datos de interés.

Yo me pongo manos a la obra y espero, la próxima semana, mostraros los datos e información que he podido extraer de los mismos.

Ya sabéis, si alguno se anima, que lo comparta, y cualquier duda preguntad.

Transformando los datos. ¿Qué hago con mi GPX? #Doityourself

Queridos corredores, la semana pasada vimos cómo descargarnos nuestros datos, los archivos GPX de nuestros entrenamientos, rutas o competiciones de los diferentes portales o Apps en los que los tenemos registrados.

App de entrenamiento

Tenemos en nuestro disco duro decenas, cientos y alguno puede que miles de Tracks. ¿Qué puedo hacer ahora?

En este artículo os voy a mostrar algunas opciones para transformar esos datos y poder trabajar con ellos de cara a que nos den más información. Comenzaremos por lo más básico:

Del GPX al Dataset

Si se os ocurre abrir un archivo GPX en el wordpad os quedaréis impresionaods con la cantidad de datos que se acumulan en el mismo, pero además, con estos datos en bruto poco podemos hacer ya que, normalmente, se trata de información de posición en el formato (Latitud, Longitud) con la cota de elevación y el tiempo en que se registró dicha información.

En la Summer School de machine learning en Valencia, hace unas semanas, me descubrieron una web muy sencilla en la que poder transformar nuestros archivos GPX a tablas de datos con algunos datos transformados que nos pueden ser de utilidad de cara a trabajar con ellos en BigML para analizar aspectos de nuestro entrenamiento: www.gpsvisualizer.com

FireShot Screen Capture #086 - 'GPS Visualizer_ Convert GPS files to plain text or GPX' - www_gpsvisualizer_com_convert_input

En esta Web nos encontramos con un menú en el que podemos seleccionar hasta 10 archivos GPX diferentes (Si pones más de uno que tengas en cuenta que en el archivo transformado te los va a unir todos uno detrás de otro).

En nuestro caso tenemos los archivos GPX descargados (De mi Strava, Endomondo y Garmin Connect) por lo que quiero que me saque los datos en “Plain Text” para después poderlo copiar/pegar a un CSV-Excel o Google Docs.

Seleccionamos el archivo o archivos y seleccionamos (por defecto) la separación por tabulaciones. Más abajo, viene lo interesante, seleccionar qué información queremos que nos calcule de ese GPX. En mi caso tomé:

Speed: Velocidad entre un punto y otro.

Slope (%): Pendiente del tramo.

Distance: Distancia entre un punto y otro.

Pace: Ritmo en minutos/kilómetro. La medida más habitual entre corredores, más que los km/h

Elevation: El programa te puede añadir la elevación seleccionando la que viene en la información del track o, dándote la opción de capturar la información de elevación a través de otros modelos más precisos según la posición.

GPS Visualizer

Debajo de este menú, si pulsamos sobre la pestaña de OPCIONES AVANZADAS, nos aparecen algunas opciones interesantes como: Dar los datos en el recorrido a la inversa, contectar segmentos para evitar que haya huecos en el track, que de de la información sobre una distancia prefijada entre Track o tiempo (Por ejemplo cada 50m), o que te calcule la información de ascenso o descenso acumulado en el total del track.

FireShot Screen Capture #075

Después de seleccionar todo pulsamos el botón “CONVERT” y nos descargaremos el archivo de texto que abriremos y, tras seleccionar y copiar todo su contenido, podrémos pegar en una hoja de EXCEL para tener un archivo CVS con el que poder trabajar en BigML.

FireShot Screen Capture #085 - 'IBP INDEX - Tabla comparativa de índices IBP' - www_ibpindex_com_index_php_es_blog_item_55-tabla-comparativa-de-indices-ibp

Os ha parecido largo y no os queréis “quebrar la cabeza”, pues no os preocupéis que os enseño una Web que os gustará. Se trata de www.ibpindex.com un proyecto dirigido por Joan Casares desde Barcelona y que es gratuíto y abierto (Nos podemos registrar con nuestro facebook) generándonos, a partir de los archivos GPX un índice de dificultad en la ruta que nos permite compararlo con otros.

Pero ese índice, una información más que podemos usar para comparar nuestros datos y entrenamientos, es lo de menos, lo mejor es que te genera unas estadísticas de cada Track que son muy interesantes:

Datos generales y absolutos del Track:FireShot Screen Capture #089 - 'IBP = 617 RNG 20140719-045032-run_gpx' - www_ibpindex_com_ibpindex_ibp_analisis_completo_php_REF=36534017181098&LAN=es

FireShot Screen Capture #090 - 'IBP = 617 RNG 20140719-045032-run_gpx' - www_ibpindex_com_ibpindex_ibp_analisis_completo_php_REF=36534017181098&LAN=es

Tipo de perfiles a los que nos enfentamos según la pendiente con velocidades medias de cara clasificación y % respecto al total de la ruta tanto de las subidas como de las bajadas:

FireShot Screen Capture #091 - 'IBP = 617 RNG 20140719-045032-run_gpx' - www_ibpindex_com_ibpindex_ibp_analisis_completo_php_REF=36534017181098&LAN=es

E información sobre las distancias recorridas en altitudes por encima de 1500m asi como del tiempo de parada:

FireShot Screen Capture #092 - 'IBP = 617 RNG 20140719-045032-run_gpx' - www_ibpindex_com_ibpindex_ibp_analisis_completo_php_REF=36534017181098&LAN=es

Con esta información tan completa de cada una de nuestras rutas podemos elaborar un dataset muy completo con el que trabajar en BigML.

Y por último, quería mostraros un proyecto en ciernes de un ingeniero gaditano, Juan Ramírez, que trabaja en Tuenti que quiere trasladar lo que hace el índice IBP del monte o montaña a la ruta dónde las pendientes de las subidas y bajadas a veces son leves pero, cuando uno va a tope, se notan:

https://github.com/juanramirez/hillpace

Por último, recordaros cuando elaboréis vuestro CSV con los datos, que en BigML podéis registraros de forma gratuíta y trabajar con la plataforma con archivos de datos pequeños.

Cómo descargarnos nuestros entrenamientos de plataformas o Apps #DoItYourself #Datos

App de entrenamiento

En este blog hablamos de datos y más datos, pero ¿dónde están mis datos de entrenamiento?

En mi caso, desde 1995 hasta bien entrado los años 2000 están en libretas de entrenamiento en las que he llegado a anotar, además de los entrenamientos, tiempos de series y demás, pulsos basales, sensaciones, alimentación, etc. A partir del año 2005 que comencé a entrenar con Antonio Serrano me liberé un poco de esa carga y, la verdad, algún día me pasaré por su casa para que me deje hacer fotocopias de su libreta mágica. Y, por último, a partir de 2009, comencé a compartir y guardar la información de mis entrenamientos en plataformas como Garmin Connect, Strands, Endomondo (Adquirida por ADIDAS), Runtastic (Adquirida por UNDER ARMOUR), Strava, Suunto, Polar, TomTom MySports, FitBit, NIKE+, DailyMile, MapMyRun,  RunKeeper,  además de compartirlas en mi Blog durante la preparación de algunas maratones que habéis podido seguir.

Ahora estamos llegando a un nuevo paso como es el de los agregadores como Runator o RankRunner que nos permiten descargar desde todo tipo de aplicaciones y plataformas nuestros entrenamiento para que el histórico, por así decirlo, esté siempre en el mismo sitio y no tengamos que hipotecar nuestra existencia y la de nuestros entrenamientos a un mismo modelo de móvil, GPS o App.

Pero seguro que nos gustaría tener esa información más a mano y, sobre todo, poder “jugar” con ella en cuanto a análisis de datos.

Los más “freaks” seguro que, aun subiendo sus entrenamiento en alguna plataforma, siguen conservando sus libretas de entrenamiento o, la evolución natural, a las hojas EXCEL más o menos dinámicas.

Como uno de los objetivos de este blog es animaros a que juguemos con vuestros datos de entrenamiento de cara a poder optimizar vuestros entrenamiento o descubrir  cosas interesantes que os puedan ayudar a mejorarlos, vamos con este primer capítulo del #Doityourself para explicar, en principio de algunas, pero para eso están los blogs colaborativos, de todas las plataformas que hay o que vayan surgiendo, cómo podemos descargarnos nuestros datos, sobre todo teniendo en cuenta que muchos de los nuevos “runners” acceden directamente al espacio online sin pasar por los tradicionales “diarios de entrenamiento”.

Uno de los principales problemas que nos encontramos es que cuando queremos descargar las información de las plataformas, lo que nos podemos descargar es el archivo de datos del GPS, normalmente en formato de extensión GPX, pero toda la información extra que podemos incluir en nuestro diario de entrenamiento virtual: Zapatillas, sensaciones, climatología, etc, no suele venir acompañando al resto aunque seguro que en los comentarios alguno colgará trucos para poder hacerlo.

En principio vamos a mostrar cómo descargarse estos archivos GPX, archivos con la información de posición, tiempo, pulso si se ha registrado y elevación, normalmente generados por los dispositivos o apps basadas en la tecnología GPS.

Vamos a mostrar cómo hacerlo desde tres plataformas: STRAVA, ENDOMONDO y GARMIN CONNECT que son las tres que he utilizado yo últimamente. Si alguno quiere compartir cómo hacerlo desde otra aplicación que él utiliza puede colgarlo en un comentario o mandármelo por email y lo incluiré en el artículo.

GARMIN CONNECT

Los amigos de Garmin Connect te obligan a descargarte una a una las actividades ya que si vas al apartado en el que puedes ver el listado de actividades y seleccionas una o varias, sólo te da la opción de descarga como archivo CSV incluyendo la información de totales y laps a lo sumo.

Para descargar el archivo en formato GPX del entrenamiento nos tenemos que ir a la actividad que estamos interesados en descargar y pulsando sobre la rueda en la parte superior derecha se desplegará un menú:

DescargaDatos_01_Garminconnect01

En dicho menú tendremos la opción de descargarnos el archivo en diferentes formatos: Original, TCX, GPX, Google Earth o CSV.

DescargaDatos_01_Garminconnect02

STRAVA

La aplicación STRAVA nos ofrece la doble opción, por un lado descargarte el archivo desde una actividad concreta pulsando sobre la “llave inglesa” aparecerá el menú que nos da la opción de “Exportar GPX”.

DescargaDatos_02_Strava04

O bien, lo que nos podría interesar en este caso, la posibilidad de descargarnos a la vez todos los archivos de nuestras actividades en formato GPX de la siguiente forma.

Nos vamos al apartado “Mi PERFIL” donde encontraremos, en la parte inferior derecha, un botón que nos indica “Descarga tus datos”

DescargaDatos_02_Strava01

Al pulsar el botón “Descarga tus datos” nos aparecerá una ventana informando que se nos enviará un email con un enlace para descargar todas las actividades. Deberemos pulsar en “Descargar todas tus actividades”.

DescargaDatos_02_Strava02

Y en pocos segundos o minutos recibiremos un email en nuestra dirección de correo electrónico que tengamos configurada en STRAVA con un link en el que, al pulsarlo, se descargará un archivo comprimido con todos los archivos GPX de nuestras actividades:

DescargaDatos_02_Strava03

ENDOMONDO

Por último, por ahora, en la plataforma ENDOMONDO, recientemente adquirida por UNDER ARMOUR, sólo nos da la opción de descargar las actividades de forma individual.

En la actividad que queramos descargar, al pulsar sobre la pestaña de menú arriba a la derecha, junto a los botones de compartir en Facebook y Twitter, pulsamos sobre la opción “EXPORT”

DescargaDatos_03_Endomondo01

Y nos dará dos opciones de formato para la exportación: GPX y TCX.

DescargaDatos_03_Endomondo02

En el próximo post en formato #DoItYourself os mostraré cómo transformar esos datos de forma automática para, a partir de los archivos GPX, poder tener datos tan interesantes como la velocidad o la pendiente de subida/bajada. Datos a los que podremos sacar jugo, por ejemplo, para aquellos que se muevan por la montaña.