“Los datos brutos de los acontecimientos deportivos no van a tener derechos de propiedad intelectual”

w_900x700_26164127c1e34c2a-269d-49f6-8b41-ce29f21e955a

6º encuentro LaLiga sobre Derecho Deportivo. Carolina Pina (Izquierda), Alberto Palomar (Centro). Foto: LaLiga

Toma ya el titular del artículo ¿no? Pues sí, es lo que más me ha llamado la atención del resumen que hace la publicación Palco23 en su noticia sobre el 6º encuentro organizado por la Fundación de la Liga de fútbol Profesional sobre derecho deportivo.

En esta sesión, una de las ponentes, del bufete Garrigues, Carolina Pina, desgrana alguna de las claves del Big Data en el deporte que “Ha venido para quedarse”.

La principal que quiero destacar es la que se recoge en el titular: “Los datos brutos de los acontecimientos deportivos no van a tener derechos de propiedad intelectual”. O sea, ninguna organización puede impedir el registro o uso de datos recogidos durante los eventos deportivos.

O sea, las organizaciones deportivas y/o propietarios de los derechos de las competiciones deportivas no podrán hacer un eso exclusivo de los datos deportivos de sus eventos (Indicaba Carolina Pina en el acto que existen ya sentencias al respecto) señalando que lo único que se podría proteger por parte de las organizaciones es su software de análisis de datos o cómo se visualiza y traduce de cara a su uso por parte de clubes, medios de comunicación o los propios aficionados.

Para mi está claro dónde entra en juego el desarrollo de disciplinas de análisis de datos, aprendizaje automático e inteligencia artificial y el nicho de mercado que tienen con, para empezar, todas estas grandes empresas, instituciones e industria de los enventos deportivos (Ligas, Comités organizadores, grandes competiciones, …)

¿Cuál es el producto?

Generar valor sobre los datos, grandes cantidades de datos, que se generan en los eventos deportivos para sus posibles interesados: Medios de comunicación, empresas de publicidad y marketing, aficionados, empresas de apuestas deportivas, etc.

 

Que queréis chicos, no todo iba a ser correr con el GPS en esto del BigDATA 😛

Preparando los datos para analizar #Doityourself

Desde que comencé esta aventura de con www.datosydeporte.com cada semana algunos de vosotros os habéis ofrecido a enviarme todos los datos que tenéis de vuestros entrenamientos. Os lo agradezco y para algún trabajo específico de análisis como los que me gustaría hacer sobre entrenamientos de tiradas de maratón etc, probablemente lo haga, pero el objetivo principal es mostraros cómo lo podéis hacer vosotros mismos con vuestros datos y a través de un registro gratuito en www.bigml.com podáis analizar vuestros entrenamientos en busca de información relevante que os haga poder mejorar esos entrenamientos.

IMG-20150225-WA0005

En los artículos anteriores os he intentado mostrar cómo descargaros vuestros datos, archivos GPX, desde diferentes plataformas dónde los podemos tener recopilados. También cómo transformar esos datos a través de diferentes herramientas para obtener más datos con los que “jugar” en un análisis.

Screenshot_2014-12-10-20-12-42

Y ahora lo que os voy a proponer es qué datos podemos tomar para organizarlos en un Excel/googlesdoc/csv para poder analizarlos en Bigml.

Cómo el movimiento se demuestra andando, os dejo mi propuesta de datos que trasladaré a un archivo y que la próxima semana os mostraré la información y espero que os animéis a hacerlo vosotros y a compartirlo.

Para este proyecto voy a utilizar los datos de preparación del maratón de Berlín hasta que me lesioné,  7 semanas de entrenamiento en #Objetivo42k del 8 de junio al 26 de julio de 2015 que son púlicas ya que tengo los tracks publicados en Strava y en mi Blog:

Semana 1Semana 2Semana 3Semana 4Semana 5Semana 6Semana 7

También incluiré los datos de los dos meses anteriores de entrenamiento, desde el 4 de abril de 2015 al 7 de junio. En total serán unos 160 tracks de entrenamiento (Hay más que días porque en ocasiones doblo sesión mañana y tarde y en otras tomo en archivos diferentes el calentamiento y las series) que podéis ver en mi perfil de Strava

IMG_20150210_224729

¿Qué datos tomaré?

Una vez tenemos los Tracks ¿qué datos tomamos que podamos manejar? Creo que hay que ser práctico y cada uno conoce los datos extra que registra a parte de los entrenamiento y que le pueden interesar: Peso, horas de sueño, sensaciones (Escala subjetiva), condiciones climatológicas, …

2015-07-22 13.06.20

En mi caso esta vez voy a utilizar la web www.ibpindex.com con su índice IBP y algo más de información extra que nos aporta de cadas Track:

  • Fecha del entrenamiento
  • Hora de inicio (Importante si queremos apreciar diferencias entre los entrenamientos entre madrugada, mañana, tarde, noche, etc)
  • Índice IBP (Dureza o dificultad del recorrido)
  • Distancia del entrenamiento
  • Altitud inicial (Nos da info de la cota a la que estamos entrenando por si variamos de lugar de entrenamiento y queremos ver si las diferencias de altitud son soignificativas)
  • Tiempo de entrenamiento (Cojo el tiempo en movimiento)
  • Velocidad media en movimiento (km/h)
  • Velocidad máxima sostenida (Km/h)
  • % del track entre +1-(-1)% de desnivel (O sea, plano)
  • Tipo de entrenamiento. Categorízo si es entrenamiento de series, rodaje, Tirada, calentamiento, Doble sesión.

¿Qué otro datos podemos incluir?

Ahí ya entra lo que cada uno quiera exprimirse la cabeza o los datos, o las rutinas de registro de datos o acceso a datos automatizados que podáis tener. Os dejo unos ejemplos con la aportación que pueden hacer al análisis:

  • Si tenemos teléfono móvil con App de salud un una pulsera tipo FitBit es fácil que podamos incluir los datos del podómetro que toma día a día y puede ser un índice de actividad.
  • Horas de sueño o la hora a la que nos levantamos. Puede ser interesante para analizar cómo afectan las horas de sueño o, si nos afectan los madrugones.
  • Si nos preocupa el tema “comidas” un primer acercamiento es registrar la hora a la que comenzamos a comer y ver cómo afecta a los entrenamientos que hacemos después. Si nos metemos con el tipo de comidas podemos analizar qué comidas nos sientan mejor o cuales nos sientan mal.
  • Peso, acordaros registrarlo a la misma hora siempre para evitar la variabilidad intradiaria.
  • Escala de Borg. Es una escala en la que valoramos de 0 a 10 cómo nos hemos encontrado de energía ese día, por ejemplo 10 sería que te has encontrado genial y el entrenamiento los has completado perfectamente y 0 para un día en el que tienes malas sensaciones, te molesta todo (Agujetas o dolores por enfermedad) y no has sido capaz de completar el entrenamiento.
  • Si hemos entrenado solos o en grupo. Podemos valorar si se nota a mejor o a peor cuando entrenamos en grupo si solemos alternar.
  • Lugar de entrenamiento o circuito. Puede que tengamos la impresión de que los rodajes nos salen mejor en ese parque determinado pero no estamos seguros.
  • Día de la semana. Así podemos detectar qué días nos encontramos mejor o con más energía dentro del ciclo de la semana.
  • Datos climatológicos. Esto quizás sea más complicado ya que hay que buscar a posteriori información sobre temperaturas, humedad o vientos en la zona donde entrenes, pero si lo vamos anotando día a día nos dará información real sobre si nos afecta o no el frío, calor, humedad y hasta qué punto.
  • Zapatillas. Si cambiamos a menudo de calzado del mismo tipo nos puede dar información sobre qué zapatilla nos ajusta mejor. Por ejemplo si para rodar varío entre Asics Nimbus y Asics Cúmulus pudo intentar detectar si con una de las dos entreno mejor o no.
  • Entrenamiento de los días anteriores. Una vez registrados todos los datos podemos añadir columnas con el tipo de entrenamiento o la escala de borg de los días anteriores a cada entrenamiento y así poder detectar patrones y predecir cuándo vamos a tener un día bueno o un día malo.
  • Días que pasamos por el fisioterapeuta. A muchos nos asalta la duda de cuándo darnos masaje, antes o después de las series, en un día de descanso o no. Si añadimos el dato de los días que han pasado desde que visitamos a nuestro físio podremos analizar ese parámetro y ver qué día es el que mejor nos encontramos tras un masaje de descarga. Por ejemplo, el día que recibimos el tratamiento sería el día CERO y a partir de ahí vamos sumando 1, 2, 3, 4 hasta que vayamos de nuevo al fisioterapeuta.
  • Si tenemos una lesión no invalidante pero que nos molesta y queremos detectar cómo evoluciona por la sensación subjetiva de molestia podemos utilizar una escala subjetiva de 0 a 10 dónde 0 es que no molestó nada y 10 es que no te dejó entrenar. Podremos analizar a posteriori la evolución de la lesión respecto a la cargas de entrenamiento.

IMG-20150329-WA0002

Y seguro que se os ocurren a vosotros muchos más datos de interés.

Yo me pongo manos a la obra y espero, la próxima semana, mostraros los datos e información que he podido extraer de los mismos.

Ya sabéis, si alguno se anima, que lo comparta, y cualquier duda preguntad.

¿Tienes datos? ¿Los ponemos en marcha?

Uno de los objetivos de este blog, como os proponía en el artículo de presentación de la pasada semana, es que este blog tenga un perfil colaborativo. No serán únicamente mis datos y mis inquietudes las que muevan sus contenidos ya que estoy convencido de que vuestra curiosidad nos ofrecerá estupendas posibilidades de descubrir lo que el análisis predictivo de datos nos puede dar en el ámbito del deporte.

El mundo del deporte está lleno de datos, de información y muchos la guardamos, incluso sin darnos cuenta, en nuestros diarios de entrenamiento, en nuestros gadgets, sobre todo los últimos “wereables”, en nuestro día a día de trabajo como entrenadores, técnicos o como meros aficionados al deporte.

En la mayoría de ocasiones tenemos muchos más datos de los que necesitamos o somos capaces de manejar por lo que solemos simplificar con aquellos que consideramos que nos ayudan, de forma más o menos intuitiva, a tomar las decisiones adecuadas en nuestro entrenamiento, sin embargo, estoy convencido de que con herramientas como BigML y el análisis predictivo de datos podemos “atrevernos” a exprimir todos esos datos.

runners_data

Por ejemplo, cuando llegáis a casa tras vuestro entrenamiento de carrera ¿Qué información miráis o cuál es la que os pide el entrenador? Los tiempos de las series, el ritmo medio del rodaje, pulso medio o la recuperación, el parcial más rápido, … tenemos a nuestra disposición decenas de datos diferentes que, en la mayoría de ocasiones no sabemos cómo interpretar: tiempo de apoyo, cadencia, índices de entrenamiento o fatiga, …

Toda esa información y más la tenemos en nuestra mano pero nos es muy complicado poderla procesar y que nos den una información relevante de nuestro entrenamiento, si hemos trabajado lo suficiente, si nos hemos pasado, si mañana estaremos mejor o peor, si tenemos mayor riesgo de sobrecarga o lesión, etc.

Además, esto no sólo ocurre en nuestros deportes, en deportes colectivos como el fútbol, y otros también, se han desarrollado sistemas para el análisis completo del juego mediante imágenes que permiten una recogida de datos exahustiva tanto en entrenamientos como en competición.

Por ejemplo en el fútbol, una empresa como PROZONE Sports desarrolla, a través de una plataforma de captación de imágenes con 8 cámaras en un campo de fútbol, un software que es capáz de medir y analizar una inmensa cantidad de información sobre cada partido, de uno y otro equipo, desde la posición de cada jugador en cada instante de juego, su velocidad, sus posiciones relativas, desarrollo de acciones tácticas defensivas y ofensivas y un largo etcétera que suponen, para los equipos técnicos y entrenadores, una auténtica revolución.

Una ingente cantidad de información que hay que analizar y saber aprovechar en beneficio de tu equipo tanto para correcciones tácticas como para el trabajo físico para evaluar y optimizar el trabajo antes y después de los partidos.

futbool

Con herramientas como BigML y un conocimiento específico de esa información que puede ser relevante podríamos trabajar en base a esos datos en busca un análisis predictivo de patrones, anomalías o información relevante que nos ayude o, incluso, si se pudiera volcar en tiempo real a través de alguna APP, obtener información inmediata que nos permita mejorar en nuestra toma de decisiones, desde la optimización de los entrenamientos para nuestra maratón de primavera como para el próximo equipo campeón de la Champions League.

Esta próxima semana, los días 15 y 16 de septiembre, participaré en el Valencia Summer School in Machine Learning dónde espero desarrollar mis conocimientos sobre esta herramienta y sobre el tratamiento de los datos.

Llevo ya en la recámara varios archivos de datos con los que trabajar, y a finales de septiembre espero colgaros por aquí algún ejemplo de lo que se puede hacer con ellos.

Sin embargo, estoy seguro de que alguno de vosotros no le importaría que exprimiéramos un poco sus datos con un gran número de expertos que se darán cita en Las Naves, en Valencia, por lo que no tenéis más que poneros en contacto conmigo y me los llevo bajo el brazo para contaros lo que hemos podido hacer con ellos.

Si quieres sólo tienes que ponerte en contacto