7 Formas de Crear Estrategias de Apuestas Más Sólidas

Protegerse contra el datamining y el sobreajuste es esencial para garantizar que tus filtros y estrategias de pronóstico sean robustos y generalicen bien a nuevos datos en el futuro. 

Sobreajuste: En la modelización matemática, el sobreajuste es “la producción de un análisis que se corresponde demasiado estrecha o exactamente con un conjunto particular de datos y que, por lo tanto, puede no ajustarse a datos adicionales o predecir observaciones futuras de forma fiable”. Wikipedia El sobreajuste con las estrategias de Betaminic ocurre cuando jugamos con los filtros y encontramos una tendencia histórica rentable que en realidad no es una tendencia real, sino simplemente el resultado de la suerte y de sobre-optimizar los filtros para recortar las apuestas perdedoras. Aquí tienes algunos métodos sólidos que puedes utilizar para mitigar este problema:

1. **División adecuada de los datos**:

Divide tus datos históricos en conjuntos de entrenamiento y pruebas. Utiliza el conjunto de entrenamiento para desarrollar y ajustar tus filtros y modelos, y utiliza el conjunto de pruebas para evaluar su rendimiento. Esto te ayudará a obtener una estimación más realista del rendimiento futuro y evitará que el modelo memorice los datos de entrenamiento. Por ejemplo, si tenemos datos de 11 temporadas, de 2012 a 2023, podríamos dividirlos en 8 temporadas de datos de entrenamiento y 3 temporadas de datos de prueba. De este modo, podrías investigar tu sistema basándote en las 8 temporadas de datos de entrenamiento para “entrenar el modelo”, y luego comprobar si los filtros que has encontrado funcionan con los nuevos datos aplicándolos a las 3 temporadas de prueba. La separación de 8 + 3 temporadas es sólo un ejemplo y deberías probar cualquier separación que consideres significativa en función de los datos de que dispongas. También puedes utilizar los datos más recientes para entrenar el modelo y probarlo con datos más antiguos. O utilizar temporadas o meses alternos como datos de entrenamiento y la otra mitad de las temporadas como datos de prueba. Hay muchas formas de aplicar este método. En el libro de Tom Whitaker “Big Data Betting on Football – The Betaminic Guide 2” (que se puede descargar gratis aquí) dividió 8 años de datos en 6 años de datos de entrenamiento y 2 años de datos de prueba para crear una serie de estrategias.

En varias estrategias de Betaminic compartidas públicamente, los usuarios incluyen qué método de separación de datos utilizaron en la sección de descripción para recordar cómo investigaron la estrategia. A veces llaman a los datos de entrenamiento “Periodo de investigación” (RP – Research Period) y a los datos de prueba “Periodo de prueba” (TP – Test Period). En la imagen de abajo el usuario escribe “RP 7,7,33,19,14,16 TP 5,22” en la sección de descripción de la estrategia BDHY Home vs Weak Away para sugerir que utilizó 6 temporadas para los datos de entrenamiento y el rendimiento que encontró en cada una de esas temporadas, y utilizó 2 temporadas para los datos de prueba y el rendimiento que encontró en esas 2 temporadas. De esta forma se puede ver cómo la tendencia encontrada en los datos de entrenamiento continuó en los datos de prueba.  

Los datos Desde su publicación de la misma estrategia muestran que incluso después de ser compartida, la tendencia ha continuado con un 8,94% de ROI de 234 apuestas.  

2. **Validación cruzada**:

En lugar de una única división entre datos de entrenamiento y pruebas, considera utilizar técnicas de validación cruzada, como validación cruzada k-fold. Esto implica dividir los datos en múltiples conjuntos de entrenamiento/prueba y promediar los resultados para obtener una evaluación más robusta del rendimiento del modelo. Por ejemplo, si tienes una metodología de investigación estándar sobre cómo añadir filtros, puedes aplicar ese método al mismo conjunto de datos pero utilizando diferentes conjuntos de entrenamiento y prueba para ver si se producen modelos similares. Por ejemplo, si tu estilo habitual es aplicar primero filtros objetivos como la forma reciente o los nombres de los equipos, después aplicar filtros subjetivos como los filtros de cuotas y, por último, filtrar las ligas en función de su inclusión positiva o negativa. Entonces este proceso de tres pasos podría aplicarse a un conjunto de datos pero con diferentes configuraciones de validación.

A) Las primeras 7 temporadas como temporadas de entrenamiento y las 4 más recientes como temporadas de prueba.

B) Las últimas 7 temporadas como temporadas de entrenamiento y las 4 más antiguas como temporadas de pruebas.

C) Alternar las temporadas 1,3,5,7,9,11 como temporadas de entrenamiento y las 2,4,6,8,10 como temporadas de prueba.

D) Alternar los meses como temporadas de entrenamiento y los demás meses como temporadas de pruebas.

Si obtienes resultados muy diferentes con el mismo método de aplicación del filtro, puedes cambiar tu forma de ver el método de investigación. También puedes probar a aplicar un método diferente, como dejar el filtrado subjetivo para después del filtrado de liga, y ver si se obtienen resultados similares o diferentes. Cuando se aplican varios métodos de investigación diferentes y se utiliza la validación cruzada, entonces se pueden observar los diferentes filtros que se han investigado y elegir un término medio que cubra mejor la tendencia de valor encontrada, o incluso centrarse sólo en los filtros principales que funcionaron en todas las pruebas.

3. **Mantén una muestra de datos de validación independiente**:

Aparta una muestra de datos de validación que no se utilice en el proceso de ajuste de modelos. Esta muestra se utilizará solo para una evaluación final del rendimiento antes de implementar la estrategia en un entorno de apuestas real. Se trata de dividir los datos en 3 partes. Un conjunto de entrenamiento, un conjunto de prueba y un conjunto de validación. En el caso de los conjuntos de entrenamiento y de prueba, podemos caer en la tentación de volver atrás tras un mal resultado en la prueba y cambiar los filtros del conjunto de entrenamiento e intentarlo de nuevo. Además, si estamos haciendo validación cruzada, acabamos viendo los resultados de algunos de los conjuntos de prueba, lo que puede influir en nuestros próximos intentos, y a través de nuestra diligente investigación acabamos contaminando los datos de prueba hasta cierto punto y sesgando nuestros esfuerzos de investigación posteriores. Por este motivo, disponer de un conjunto de datos final independiente al que no se le haya aplicado el modelo en ningún momento puede ser útil como validación final del modelo. El equilibrio estriba en determinar el tamaño de los conjuntos de datos de entrenamiento, prueba y validación. Un conjunto demasiado pequeño puede reducir su significado, pero el conjunto de entrenamiento se beneficiará de tantos datos como sea posible para evitar el sobreajuste. Esto es algo que debe juzgar el investigador.

4. **Limita el número de variables y combinaciones**:

Evita utilizar un gran número de variables o probar demasiadas combinaciones de filtros. Cuantas más pruebas realices, mayor será el riesgo de encontrar aparentes patrones solo por azar. Cuantos más filtros se apliquen, más pequeño será el conjunto de datos. Cuanto más pequeño sea el conjunto de datos, más posibilidades hay de que sus resultados se deban sólo a la suerte. Por este motivo, es mejor utilizar menos filtros. Además, no debemos jugar con los filtros para “encontrar” un patrón ganador. Esto tiene una alta probabilidad de filtrar apuestas perdedoras y obtener sólo apuestas ganadoras que parecen ser una tendencia pero que en realidad son sólo el resultado de borrar resultados perdedores. Esto nos lleva al siguiente punto.

5. **Enfoque en fundamentos sólidos**:

En lugar de confiar únicamente en el datamining, basa tus filtros y modelos en fundamentos sólidos y conocimientos de fútbol. Esto podría incluir factores como el rendimiento del equipo en casa y fuera de casa, el estado de los jugadores clave, tácticas del entrenador, enfrentamientos históricos entre equipos, entre otros.

Por fundamentos nos referimos a factores objetivamente medibles. Esto incluye la forma de un equipo, los goles marcados, los goles encajados y los partidos jugados esta temporada que se pueden encontrar en la base de datos de Betaminic. Pero también noticias del equipo como si el delantero principal está lesionado o el capitán suspendido o un nuevo entrenador que se hace cargo de su primer partido, que requieren una rápida comprobación antes de realizar la apuesta real. Las cuotas de un partido pueden considerarse más subjetivas, ya que son decididas por humanos, ya sean las cuotas de apertura del modelo de Pinnacle y las cuotas de cierre después de que las fuerzas del mercado público las hayan empujado hacia arriba o hacia abajo. Hay que tener en cuenta los fundamentos sólidos, y después de haber construido un modelo a partir de la base de datos de Betaminic, ya sea a través de Betamin Builder o a través de Betlamp, añadir un poco de visión humana sobre esos grandes datos puede mejorar el ROI de un sistema en gran medida. Si un delantero estrella está lesionado, puede que merezca la pena saltarse esa apuesta. Las estadísticas no anulan la necesidad de tener conocimientos futbolísticos. Las estadísticas nos proporcionan herramientas poderosas para que sepamos qué partidos mirar y analizar para nuestra decisión final. Puede ser difícil no apostar por un pronóstico por el que ya se ha pagado, pero a veces la capacidad de saber cuándo no apostar es tan importante como saber cuándo apostar.

6. **Prueba con datos fuera de muestra**:

Si es posible, obtén datos adicionales fuera de la muestra original para probar la efectividad de tus filtros y modelos en datos completamente nuevos antes de implementarlos en apuestas reales. Una forma de hacerlo es probar la estrategia “sobre el papel” llevando un registro en una hoja de cálculo de apuestas imaginarias. Si has formulado una estrategia con Betlamp, entonces necesitas mantener un registro de tus posibles apuestas para ver si la estrategia funciona antes de realizar apuestas con dinero real. Si has investigado una estrategia con Betamin Builder, entonces puedes guardar esa estrategia o compartirla en la página pública de estrategias y vigilarla durante un número de apuestas sin pagar dinero por picks en ella todavía. Betamin Builder registra los resultados desde que se creó / desde que se compartió y puedes ver si la tendencia continúa más allá de los datos de entrenamiento, prueba y validación en los nuevos datos.

7. **Reevaluación periódica**:

Realiza una reevaluación periódica de tus filtros y estrategias. Los mercados deportivos pueden cambiar con el tiempo, y lo que funcionaba en el pasado podría no ser efectivo en el futuro. Mantén tus modelos actualizados y adapta tus enfoques según sea necesario. En la sección de estrategias compartidas de Betamin Builder se puede ver a menudo “(Actualizado xx-xx-xxxx)” en algunos de los nombres de las estrategias que muestran que un usuario ha vuelto atrás y ha vuelto a investigar su estrategia incluyendo los datos más recientes. El número de ligas disponibles en la base de datos de Betaminic ha crecido y cada año hay más de 30.000 nuevos datos de partidos que se añaden a las estrategias.

 

 

Haz que las estadísticas trabajen para ti

Recuerda que ningún modelo o filtro puede garantizar el éxito absoluto en las apuestas deportivas, ya que siempre existe un elemento de incertidumbre. Sin embargo, si se siguen prácticas de validación sólidas y se evitan los ajustes excesivos y el análisis de datos demasiado simplista, se puede aumentar la probabilidad de obtener resultados más coherentes y realistas en el futuro.

 

Regístrate gratis para acceder a Betamin Builder aquí.

25 Equipos Más Rentables para apostar en el 2023

Aprende a automatizar las estrategias de Betaminic con un bot de apuestas.

Lee más sobre los planes de staking aquí.

Accede a Betlamp, la increíble herramienta gratuita de estadísticas aquí.

Lee más artículos de Betaminic aquí.