Definiciones

Glosario

Los términos detrás de cada veredicto, definidos con claridad. Conceptos, no fórmulas: ningún corte de calibración aparece aquí.

Sobreajuste: Cuando una estrategia parece rentable porque se ajustó a los datos del pasado en lugar de capturar una ventaja real. Al probar muchas variantes, alguna luce excelente por azar; con datos nuevos, falla. Detectarlo es el propósito de la validación.
Backtest: Simulación del desempeño de una estrategia sobre datos históricos. Es un punto de partida útil, no una prueba de robustez: un buen backtest puede esconder sobreajuste. El backtest propone; la validación dispone.
Fuera de muestra (out-of-sample): Datos que no participaron en el diseño ni en el ajuste de la estrategia. Medir el desempeño fuera de muestra es la forma básica de comprobar si una ventaja es real o solo memorizó la historia.
Walk-forward: Procedimiento de validación que avanza en el tiempo: entrena sobre un tramo, prueba sobre el siguiente y repite. Imita cómo operaría la estrategia en la práctica y penaliza a las que solo funcionan mirando hacia atrás.
Ratio de Sharpe: Medida clásica de rendimiento ajustado por riesgo. Es informativa pero fácil de inflar: si eliges la mejor de muchas configuraciones, su Sharpe está sesgado por la búsqueda. Por eso se «deflacta» (ver Deflated Sharpe Ratio).
Deflated Sharpe Ratio (DSR): Versión corregida del ratio de Sharpe que descuenta el efecto de haber probado múltiples variantes y la no-normalidad de los retornos. Estima si la ventaja es real o un artefacto de la selección. Método publicado por Marcos López de Prado (2014).
Probabilidad de sobreajuste del backtest (PBO): Estima qué tan probable es que la configuración «ganadora» dentro de la muestra resulte mediocre fuera de ella. Una probabilidad alta es la firma del sobreajuste: el desempeño in-sample no sobrevive cuando cambian los datos.
Validación cruzada purgada (CPCV): Validación cruzada combinatoria purgada. Prueba la estrategia sobre muchas combinaciones de tramos de entrenamiento y de prueba, en vez de una sola división, para obtener una lectura más estable de su desempeño fuera de muestra.
Embargo y purga: Dos salvaguardas que hacen honesta la validación cruzada en series temporales. La purga elimina observaciones de entrenamiento que se solapan en el tiempo con el tramo de prueba; el embargo descarta un margen alrededor de ese tramo. Juntas evitan que información cercana en el tiempo se filtre y exagere los resultados.
Score de Robustez: Calificación de 0 a 100 que resume qué tan robusta es una estrategia según la validación. Acompaña a una banda y a un veredicto. Mide robustez, no rentabilidad esperada, y no predice ganancias. Los cortes que separan un nivel de otro son parte de la calibración y no se publican.
Bandas de robustez: Las categorías en que se expresa el resultado. La banda es pública; la calibración que la determina es privada:; Robusta — cumple los estándares con grado de auditoría en las dimensiones evaluadas.; Robustez Condicional — muestra potencial robusto, con debilidades específicas a refinar antes de desplegar.; Robustez Limitada — calidad por debajo del umbral de robustez, con debilidades materiales; requiere retrabajo estructural.; No Robusta — no es desplegable en su forma actual; se recomienda retrabajo significativo antes de revalidar.
Abstención de Opinión: El desenlace cuando la muestra es insuficiente para una evaluación con grado de auditoría. No es un «fallo» de la estrategia: significa que no hay evidencia suficiente para emitir un veredicto. La vía es generar más datos de operaciones y volver a enviar.
Veredicto: La conclusión del certificado: la banda, el Score de Robustez cuando corresponde, y la explicación de qué significa el resultado y cuáles son los próximos pasos.
Resultado acotado: Cuando una o más puertas de control limitan el resultado, el certificado lo señala como acotado y no emite un puntaje numérico. Indica qué control fue determinante, sin revelar sus umbrales.
ID de Certificado (folio): El identificador único de cada certificado, con el formato TRV-XXXX-XXXX. Permite referirse a una validación específica y, junto con el hash, verificar su autenticidad.
Hash de Reproducibilidad: Huella criptográfica del veredicto y de las entradas que lo produjeron. Con las mismas entradas se obtiene el mismo hash, lo que permite confirmar que el certificado no se alteró tras emitirse.

Aviso. TRAVIDENCE es un servicio de validación independiente. No es asesoría financiera ni una recomendación de inversión. El rendimiento pasado no garantiza resultados futuros; ninguna validación elimina el riesgo de pérdida.

Lee cómo se aplican estos conceptos en la metodología →