Planificación de experimentos

Calculadora de tamaño de muestra para pruebas A/B

Utilice esta página para planificar la cantidad de tráfico o usuarios necesarios antes de realizar un experimento. Está diseñada para pruebas A/B sencillas con dos variantes, donde se busca detectar una mejora significativa con suficiente sensibilidad estadística.

Compartir pagina
Ayuda a otros a encontrar la calculadora adecuada más rápido
Confiabilidad
Mejor confianza
Sesgo
Reducir error
Eficiencia
Evitar sobremuestreo

Calculadora de tamaño de muestra para pruebas A/B

Usa la calculadora de abajo para obtener una estimación rápida en esta página.

Por variante
3,842
Muestra recomendada para cada variante en una prueba de dos variantes.
Muestra total
7,684
Tráfico combinado entre A y B.
Empieza tu encuesta despues de calcular la muestra

Empieza a crear encuestas increibles

Cuando ya sabes cuantas respuestas necesitas, el siguiente paso es recopilarlas. Con SurveyLegend puedes crear encuestas atractivas y analizar resultados en tiempo real.

¿Qué factores determinan el tamaño de la muestra en las pruebas A/B?

El tamaño de la muestra para una prueba A/B depende principalmente de cuatro factores: su nivel de confianza, la potencia objetivo, la tasa de conversión de referencia y el efecto mínimo detectable que le interese.

Los incrementos previstos menores requieren más tráfico, mientras que los incrementos previstos mayores requieren menos. Las tasas de conversión iniciales más bajas también tienden a aumentar la muestra necesaria.

Por qué esto es importante

Realizar un experimento con datos insuficientes aumenta la probabilidad de pasar por alto diferencias reales o de reaccionar de forma exagerada ante el ruido aleatorio. Planificar el tamaño de la muestra con antelación reduce la tentación de detener el experimento prematuramente debido a resultados inestables.

Esta página te ofrece un objetivo práctico por variante para que puedas evaluar si una prueba es realista antes de su lanzamiento.

  • Estimar las necesidades de tráfico antes del lanzamiento.
  • Establezca duraciones de prueba realistas.
  • Evite los experimentos con potencia estadística insuficiente.
  • Alinear a los equipos sobre qué se considera un levantamiento significativo

Cómo utilizar el resultado

El resultado por variante indica aproximadamente cuántas observaciones debería recibir cada variante. El tamaño total de la muestra es el tráfico combinado de ambas variantes.

Si el resultado parece demasiado grande para el tráfico disponible, el siguiente paso habitual es reconsiderar el efecto mínimo detectable, no ejecutar la misma prueba con menos datos.

Cómo convertir el resultado en un plan de pruebas

Una vez que tengas un objetivo de muestra por variante, compáralo con el tráfico semanal para estimar cuánto tiempo deberá durar el experimento. Esto te ayudará a decidir si la prueba es realista antes de comprometerte con el diseño y la ingeniería.

El tamaño de la muestra es solo una parte de la calidad del experimento. Un seguimiento preciso, una línea base estable y una regla de detención clara siguen siendo importantes, ya que una muestra grande no puede compensar una prueba mal ejecutada.

  • Calcula la duración a partir del tráfico por variante, no del tráfico total del sitio.
  • Seleccione el efecto mínimo detectable antes del lanzamiento.
  • Mantenga la asignación y el seguimiento estables durante la ejecución.
  • Evite detenerse prematuramente cuando los resultados parezcan prometedores temporalmente.

Páginas relacionadas para Calculadora de tamaño de muestra para pruebas A/B

Preguntas frecuentes

¿Qué mide esta calculadora de pruebas A/B?
Estima cuántos usuarios o sesiones necesitas por variante y en total según el nivel de confianza, la potencia, la tasa de conversión base y el efecto mínimo detectable.
¿Qué es el efecto mínimo detectable?
El efecto mínimo detectable es la mejora mínima que quieres que la prueba detecte de forma fiable. Los efectos más pequeños requieren muestras más grandes.
¿Por qué importan tanto la potencia como la confianza?
La confianza controla los falsos positivos, mientras que la potencia controla los falsos negativos. Ambas influyen en cuánto tráfico necesitas antes de confiar en el resultado de un experimento.
¿Cómo convierto el resultado de la muestra en la duración de la prueba?
Toma el objetivo de muestra por variante y compáralo con la cantidad de usuarios o sesiones elegibles que recibe cada variante a lo largo del tiempo. Esto te dará una estimación del tiempo de ejecución más realista que si solo consideras el tráfico total del sitio.
¿Puedo ejecutar la prueba de todos modos si la cantidad de muestras requeridas es demasiado alta?
Sí, puedes hacerlo, pero debes esperar una mayor probabilidad de obtener resultados inconclusos o engañosos. Lo más recomendable suele ser revisar el efecto mínimo detectable, las suposiciones iniciales o el alcance del experimento antes de su lanzamiento.