Pianificazione degli esperimenti

Calcolatore della dimensione del campione per il test A/B

Utilizza questa pagina per pianificare il traffico o il numero di utenti necessari prima di avviare un esperimento. È pensata per semplici test A/B a due varianti, in cui si desidera rilevare un incremento significativo con una sensibilità statistica sufficiente.

Condividi pagina
Aiuta gli altri a trovare più rapidamente il calcolatore giusto
Affidabilita
Maggiore confidenza
Bias
Riduci errore
Efficienza
Evita sovracampionamento

Calcolatore della dimensione del campione per il test A/B

Usa il calcolatore qui sotto per una stima rapida in questa pagina.

Per variante
3,842
Campione consigliato per ogni variante in un test a due varianti.
Campione totale
7,684
Traffico combinato tra A e B.
Avvia il sondaggio dopo il calcolo del campione

Inizia a creare sondaggi fantastici

Una volta definito il numero di risposte necessarie, il passo successivo e raccoglierle. Con SurveyLegend crei sondaggi coinvolgenti e analizzi in tempo reale.

Quali fattori influenzano la dimensione del campione per i test A/B?

La dimensione del campione per un test A/B dipende principalmente da quattro fattori: il livello di confidenza, la potenza statistica desiderata, il tasso di conversione di base e l'effetto minimo rilevabile che si intende considerare.

Un volume di traffico inferiore richiede più traffico, mentre un volume di traffico superiore ne richiede meno. Anche tassi di conversione di base più bassi tendono ad aumentare il campione necessario.

Perché è importante

Condurre un esperimento con un numero insufficiente di dati rende più facile non rilevare differenze reali o reagire in modo eccessivo al rumore casuale. Pianificare in anticipo la dimensione del campione riduce la tentazione di interrompere prematuramente l'esperimento a causa di risultati instabili.

Questa pagina fornisce un obiettivo pratico per ogni variante, in modo da poter valutare se un test è realistico prima del lancio.

  • Stimare il fabbisogno di traffico prima del lancio
  • Imposta durate di prova realistiche
  • Evitare esperimenti con potenza statistica insufficiente.
  • Allineare i team su cosa si intende per sollevamento significativo

Come utilizzare il risultato

Il risultato per variante indica approssimativamente quante osservazioni dovrebbe ricevere ciascuna variante. La dimensione totale del campione corrisponde al traffico combinato di entrambe le varianti.

Se il risultato sembra eccessivo rispetto al traffico disponibile, il passo successivo usuale è riconsiderare l'effetto minimo rilevabile, non eseguire lo stesso test con meno dati.

Come trasformare il risultato in un piano di test

Una volta definito l'obiettivo di campionamento per ciascuna variante, confrontatelo con il traffico settimanale per stimare la durata necessaria all'esperimento. Questo vi aiuterà a valutare la fattibilità del test prima di avviare la fase di progettazione e sviluppo.

La dimensione del campione è solo una parte della qualità di un esperimento. Un tracciamento preciso, una linea di base stabile e una chiara regola di arresto sono comunque importanti, perché un campione ampio non può salvare un esperimento mal condotto.

  • La durata della stima si basa sul traffico per variante, non sul traffico totale del sito.
  • Scegliere l'effetto minimo rilevabile prima del lancio
  • Mantenere stabili l'allocazione e il tracciamento durante l'esecuzione.
  • Evitate di interrompere l'attività prematuramente quando i risultati sembrano temporaneamente promettenti.

Pagine correlate per Calcolatore della dimensione del campione per il test A/B

Domande frequenti

Che cosa misura questo calcolatore per test A/B?
Stima quanti utenti o sessioni ti servono per variante e in totale in base a livello di confidenza, potenza, tasso di conversione di base ed effetto minimo rilevabile.
Che cos’è l’effetto minimo rilevabile?
L’effetto minimo rilevabile è il più piccolo miglioramento che vuoi che il test rilevi in modo affidabile. Effetti più piccoli richiedono campioni più grandi.
Perché contano sia la potenza sia la confidenza?
La confidenza controlla i falsi positivi, mentre la potenza controlla i falsi negativi. Entrambe influenzano il traffico necessario prima di fidarti del risultato di un esperimento.
Come faccio a convertire il risultato del campione in una durata del test?
Prendi il campione target per variante e confrontalo con il numero di utenti idonei o sessioni che ogni variante riceve nel tempo. Questo ti fornisce una stima del tempo di esecuzione più realistica rispetto a considerare solo il traffico totale del sito.
Posso comunque eseguire il test se il numero di campioni richiesti è troppo elevato?
È possibile, ma bisogna aspettarsi una maggiore probabilità di risultati inconcludenti o fuorvianti. La soluzione migliore è solitamente quella di rivedere l'effetto minimo rilevabile, le ipotesi di base o la portata dell'esperimento prima di avviarlo.