Experimentplanering

Kalkylator för A/B-teststorlek

Använd den här sidan för att planera hur mycket trafik eller hur många användare du behöver innan du kör ett experiment. Den är utformad för enkla A/B-tester med två varianter där du vill upptäcka en meningsfull ökning med tillräcklig statistisk känslighet.

Dela sidan

Hjälp andra att hitta rätt kalkylator snabbare

X Facebook LinkedIn Reddit

Tillförlitlighet

↑

Högre säkerhet

Bias

↓

Minska fel

Effektivitet

✓

Undvik översampling

Kalkylator för A/B-teststorlek

Använd kalkylatorn nedan för en snabb uppskattning på den här sidan.

KonfidensnivåPower (%)Baslinjekonvertering (%)Minsta detekterbara effekt (pp)

Per variant

3,842

Rekommenderat urval för varje variant i ett test med två varianter.

Totalt urval

7,684

Total trafik över A och B.

Starta din enkät efter att du beräknat urvalsstorlek

Börja skapa snygga enkäter

När du vet hur många svar som behövs är nästa steg att samla in dem. Med SurveyLegend kan du skapa engagerande enkäter och analysera resultat i realtid.

Registrera dig gratis Besök webbplats

Vad som styr A/B-testurvalets storlek

Storleken på A/B-testurvalet beror huvudsakligen på fyra val: din konfidensnivå, din målstyrka, din baslinjekonverteringsfrekvens och den minsta detekterbara effekten du bryr dig om.

Mindre förväntade ökningar kräver mer trafik, medan större förväntade ökningar kräver mindre. Lägre baslinjekonverteringsfrekvenser tenderar också att öka det urval som behövs.

Varför detta är viktigt

Att genomföra ett experiment med för lite data gör det lättare att missa verkliga skillnader eller överreagera på slumpmässigt brus. Att planera urvalsstorleken i förväg minskar frestelsen att stoppa tidigt baserat på instabila resultat.

Den här sidan ger dig ett praktiskt mål per variant så att du kan bedöma om ett test är realistiskt före lansering.

Uppskatta trafikbehov före lansering
Ställ in realistiska testtider
Undvik experiment med låg effekt
Samordna teamen kring vad som räknas som ett meningsfullt lyft

Hur man använder resultatet

Resultatet per variant visar ungefär hur många observationer varje variant bör få. Den totala urvalsstorleken är den kombinerade trafiken över båda varianterna.

Om resultatet ser ut att vara för stort för din tillgängliga trafik är det vanliga nästa steget att ompröva den minsta detekterbara effekten, och inte köra samma test med mindre data.

Hur man omvandlar resultatet till en testplan

När du har ett urvalsmål per variant, jämför det med veckotrafiken för att uppskatta hur länge experimentet behöver köras. Det hjälper dig att avgöra om testet är realistiskt innan design- och konstruktionsarbetet påbörjas.

Urvalsstorleken är bara en del av experimentets kvalitet. Tydlig spårning, en stabil baslinje och en tydlig stoppregel spelar fortfarande roll eftersom ett stort urval inte kan rädda ett dåligt genomfört test.

Uppskatta varaktighet från trafik per variant, inte total webbplatstrafik
Välj den minsta detekterbara effekten före start
Håll allokering och spårning stabil under körningen
Undvik att sluta för tidigt när resultaten ser tillfälligt lovande ut

Relaterade sidor för Kalkylator för A/B-teststorlek

Kalkylator för urvalsstorlek på undersökningen Felmarginalkalkylator Konfidensintervallkalkylator Kalkylator för korrigering av ändlig population Exempel på A/B-teststorlekar Baslinjekonverteringsfrekvens i A/B-testplanering Hur man beräknar A/B-testprovstorleken Minsta detekterbara effekt förklarad Net Promoter Score Calculator

Skapa din enkät nu

Bygg och lansera med SurveyLegend

Vanliga frågor

Vad mäter den här A/B-testkalkylatorn?

Den uppskattar hur många användare eller sessioner du behöver per variant och totalt utifrån konfidensnivå, power, baskonvertering och minsta detekterbara effekt.

Vad är minsta detekterbara effekt?

Minsta detekterbara effekt är den minsta förbättring som testet ska kunna upptäcka på ett tillförlitligt sätt. Mindre effekter kräver större urval.

Varför spelar både power och konfidens roll?

Konfidens styr falska positiva resultat, medan power styr falska negativa resultat. Båda påverkar hur mycket trafik du behöver innan du kan lita på ett experimentresultat.

Hur omvandlar jag provresultatet till en testtid?

Ta stickprovsmålet per variant och jämför det med antalet berättigade användare eller sessioner som varje variant får över tid. Det ger dig en mer realistisk uppskattning av körtiden än att enbart titta på den totala webbplatstrafiken.

Kan jag köra testet ändå om det erforderliga provet är för högt?

Det kan du, men du bör förvänta dig en högre risk för ofullständiga eller missvisande resultat. Det bättre svaret är vanligtvis att se över den minsta detekterbara effekten, utgångsantagandena eller experimentets omfattning före lansering.