Vem är den här A/B-testguiden för?

Den här guiden är för produktteam, growth marketers, analytiker och alla som planerar experiment och vill fatta bättre beslut om effektstorlek, trafik och testdesign.

Vad bör jag göra efter att ha läst den här sidan?

Använd förklaringen här för att välja realistiska antaganden och gå sedan vidare till kalkylatorn eller relaterade sidor för att uppskatta den trafik du behöver för ditt experiment.

Vilken är den bästa utgångspunkten för att planera urvalsstorleken för A/B-testning?

Börja med den effektstorlek som faktiskt skulle ha betydelse för ett produkt- eller affärsbeslut, kombinera sedan det med baslinjekonverteringsfrekvens, konfidensnivå och effekt. Den ordningen håller testet fokuserat på meningsfulla resultat.

Varför kan två liknande tester behöva väldigt olika prover?

Eftersom baslinjekonverteringsfrekvensen, måleffekten och trafikkvaliteten kan skilja sig åt även om ändringen av användargränssnittet ser liknande ut. Den statistiska uppställningen, inte bara den kreativa idén, avgör urvalskravet.

Experimentguide

Hur man beräknar A/B-testprovstorleken

Planering av A/B-testurvalsstorlek handlar främst om att bestämma vilken förändringsstorlek som är värd att detektera och hur mycket säkerhet man vill ha kring testet. Den här sidan går igenom den praktiska logiken bakom den beräkningen.

Börja med den effekt som spelar roll

Planering av A/B-test börjar med den minsta detekterbara effekten, inte med själva urvalsstorleken. Först bestämmer du vilken förändring som faktiskt skulle vara tillräckligt meningsfull för att påverka ett produkt-, tillväxt- eller designbeslut.

Små effekter kräver mycket större stickprov för att upptäckas.

Lägg till självförtroende och kraft

Konfidensnivån styr hur strikt du vill vara gällande slumpmässig variation. Styrkan styr hur sannolikt det är att du upptäcker en verklig effekt om den existerar. Tillsammans sätter de testets känslighet.

Högre standarder för båda åtgärderna ökar vanligtvis den trafik som behövs.

Använd en realistisk baslinje

Baskonverteringsfrekvensen är grunden för beräkningen. En sida som redan konverterar med 2 % beter sig annorlunda än en sida som konverterar med 20 %, även när målökningen ser liknande ut i absoluta punkter.

Det är därför planering av urvalsstorlek för A/B-test fungerar bäst när den använder aktuell baslinjedata snarare än grova gissningar.

En praktisk planeringssekvens

En bra ordning är att först definiera beslutströskeln, uppskatta en realistisk baslinje, välja den minsta detekterbara effekten och först sedan titta på urvalsstorleken. Det håller experimentet förankrat i affärsrelevans istället för att börja enbart med trafik.

Det hjälper också team att undvika att utforma tester som är tekniskt giltiga men operationellt orealistiska. Om körtiden blir för lång behöver de tidigare antagandena vanligtvis revideras före lansering.

Välj en effektstorlek som faktiskt skulle förändra ett beslut
Använd aktuell baslinjedata från samma trattsteg
Kontrollera körtiden innan du påbörjar experimentet
Revidera planen istället för att lansera ett uppenbart underdrivet test

Hur man beräknar A/B-testprovstorleken

Börja med den effekt som spelar roll

Lägg till självförtroende och kraft

Använd en realistisk baslinje

En praktisk planeringssekvens

Relaterade sidor för Hur man beräknar A/B-testprovstorleken

Vanliga frågor