Experimentplanning

A/B-test steekproefgrootte calculator

Gebruik deze pagina om te plannen hoeveel verkeer of hoeveel gebruikers je nodig hebt voordat je een experiment uitvoert. Het is ontworpen voor eenvoudige A/B-tests met twee varianten, waarbij je een significante verbetering wilt detecteren met voldoende statistische nauwkeurigheid.

Deel deze pagina
Help anderen sneller de juiste calculator te vinden
Betrouwbaarheid
Meer zekerheid
Bias
Minder fout
Efficiëntie
Vermijd oversampling

A/B-test steekproefgrootte calculator

Gebruik de calculator hieronder voor een snelle schatting op deze pagina.

Per variant
3,842
Aanbevolen steekproef per variant in een test met twee varianten.
Totale steekproef
7,684
Gecombineerd verkeer over A en B.
Start je enquête na het berekenen van je steekproefgrootte

Begin met het maken van mooie enquêtes

Zodra je weet hoeveel reacties je nodig hebt, is de volgende stap ze verzamelen. Met SurveyLegend maak je boeiende enquêtes, verspreid je ze via meerdere kanalen en analyseer je resultaten in realtime.

Wat bepaalt de steekproefomvang van A/B-tests?

De steekproefgrootte voor een A/B-test hangt hoofdzakelijk af van vier factoren: uw betrouwbaarheidsniveau, uw beoogde power, uw basisconversieratio en het minimaal detecteerbare effect dat voor u van belang is.

Kleinere verwachte verbeteringen vereisen meer verkeer, terwijl grotere verwachte verbeteringen minder verkeer vereisen. Lagere basisconversiepercentages leiden doorgaans ook tot een grotere benodigde steekproefomvang.

Waarom dit belangrijk is

Een experiment uitvoeren met te weinig data vergroot de kans op het missen van echte verschillen of het overreageren op willekeurige ruis. Door de steekproefomvang van tevoren te plannen, verklein je de verleiding om vroegtijdig te stoppen op basis van instabiele resultaten.

Op deze pagina vindt u een praktisch streefdoel per variant, zodat u kunt beoordelen of een test realistisch is vóór de lancering.

  • Schat de verkeersbehoeften in vóór de lancering.
  • Stel realistische testduur in.
  • Vermijd experimenten met onvoldoende statistische power.
  • Zorg dat de teams het eens zijn over wat een zinvolle verbetering inhoudt.

Hoe het resultaat te gebruiken

Het resultaat per variant geeft een ruwe schatting van het aantal waarnemingen dat elke variant zou moeten ontvangen. De totale steekproefomvang is het gecombineerde verkeer over beide varianten.

Als het resultaat te groot lijkt voor uw beschikbare dataverkeer, is de gebruikelijke volgende stap om het minimaal detecteerbare effect opnieuw te bekijken, en niet om dezelfde test met minder data uit te voeren.

Hoe zet je het resultaat om in een testplan?

Zodra je een streefwaarde voor de steekproef per variant hebt vastgesteld, vergelijk je deze met het wekelijkse verkeer om te schatten hoe lang het experiment moet lopen. Dit helpt je te bepalen of de test realistisch is voordat je begint met het ontwerpen en ontwikkelen ervan.

De steekproefomvang is slechts één aspect van de kwaliteit van een experiment. Nauwkeurige registratie, een stabiele basislijn en een duidelijke stopregel blijven belangrijk, omdat een grote steekproef een slecht uitgevoerde test niet kan redden.

  • Schat de duur op basis van het verkeer per variant, niet op basis van het totale siteverkeer.
  • Kies het minimaal detecteerbare effect vóór de lancering.
  • Zorg ervoor dat de toewijzing en de tracking stabiel blijven gedurende de run.
  • Stop niet voortijdig, ook al lijken de resultaten op dit moment veelbelovend.

Gerelateerde pagina's voor A/B-test steekproefgrootte calculator

Veelgestelde vragen

Wat meet deze A/B-testcalculator?
Hij schat hoeveel gebruikers of sessies je per variant en in totaal nodig hebt op basis van betrouwbaarheidsniveau, power, baseline-conversieratio en minimaal detecteerbaar effect.
Wat is het minimaal detecteerbare effect?
Het minimaal detecteerbare effect is de kleinste verbetering die je test betrouwbaar moet kunnen detecteren. Kleinere effecten vereisen grotere steekproeven.
Waarom zijn zowel power als betrouwbaarheid belangrijk?
Betrouwbaarheid stuurt fout-positieven, terwijl power fout-negatieven stuurt. Beide beïnvloeden hoeveel verkeer je nodig hebt voordat je een experimentresultaat kunt vertrouwen.
Hoe zet ik het steekproefresultaat om in een testduur?
Neem de steekproefdoelstelling per variant en vergelijk deze met het aantal in aanmerking komende gebruikers of sessies dat elke variant in de loop van de tijd ontvangt. Dat geeft een realistischer beeld van de looptijd dan wanneer je alleen naar het totale websiteverkeer kijkt.
Kan ik de test toch uitvoeren als het vereiste aantal samples te hoog is?
Dat kan, maar houd er rekening mee dat de kans op onduidelijke of misleidende resultaten groter is. Het is doorgaans beter om het minimaal detecteerbare effect, de basisveronderstellingen of de reikwijdte van het experiment opnieuw te bekijken voordat het experiment van start gaat.