A/B-concept

Statistische power voor A/B-testen

De power is de waarschijnlijkheid dat je test een reëel effect van de gewenste omvang detecteert. In de praktijk is het een van de duidelijkste manieren om na te denken over hoe groot de kans is dat je experiment iets belangrijks over het hoofd ziet.

Wat macht betekent

Als de power 80% is, is uw test ontworpen om het beoogde effect in ongeveer 80% van de gevallen te detecteren, mits dat effect daadwerkelijk bestaat. Een lagere power betekent een grotere kans om echte verschillen te missen.

Daardoor wordt stroomvoorziening een kernaspect van de planning, in plaats van een detail dat alleen aan de voorhoede wordt toegevoegd.

Waarom een ​​hoger vermogen meer monsters vereist

Meer vermogen betekent dat je een grotere gevoeligheid wilt, wat meestal meer waarnemingen vereist. Die afweging wordt vooral duidelijk wanneer het verwachte effect klein is.

Veel teams hanteren 80% als gangbare norm omdat dit een goede balans biedt tussen nauwkeurigheid en praktische uitvoerbaarheid.

Hoe gebruik je het bij het plannen?

Vermogen is alleen zinvol in combinatie met een minimaal detecteerbaar effect. Een test kan een hoog vermogen hebben om een ​​groot effect te detecteren en een laag vermogen om een ​​klein effect te detecteren.

Daarom mag er nooit over vermogen worden gesproken zonder de beoogde effectgrootte.

Hoe macht de beslissingen bij daadwerkelijke experimenten beïnvloedt

Kracht is belangrijk, want een test met onvoldoende statistische power kan geen significant resultaat opleveren, zelfs als er wel degelijk een betekenisvolle verandering plaatsvindt. Dit leidt er vaak toe dat teams ten onrechte concluderen dat een idee niet werkte.

Nadenken over het vermogen helpt ook om de verwachtingen van belanghebbenden te managen. Een test met beperkt verkeer kan nog steeds de moeite waard zijn, maar iedereen moet begrijpen welke effectgrootte betrouwbaar kan worden gedetecteerd en welke niet.

  • Gebruik macht om het risico in te schatten dat een reëel effect over het hoofd wordt gezien.
  • Bespreek vermogen samen met MDE, nooit afzonderlijk.
  • Leg de afweging tussen gevoeligheid en rekentijd uit.
  • Vermijd het interpreteren van niet-significante resultaten als bewijs dat er geen verschil is.

Gerelateerde pagina's voor Statistische power voor A/B-testen

Veelgestelde vragen

Wat leer ik op deze pagina?
De power is de waarschijnlijkheid dat je test een reëel effect van de gewenste omvang detecteert. In de praktijk is het een van de duidelijkste manieren om na te denken over hoe groot de kans is dat je experiment iets belangrijks over het hoofd ziet.
Voor wie is deze A/B-testgids bedoeld?
Deze gids is bedoeld voor productteams, growth marketeers, analisten en iedereen die experimenten plant en betere beslissingen wil nemen over effectgrootte, verkeer en testopzet.
Wat moet ik doen nadat ik deze pagina heb gelezen?
Gebruik de uitleg hier om realistische aannames te kiezen en ga daarna naar de calculator of gerelateerde pagina’s om het verkeer te schatten dat je experiment nodig heeft.
Waarom gebruiken veel teams 80% van hun vermogen?
Omdat het een praktische afweging is tussen gevoeligheid en rekentijd. Een hoger vermogen verkleint de kans dat een echt effect over het hoofd wordt gezien, maar verhoogt ook de hoeveelheid dataverkeer die nodig is om de test correct uit te voeren.
Kan een test met laag vermogen nog steeds nuttig zijn?
Soms wel, maar alleen als het team de beperkingen ervan begrijpt. Een test met een lage power heeft een grotere kans om echte effecten te missen, dus een niet-significant resultaat moet met extra voorzichtigheid worden geïnterpreteerd.