Vaak is het ontbreken van een deel van de gegevens niet zo erg: bij de mislukte bloedafname zal toeval een grote rol spelen en het is dan niet waarschijnlijk dat de bloedwaarden van deze persoon erg afwijken van die van de andere deelnemers.
Anders is het wanneer mensen uitvallen vanwege aan het onderzoek gerelateerde redenen. Neem het voorbeeld van een gerandomiseerde placebogecontroleerde trial waarbij patiënten in de interventiegroep de interventie zo belastend vinden in verhouding tot het ervaren effect, dat ze er na enige tijd geen zin meer in hebben. Als de uitvallers zich onttrekken aan de vervolgmetingen, zijn de overblijvers geen goede afspiegeling van de hele groep en volgen er te rooskleurige conclusies.
Soms is uitval inherent aan het onderzoek. De Leiden 85-plus Studie, waarin een grote groep mensen van 85 jaar en ouder werd gevolgd om inzicht te krijgen in factoren die samenhangen met ziekte en sterfte op hoge leeftijd, had begrijpelijkerwijs bij ieder volgend meetmoment te maken met een steeds kleiner wordende onderzoekspopulatie.
Bij het beoordelen van onderzoeken, bijvoorbeeld bij het schrijven van Cochrane-reviews, zijn ontbrekende metingen een belangrijk criterium om de kans op vertekende resultaten in te schatten. Het follow-uppercentage dat nog door de beugel kan is een arbitraire keuze. Bij Cochrane-reviews wordt de grens gelegd bij 80%. Is in een trial het percentage deelnemers van wie vervolgmetingen zijn verkregen lager dan 80%, dan krijgt het onderzoek op dit onderdeel als oordeel ‘high risk of bias’.
Er zijn oplossingen voor het probleem van de ontbrekende waarnemingen, ook als de dataverzameling al is afgesloten. Een simpele werkwijze is om, wanneer de bloeddruk van enkele deelnemers niet gemeten is, hiervoor de laatst bekende meting te gebruiken, of bij de personen zonder meting het gemiddelde van alle metingen in te vullen. De laatste decennia zijn er statistische technieken ontwikkeld om ontbrekende waarnemingen op een meer verantwoorde manier ‘op te vullen’. We noemen dit imputeren. Daarbij wordt voor een ontbrekende waarde in de gegevens gebruikgemaakt van de waarden van vergelijkbare deelnemers, maar bovendien een snufje toeval (random error) toegevoegd. Bij zogenaamde multipele imputatie wordt op deze wijze eenzelfde dataset op verschillende manieren aangevuld en vindt de uiteindelijke analyse plaats op meerdere datasets. Deze techniek is tegenwoordig de state of the art.