Hoofdbanner

Sommige cijfers komen in getallenreeksen vaker voor dan andere. Tenminste, wanneer ze door natuurlijke omstandigheden tot stand zijn gekomen, zoals bij het aantal inwoners van een stad of de spaartegoeden bij een bank. Wanneer mensen zelf getallenreeksen verzinnen, zullen ze alle cijfers zoveel mogelijk laten terugkeren in hun overzichten. Omdat ze denken zo het meest eerlijk over te komen. Maar in feite ontmaskeren ze zichzelf juist hiermee.

In 1938 deed de natuurkundige Frank Benford onderzoek naar de lengtes van rivieren. Hij zocht er duizenden van op in atlassen, maakte een tabel en vergeleek de hoeveelheden meters met elkaar. Er bleek iets merkwaardigs aan de hand. Je zou verwachten dat elk cijfer van 1 t/m 9 even vaak zou voorkomen in die lengtes, de rivieren lagen immers willekeurig verspreid. Maar dat was niet het geval.  Sommige cijfers kwamen vaker voor dan andere. Toeval?

Nee, het bleek een wetmatigheid te zijn. Cijfers, door natuurlijke omstandigheden ontstaan, zijn niet willekeurig. Het begincijfer 1 komt vaker voor dan het begincijfer 2, deze weer vaker dan het begincijfer 3, etc.
Al in 1881 was deze merkwaardige eigenschap van reeksen getallen de sterrenkundige Simon Newcomb opgevallen. Hij merkte dat de eerste bladzijden van logaritmetabellen aanzienlijk meer beduimeld waren dan verderop. Kennelijk zochten mensen vaker logaritmen op van getallen beginnend met lagere cijfers. Waarbij hij de conclusie trok dat lagere cijfers vaker voorkwamen dan hogere. 

Deze wetmatigheid lijkt vreemd, maar is enigszins te begrijpen wanneer je bijvoorbeeld naar de huisnummers in een straat kijkt. Neem je de eerste negentien huizen, dan is het begincijfer van huis 10 t/m 19 een 1. Samen met huis één is dat elf op de negentien huizen die met een 1 beginnen, zo’n 58 %. De begincijfers 2 t/m 9 komen in deze situatie ieder maar één keer voor, dus één op de negentien, zo’n 5 %.

Tot en met huisnummer 99 loopt het percentage begincijfers steeds meer gelijk op, maar daarna neemt dat van cijfer 1 weer snel toe. Elk getal begint vanaf 100 immers met een 1. Dit gaat door tot huisnummer 200, waarna weer eenzelfde redenering is toe te passen, etc. Dit kun je ook doen met het begincijfer 2, met 3 en alle andere getallen.

 Benford heeft deze wetmatigheid uitgediept en er een wiskundige formule voor opgesteld. Deze blijkt in de praktijk nauwkeurig te kloppen.

                         F(n) = 100 log (n+1) / n

Dit is de wet van Benford. Daarbij is:
F(n) het percentage waarin een begincijfer voorkomt, log de afkorting van logaritme, het getal n het in te vullen cijfer 1 t/m 9.
Het cijfer 0 is hier buiten beschouwing gelaten (omdat begincijfers gewoonlijk niet met een 0 beginnen: 1/n levert bij n=0 ook geen antwoord op).

Nodig: een rekenmachine. Invullen van de begincijfers 1 t/m 9 geeft dan:
Begincijfer:
1:  een kans van 30,1 %
2:  een kans van 17,6 %
3:  een kans van 12,5 %
4:  een kans van 9,7 %
5:  een kans van 7,9 %
6:  een kans van 6,7 %
7:  een kans van 5,8 %
8:  een kans van 5,1 %
9:  een kans van 4,6 %


De getallen in een groot financieel overzicht bijvoorbeeld voldoen bijna altijd aan de wet van Benford. Accountants van de belastingdienst maken daar gebruik van. Ze gaan er van uit dat het bewust manipuleren van getallen een andere verdeling van begincijfers oplevert dan de wet van Benford voorspelt. Als bijvoorbeeld 7% van de getallen met het cijfer 9 begint, zal men dit nader gaan onderzoeken. Want, het is ongeveer anderhalve keer zoveel als men zou verwachten op grond van de wet van Benford (namelijk 4,6 %).

Op dezelfde manier doet men onderzoek naar tweede cijfers in een getallenreeks. Ook dan behoren de cijfers (volgens een iets andere berekening) niet even vaak voor te komen. Idem bij derde cijfers in een reeks.
Wijken de cijfers in de getallen te veel af van wat op basis van de wet van Benford verwacht zou mogen worden, dan is er zo goed als zeker fraude gepleegd. Met een eenvoudig programmaatje op de computer is dit gemakkelijk op te sporen. Hetgeen dan ook gebeurt. Zo worden in de praktijk bij bijvoorbeeld de belastingdienst fraudeurs in de kraag gevat!