De Wet van Benford
Het is inmiddels ruim tien (10) jaar geleden dat we voor het eerst aandacht schonken aan de Wet van Benford. In ons toen nog bestaande tijdschrift Voortschrijdende Inzichten besteedden we in het nulnummer aandacht aan de even curieuze als meedogenloze Wet van Benford. Iedere keer opnieuw blijkt deze wet aan grote delen van de mensheid onbekend is. Hoewel we ook toen al berichtten dat de Wet van Benford kan worden ingezet om frauduleuze belastingaangiftes te detecteren, blijken toch iedere keer weer financiële fraudeurs tegen de lamp te lopen.
Het NWT Magazine (
) bericht in zijn oktobernummer 2011 over een wel erg actuele fraudeur: de Griekse overheid! Het artikel onder de titel 'Gepakt door begincijfers' is gebaseerd op de uitkomsten van een onderzoek van een aantal Duitse onderzoekers [Bernhard Rauch, Max Göttsche, Gernot Brähler, Stefan Engel (2011) Fact and Fiction in EU-Governmental Economic Data (
). German Economic Review, volume 12 (3), 243–255]. Pikant aan het onderzoek is ook dat er ook andere landen zijn waarvan de cijfers misschien niet in orde zijn. Het minst verdacht, of moeten we gewoon zeggen onverdacht, is Nederland. Kortom: lees het ardige artikel in het NWT magazine.
Een raar geval
Dr Frank Benford was een fysicus bij de het Amerikaanse bedrijf General Electric. In 1938 publiceerde hij een artikel in een wetenschappelijk tijdschrift. Dit artikel beschrijft het merkwaardige verschijnsel dat in een verzameling getallen de meeste van die getallen met een 1 beginnen. Minder getallen beginnen met een 2 en de minste met een 9. Dit gaat in tegen het algemene gevoel dat de kans op een begincijfer voor alle cijfers van 1 tot en met 9 gelijk is en dus 1/9 zou bedragen. Volgens Benford is dit dus niet zo. In zijn artikel haalt hij vele voorbeelden aan die zijn stelling ondersteunen.
De wet
In het artikel wordt dan ook uiteindelijk een wetmatigheid gesteld die zegt dat de kans dat een getal met d begint gelijk is aan log (1+1/d). In de figuur is dit uitgezet voor de getallen 1 t/m 9 (zie de balkjes). De kans dat in een reeks getallen een getal met een 1 begint, is dus volgens Benford ongeveer 30%! De kans dat een getal met een 9 begint daarentegen is slechts 5%. Deze wetmatigheid is later de Wet van Benford gaan heten. Velen hebben later de moeite genomen om datasets te onderzoeken op de geldigheid voor de Wet van Benford. Op internet zijn vele voorbeelden te vinden. In vrijwel alle gevallen claimt men dat voldaan is aan de Wet van Benford.
Echter, zelf zien is geloven. We namen de beurspagina van de Volkskrant van 9 maart 2001 en turfden in de rubrieken 'Beleggingsfondsen' en 'FTSE Eurotop' in de koerslijsten de frequentie van de begincijfers. Totaal stonden er 612 koersgetallen in. Het resultaat staat in de figuur hiernaast. Dat ziet er aardig uit! Als je grotere databestanden gebruikt, wordt de overeenkomst met de lijn van Benford steeds beter. Het maakt overigens niet uit waar de getallen in uitgedrukt zijn. In de Volkskrant waren de koerslijsten uitgedrukt in guldens, maar het hadden ook euro's of dollars mogen zijn. Anders gezegd de kansen zijn onafhankelijk van de gekozen schaal.

De Wet van Benford. Donkerblauwe balken: wat de Wet van Benford voorspelt.
Lichtblauwe balken: de resultaten van de tellingen in de koerslijsten.
Opnieuw uitgevonden
Curieus is verder dat de wetmatigheid die Benford ontdekte, al veel eerder was gevonden en wel in 1881. In dat jaar publiceerde de Amerikaanse astronoom en wiskundige Simon Newcomb een wetenschappelijk artikel met dezelfde bevindingen als Benford 50 jaar later zou doen. Tot slot: ook de waarneming die leidde tot het artikel van Newcomb is aardig om te vermelden. Hij merkte op dat de eerste bladzijden van logaritmetabellen veel vaker werden gebruikt dan de verdere pagina's. Hij kon dit zien aan de vuilheid van de pagina's. Blijkbaar zochten mensen dus meer logaritmen van getallen beginnen met lage cijfers dan met hogere cijfers.
De
Wet van Benford aan de hand van een praktijkgeval

De eerste pagina van het artikel van Benford

