De Wet van Benford
Een raar geval
Dr
Frank Benford was een fysicus bij de het Amerikaanse bedrijf General Electric.
In 1938 publiceerde hij een artikel in een wetenschappelijk tijdschrift.
Dit artikel beschrijft het merkwaardige verschijnsel dat in een verzameling
getallen de meeste van die getallen met een 1 beginnen. Minder getallen
beginnen met een 2 en de minste met een 9. Dit gaat in tegen het algemene
gevoel dat de kans op een begincijfer voor alle cijfers van 1 tot en met
9 gelijk is en dus 1/9 zou bedragen. Volgens Benford is dit dus niet zo.
In zijn artikel haalt hij vele voorbeelden aan die zijn stelling ondersteunen.
De wet
In het artikel wordt dan ook uiteindelijk een wetmatigheid gesteld die zegt
dat de kans dat een getal met d begint gelijk is aan log (1+1/d). In de
figuur is dit uitgezet voor de getallen 1 t/m 9 (zie de balkjes). De kans
dat in een reeks getallen een getal met een 1 begint, is dus volgens Benford
ongeveer 30%! De kans dat een getal met een 9 begint daarentegen is slechts
5%. Deze wetmatigheid is later de Wet van Benford gaan heten. Velen hebben
later de moeite genomen om datasets te onderzoeken op de geldigheid voor
de Wet van Benford. Op internet zijn vele voorbeelden te vinden. In vrijwel
alle gevallen claimt men dat voldaan is aan de Wet van Benford.
Eigen onderzoek
Echter, zelf zien is geloven. We nemen de beurspagina van de Volkskrant
van 9 maart 2001 en turven in de rubrieken 'Beleggingsfondsen' en 'FTSE
Eurotop' in de koerslijsten de frequentie van de begincijfers. Totaal staan
er 612 koersgetallen in. Het resultaat staat in de figuur hiernaast. Dat
ziet er aardig uit! Als je grotere databestanden gebruikt, wordt de overeenkomst
met de lijn van Benford steeds beter. Het maakt overigens niet uit waar
de getallen in uitgedrukt zijn. In de Volkskrant zijn de koerslijsten uitgedrukt
in guldens, maar het hadden ook euro's of dollars mogen zijn. Anders gezegd
de kansen zijn onafhankelijk van de gekozen schaal.
Opnieuw uitgevonden
Curieus is verder dat de wetmatigheid die Benford ontdekte, al veel eerder
gevonden was en wel in 1881. In dat jaar publiceerde de Amerikaanse astronoom
en wiskundige Simon Newcomb een wetenschappelijk artikel met dezelfde bevindingen
als Benford 50 jaar later zou doen. Tot slot: ook de waarneming die leidde
tot het artikel van Newcomb is aardig om te vermelden. Hij merkte op dat
de eerste bladzijden van logaritmetabellen veel vaker werden gebruikt dan
de verdere pagina's. Hij kon dit zien aan de vuilheid van de pagina's. Blijkbaar
zochten mensen dus meer logaritmen van getallen beginnen met lage cijfers
dan met hogere cijfers.


