Voortschrijdende Inzichten

Verrassende onderwerpen | Nieuwe invalshoeken

 

Benford's law bij Wikipedia

Over Simon Newcomb bij Wikipedia

Wilfried van Hirtum over de Wet van Benford

Hoe Excel te gebruiken om een dataset te analyseren of deze voldoet an de Wet van Benford: Putting Benford's Law to Work

De Wet van Benford aan de hand van een praktijkgeval

Er is nog een interessante toepassing van de Wet van Benford. De wet kan namelijk gebruikt worden om frauduleuze datasets te ontmaskeren. Zo wordt beweerd dat in sommige staten in de Verenigde Staten de belastingdienst belastingaangiftes op geldigheid onderzoekt met de Wet van Benford. Immers ook voor een belastingsaangifte moet gelden dat alle getallen in de aangifte ongeveer voorkomen in de frequentie die de Wet van Benford voorspelt! Is dit niet zo dan is dit een aanwijzing voor een onjuiste of zelfs frauduleuze belastingsaangifte.

Een frauduleuze advertentie

Voortschrijdende Inzichten onderzocht voor de lezers een ander fenomeen: reclame. Onlangs plaatste een groot bedrijf in elektronica in een huis-aan-huisblad een paginagrote advertentie met opruimingsaanbiedingen. Bij elk item stond ook het aantal vermeld dat nog in voorraad was. De boodschap was duidelijk: lage prijzen gecombineerd met kleine aantallen, dus snel naar de winkel, voordat het op is. Wij onderzochten de begincijfers van de vermelde aantallen op frequentie van voorkomen. We telden totaal 159 aantallen. Het onderzoek leidde tot een verrassende uitkomst. De begincijfers in de advertentie voldeden in het geheel niet aan de Wet van Benford! Zo had het begincijfer 1 ongeveer in 30% van de gevallen moeten voorkomen; het was echter slechts 13%. Wat verder opvalt is dat alle getallen tussen de 5 en 15% van de gevallen voorkomen. Dit lijkt dus nergens op. Het is een sterke aanwijzing dat het bedrijf de aantallen in de advertentie gewoon verzonnen heeft. Daarbij heeft men de klassieke fout gemaakt. Men heeft gedacht: 'Het moet niet opvallen dat we het verzonnen hebben, dus alle getallen moeten ongeveer evenveel voorkomen, althans in mate van voorkomen niet al te erg van elkaar verschillen'. Jammer dat de Wet van Benford voorschrijft dat het nu juist wel veel van elkaar moet verschillen.

De donkerblauwe balken geven de verdeling volgens de Wet van Benford weer. Neem een willekeurige dataset en het blijkt dat 30% van de getallen met een 1 beginnen, 18% met een 2, enz tot 5% met een 9. In de advertentie van bedrijf X (lichtblauwe balken) begint echter slechts 13% van de getallen met een 1 (volgens Benford dus veel te weinig) en bijvoorbeeld 16% met een 9 (wat volgens Benford weer veel te veel is). Bedrijf X is een gefingeerde naam. Het bedrijf is om redenen van privacy niet met de werkelijke naam weergegeven.

Beurskoersen

Beurskoersen vormen een dankbaar onderwerp. Wij namen de koersen van de effectenbeurs in New York van 16 decmeber 2010 (zie de website van het Wallstreet Journal voor de data). De lijst telt ruim 2000 aandelen waarvan we de slotkoersen en de verhandelde volumes analyseerden. Het had misschien beter gekund, maar de data voldoen toch redelijk aan wat de Wet van Benford voorspelt.

Slotkoersen en volumes

Inwoners van Zwitsere gemeenten

Christian Kleiber toetste de Wet van Benford aan de hand een onderzoek van Kristian kleiber naar de inwoneraantallen van Zwitserse gemeenten. Kommen alle Ziffern gleich häufig vor? [Let op! Opent pdf in nieuw venster!]