Закон Бенфорда: как математика ловит мошенников
Если я попрошу вас загадать случайное число, скажем, от 1 до 10 000. Какова вероятность, что оно будет начинаться с цифры 1?
Интуиция подсказывает: ну, всего цифр девять (1, 2, ... 9). Значит, вероятность для каждой - примерно 11% (1/9).
А вот и нет. В реальном мире всё работает иначе.
В чем суть закона?
В большинстве наборов данных из реальной жизни, которые охватывают несколько порядков (например, от сотен до миллионов), числа не распределены равномерно.
Существует странная магия:
▪️Примерно 30% всех чисел начинаются с единицы.
▪️Около 18% начинаются с двойки.
▪️...
▪️И только менее 5% чисел начинаются с девятки.
Этот график убывающей вероятности называется Законом Бенфорда (или законом первой цифры).
Где это работает?
Это работает почти везде, где данные возникают естественным путем или в результате роста:
🔹 Население всех городов в стране.
🔹 Длины всех рек на планете.
🔹 Цены акций на бирже.
🔹 Размеры файлов на вашем жестком диске.
🔹 Числа в вашей налоговой декларации (если она честная!).
Почему так? (Очень упрощенно)
Представьте, что у вас есть 1000 рублей. Чтобы ваше состояние начало начинаться с двойки (2000), вам нужно удвоить капитал - рост на 100%. А чтобы состояние выросло с 8000 до 9000, нужен рост всего на 12.5%. Вы гораздо дольше "просидите" в зоне единицы, чем в зоне восьмерки или девятки.
🚨 Как это используют на практике?
Это мощнейший инструмент для поиска мошенничества и подделок.
Когда человек пытается придумать "случайные" числа (например, подделывая бухгалтерский отчет или результаты выборов), он подсознательно старается использовать цифры равномерно. Ему кажется подозрительным писать слишком много единиц.
В итоге его фальшивый отчет нарушает Закон Бенфорда. Налоговые службы и аудиторы по всему миру используют этот математический трюк, чтобы автоматически находить подозрительные документы для проверки.
Математика - лучший детектор лжи!
P.S. Закон не работает на данных с жесткими рамками (например, рост взрослых людей - там почти всё начинается с 1 или 2) или на действительно случайных наборах вроде лотерейных номеров.
👉 @Pomatematike