14 сент. 2015 г.

Занимательная статистика

Каждый раз, когда я вхожу в электронный банк, или когда перевожу деньги мне прихоят СМС с паролем. При этом я всегда удивляюсь, почему в 99% случаев в пароле есть 2 одинаковые цифры. Я не помню, чтобы были 3 одинаковые и как-то раз видел все 5 цифр разные.
У меня закралось сомнение, что генерация этого пароля дело случая. Решил проверить.

Вспонмив основы матстатистики я посчитал вероятность того, что в пятизначном числе как минимум 1 цифра повторяется более одного раза. Для этого я посчитал сколько всего бывает пятнизначных чисел - 10 в 5й степени = 100000. И потом посчитал сколько всего комбинаций бывает, когда все цифры разные. Посчитать это просто. Первой цифрой может быть любая из 10 цифр. Второй уже только из 9, так как одна цифра уже использована. То есть всего комбинаций: 10*9*8*7*6 = 30240.
Таким образом, вероятность того, что в числе все цифры разные равна 30% (30240/100000).

Это число показалось мне сильно завышенным. И я решил уточнить условия. Наверняка, число не может начинаться с нуля. Поэтому всего комбинаций 90000, а чисел с разными цифрами 9*8*7*6*5 = 15120.
Вероятность в этом случае равна примерно 17%.

Уже лучше. Но никак необъясняет того факта, что мне приходит практически всегда по 2 одинаковых цифры.

Судя по всему алгоритм генерации кода специально включает этот элемент. Вот только зачем? Ведь это сокращает общее количество вариантов... Кто-то знает?

1 комментарий:

  1. Если число не может начинаться с нуля, то комбинаций 9*9*8*7*6, второе число ведь может быть нулём. Таким образом, вероятность та же - 30%.

    Вероятность вполне нормальная, почитай про парадокс дней рождений.

    ОтветитьУдалить