[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]16 ноя 2022, 06:27
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]15 ноя 2022, 21:47
Клиены dom.ru из СПб, около 2.4 миллиона.
В 2-х текстовых файлах содержатся данные юридических и физических лиц:
- ФИО
- адрес
- ИНН, ФИО директора, банковские реквизиты (для юр. лиц)
- дата рождения (не у всех)
- телефон (2,7 млн уникальных номеров)
Судя по информации из этих файлов, данные актуальны на 09.11.2021.
Доброе утро!
Публикую свою версию обработки этой утечки, ранее здесь выложенной
TTM
Что сделано:
-Объединил в один два файла {в одном были номера, в другом ФИО и некоторые другие данные};
-Убрал основные дубли и мусор {не всё, там ещё есть мусорные номера, неправильные номера, записи с двумя номерами, но эти оставил специально т. к. можно выявить связь между двумя телефонами};
Что можно сделать:
-Убрать данные о адресе, потому что там для обычного человека мало пользы без их обогащения;
-Убрать телефоны типа 1111111111111, но стоит делать это с осторожностью, у подобных записей есть иные полезные данные;
Данные о файле:
-Кодировка:
Кириллица Win-1251
-Разделитель:
вертикальная черта |
-Количество строк с данными:
3.587.076
-Вес файла в архиве/распакованного:
53.2МБ/284МБ
-Столбцы с днными:
ТЕЛЕФОН|ФИО|АДРЕС|ДИРЕКТОР|ПОМЕЩЕНИЕ|КОНТАКТ|E-MAIL|ВИП-ФИО|ВИП-ПОСТ|ИНН|КОНТАКТ ПОСТ|ПАСПОРТ|КПП|ДАТА РОЖДЕНИЯ|ДАТА ИМПОРТА|ДАТА
Дополнительная информация:
-В последнем столбце ошибся, написал ДПТП вместо ДАТА
-
Почему много повторных строк с разными номерами? - Потому что к базе похоже привязывались номера членов семьи или коллектива, где-то к домофону, к договору, к личному кабинету, еще как-то они связывались друг с другом.
-
Почему некоторые записи не совпадают по ФИО с другими базами данных, либо совпадают по фамилии, но это скорее всего другой член семьи? - Потому что основная запись, вероятно, идёт на имя того, с кем заключали договор, а телефоном может пользоваться кто-то другой.
ВНИМАНИЕ! Выше лишь мои предположения.
Ссылка на архив:
Скрытый текст
Для просмотра скрытого текста необходимо быть авторизованным пользователем.
Пароль на архив: phreaker.info