Добрый вечер!
Недавно была утечка книжного магазина
book24.ua, по сети начали распространять несколько SQL с данными. На форуме исходники опубликовал
FamilyTheRapy
Публикую обработанные файлы.
Что сделано:
-Извлечена информация {из почти 8ГБ осталось 100МБ};
-Немного почищен мусор, тестовые записи;
-Приведены в привычный нам вид даты рождения {ДД-ММ_ГГГГ};
-Убран основной мусор из номеров телефонов, однако сами мусорные номера типа: 1111111111 остались, так же НЕ нормализовал номера без приписанного кода 380;
-Логически верно расставлены столбцы {ФИО, ДР, Контакты}.
Разделитель: вертикальная черта
|
Получилось на выходе 9 файлов {хотя агрегаторы утечек пишут лишь о трёх больших таблицах}.
Информация в этих файлах пересекается и дублируется, поэтому если сильно заморочиться – думаю можно уменьшить их количество и обогатить ими друг друга, после этого зачистив дубли.
Для меня это не приоритетная база, а времени совсем нет, поэтому провёл лишь основное извлечение и зачистку данных и передаю как есть на углублённую чистку и перевод в Кронос умельцам.
Один из файлов оставляю в том виде, в котором извлёк из SQL, там нет разделителей и я не стал париться с зачисткой.
В этом файле 308 тысяч строк, которые содержат ФИО, телефоны, почту.
Они же повторяются и в других таблицах, но с разделителями и по отдельности в разных файлах.
Пароль: рекомендованный.
ССЫЛКА НА АРХИВ:
Скрытый текст
Для просмотра скрытого текста необходимо быть авторизованным пользователем.