Прочие базы данных ч.2 -АРХИВ

ВСЕ СТАРЫЕ И ЗАКРЫТЫЕ ТЕМЫ

Модераторы: konkar, deicide

Закрыто
Аватара пользователя
Burg0mister
профи
Сообщения: 326
Зарегистрирован: 19 июл 2022, 17:07
Благодарил (а): 1794 раза
Поблагодарили: 697 раз

Re: Прочие базы данных

Сообщение Burg0mister »

Всем доброго утра!

Публикую обещанный переработанный KDL.RU
Ранее эти таблицы здесь разместили theduck и sergeiii, за что им спасибо!

В сборке несколько файлов с таблицами, которые извлечены из SQL дампов.
В этой версии не потеряны регионы, даты, комментарии и прочая информация, все должно быть на месте!
Время из формата UNIX в нормальный не переведено, если его исправить или убрать - получится удалить больше дублей.
Если объединить таблицы в одну, думаю что тоже порядочное число дублей должно найтись, но непроверял.
Часть мусорных и тестовых записей удалил, но не все {если будете чистить - осторожнее, потому что слово тест в комментариях может встречаться не как показатель тестовой записи, а как что-то связанное с медицинскими тестами, так можно удалить полезную запись}.

Обработка стандартная:
Кодировка: кириллица Win-1251
Разделитель: вертикальная черта |
Вес файлов распакованных/в архиве: 18.8МБ/5.81МБ
Количество файлов: 16
Изначально SQL таблиц: 2

Ссылка:
Спойлер
Скрытый текст
Для просмотра скрытого текста необходимо быть авторизованным пользователем.
Пароль:
phreaker.info
Спойлер
Если на раздачи ставлю личный пароль - делюсь им безвозмездно, так же он есть и у администрации! Приму в дар БД с контактами, ФИО, адресами по СНГ/РФ. Интересуют: Современные ГИБДД, банки, блэклисты банков, телефоны, спецучет и т. п.
MaratG
Сообщения: 5
Зарегистрирован: 13 июл 2023, 08:01
Благодарил (а): 1 раз
Поблагодарили: 6 раз

Re: Прочие базы данных

Сообщение MaratG »

[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]31 июл 2023, 08:57 Друзья, подскажите как в SQL дубли можно удалить?
В sql (и mysql и postgres) есть ключевое слово distinct, означающее, что нужно вернуть только уникальные строки.
Например, SELECT DISTINCT * FROM mytab вернет только уникальные строки таблицы mytab.
А, например, CREATE TABLE tablename SELECT DISTINCT name, phone FROM othertable сделает новую таблицу tablename с уникальными name, phone.
P.S. Может, где-то чуть ошибся синтаксисом - по памяти писал.
theduck
новый пользователь
Сообщения: 20
Зарегистрирован: 27 янв 2022, 17:48
Благодарил (а): 13 раз
Поблагодарили: 77 раз

Re: Прочие базы данных

Сообщение theduck »

[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]31 июл 2023, 12:23 Всем доброго утра!

Публикую обещанный переработанный KDL.RU
Ранее эти таблицы здесь разместили theduck и sergeiii, за что им спасибо!

В сборке несколько файлов с таблицами, которые извлечены из SQL дампов.
В этой версии не потеряны регионы, даты, комментарии и прочая информация, все должно быть на месте!
Время из формата UNIX в нормальный не переведено, если его исправить или убрать - получится удалить больше дублей.
Если объединить таблицы в одну, думаю что тоже порядочное число дублей должно найтись, но непроверял.
Часть мусорных и тестовых записей удалил, но не все {если будете чистить - осторожнее, потому что слово тест в комментариях может встречаться не как показатель тестовой записи, а как что-то связанное с медицинскими тестами, так можно удалить полезную запись}.

Обработка стандартная:
Кодировка: кириллица Win-1251
Разделитель: вертикальная черта |
Вес файлов распакованных/в архиве: 18.8МБ/5.81МБ
Количество файлов: 16
Изначально SQL таблиц: 2

Ссылка:
Спойлер
Скрытый текст
Для просмотра скрытого текста необходимо быть авторизованным пользователем.
Пароль:
phreaker.info

Время из формата UNIX в нормальный переведено dd.MM.yyyy HH:mm:ss

[External Link Removed for Guests]
theduck
новый пользователь
Сообщения: 20
Зарегистрирован: 27 янв 2022, 17:48
Благодарил (а): 13 раз
Поблагодарили: 77 раз

Re: Прочие базы данных

Сообщение theduck »

kdl_analyzes-id.sql конвертировано в kdl_analyzes-id.sql - logs.csv

[External Link Removed for Guests]
theduck
новый пользователь
Сообщения: 20
Зарегистрирован: 27 янв 2022, 17:48
Благодарил (а): 13 раз
Поблагодарили: 77 раз

Re: Прочие базы данных

Сообщение theduck »

kdl_analyzes-id.sql-logs-decode-Создание пользователя из корзины.csv
-извлечен Создание пользователя из корзины(Phone, date, FIO, IDFizlica, DOB, Sex, Email, Address, CodeWord, CardID, SenderID, CardType, Partner, id, date, tag, table_name) 87732
-дубли убраны
-ДАТА подчищены
-телефоны подчищены
-Разделитель: вертикальная черта |
-кодировка кириллица Win-1251


[External Link Removed for Guests]
imaltsev
профи
Сообщения: 77
Зарегистрирован: 14 май 2023, 16:33
Откуда: Москва
Благодарил (а): 132 раза
Поблагодарили: 416 раз

Re: Прочие базы данных

Сообщение imaltsev »

Полная версия слива от Лукойл.
12 000 000 строк
[External Link Removed for Guests]
imaltsev
профи
Сообщения: 77
Зарегистрирован: 14 май 2023, 16:33
Откуда: Москва
Благодарил (а): 132 раза
Поблагодарили: 416 раз

Re: Прочие базы данных

Сообщение imaltsev »

Полная версия слива от ЗдравСити
10 000 000 строк
[External Link Removed for Guests]
theduck
новый пользователь
Сообщения: 20
Зарегистрирован: 27 янв 2022, 17:48
Благодарил (а): 13 раз
Поблагодарили: 77 раз

Re: Прочие базы данных

Сообщение theduck »

kdl_analyzes-id.sql-logs-decode-Быстрый выезд.csv
-извлечен Быстрый выезд(phone, dbRegion, regionCode, senderId, fio, source, utmSource, utmMedium, utmCampaign, utmContent, utmTerm, id, date, tag) 33917
-дубли убраны
-ДАТА подчищены
-телефоны подчищены
-Разделитель: вертикальная черта |
-кодировка кириллица Win-1251

[External Link Removed for Guests]
imaltsev
профи
Сообщения: 77
Зарегистрирован: 14 май 2023, 16:33
Откуда: Москва
Благодарил (а): 132 раза
Поблагодарили: 416 раз

Re: Прочие базы данных

Сообщение imaltsev »

В свободный доступ попал полный SQL-дамп из CMS «Bitrix» предположительно сайта магазина туристического и горнолыжного снаряжения «СПОРТ-МАРАФОН» (sport-marafon.ru). 👇
В таблице зарегистрированных пользователей 361,987 строк, содержащих:

🌵 ФИО
🌵 телефон (278 тыс. уникальных номеров)
🌵 адрес эл. почты (356 тыс. уникальных адресов)
🌵 хешированный пароль
🌵 адрес (не для всех)
🌵 пол (не для всех)
🌵 дата рождения (не для всех)
🌵 дата регистрации и последнего захода (с 16.05.2012 по 02.04.2023)

[External Link Removed for Guests]
[External Link Removed for Guests]
imaltsev
профи
Сообщения: 77
Зарегистрирован: 14 май 2023, 16:33
Откуда: Москва
Благодарил (а): 132 раза
Поблагодарили: 416 раз

Re: Прочие базы данных

Сообщение imaltsev »

В открытый доступ попал дамп заказов билетной системы "Кинокасса" от разработчика решений для кинотеатров "КИНОПЛАН" ([External Link Removed for Guests]).
ℹ️ 4 JSON-файла в целом содержат информацию о примерно 6 миллионах заказов с такими с такими полями как:
⭕️ Эл. почта;
⭕️ Телефон (350 тысяч уникальных);
⭕️ Данные user_agent;
⭕️ Даты оплаты;
⭕️ Некоторые технические детали.

📅 Актуальность данных на 05.2022 года.

[External Link Removed for Guests]
Закрыто