Страница 66 из 68

Re: Прочие базы данных

Добавлено: 23 авг 2025, 12:20
bobber
сконвертировал в csv первые три файла из мегамаркета (1ТБ)
файлы
megamarket.ru_600k_25.12.2024-16.12.2024
megamarket.ru_160k_30.12.2024-25.12.2024
megamarket.ru_1.25m_09.01.2024-31.12.2023

поля: receiver,email,phone,surname,name,patronymic,administrative_area,settlement,street,house,apartment,address_line_1
 Скрытый текст. Для просмотра нужно быть [Local Link Removed for Guests] и иметь благодарностей: 7
пароль: phreaker.in

Re: Прочие базы данных

Добавлено: 23 авг 2025, 18:18
bobber
сконвертировал в csv еще 7 файлов из мегамаркета (1ТБ)
файлы
1_megamarket.ru_4m_17.12.2024-30.10.2024
2_megamarket.ru_2m_28.10.2024-02.10.2024
3_megamarket.ru_4m_01.10.2024-12.08.2024
4_megamarket.ru_1m_12.08.2024-30.07.2024
5_megamarket.ru_4m_30.07.2024-19.06.2024
6_megamarket.ru_4m_19.06.2024-23.05.2024
7_megamarket.ru_4m_23.05.2024-02.05.2024

поля: receiver,email,phone,surname,name,patronymic,administrative_area,settlement,street,house,apartment,address_line_1
 Скрытый текст. Для просмотра нужно поблагодарить автора за это сообщение
пароль: phreaker.in

оставшиеся 7 файлов завтра

Re: Прочие базы данных

Добавлено: 23 авг 2025, 22:38
Boris00
Доброго всем!
Уважаемый "bobber" обрабатывает и выкладывает материал под названием "Мегамаркет".
Я так понимаю что это относиться к сайту: [External Link Removed for Guests] - ВЕНО?

Но по сети гуляет файл с таким же названием "Мегамаркет" на 22.529.827 записей, по в описании стоит сайт [External Link Removed for Guests] (бывший: [External Link Removed for Guests]), и правильное название у него "Магнит Маркет"

Проверил несколько моб номеров из того что выложил bobber и из файла на 22млн совпадений не нашёл (может из-за того что ещё не все файлы готовы)...

Или это разные материалы?

Возник вопрос по более точной идентификации материала
p.s. Проверил нару номеров из обоих материалов в БОТе - показало что номерам (оба номера) есть в утечке "megamarket.ru [06.2023-02.2025]"

???

Re: Прочие базы данных

Добавлено: 23 авг 2025, 23:05
Unlim
Мегамаркет и Магнит Маркет - это две разные базы. Макнит - всё верно на 22 млн. Мегамаркет в несколько раз больше.
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]23 авг 2025, 22:38 Доброго всем!
Уважаемый "bobber" обрабатывает и выкладывает материал под названием "Мегамаркет".
Я так понимаю что это относиться к сайту: [External Link Removed for Guests] - ВЕНО?

Но по сети гуляет файл с таким же названием "Мегамаркет" на 22.529.827 записей, по в описании стоит сайт [External Link Removed for Guests] (бывший: [External Link Removed for Guests]), и правильное название у него "Магнит Маркет"

Проверил несколько моб номеров из того что выложил bobber и из файла на 22млн совпадений не нашёл (может из-за того что ещё не все файлы готовы)...

Или это разные материалы?

Возник вопрос по более точной идентификации материала
p.s. Проверил нару номеров из обоих материалов в БОТе - показало что номерам (оба номера) есть в утечке "megamarket.ru [06.2023-02.2025]"

???

Re: Прочие базы данных

Добавлено: 24 авг 2025, 08:41
sergeiii
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]23 авг 2025, 23:05 Мегамаркет и Магнит Маркет - это две разные базы. Макнит - всё верно на 22 млн. Мегамаркет в несколько раз больше.
для инфы:у меня в MM.RU после чистки (удаления дублей и мусора) осталось 5кк записей

Re: Прочие базы данных

Добавлено: 24 авг 2025, 10:17
bobber
да, это megamarket.ru за 2024
говорят есть еще json файлы за 2023 и 2025, но я сам не встречал

сконвертировал в csv последние 7 файлов из мегамаркета (1ТБ)
файлы
8_megamarket.ru_4m_02.05.2024-14.04.2024
9_megamarket.ru_4m_14.04.2024-27.03.2024
10_megamarket.ru_4m_27.03.2024-14.03.2024
11_megamarket.ru_4m_14.03.2024-03.03.2024
12_megamarket.ru_4m_03.03.2024-17.02.2024
13_megamarket.ru_4m_17.02.2024-28.01.2024
14_megamarket.ru_4m_28.01.2024-09.01.2024

поля: receiver,email,phone,surname,name,patronymic,administrative_area,settlement,street,house,apartment,address_line_1
 Скрытый текст. Для просмотра нужно поблагодарить автора за это сообщение
пароль: phreaker.in

Re: Прочие базы данных

Добавлено: 24 авг 2025, 14:18
sergeiii
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]24 авг 2025, 10:17 говорят есть еще json файлы за 2023 и 2025, но я сам не встречал
вот у меня файл "мегамаркет 2023" ,посмотрите,может это он
[External Link Removed for Guests]

Re: Прочие базы данных

Добавлено: 24 авг 2025, 15:20
bobber
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]24 авг 2025, 14:18
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]24 авг 2025, 10:17 говорят есть еще json файлы за 2023 и 2025, но я сам не встречал
вот у меня файл "мегамаркет 2023" ,посмотрите,может это он
да, насколько я понял, там с 12.06.2023 по 31.12.2023

Re: Прочие базы данных

Добавлено: 24 авг 2025, 17:28
Burg0mister
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]24 авг 2025, 10:17 да, это megamarket.ru за 2024
говорят есть еще json файлы за 2023 и 2025, но я сам не встречал

сконвертировал в csv последние 7 файлов из мегамаркета (1ТБ)
файлы
8_megamarket.ru_4m_02.05.2024-14.04.2024
9_megamarket.ru_4m_14.04.2024-27.03.2024
10_megamarket.ru_4m_27.03.2024-14.03.2024
11_megamarket.ru_4m_14.03.2024-03.03.2024
12_megamarket.ru_4m_03.03.2024-17.02.2024
13_megamarket.ru_4m_17.02.2024-28.01.2024
14_megamarket.ru_4m_28.01.2024-09.01.2024

поля: receiver,email,phone,surname,name,patronymic,administrative_area,settlement,street,house,apartment,address_line_1
Скрытый текст

пароль: phreaker.in
Отличная работа, спасибо!
Вы наверное не ответите, но возник вопрос, если не совсем секрет, как это все достали в нормальном виде? У меня есть конвертеры, но они либо не всегда и не со всеми JSON работают, либо файлы нужно разделять на тысячи фрагментов.

Re: Прочие базы данных

Добавлено: 25 авг 2025, 11:31
bobber
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]24 авг 2025, 17:28 Отличная работа, спасибо!
Вы наверное не ответите, но возник вопрос, если не совсем секрет, как это все достали в нормальном виде? У меня есть конвертеры, но они либо не всегда и не со всеми JSON работают, либо файлы нужно разделять на тысячи фрагментов.
там очень кривая выгрузка логов в json, поэтому обычным способом не получалось выцепить инфу, постоянные ошибки
я извлек нужное мне количество строк после receiver
дальше уже просто питоном распарсил