Из миллиона - 800 тысяч отфильтровалось как дубли. В оставшихся 200 т. на одно ФИО приходится 3-5 строк с контактами. Итого реально уникальных записей 50 т.+-[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 07:13 1млн из 30 миллионов клиентов Альфы.
из СМИ: «Команда KibOrg в сотрудничестве с хакерами NLB взломали базу данных российского Альфа-Банка. Получены персональные данные более 30 миллионов клиентов крупнейшего частного банка России»
Офтопиккрасавы! если это действительно так, то пацаны профи, прут прям через колготки![]()
![]()
Прочие базы данных ч.2 -АРХИВ
-
- профи
- Сообщения: 56
- Зарегистрирован: 07 дек 2021, 20:45
- Благодарил (а): 27 раз
- Поблагодарили: 136 раз
Re: Прочие базы данных
- deicide
- профи
- Сообщения: 82
- Зарегистрирован: 28 ноя 2021, 15:42
- Благодарил (а): 314 раз
- Поблагодарили: 190 раз
Re: Прочие базы данных
Смотря по каким полям удалять дубли.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 09:22 Из миллиона - 800 тысяч отфильтровалось как дубли. В оставшихся 200 т. на одно ФИО приходится 3-5 строк с контактами. Итого реально уникальных записей 50 т.+-
Прогнал идентификацию по uk, clientcontact_ccode и account_number. Осталось чуть более 614 тыщ записей. ФИО и ДР одинаковые, а вот телефоны и номера счетов разные.
-
- профи
- Сообщения: 56
- Зарегистрирован: 07 дек 2021, 20:45
- Благодарил (а): 27 раз
- Поблагодарили: 136 раз
Re: Прочие базы данных
Сначала прогнал по ФИО, дата рождения, телефон. Получилось 200 т. записей, потом убрал телефон, получилось 44 т. уникальных ФИО. По факту там инфа по 44 т. клиентов, но раскидана на миллион записей. То есть слиты не клиенты, а записи (строки).[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 10:08Смотря по каким полям удалять дубли.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 09:22 Из миллиона - 800 тысяч отфильтровалось как дубли. В оставшихся 200 т. на одно ФИО приходится 3-5 строк с контактами. Итого реально уникальных записей 50 т.+-
Прогнал идентификацию по uk, clientcontact_ccode и account_number. Осталось чуть более 614 тыщ записей. ФИО и ДР одинаковые, а вот телефоны и номера счетов разные.
- deicide
- профи
- Сообщения: 82
- Зарегистрирован: 28 ноя 2021, 15:42
- Благодарил (а): 314 раз
- Поблагодарили: 190 раз
Re: Прочие базы данных
ФИО уникальны, а телефоны потеряны.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 10:19 Сначала прогнал по ФИО, дата рождения, телефон. Получилось 200 т. записей, потом убрал телефон, получилось 44 т. уникальных ФИО. По факту там инфа по 44 т. клиентов, но раскидана на миллион записей. То есть слиты не клиенты, а записи (строки).
-
- новый пользователь
- Сообщения: 17
- Зарегистрирован: 28 мар 2022, 17:52
- Благодарил (а): 30 раз
- Поблагодарили: 116 раз
Re: Прочие базы данных
Парсинг ресурса ingruz.ru (19.10.2023) (грузоперевозки)
Формат - csv
Количество записей - 12045
Состав полей:
Пароль рекомендованный
[External Link Removed for Guests]
Формат - csv
Количество записей - 12045
Состав полей:
Спойлер
ФИО (физ лицо)
Название компании
Контактное лицо
Регистрация на сайте
Сфера деятельности
ИНН Компании
Город
Адрес
Сотовый телефон
Рабочий телефон
email
ссылка
Название компании
Контактное лицо
Регистрация на сайте
Сфера деятельности
ИНН Компании
Город
Адрес
Сотовый телефон
Рабочий телефон
ссылка
[External Link Removed for Guests]
-
- новый пользователь
- Сообщения: 25
- Зарегистрирован: 15 июн 2022, 16:18
- Благодарил (а): 35 раз
- Поблагодарили: 29 раз
Re: Прочие базы данных
вчера как раз чистил, объединив строки с телефонами в одно поле получил 180 по моему с учетом кучи разных номеров карт и счетов, отделив только ФИО насчитал неполных 44 тыс уников.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 10:19Сначала прогнал по ФИО, дата рождения, телефон. Получилось 200 т. записей, потом убрал телефон, получилось 44 т. уникальных ФИО. По факту там инфа по 44 т. клиентов, но раскидана на миллион записей. То есть слиты не клиенты, а записи (строки).[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 10:08Смотря по каким полям удалять дубли.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]20 окт 2023, 09:22 Из миллиона - 800 тысяч отфильтровалось как дубли. В оставшихся 200 т. на одно ФИО приходится 3-5 строк с контактами. Итого реально уникальных записей 50 т.+-
Прогнал идентификацию по uk, clientcontact_ccode и account_number. Осталось чуть более 614 тыщ записей. ФИО и ДР одинаковые, а вот телефоны и номера счетов разные.
учитывая, что часть карт закончился валид в 2009-2013 - можно делать выводы об актуальности массива...
чекал выборочно - данные сходятся, в целом все равно неплохое дополнение.
а при презентации конечно сильно преувеличили значимость, желая пропиариться слив "всю альфу", впрочем и за это спасибо авторам.
ждем остаток в ближайшее время, там 1-1,5 млн еще можно будет извлечь.
\\
- ratushka
- профи
- Сообщения: 57
- Зарегистрирован: 30 дек 2021, 03:15
- Благодарил (а): 81 раз
- Поблагодарили: 436 раз
База продавцов на Wildberries - 2023
-Обновление-
База продавцов на Wildberries
Актуальность: октябрь 2023
Количество: 405.615 компаний продавцов.
Формат: Excel.
Поля:
ID продавца, Страница на сайте Wildberries, Наименование организации на Wildberries, Адрес организации на Wildberries, Дата регистрации на Wildberries, Количество отзывов, Проданных товаров, Процент товаров с браком, Разделы товаров, Бренды продавца, Ссылки на бренды продавца, Количество товаров в продаже на дату сбора данных, Средняя цена товаров, Средний показатель скидки товаров, Среднее количество отзывов у товаров, Средний показатель рейтинга товаров, Организация, Статус организации, Дата регистрации, ОГРН, ИНН, Юридический адрес, ФИО руководителя, Телефон, Email, Сайт, Мобильный телефон ИП, совладельцы, основной код ОКВЭД, Среднесписочная численность работников, Выручка, Чистая прибыль (убыток).
Под конверт в кронос.
Рекомендованный пароль.
[External Link Removed for Guests]
База продавцов на Wildberries
Актуальность: октябрь 2023
Количество: 405.615 компаний продавцов.
Формат: Excel.
Поля:
ID продавца, Страница на сайте Wildberries, Наименование организации на Wildberries, Адрес организации на Wildberries, Дата регистрации на Wildberries, Количество отзывов, Проданных товаров, Процент товаров с браком, Разделы товаров, Бренды продавца, Ссылки на бренды продавца, Количество товаров в продаже на дату сбора данных, Средняя цена товаров, Средний показатель скидки товаров, Среднее количество отзывов у товаров, Средний показатель рейтинга товаров, Организация, Статус организации, Дата регистрации, ОГРН, ИНН, Юридический адрес, ФИО руководителя, Телефон, Email, Сайт, Мобильный телефон ИП, совладельцы, основной код ОКВЭД, Среднесписочная численность работников, Выручка, Чистая прибыль (убыток).
Под конверт в кронос.
Рекомендованный пароль.
[External Link Removed for Guests]
-
- новый пользователь
- Сообщения: 17
- Зарегистрирован: 28 мар 2022, 17:52
- Благодарил (а): 30 раз
- Поблагодарили: 116 раз
Re: Прочие базы данных
Парсинг риэлторов etagi.com (22.10.2023)
Формат - csv
Количество записей - 12465
Состав полей:
Пароль рекомендованный
[External Link Removed for Guests]
Офтоп
Формат - csv
Количество записей - 12465
Состав полей:
Спойлер
ФИО
Город
email
телефон
еще телефон
ссылка на страницу
Город
телефон
еще телефон
ссылка на страницу
[External Link Removed for Guests]
Офтоп
Спойлер
Изначально планировал спарсить телефон и мыло, но нашел в коде страницы интересную инфу, а именно:
Разрабы решили не париться и оставили все внутри кода страницы. Я так понял, в первом столбце телефонов часть виртуальных номеров, во втором уже реальные телефоны риэлторов
Спойлер
{"name":"Является стажером","value":"Нет"}},"department":10,"replacement_phones":{"0":"79068253523"},"user_phone":"79206421644","id":24357,"email":"[email protected]","city_name":"Москва}
- Olkaddott
- профи
- Сообщения: 158
- Зарегистрирован: 14 авг 2022, 11:11
- Благодарил (а): 54 раза
- Поблагодарили: 703 раза
Re: Прочие базы данных
Покупатели БАДов Казахстан
поля: Телефон, ФИО, Дата рождения, Страна, Город , Дата заказа, Наименование, Цена (за 1 кол-во), Количество
кол-во: 534k
май 2023
поля: Телефон, ФИО, Дата рождения, Страна, Город , Дата заказа, Наименование, Цена (за 1 кол-во), Количество
кол-во: 534k
май 2023
Скрытый текст. Для просмотра нужно быть [Local Link Removed for Guests] и иметь сообщений: 20
- medvedev1974
- профи
- Сообщения: 86
- Зарегистрирован: 29 ноя 2021, 10:56
- Откуда: Moscow
- Благодарил (а): 219 раз
- Поблагодарили: 583 раза
Re: Прочие базы данных
Дамп сайта pharmacosmetica.ru 2023
формат csv
поля: id,date,idgroup,idimg,login,,name,email,balance,balance_site_1,balance_site_3,dauth,cauth,active,authcode,phone,zipcode,region,city,street,home,flat,doorway,domophone,floor,subscription,commonreg,nobirthdate,promo,basket,wish,area,corpus,site,site_b,idold,userpay,sms,noring,lastmobileenter,countmobileenters,corders,idoperator,operatorcb,subscription_s,subscription_b,birthdate,hidden_brand,subscription_p,comment,source,debug,dateupload1c,code1c,nepredotsum,refcode,refpay,user_ref,cosmetician,sberpay,validir,photopassp,photodipl,cosmeticianon,update_getresponse,notup_getresponse,subscription_c,cospetoff,cosmetdt,debugusers,log,userstatus,userstatus_sum,userstatus_count_ord,userAddress,cosmetclient,cosmetspec,cosmetsalon,cosmetbuy,cosmetblock,cosmetsite,cosmetselect,userdeliveries,favorites,favorites_p,loyaltypr,participantpl,specprices
строк 84725
[External Link Removed for Guests]
пароль - сайт
формат csv
поля: id,date,idgroup,idimg,login,,name,email,balance,balance_site_1,balance_site_3,dauth,cauth,active,authcode,phone,zipcode,region,city,street,home,flat,doorway,domophone,floor,subscription,commonreg,nobirthdate,promo,basket,wish,area,corpus,site,site_b,idold,userpay,sms,noring,lastmobileenter,countmobileenters,corders,idoperator,operatorcb,subscription_s,subscription_b,birthdate,hidden_brand,subscription_p,comment,source,debug,dateupload1c,code1c,nepredotsum,refcode,refpay,user_ref,cosmetician,sberpay,validir,photopassp,photodipl,cosmeticianon,update_getresponse,notup_getresponse,subscription_c,cospetoff,cosmetdt,debugusers,log,userstatus,userstatus_sum,userstatus_count_ord,userAddress,cosmetclient,cosmetspec,cosmetsalon,cosmetbuy,cosmetblock,cosmetsite,cosmetselect,userdeliveries,favorites,favorites_p,loyaltypr,participantpl,specprices
строк 84725
[External Link Removed for Guests]
пароль - сайт