да...emeditor наше все...менял так на "всякий случай" ГРЗ, а вот с ФИО не догадался....пакетная замена шикарная штука - помогла заменить таблицу сдека на телефоны[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:38Можно просто пакетной заменой в Emeditor, там не так много возможных комбинаций.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 11:05Regex-ами можно поправить.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 10:57 Подскажите есть ли что-то подобное в EmEditor?
Прочие базы данных ч.2 -АРХИВ
-
- новый пользователь
- Сообщения: 11
- Зарегистрирован: 14 май 2022, 19:57
- Благодарил (а): 8 раз
- Поблагодарили: 8 раз
Re: Прочие базы данных
- Altron
- профи
- Сообщения: 478
- Зарегистрирован: 23 фев 2022, 04:12
- Благодарил (а): 557 раз
- Поблагодарили: 934 раза
Re: Прочие базы данных
ГРЗ через latrus все время прогоняю.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:43да...emeditor наше все...менял так на "всякий случай" ГРЗ, а вот с ФИО не догадался....пакетная замена шикарная штука - помогла заменить таблицу сдека на телефоны[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:38Можно просто пакетной заменой в Emeditor, там не так много возможных комбинаций.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 11:05
Regex-ами можно поправить.
Тоже "на всякий случай".
Сейчас даже метки стал ставить, была замена через latrus или нет...
- Burg0mister
- профи
- Сообщения: 326
- Зарегистрирован: 19 июл 2022, 17:07
- Благодарил (а): 1811 раз
- Поблагодарили: 697 раз
Re: Прочие базы данных
К сожалению, да, и это работа на годы вперед, если не использовать какие-то хитрые скрипты.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 14:32 в очень многих дампах такое
Подтверждаю, я считал в минимальной версии, где убрал пустые записи без контактов, дат рождения и счетов, там заменил вручную {ниже поясню почему вручную}, было всего в районе 360 строк.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:36 В том файле где 115кк строк их намного больше
Проверил в большом файле, а там их минимум 11 тысяч.
В таблицах с автомобильными номерами это хороший вариант, а вот с ФИО и наименованиями - нет.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:38 Можно просто пакетной заменой в Emeditor, там не так много возможных комбинаций.
Там обилие иностранных граждан и компаний, если транслитирировать прямым методом, тогда такие имена и названия станут бесполезным набором букв, например Alex станет чем-то вроде Алех
К тому же там есть ошибки раскладки, когда часть имени написана правильно клоавишей,Ю но не в той раскладке - Иванович - Иваноdbx
Хочу еще добавить свои рассуждения на тему этой базы.
В оригинальности ее сомнений нет, как и в полезности, можно установить родственные и дружеские связи по номерам телефонов, можно понять где человек раньше жил по старым городским телефонам {а может и сейчас живет}.
Но сдается мне, что нам мало того, что скинули далеко не все записи, которые на самом деле есть, но еще и не выбросили в паблик дополнительные таблицы.
Это же банк, он должен собирать номера документов, ИНН, паспорт, водительское, адрес прописки и фактический, даже отдельная таблица с комментариями СБ могла бы быть.
В данном случае есть лишь пометка рядом с ФИО о том, что клиент умер, даже не в отдельной ячейке, а прямо в ФИО.
У меня такое ощущение, что это либо выгрузка из более сложной базы, которая предназначена для каких-то обзвонщиков, технических служб, тестов, либо это нам специально кинули подачку, но явно не все и не основную рабочую базу, может чтобы мы думали что у нас полная версия и перестали искать?
Спойлер
Если на раздачи ставлю личный пароль - делюсь им безвозмездно, так же он есть и у администрации! Приму в дар БД с контактами, ФИО, адресами по СНГ/РФ. Интересуют: Современные ГИБДД, банки, блэклисты банков, телефоны, спецучет и т. п.
-
- местный
- Сообщения: 33
- Зарегистрирован: 08 ноя 2022, 15:57
- Благодарил (а): 21 раз
- Поблагодарили: 36 раз
Re: Прочие базы данных
Вы проводили всю эту работу с оригинальной версией,которую в тг слили? (Там файл был разбит на три части из-за размера и ещё пароль был G5ydUW>f*qbr8S)[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 23:08К сожалению, да, и это работа на годы вперед, если не использовать какие-то хитрые скрипты.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 14:32 в очень многих дампах такое
Подтверждаю, я считал в минимальной версии, где убрал пустые записи без контактов, дат рождения и счетов, там заменил вручную {ниже поясню почему вручную}, было всего в районе 360 строк.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:36 В том файле где 115кк строк их намного больше
Проверил в большом файле, а там их минимум 11 тысяч.
В таблицах с автомобильными номерами это хороший вариант, а вот с ФИО и наименованиями - нет.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:38 Можно просто пакетной заменой в Emeditor, там не так много возможных комбинаций.
Там обилие иностранных граждан и компаний, если транслитирировать прямым методом, тогда такие имена и названия станут бесполезным набором букв, например Alex станет чем-то вроде Алех
К тому же там есть ошибки раскладки, когда часть имени написана правильно клоавишей,Ю но не в той раскладке - Иванович - Иваноdbx
Хочу еще добавить свои рассуждения на тему этой базы.
В оригинальности ее сомнений нет, как и в полезности, можно установить родственные и дружеские связи по номерам телефонов, можно понять где человек раньше жил по старым городским телефонам {а может и сейчас живет}.
Но сдается мне, что нам мало того, что скинули далеко не все записи, которые на самом деле есть, но еще и не выбросили в паблик дополнительные таблицы.
Это же банк, он должен собирать номера документов, ИНН, паспорт, водительское, адрес прописки и фактический, даже отдельная таблица с комментариями СБ могла бы быть.
В данном случае есть лишь пометка рядом с ФИО о том, что клиент умер, даже не в отдельной ячейке, а прямо в ФИО.
У меня такое ощущение, что это либо выгрузка из более сложной базы, которая предназначена для каких-то обзвонщиков, технических служб, тестов, либо это нам специально кинули подачку, но явно не все и не основную рабочую базу, может чтобы мы думали что у нас полная версия и перестали искать?
-
- профи
- Сообщения: 116
- Зарегистрирован: 19 дек 2022, 16:48
- Благодарил (а): 72 раза
- Поблагодарили: 118 раз
Re: Прочие базы данных
Большой текстовый файл содержит в себе данные из 3 маленьких?[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]13 янв 2024, 12:31Вы проводили всю эту работу с оригинальной версией,которую в тг слили? (Там файл был разбит на три части из-за размера и ещё пароль был G5ydUW>f*qbr8S)[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 23:08К сожалению, да, и это работа на годы вперед, если не использовать какие-то хитрые скрипты.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 14:32 в очень многих дампах такое
Подтверждаю, я считал в минимальной версии, где убрал пустые записи без контактов, дат рождения и счетов, там заменил вручную {ниже поясню почему вручную}, было всего в районе 360 строк.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:36 В том файле где 115кк строк их намного больше
Проверил в большом файле, а там их минимум 11 тысяч.
В таблицах с автомобильными номерами это хороший вариант, а вот с ФИО и наименованиями - нет.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]12 янв 2024, 17:38 Можно просто пакетной заменой в Emeditor, там не так много возможных комбинаций.
Там обилие иностранных граждан и компаний, если транслитирировать прямым методом, тогда такие имена и названия станут бесполезным набором букв, например Alex станет чем-то вроде Алех
К тому же там есть ошибки раскладки, когда часть имени написана правильно клоавишей,Ю но не в той раскладке - Иванович - Иваноdbx
Хочу еще добавить свои рассуждения на тему этой базы.
В оригинальности ее сомнений нет, как и в полезности, можно установить родственные и дружеские связи по номерам телефонов, можно понять где человек раньше жил по старым городским телефонам {а может и сейчас живет}.
Но сдается мне, что нам мало того, что скинули далеко не все записи, которые на самом деле есть, но еще и не выбросили в паблик дополнительные таблицы.
Это же банк, он должен собирать номера документов, ИНН, паспорт, водительское, адрес прописки и фактический, даже отдельная таблица с комментариями СБ могла бы быть.
В данном случае есть лишь пометка рядом с ФИО о том, что клиент умер, даже не в отдельной ячейке, а прямо в ФИО.
У меня такое ощущение, что это либо выгрузка из более сложной базы, которая предназначена для каких-то обзвонщиков, технических служб, тестов, либо это нам специально кинули подачку, но явно не все и не основную рабочую базу, может чтобы мы думали что у нас полная версия и перестали искать?
- Burg0mister
- профи
- Сообщения: 326
- Зарегистрирован: 19 июл 2022, 17:07
- Благодарил (а): 1811 раз
- Поблагодарили: 697 раз
Re: Прочие базы данных
Работал с версией из 3 файлов, да, за день до слива в окончательный паблик обменялся с одним из форумчан, примерно тогда же давний соратник предложил эту базу на разбор без условий, но я уже скачивал к тому времени архивы. Чуть позже увидел версию в одном файле и даже приостановил обработку на время сверки и исследований, однако стало понятно, что версия из трех файлов разбирается удобнее и по материалу не беднее.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]13 янв 2024, 12:31 Вы проводили всю эту работу с оригинальной версией,которую в тг слили? (Там файл был разбит на три части из-за размера и ещё пароль был G5ydUW>f*qbr8S)
Кстати, версия поданная одним файлом своей структурой напомнила мне базу родственных связей, которая мягко говоря не оптимизирована и спустя неделю работы ужимается до 8-11 гигабайт {что-то там в районе 70 миллионов человек, и это не предел}. Жаль не могу поделиться ее обработкой в силу обязательств.
Файл был разбит на части не из-за размера, там разное содержимое по-моему было. Хотя исходники уже удалил, могу путать.
Тесты показали, что да это чья-то версия сборки частей базы, но под мои нужды она не совсем подошла и не считаю ее рациональной, как написал выше, она напомнила родственные связи до обработки, где на каждого человека была отдельная строка с дублями и если в квартире жило пять человек - получалось 5 отдельных строк со всеми жильцами, хотя все это вполне реально уместить в одну строку и не дублировать.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]13 янв 2024, 14:28 Большой текстовый файл содержит в себе данные из 3 маленьких?
Я когда первую тестовую альфу конвертировал, там тоже получилось на каждую личность все свести в одну строку, а не плодить для каждого телефона и каждой карточки отдельные строки с ФИО, датами рождения. Не говоря уже о том, когда к нескольким картам один и тот же телефон привязан и все это по кругу идет. На выходе получается файлик размером в 10 гигабайт и это при условии, что в базе остаются дапнные о картах и счетах, которые далеко не всем нужны. Без них ощутимо меньше. И это еще тоже не самая тщательная чистка, дубли там есть еще из-за дат рождения и контактов местами указанных, местами нет. Если со временем человек, с которым обменялись базами будет не против, поделюсь конвертом.
Хотя выше Search уже поделился своим вариантом, этому форумчанину и его работе на мой взгляд стоит верить.
Спойлер
Если на раздачи ставлю личный пароль - делюсь им безвозмездно, так же он есть и у администрации! Приму в дар БД с контактами, ФИО, адресами по СНГ/РФ. Интересуют: Современные ГИБДД, банки, блэклисты банков, телефоны, спецучет и т. п.
-
- профи
- Сообщения: 116
- Зарегистрирован: 19 дек 2022, 16:48
- Благодарил (а): 72 раза
- Поблагодарили: 118 раз
Re: Прочие базы данных
А мне версия одним файлом зашла больше. Добавил связь по полю идентификатор и любо дорого пользоваться.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]15 янв 2024, 11:08Работал с версией из 3 файлов, да, за день до слива в окончательный паблик обменялся с одним из форумчан, примерно тогда же давний соратник предложил эту базу на разбор без условий, но я уже скачивал к тому времени архивы. Чуть позже увидел версию в одном файле и даже приостановил обработку на время сверки и исследований, однако стало понятно, что версия из трех файлов разбирается удобнее и по материалу не беднее.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]13 янв 2024, 12:31 Вы проводили всю эту работу с оригинальной версией,которую в тг слили? (Там файл был разбит на три части из-за размера и ещё пароль был G5ydUW>f*qbr8S)
Кстати, версия поданная одним файлом своей структурой напомнила мне базу родственных связей, которая мягко говоря не оптимизирована и спустя неделю работы ужимается до 8-11 гигабайт {что-то там в районе 70 миллионов человек, и это не предел}. Жаль не могу поделиться ее обработкой в силу обязательств.
Файл был разбит на части не из-за размера, там разное содержимое по-моему было. Хотя исходники уже удалил, могу путать.
Тесты показали, что да это чья-то версия сборки частей базы, но под мои нужды она не совсем подошла и не считаю ее рациональной, как написал выше, она напомнила родственные связи до обработки, где на каждого человека была отдельная строка с дублями и если в квартире жило пять человек - получалось 5 отдельных строк со всеми жильцами, хотя все это вполне реально уместить в одну строку и не дублировать.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]13 янв 2024, 14:28 Большой текстовый файл содержит в себе данные из 3 маленьких?
Я когда первую тестовую альфу конвертировал, там тоже получилось на каждую личность все свести в одну строку, а не плодить для каждого телефона и каждой карточки отдельные строки с ФИО, датами рождения. Не говоря уже о том, когда к нескольким картам один и тот же телефон привязан и все это по кругу идет. На выходе получается файлик размером в 10 гигабайт и это при условии, что в базе остаются дапнные о картах и счетах, которые далеко не всем нужны. Без них ощутимо меньше. И это еще тоже не самая тщательная чистка, дубли там есть еще из-за дат рождения и контактов местами указанных, местами нет. Если со временем человек, с которым обменялись базами будет не против, поделюсь конвертом.
Хотя выше Search уже поделился своим вариантом, этому форумчанину и его работе на мой взгляд стоит верить.
- ratushka
- профи
- Сообщения: 58
- Зарегистрирован: 30 дек 2021, 03:15
- Благодарил (а): 81 раз
- Поблагодарили: 456 раз
ОСАГО МСК 01/2023
База ОСАГО Москва январь 2023 г.
Состав: policy, vin, Модель, insurer_name, region, city, osago_start_date, osago_end_date, VIN, Категория, Год выпуска, Двигатель, Мощность лс, Телефон, ФИО, ДР, ГРЗ.
Формат: excel.
7600 строк.
Под конверт в кронос.
Пароль личный только для местных.
[External Link Removed for Guests]
Состав: policy, vin, Модель, insurer_name, region, city, osago_start_date, osago_end_date, VIN, Категория, Год выпуска, Двигатель, Мощность лс, Телефон, ФИО, ДР, ГРЗ.
Формат: excel.
7600 строк.
Под конверт в кронос.
Пароль личный только для местных.
[External Link Removed for Guests]
- HugoBoss
- местный
- Сообщения: 36
- Зарегистрирован: 02 май 2023, 16:58
- Благодарил (а): 58 раз
- Поблагодарили: 42 раза
Re: Прочие базы данных
Это оригинал, а все остальное - версии и доработки.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]15 янв 2024, 11:08 Тесты показали, что да это чья-то версия сборки частей базы
Именно в таком виде ее выложили хакеры из Киборга, а потом когда сайт лег, переложили в канал.
-
- профи
- Сообщения: 106
- Зарегистрирован: 26 янв 2022, 11:29
- Благодарил (а): 100 раз
- Поблагодарили: 422 раза
Re: Прочие базы данных
Именно, первоисточник выкладывался одним файлом, а потом уже, когда сайт лег, посыпались поделия рукожопых анонимов.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]15 янв 2024, 18:55Это оригинал, а все остальное - версии и доработки.[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]15 янв 2024, 11:08 Тесты показали, что да это чья-то версия сборки частей базы
Именно в таком виде ее выложили хакеры из Киборга, а потом когда сайт лег, переложили в канал.