Страница 20 из 100
Re: Прочие базы данных
Добавлено: 31 июл 2023, 12:23
Burg0mister
Всем доброго утра!
Публикую обещанный переработанный
KDL.RU
Ранее эти таблицы здесь разместили
theduck и
sergeiii, за что им спасибо!
В сборке несколько файлов с таблицами, которые извлечены из SQL дампов.
В этой версии не потеряны регионы, даты, комментарии и прочая информация, все должно быть на месте!
Время из формата UNIX в нормальный не переведено, если его исправить или убрать - получится удалить больше дублей.
Если объединить таблицы в одну, думаю что тоже порядочное число дублей должно найтись, но непроверял.
Часть мусорных и тестовых записей удалил, но не все {если будете чистить - осторожнее, потому что слово тест в комментариях может встречаться не как показатель тестовой записи, а как что-то связанное с медицинскими тестами, так можно удалить полезную запись}.
Обработка стандартная:
Кодировка: кириллица Win-1251
Разделитель: вертикальная черта |
Вес файлов распакованных/в архиве: 18.8МБ/5.81МБ
Количество файлов: 16
Изначально SQL таблиц: 2
Ссылка:
Скрытый текст
Для просмотра скрытого текста необходимо быть авторизованным пользователем.
Пароль:
phreaker.info
Re: Прочие базы данных
Добавлено: 31 июл 2023, 12:49
MaratG
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]31 июл 2023, 08:57
Друзья, подскажите как в SQL дубли можно удалить?
В sql (и mysql и postgres) есть ключевое слово distinct, означающее, что нужно вернуть только уникальные строки.
Например, SELECT DISTINCT * FROM mytab вернет только уникальные строки таблицы mytab.
А, например, CREATE TABLE tablename SELECT DISTINCT name, phone FROM othertable сделает новую таблицу tablename с уникальными name, phone.
P.S. Может, где-то чуть ошибся синтаксисом - по памяти писал.
Re: Прочие базы данных
Добавлено: 31 июл 2023, 13:55
theduck
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]31 июл 2023, 12:23
Всем доброго утра!
Публикую обещанный переработанный
KDL.RU
Ранее эти таблицы здесь разместили
theduck и
sergeiii, за что им спасибо!
В сборке несколько файлов с таблицами, которые извлечены из SQL дампов.
В этой версии не потеряны регионы, даты, комментарии и прочая информация, все должно быть на месте!
Время из формата UNIX в нормальный не переведено, если его исправить или убрать - получится удалить больше дублей.
Если объединить таблицы в одну, думаю что тоже порядочное число дублей должно найтись, но непроверял.
Часть мусорных и тестовых записей удалил, но не все {если будете чистить - осторожнее, потому что слово тест в комментариях может встречаться не как показатель тестовой записи, а как что-то связанное с медицинскими тестами, так можно удалить полезную запись}.
Обработка стандартная:
Кодировка: кириллица Win-1251
Разделитель: вертикальная черта |
Вес файлов распакованных/в архиве: 18.8МБ/5.81МБ
Количество файлов: 16
Изначально SQL таблиц: 2
Ссылка:
Скрытый текст
Для просмотра скрытого текста необходимо быть авторизованным пользователем.
Пароль:
phreaker.info
Время из формата UNIX в нормальный переведено dd.MM.yyyy HH:mm:ss
[External Link Removed for Guests]
Re: Прочие базы данных
Добавлено: 31 июл 2023, 15:15
theduck
kdl_analyzes-id.sql конвертировано в kdl_analyzes-id.sql - logs.csv
[External Link Removed for Guests]
Re: Прочие базы данных
Добавлено: 31 июл 2023, 15:59
theduck
kdl_analyzes-id.sql-logs-decode-Создание пользователя из корзины.csv
-извлечен Создание пользователя из корзины(Phone, date, FIO, IDFizlica, DOB, Sex, Email, Address, CodeWord, CardID, SenderID, CardType, Partner, id, date, tag, table_name) 87732
-дубли убраны
-ДАТА подчищены
-телефоны подчищены
-Разделитель: вертикальная черта |
-кодировка кириллица Win-1251
[External Link Removed for Guests]
Re: Прочие базы данных
Добавлено: 01 авг 2023, 02:21
imaltsev
Полная версия слива от Лукойл.
12 000 000 строк
[External Link Removed for Guests]
Re: Прочие базы данных
Добавлено: 01 авг 2023, 02:33
imaltsev
Полная версия слива от ЗдравСити
10 000 000 строк
[External Link Removed for Guests]
Re: Прочие базы данных
Добавлено: 01 авг 2023, 05:28
theduck
kdl_analyzes-id.sql-logs-decode-Быстрый выезд.csv
-извлечен Быстрый выезд(phone, dbRegion, regionCode, senderId, fio, source, utmSource, utmMedium, utmCampaign, utmContent, utmTerm, id, date, tag) 33917
-дубли убраны
-ДАТА подчищены
-телефоны подчищены
-Разделитель: вертикальная черта |
-кодировка кириллица Win-1251
[External Link Removed for Guests]
Re: Прочие базы данных
Добавлено: 01 авг 2023, 09:13
imaltsev
В свободный доступ попал полный SQL-дамп из CMS «Bitrix» предположительно сайта магазина туристического и горнолыжного снаряжения «СПОРТ-МАРАФОН» (sport-marafon.ru).

В таблице зарегистрированных пользователей 361,987 строк, содержащих:

ФИО

телефон (278 тыс. уникальных номеров)

адрес эл. почты (356 тыс. уникальных адресов)

хешированный пароль

адрес (не для всех)

пол (не для всех)

дата рождения (не для всех)

дата регистрации и последнего захода (с 16.05.2012 по 02.04.2023)
[External Link Removed for Guests]
[External Link Removed for Guests]
Re: Прочие базы данных
Добавлено: 01 авг 2023, 09:19
imaltsev
В открытый доступ попал дамп заказов билетной системы "Кинокасса" от разработчика решений для кинотеатров "КИНОПЛАН" (
[External Link Removed for Guests]).

4 JSON-файла в целом содержат информацию о примерно 6 миллионах заказов с такими с такими полями как:

Эл. почта;

Телефон (350 тысяч уникальных);

Данные user_agent;

Даты оплаты;

Некоторые технические детали.

Актуальность данных на 05.2022 года.
[External Link Removed for Guests]