[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]10 ноя 2024, 10:20
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]09 ноя 2024, 14:52
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]09 ноя 2024, 14:26
Да вроде как нет никаких различий, это все один и тот-же человек парсил и в чат сливал
В какой чат? Остались ссылки на файлы?
Доброго!
Ссылки??? - Интернет помнит всё!!!
[External Link Removed for Guests]
Рекомендованный
Вопрос кто возьмётся (
у самого со временем беда) привести в божеский вид соединив все три файла???
1. Ваши файлы не смотрел, но если говорить о базах на 5 млн и 1,3 млн, то файл из 1,3 млн это вырезка из файла на 5 млн. Поэтому объединять ничего не нужно - вариант на 5 млн будет включать в себя вариант на 1,3 млн.
2. По поводу фоток, есть опыт работы с бд с фотками в кроносе - не рекомендую, куда лучше сохранять с правильными именами фотки, а в кроносе просто давать ссылку (можно даже в текстовом формате) на соответствующий файл. Для сравнения, фотки примерно 5 млн профилей соцсетей могут выжрать до 1 Тб (в оригинальном качестве), держать такое в кроносе - так себе затея.
3. Для того, кто будет парсить ОК по ссылках на профиля из 5 млн базы дам бесплатный совет по повышению продуктивности
есть ссылки вида
а)
[External Link Removed for Guests]....
б)
[External Link Removed for Guests]...
ссылки "а" будут отдавать при открытии фото и их можно сохранять под удобным вам именем, ссылки "б" это ссылки на профиль в ОК, как правило (в 97+% случаев эти профиля без фото), поэтому их можно и не парсить.
В любом случае, места под это лучше резервировать не меньше 1 Тб.
Знаю, что на руках есть парс куда большего количества ОК с ру номерами (30+ млн).
А особо интересует метод парсинга, если кто-то готов поделиться в личку - был бы благодарен.