Как можно восстановить дроп-сайт? Я уже рассказывал про сайт Avarachiv — это самый популярный, известный и старый сервис, который только есть в рунете, и он замечательно живет, все с ним хорошо. Восстанавливает он очень быстро, есть своя CMS, и он восстановит ровно все, что есть на архиве — ни больше, ни меньше. Но основная проблема в том, что на архиве есть не все. Проблема номер два — все, что он восстановит, можно выгрузить в структурированные данные для загрузки в WordPress, но вся структура и конкретные данные теряются. Делать восстановление на WordPress через архивариус — тяжело и лучше даже этим не заниматься. Плюс ко всему он платный.
Основная проблема восстановления сайтов с дропов в том, что отсутствует много того, что должно быть: нет страниц, на которые есть ссылки, нет изображений внутри статей, есть ссылки на сайты, которых уже нет (очередной дроп), и так далее. Если вы восстановите обычным способом, у вас будет куча битых ссылок, либо вы потеряете кучу страниц, а потом, зайдя в вебмастер после восстановления, будете видеть 404 ошибки на каждом шагу.
На Telderi можно купить восстановленные сайты, минимальная цена — от 5000 рублей, и за что-то более-менее приличное — около 10 000 рублей. Это обычно уже перенесенные на WordPress сайты. Из десяти купленных мною сайтов восемь постоянно показывают ошибки 404. Общался с человеком, который восстанавливал сайт руками — он восстановил все, что смог, и продает по той цене, по которой смог это сделать. Хотите восстановить больше — восстанавливайте сами.
Платформы вроде Litik позволяют сделать более нормальную выгрузку для WordPress, но вы все равно получаете ровно то, что есть в архиве, ни больше, ни меньше. Есть еще скрипт на GitHub, который выгружает все, что есть, и делает ссылки локальными вместо внешних. Но веб-архив недавно ввел ограничение — можно запросить за несколько минут всего 20 страниц. Для больших сайтов нужно использовать прокси или ждать, что неудобно. На Кворке есть умельцы, которые делают это хорошо, но за 15000 рублей минимум.
Мы создали свою методику восстановления для себя. Сначала качаем Sitemap, убираем неважные страницы (главные, категории и старые Sitemap), убираем лишний код и счётчики, чтобы получить чистый контент. Если нет изображений, нейросеть генерирует их на основе Alt-текста, если генерация не удалась — ищем релевантные картинки через Яндекс. Так мы восстанавливаем 100% изображений даже тех, которых нет в архиве. Получаем сразу статьи, структуру сайта, тайтлы, дескрипшены и хедеры — все на месте.