Массовая очистка сайтов WordPress

  1. Выскабливание сайтов WordPress
  2. Скребок, но с какой целью?
  3. Что делать в случае Лом?
  4. Решения против лома

Очистка. Очистка веб-страниц (иногда называемая сбором урожая) - это метод извлечения содержимого веб-сайтов с помощью сценария или программы с целью преобразования его для использования в другом контексте. _ Википедия

Выскабливание сайтов WordPress

Пока я делал WordPress ожидания на WPFormation, просматривая поисковики Bing - да, это действительно поисковая система Bing, но мы делаем его часы правильно или нет;) Более того, я советую всем вам зарегистрироваться на Bing Webmaster очень хороший инструмент с множеством возможностей - я обнаружил это:

На названии моего сайта очень четко отображается позиция 5, выходной URL я не знаю где! Нажмите здесь, и вот точная копия моего сайта! Что еще более важно, внутренние ссылки являются функциональными, поэтому, когда я нажимаю на меню сайта копира, я остаюсь на копии.

На момент написания этой статьи я, конечно, исправил проблему.Пример, который я покажу вам ниже, это пример альбома. SeoMix также коснулся:

В обсуждении с Benoit Я найду не менее 300 очищенных сайтов в нескольких разных областях. Некоторые сайты WordPress полностью скопированы, другие частично:

Предупреждение : Скраперы используют много доменов через CloudFlare, есть не только codercanyon
Предупреждение : Скраперы используют много доменов через CloudFlare, есть не только codercanyon.net, мы также находим tisa-cref.org, tjoos.co и т. Д., Например, сайт Дэниела не используется с 2 разных доменов :(

Скребок, но с какой целью?

Это первый вопрос , в чем заключается интерес копирования всего сайта? Это сайт Франсуа дю Mitambo кто просветил меня Ноэль это отрицательный SEO.

Франсуа обнаружил многоуровневую пирамиду, придающую вес некоторым скопированным сайтам, цель которой состоит в том, чтобы занять позиции в поисковой выдаче и отвлечь часть трафика.

Некоторые скажут, что эти методы работают только на сайтах с небольшим стажем и минимальными полномочиями, это неправильно! Я отсылаю их к первому скриншоту этой статьи (сборник состоялся 1 мая 2014 года), и на Bing сайт копировальной машины уже появляется в позиции 5 в поисковой выдаче. Сколько времени потребуется, чтобы прогрессировать в Google?

Пол Санчес создал спор по этому вопросу, который сам переместил Мэтта Каттса , удалив его домашнюю страницу Google.fr (не из блога, а из корня). Так что проблема «казни» реальна.

Чтобы эффективно бороться с этим типом NSEO , вы должны поместить канонические теги в контент, который отображает официальный URL (SEO от Yoast делает). Так что, если страница очищена, а скребок не обратил внимания, по крайней мере, канонический возврат к правильному URL ... но в моем случае скребок также изменился ...

Что делать в случае Лом?

Первое, что нужно сделать, это выявить проблему , сайт копира размещен на CDN cloudflare, поэтому должен быть способ обсудить с ними ... Ну, нет, CloudFlare ответит мне: «Мы являемся поставщиком сеть, предлагающая обратный прокси. Мы не хостинг-провайдер. CloudFlare не контролирует контент своих клиентов "... Так!

Другое решение состоит в том, чтобы предупредить Google , есть форма, Google Scraper Report , Это происходит из твита Мэтта Каттса, поэтому мы можем верить в законную форму: Google-скребковый инструмент 185532 ,

Форма размещена, но в заголовке формы указано следующее: «объявить очищенный контент, который лучше позиционирует себя в поисковой выдаче, чем исходный контент». Мы должны ждать, чтобы пройти впереди, чтобы среагировать.

3-е решение , учитывая очищенные сайты (в частности, Envato), твит, чтобы предупредить их, оно неизбежно будет иметь больший вес, а объединение - не сила.

4-е решение , найти технический прием. Действительно, как можно копировать весь мой сайт? Как получается, что когда я делаю модификацию, она сразу же влияет на сайт копира?

Решения против лома

Решение придет Майкл из IP_Solution который нашел сервер Nginx и фактически прокси для wpformation, поэтому способ остановить их , заблокировав их IP-адреса от брандмауэра моего сервера .

Грегори , чей сайт был также очищен, использовал плагин WordPress WordFence заблокировать IP-адреса сервера ксерокса.

Сообщить о незаконном контенте со страницы Удаление контента Google Будьте внимательны при заполнении формы (см. Скриншот ниже). Если случай будет доказан и принят во внимание, Google удалит содержимое своих поисковой выдачи (спасибо @ Лунный свет ;)

Знайте наконец, что есть также служба DMCA что позволяет подавать жалобы, но это касается только законодательства США, но они говорят, что работать на любого человека, даже за пределами США. Если они действуют, это как минимум 199 долларов, в противном случае за 10 долларов вы можете подать жалобу, и они объяснят процедуру, которой необходимо следовать.

Если они действуют, это как минимум 199 долларов, в противном случае за 10 долларов вы можете подать жалобу, и они объяснят процедуру, которой необходимо следовать

Завершая этот пост , я напоминаю вам не забывать следить за вашим контентом, делать технические наблюдения и отслеживать ваши позиции. Используйте такие инструменты, как Copyscape и / или DMCA, чтобы убедиться, что ваш контент не скопирован, а главное ... будьте бдительны;)
Некоторые дополнительные статьи по соскобу:

Массовая очистка сайтов WordPress

5 за 3 голоса

Что делать в случае Лом?
Скребок, но с какой целью?
Сколько времени потребуется, чтобы прогрессировать в Google?
Что делать в случае Лом?
Действительно, как можно копировать весь мой сайт?
Как получается, что когда я делаю модификацию, она сразу же влияет на сайт копира?

Номера

Номерной фонд гостиницы насчитывает 173 номера различных категорий.

Забронировать отель можно прямо сейчас: Бронирование онлайн