Размах воровства контента в рунете вынуждает проверять статьи сайта на уникальность и бороться с ворами. Скопированная статья становится неуникальной и теряет позиции. Проверить все статьи сайта на уникальность нам поможет программа Etxt антиплагиат. Забиваем список урлов сайта в программу и она ищет совпадения в сети, выдавая после завершения работы список неуникальных страниц и, соответственно, сайты воров. Ещё можно проверить текст на антиплагиат в онлайн режиме. Далее более подробно.
Круговорот контента в природе можно описать следующей схемой
- по продвигаемому запросу мы далеко за топом
- продвигаем запрос
- страница запроса выходит в топ
- топ мониторится ворами которые копируют наши статьи
- наши статьи становятся неуникальными
- по продвигаемому запросу мы снова в заднице
- понеслось сначала с пункта 1
Чтобы не забивать в программы проверки уникальности каждую статью отдельно, воспользуемся Etxt антиплагиат. Первым делом нам потребуется список адресов всех страниц проверяемого сайта. Заходим на страницу с картой нашего сайта и кликаем по кнопке «Links» в панели бара RDS, которая показывает все ссылки на странице.
Если параметра «Links in/out» на панели у вас нет, значит его нужно включить в настройках RDS бара.
Теперь мы имеем список адресов всех страниц сайта
Копируем список и чистим его от адресов рубрик и так далее, оставляем только страницы постов. Сохраняем список в текстовый файл. Запускаем Etxt антиплагиат. Сверху выбираем «Операции» — «Проверка сайта».
C помощью кнопки «Загрузить из файла» указываем наш файлик со списком урлов. Выставляем примерное количество страниц и запускаем проверку. Программа выполняет поиск копий для каждой страницы и выдаёт общий отчёт с указанием адресов сайтов плагиатчиков. Остаётся только разобраться с ними.
Чтобы при проверке программа не донимала вас постоянным вводом проверочного кода надо подключить антигейт. «Операции» — «Настройки» — «Другие» — вводим наш ключ антигейта.
Кроме Etxt антиплагиат больше, пожалуй, и нет бесплатного реально работающего софта по вопросу проверки на уникальность сайта целиком.
Антон, много у вас воруют статей и кто? Я вот, к своему удивлению на Юкозе много своих творений встречал, да и не только на Юкозе. Как думаете с Юкозом стоит «бодаться» или оставить как есть?
Александр, да, статьи воруют много. Укоз всегда идёт навстречу и блокирует сайты плагиаторов.
Антон, такой вопрос: некие сайты берут мои статьи, продвигают их, а когда пользователь переходит по ссылкам в поисковой выдаче, то там, вместо информации выдается как бы ветка форума, где пользователю предлагается скачать статью, естественно с вводом мобильного (куда же без этого) и далее идет серия «хвалебных» отзывов о предлагаемой для скачки информации . Потом, там же идут разъяснения о необходимости ввести мобильный, в общем полный развод на деньги. Как с этим бороться? Сталкивались ли вы когда либо с подобными сайтами?
Ну ка дайте адресок хотя бы одной статьи которую они взяли у вас и продвинули
Антон, вот: _http://www.creategift.ru/webinc/loads/elektroshema-muravey-53.html. Хочу сказать, что эти сайты постоянно меняются и статьи используют тоже разные. А вот здесь кусок моей статьи, только почему то на другом сайте. _http://yandex.ru/yandsearch?p=2&text=%3Ascooter-mania.ru&clid=1909644&lr=213 ( 25 позиция).
Встречал такие говносайтики. Контент грабится автоматом. Запрос по яндексу пустой.
Антон, неужели есть выхлоп с этих ГС?
Я никогда не занимался такими сайтами. Если вы говорите что они продвигают ворованный контент и разводят на смс то почему бы и не быть выхлопу.
Спасибо, полезно знать.
Вот бы еще знать, что делать с ворами, где правду искать. Яндексу это не интересно, про Гугл вообще молчу. Юкоз в этом плане молодцы, сразу банят по стуку, если претензия правомерна. А другие хостинги насколько идут навстречу, есть опыт?
Сейчас этих парсеров и плагинов развелось. Взял какой-то школьник от нечего делать, наполнил за день сайт контентом, который другие месяцами сами пишут и не себе , не людям. Чаще всего такие ГСы никакого толку не несут. Странно, что поисковикам, по большому счету, на это пофиг. Хотя, кто их заставляет индексировать плагиат и опускать первоисточники?
Да пока никак не поборешься, если только через хостера но далеко не все хостинги входят в положение. Так что остаётся только носом шмыгать и сопли на кулак наматывать )
Вот и я о том же. А еще, чаще всего, такие сайты размещают на хостингах, которым все это по барабану.
Считаю, это по силам поисковикам, банить сайты, на которых нет ни одной уникальной статьи. Только не понятно, почему они этого не делают, им интереснее оригинал под фильтр кинуть.
Ну если не банят значит им это не нужно.
Олег, поисковики в этом плане иногда ведут себя очень странно, особенно Яндекс. Недавно мониторил выдачу Яндекса по нескольким НЧ запросам, по одному запросу, в выдаче «торчит» сразу пять сайтов с копипастом одной и той же статьи, а на самой первой позиции «висит» сайт который сразу же перенаправляет посетителя на платную SMS подписку. Это просто ППЦ какой-то а не выдача...
Зато у них Острова есть)
«Так что остаётся только носом шмыгать и сопли на кулак наматывать» не знал про эту прогу, и по вышеуказанной причине, наверное, воздержусь от ее использования. Себе дороже. А у меня сердце больное(((
А вообще, спасибо за инфу, может и пригодится.
А зря. Нормальная программа. Я и плагиатусом пользуюсь для проверки уникальности и этой прогой.
Да вот, только что установил. Не выдержал
Говно вопрос. Ею можно просто проверять уникальность — вставляешь текст и проверяешь как и везде. Просто плагиатус бывает глючит и надо иметь запасной софт.
Опробую. А вот Адвего плагиатус у меня еще не разу не глючил. Но сравнить работу программ будет тоже интересно. Сложно теперь мне сортировать ссылки их карты сайта: очень много статей принадлежащих разным рубрикам — отсюда много повторяющихся урлов. Как отремонтирую ноут или новый куплю, займусь по свободе на работе тщательной проверкой. Только валидолом надо не забыть запаститсь
Етекстовская прога проверяет не хуже плагиатуса а временами и лучше.
Спасибо, уяснил.
Ген, да чушь всё это.
Я тоже так думаю
Вот тут ты в яблоко попал.
Наконец-то!
Я,пока что, ничего другого не умею.
Ген, да ты и этого не умеешь. Как и я впрочем. Чтобы нормально зарабатывать в интернете нужен совершенно другой уровень. Не в обиду, это на самом деле так.
p.s. тот свой коммент про блоггинг я потёр
Согласен. В сущности, «нормально» зарабатывать я и не стремлюсь: блогинг так, хобби. Чем заняться старику в свободное время?
А что бы хорошо зарабатывать нужно и хорошо напрягаться...
Ну если в таком плане то можно конечно заниматься этим тем более если оно нравится.
Сколько работаю с этой программой, а о такой полезной опции не знала.
Спасибо за пост.
Не за что.
Мой сайт полностью скопировала какая-то скотина, все статьи + уникальный дизайн.
Хостинг вора находится в Нидерландах, судя по всему – он абузоустойчивый, т.к. вообще никак не реагирует на замечания и доказательства моей правоты.
Связаться с вором напрямую тоже не получается, т.к. по ссылке «обратная связь» происходит редирект на мою страницу, т.е. всё что я напишу – придёт на мой почтовый ящик, а в whois левого домена нет контактов.
Написал в техподдержку Яндекса, на что мне ответили: «мы не правомочны разбираться в вопросах плагиата». – ну так никто их об этом и не просит, всё что им нужно – забанить или хотя-бы убрать из выдачи (за ТОП-100, чтобы его никто не видел) сайт-двойник, но и этого они делать не хотят.
И дело не в том, что сайт с ворованным контентом не находится по запросам – он находиться и по некоторым из них на 1-2 позиции ниже моего, т.е присутствует в ТОП-20.
Мало того, что Яндекс не хочет идти на встречу первоисточнику, он хочет, чтобы честные ВМ делали за него его работу – улучшали выдачу. Техподдержка Яши написала ещё: Вы можете помочь нам в работе над алгоритмами ранжирования, прислав пример запроса, по которому сайт с идентичным, на Ваш взгляд, текстовым контентом ранжируется лучше Вашего.
3,14-здец, я, что, должен тратить своё время и снимать, а потом сравнивать все позиции своего сайта и сайта-вора, т.к. то, что моя сайт находится по некоторому запросу на 7 месте, а сайт-вор – на 8, Яшку вполне устраивает, ему нужно, чтобы вор ранжировался лучше для начала хоть каких-то телодвижений.
Не так жалко уникальный дизайн моего сайта, как его статьи, на написание которых я потратил около 2 -лет. И как после этого создавать авторский, уникальный и интересный контент, если его все равно украдут, да не просто украдут, а скопируют сайт целиком и он будет находится в ТОП-30 Яндекса?
Прохожий, всё так и есть и с этим мало что можно поделать.
В общем, не стоит переживать по этому поводу, так как ничего никому не докажешь, тем более, если хостинг абузоустойчивый, а поисковику наплевать на первоисточник.
Не хочу нахваливать Google, т.к. он даёт мне меньше трафика ))), но в его выдаче только 9 страниц сайта-вора, и все они далеко за ТОП-100 по интересующим меня запросам.
Не знаю. После того как один мой сайт немного поимел пингвин — все копипастеры стали выше меня в выдаче по моим же статьям.
Нет идеальной ПС
Точно.
Антон, а у меня в RDS баре нет возможности подключить кнопку Links in/out . Может у Вас какая-то особая версия. Буду благодарна за ответ.
Тамара, смотрите лучше, должно быть окошко Links in/out в настройках rds бара (скриншот в статье выше). Версия у меня обычная 2.0.2012404. Если что обновите вашу с официального сайта.
Спасибо за ответ. Буду разбираться внимательнее.
Тамара, там нечего разбираться. Щёлкаете по значку RDS в левом верхнем углу браузера, переходите в пункт «настройки» и все опции которые можно включить и выключить перед вами. Ставим галку в нужном поле и нажимаем «применить» снизу.
Антон, доброго времени суток. Наконец-то, я проверила уникальность всех статей своего блога. Интересная картина получается. Если я где-то публиковала анонс на свою статью, то он уже делает мой пост не уникальным. Если кто-то копирует мою статью полностью и указывает ссылку, то это все равно уменьшает уникальность моего поста.
Как же теперь быть с такими не уникальными постами? Переписывать заново.
и еще получается анонсы статей всегда должны быть уникальными и не совпадать со статьей.
В начале своей статьи Вы привели схему круговорота контента в природе. Мы что же бежим по замкнутому кругу?
Тамара, а как может быть иначе? Вы берёте кусок статьи и используете его в качестве анонса. Конечно уникальность падает. Анонсы пишутся без использования текста статьи, написать пару строчек по теме не трудно. Статья про то как надо писать анонсы — /anons-stati/
Если скопировали вашу статью и поставили ссылку на источник ничего страшного, пусть так и будет, главное чтобы ссылка стояла. На счёт круговорота я образно выразился. Каждый бежит куда хочет.
Как защитить свой сайт от «пиратов»?
никак
У меня аналогичная ситуация с Тамарой. Кому-то понравилось пару рецептов и они себе их скопировали в Ливинтернет, уникальность статей стала 10%, но везде есть ссылка на источник, так что я понимаю, переживать нечего?!
Sanya, если есть ссылки на источник это ещё более менее вариант. А так вообще контент как воровали так и будут воровать, с этим ничего не сделаешь. Можно переписать статьи но я никогда с этим не заморачивался.
Есть у кого-то опыт использования абуз поисковиков по DMCA?
Например Гугл по этой ссылке — _https://support.google.com/legal/troubleshooter/1114905?rd=2#notification
Да еще один вопросик — как быть если вор рерайтит текст на 10-15%, то есть немножко меняет окончания или некоторые слова, а остальных 85-90% тупо копирует.
M, а что вы можете сделать? Только если договориться с вором чтобы он не воровал ваши статьи. Хотя в большинстве случаев это бесполезно.
Спасибо за совет. Если в моих сайтах будет несколько статей уникальностью 20 % то из-за этого могут ли быть санкции от поисковиков? Ведь много других статей написано на 95-100%.
И еще хочу узнать быстрый прокси сервер и порт для проверки на ЕТКСТ. Так как мой комп был захвачен вирусом поэтому у меня возникли проблемы с автоматическим поиском прокси, поэтому вручную веду прокси. Но мой прокси слишком медленный, хочу найти быстрый прокси и порт
Несколько статей ничего страшного. Вирус нужно удалить. Быстрые прокси платные.
на разных проверочных ресурсах показывает % уникальности по разному.
Это всегда так. Настройки поиска разные и всё остальное.
По ходу vinkon спамер, написал у меня точь в точь такой же коммент.
Да их полно сейчас.
Спасибо за полезную инфу.
Скажите пожалуйста, а какое число лучше ставить в Максимальное количество страниц, у вас на скрине 250. это получается она будет искать 250 совпадений...?
Забивайте сколько есть наверно