Главная « SEO « Пост "Сопли Гугла или дополнительный индекс"

Сопли Гугла или дополнительный индекс

Автор: Антон

Какую-то часть страниц любого сайта поисковая система Гугл считает важными и помещает в основной индекс. Такие страницы участвуют в ранжировании по запросам и формируют поисковую выдачу. Но у Google имеется и дополнительный индекс, так называемые «сопли гугла» или «Supplemental Index», в который помещаются страницы сайта, которые алгоритм посчитал не важными, либо нарушающими правила и недостойными основного индекса по каким-либо причинам.

Каждая новая статья любого веб-сайта проверяется поисковой системой Google на предмет соответствия критериям основного индекса. При этом обсчитывается масса параметров и учитывается история ресурса. Если за сайтом уже были замечены те или иные нарушения, проверка производится более тщательно и риск попадания новых страниц в supplemental index растёт.

Чем больше страниц блога или сайта попадает в сопли, тем меньше трафика с гугла имеет ресурс, так как подобные страницы не участвуют в поиске. Часто причиной просадки трафика и потери позиций является именно массовый перевод страниц сайта из основного в дополнительный индекс за какие-либо нарушения. Задачей вебмастера является уменьшение количества страниц, попавших в дополнительный индекс.

---------------------------------------

Основные причины попадания страниц в сопли

Дублированное содержание (дубли)
Неуникальный контент
Отсутствие Title, Descriptin
Минимальное количество контента на странице
Явное отклонение страницы от основной темы сайта
Изменение структуры URL ресурса
и т.д.

Проверка страниц сайта на сопли

Способы проверки сайта на наличие страниц в дополнительном индексе сильно разнятся, опишу только чем пользуюсь сам. Во-первых, посмотреть страницы в основном индексе можно с помощью следующего запроса в Гугл: site:ваш сайт/& То есть для этого блога запрос будет выглядеть таким образом: site:comp-on.ru/&

Страницы в основном индексесновной индекс

Основной индекс

Вы вставляете вместо comp-on.ru домен своего сайта соответственно. Как видим на картинке, по этому запросу найдено 194 результата, что примерно соответствует количеству опубликованных статей на этом блоге. Из этого можно сделать вывод, что почти все статьи блога находятся в основном индексе Гугла.

Для того, чтобы увидеть все страницы сайта:

site:ваш сайт

То есть для этого блога запрос будет — site:comp-on.ru

Разница между страницами в основном индексе и всеми проиндексированными страницами сайта это и будут сопли.

---------------------------------------

Теперь проверим на сопли случайный блог из Сети. Банально взял первый попавшийся блог inetrab.ru

Конструкция вида site:ваш сайт -site:ваш сайт/& — больше не работает!

Пользуйтесь определением основного и полного индекса. Как это сделать написано выше.

Проверка на дополнительный индекс

Результат — более 50 000 страниц (адресов). Я не углублялся в изучение этого сайта, но здесь скорее всего проблема с дублями контента, отсюда и такое количество страниц в дополнительном индексе. Можно предположить, что к этому сайту уже применяются санкции, либо они будут скоро применены, вплоть до исключения всего ресурса из основной выдачи Google.

---------------------------------------

Примерное соотношение страниц сайта, участвующих в основном и дополнительном индексе, можно увидеть с помощью RDS бара

Сопли в RDS

В процентах количество страниц сайта в основной выдаче, по отношению к общему количеству проиндексированных страниц.

---------------------------------------

Проблема с сопливыми страницами сайта ещё и усугубляется тем, что робот посещает данные странички крайне редко, и даже исправив все нарушения либо полностью удалив эти страницы, можно ещё полгода ждать исправления ситуации, когда бот соизволит посетить эти урлы, а потом ещё некоторый период пока обновятся данные в кэше. И только после этого алгоритм начнёт оценивать ваш сайт с позиции того что нарушения исправлены. Для удаления из индекса Гугла ненужных страниц можно воспользоваться «инструментами для веб-мастеров» от поисковой системы Google.

При наполнении сайта надо стараться, чтобы как можно большее количество страниц были качественными и попадали в основной индекс, а не уходили в сопли. Вовремя исправлять нарушения и недочёты.

Как я повторял уже много раз, каждое нарушение любого отдельно взятого сайта учитывается поисковиками и складывается в историю ресурса. Когда количество нарушений сайта переходит за какой-то определённый установленный рубеж — следует наказание, обычно в виде сильной пессимизации или бана. Не стоит доводить свой ресурс до таких проблем.

Среди сеошников давно ходит байка о том, что у гугла нет никаких соплей да и сами представители этой поисковой системы якобы заявляли об этом. Однако с помощью запросов, которые были представлены в этой статье, данные утверждение легко опровергается. Никто не говорит, что в гугле это называется именно соплями, однако суть от этого не меняется — подобные страницы не участвуют в поиске, соответственно не приводят посетителей, и часто являются причиной пессимизации либо бана сайта. А называть это можно как угодно.

Курс SEO для начинающих. Часть 3

Понравилась статья? Следи за новостями блога по

RSS или в

Twitter !

Категория: SEO

Вернуться на Главную страницу

Комментарии ⁽¹⁰¹⁾

Геннадий

10.01.2013 | 16:06

У меня много «соплей» и почти все они — ссылки на картинки, вставленные в сообщения. Что же делать? Не убирать же их...
Антон

10.01.2013 | 16:28

В сопли могут попадать урлы страниц, про ссылки на изображения ничего не слышал. Как определял?)
Геннадий

10.01.2013 | 16:57

Определял, как ты написал. Кроме того у меня установлен RDS-бар. В основном — 166 страниц, в соплях — 170, а вообще всего на данный момент в индексе — 294 страницы. Получается, что в основном индексе по показаниям RDS на данный момент 53%. Нестыковка, но все же удручает, как много идет страниц ( а это урлы картинок и еще кое каких мелочей, связанных с работой плагинов) попадают в сопли. Может быть есть способ закрытия таких урлов (на картинки идут ссылки на медиафайлы и у тебя же такого не происходит!) от индексации вообще? Я не знаю такого способа.
Геннадий

10.01.2013 | 17:09

А ты введи в поисковик site:comp-on.ru -site:comp-on.ru/& и потом нажми «повторить поиск» твои фиды высветятся более 400 раз. Тут все согласуется с показаниями RDS для твоего сайта. Но вот ссылок на картинки нет!! Парадокс.
Может быть и правда — не заморачитваться и правы SEO-шники...
Антон

10.01.2013 | 17:55

Ну ввёл site:comp-on.ru -site:comp-on.ru/& и нажал повторить, так там же написано под каждой позицией что «Описание веб-страницы недоступно из-за ограничений в файле robots.txt». То есть эти страницы запрещены к индексации в роботсе, а почему гугл их показывает это уже вопрос к гуглу, раньше не показывал, спроси на ихнем форуме, может ответят)
Посмотрел кстати и твои сопли (дубли), советую дописать в роботс —
Disallow: /attachment/
как видишь у тебя во всех дублирующих сопливых урлах присутствует директория вложений /attachment/.
Геннадий

10.01.2013 | 18:04

Да, это действительно так. Я внимательно просмотрел и свой сайт. Там все же более половины аналогичных страниц, которые запрещены роботс. Но есть и довольно много картинок.
А обращаться вряд ли стану. Как-то обращался по поводу основного индекса, дык там ответили, что его вообще нет- в RDS он на тот момент вообще исчез. С этим Гуглом сам черт не разберется(((
Антон

10.01.2013 | 18:13

Ну а если дополнительного индекса нет что тогда показывает запрос — site:ваш сайт -site:ваш сайт/& Ведь он показывает для каждого сайта свой результат.
А у тебя на блоге банальные дубли, сопли, называй это как хочешь, суть то одна. Дубли же тоже не идут в основной индекс, или дублей тоже не бывает?)
Дубли у тебя вида страниц с вложениями —
_http://prt56.ru/seo/sozdanie-onlajn-konsultacii-na-sajte-prosto-i-besplatno.html/attachment/nnnn4
_http://prt56.ru/wordpress/nrelat-effektivnyj-plagin-dlya-svyazannyx-i-populyarnyx-soobshhenij.html/attachment/lll2
и все они в индексе а наплодить их при желании можно миллионы, потому и говорю тебе допиши в роботс —
Disallow: /attachment/
Геннадий

10.01.2013 | 18:18

Disallow: /attachment/ — вставил. Теперь будем посмотреть. Только как долго все будет меняться...
Антон

10.01.2013 | 18:28

Моментально они не исчезнут из индекса. Это долго, к тому же сопли гугл посещает крайне редко, я об этом писал в статье. Правда можешь помочь хухлю выкинуть это дерьмо из индекса через вебмастер гугла — оптимизация — удалить URL адреса.
Геннадий

10.01.2013 | 18:34

Будем работать. Спасибо!
Антон

10.01.2013 | 18:42

Да, работать нужно или никаких результатов не будет вообще. У меня продолжается бесконечная война с ленью)
Олег

10.01.2013 | 23:55

У меня вообще непонятка. В индексе по RDS бару 2760 (9%), а через поиск по формуле в соплях вообще 1 страница и то, закрыта в robots.txt. Все дубли в robots позакрывал.
Зато есть сайт, где в robots три строки и там 86% в основном индексе.
Вот, как сделать, чтобы не показывал Гугл в 10 раз больше в индексе, чем Яша? Вот у тебя разница не большая.
Что значит User-agent: ia_archiver у тебя в файле?
Антон

11.01.2013 | 00:39

rds берёт данные точно так же как написано в статье — нажми на циферки страниц в соплях. Тут ещё от самого сайта зависит, у меня на сайтах на чистом html — 98-100%, так как дублям просто неоткуда браться, дубли ведь в основном движки генерируют а нет движка — нет дублей и соплей тоже)
По rds у тебя да, много страниц в гугле показывает. А если проверить через запрос site:ваш сайт/& как в статье выше написано сколько результатов?
Кстати можешь ещё посмотреть в вебмастере гугла — состояние — статус индексирования — расширенные данные — может так что то прояснится?
User-agent: ia_archiver — запрет доступа для бота вебархива.
Олег

11.01.2013 | 01:18

По запросу с & — 241 страница (примерно, как в Яндексе), а в инструментах всего проиндексировано 4 706, причем запрещено в robots — 4 827. А вот в Вебмастере Яши загружено 5112. Короче, до фига у меня страниц на сайте. Думаю это из-за комментариев, их у меня почти 5 000.
Проверил в Вебмастере, они разрешены к индексации, хотя три директивы стоит запрещающих комментарии. Только, когда сейчас поставил Disallow: /*#comment, стал показывать запрет. Получается так надо оставить?
Антон

11.01.2013 | 01:31

Ну если предыдущие правила не запрещали индексацию комментов то наверное да)
Олег

11.01.2013 | 01:55

НЕ удалил эту конструкцию. Знак # — это же закоментирывовывает строку, то есть /*#comment аналогично /*. А это значит запретить всю индексацию. Если оставить /*comment, то комментарии не закрывает. У меня так и стояло, а теперь убрал, так как есть статья где в URL есть слово comment и она запрещена для индексации. Хорошо, что заметил сейчас.
Вот теперь вопрос, как закрыть урлы комментов, которые имеют в конце примерно такую конструкцию html#comment-37562
Антон

11.01.2013 | 11:28

Олег, да я фиг знает. Попробуй
Disallow: /*comment
или
Disallow: /*comment-
На счёт значка # в урле это не имеет отношения к комментированию по моему.
Олег

11.01.2013 | 17:01

Значок # обозначает, что все, что после него не учитывается, т.е. там можно просто служебные комментарии текстом писать. А приведенные тобой варианты пробовал, не закрывают. Только статью закрывают нужную. Ладно, будет время поиграюсь.
Антон

11.01.2013 | 18:12

Олег, что такое # в коде я в курсе, только к роботсу и к урлам это мне кажется никакого отношения не имеет.
Олег

11.01.2013 | 19:31

Попробуй поставь в Вебмастере в любой строчке # после первого слэша и перед любым правилом и проверь даже главную страницу.
Антон

11.01.2013 | 19:39

Ничего не понял... «поставь в Вебмастере в любой строчке # после первого слэша» Говори сразу суть. Кстати попробуй поставить вместо # другой любой знак типа &, *, ^ — изменится что нибудь или нет?
Олег

11.01.2013 | 21:40

Я имел ввиду в разделе Анализ robots.txt, изменить таким образом robots и проверить любую страницу.
Антон

12.01.2013 | 00:43

Ну да, всё верно, типа тогда работает запрещающее правило
Disallow: /
даже не знал что в роботсе знак «#»так обрабатывается.
Олег

12.01.2013 | 00:51

Прикинь, если бы я так оставил. Хорошо, что проверил другие страницы.
Антон

12.01.2013 | 01:06

Это да. Век живи — век учись. Кстати правило Disallow: /*#comment ты сам выдумал, я тебе его не советовал. Я советовал попробовать для закрытия соплей
Disallow: /*comment
или
Disallow: /*comment-
Олег

12.01.2013 | 01:18

Просто эти два не работают, вот и придумал. Хотя по идее должны же работать.
Антон

12.01.2013 | 01:41

Не, если не работают то и не должны. А не работают потому что перед comment в урлах нет слэша наверно.
Вот тут есть немного — _http://www.armadaboard.com/topic44806.html?tape
Типа говорят решётка это не дубль. Типа поисковикам на решётки в урлах наплевать, они ставятся для браузеров, типа якорей.
Олег

12.01.2013 | 03:52

Ну и ладно. Только не понятно, почему тогда столько страниц в индексе Гугла?
Антон

12.01.2013 | 12:40

Да фиг знает, у гугла с этим делом всегда какие то непонятки были. Если хочешь спроси на форуме гугла, там есть пара толковых человек.
Sandro

15.03.2013 | 15:51

Никогда сопли не мешали, так для справки интернет магазин или форум где 10000+ страниц редактирование их что бы они попали в основную выдачу не реально да и конкретную позицию ищат единицы нафига мне корректировать их для основной выдачи, бана за это никогда не получал. на некотрых сайтах 1-5% не соплей ПР присваивается ПР трафик с поисковиков стабильный проблем нет.
Антон

15.03.2013 | 17:52

Мешают не сопли, а попадание страниц в дополнительный индекс. А если б не соплей было не 1-5%, а например 80%, то может трафика было бы больше?)
Про магазины и т.д. отдельный разговор, я их здесь вообще не касался, разговор про статейные сайты.
Наталья

13.05.2013 | 16:41

Попробовала метод — не увидела разницу в выдаче разницу между запросами:
site:http://veni.com.ua Результатов: примерно 285 (0,16 сек.)
site:http://veni.com.ua -site:http://veni.com.ua/&, Результатов: примерно 286 (0,20 сек.)
А если смотреть в RDS бар — то индекс 22%
Что я не так делаю?
Антон

14.05.2013 | 02:38

Попробуйте оформить эти запросы как написано в статье — то есть без протокола http. И вообще меньше зацикливайтесь на соплях, это не так важно.
Наталья

14.05.2013 | 15:14

Попробовала.
По запросу site:veni.com.ua -site:veni.com.ua/&,
Результатов: примерно 287 (0,21 сек.)
Все выдачи внешне выглядят одинаково, по крайней мере первые топ 10, дальше не сравнивала. Странно все это, почему у других метод работает, а у меня нет.
Антон

15.05.2013 | 06:28

site:veni.com.ua/& — 61
site:veni.com.ua -site:veni.com.ua/& — 0
Наталья

15.05.2013 | 08:51

А если смотреть в RDS бар — то индекс 22%
Антон

15.05.2013 | 10:40

Кликнете по цифре 22% в RDS и узнаете каким запросом он определяет страницы в основном индексе.
Я вот что хочу вам сказать — гугл индексирует всё подряд, вплоть до урлов которые запрещены к индексации в robots.txt. Потом лишние страницы выкидывает и через какое то время опять вносит их в индекс. На этом блоге процент страниц в основном индексе меняется примерно от 35 до 85% а количество страниц в индексе от 200 до 800.
виталий

04.08.2013 | 14:51

Только подал сайт на индексацию и сразу результат — гугл проиндексировал только главную страницу и сразу в сопли. Почему так? Контент уникальный, объём не маленький. Вот адрес _http://bodybuilding.drfarm.ru/
Антон

04.08.2013 | 15:28

Виталий, с чего ты взял что страница в соплях?
Максим

12.08.2013 | 12:32

Ка посмотреть 1-2 тренинги:
«Курс SEO для начинающих. Часть 3»
рама

12.08.2013 | 21:43

половина в соплях и что теперь делать?
Антон

12.08.2013 | 22:01

Рама, ничего не делать.
виталий

13.08.2013 | 09:04

Проверял индексацию сайта на _http://xseo.in/indexed и там только одна страница и то в дополнительном индексе была, а сейчас одна в основном и 143 в дополнительном. Это нормально?
Антон

13.08.2013 | 12:15

Чушь всё это.
Андрей

15.09.2013 | 22:52

1) RDS показывает 1820 (27%). Всего 458 статей + главная страница, страницы несколько разделов. Остальное теги — их не отключал, так как по ним есть переходы. Кто-то советовал отключить, кто-то напротив, так как сайт с уникальными статьями (свои + переводы). Некоторые страницы тегов в поиске.
С этим надо что-то делать?
2) И подскажите, пожалуйста. Добавлена в robots.txt строка — Disallow: /*?*
При этом иногда индексируются страницы подобного вида и в гугле и в яндексе: _http://www.worldbeer.org/news.html?start=10
Неправильно правило написал или это как раз тот случай, про который Вы выше написали, что google добавляет всё подряд, потом выкидывает и снова может добавить?
Антон

15.09.2013 | 23:08

1. Если контент качественный и уникальный то можно ничего не делать. Посмотрите процент страниц в основном индексе гугла на других сайтах и сравните со своим.
2. Проверьте правильность директивы в яндекс вебмастер — Настройка индексирования — Анализ robots.txt
Андрей

15.09.2013 | 23:28

1) По процентам 491 страница в поиске, а по гугл-вебмастеру 464 статьи из 476 проиндексировались, остальное — видимо теги.
2) Спасибо за подсказку — не видел раньше кнопки проверить.
Пишет по поводу этих страниц — запрещен правилом /*?*, значит все правильно. Только не понятно зачем они попадают в поиск.
Антон

16.09.2013 | 03:27

Андрей, посмотрите исходный код своих страниц, у вас всё закрыто в noindex. Открывающие теги есть а закрывающих нет. Закрывающий тег должен выглядеть так — 
На счёт страницы _http://www.worldbeer.org/news.html?start=10 она в гугле имеет пометку «Описание веб-страницы недоступно из-за ограничений в файле robots.txt.»
если коротко то роботс запрещает сканирование, а метатег ноиндекс индексирование, позволяет очистить хлам из индекса в гугле, роботс же управляет сканированием т.е. доступом бота к документу с оговоркой, что в любой момент может появиться ссылка на урл и если урл запрещен в роботсе он появится в индексе с пометкой о запрещении т.к. бот не смог его просканировать и понять выкинуть его из индекса или оставить
Андрей

16.09.2013 | 11:17

Спасибо за объяснения по роботсу и спасибо большое за найденную ошибку с индексом — не могу понять, как можно было так ошибиться и не закрыть тег везде) Добавлял недавно, надеюсь ничего не испортил.
Антон

16.09.2013 | 14:56

Исправляйте а то яндекс выкинет весь ваш контент из индекса.
Ксенья Юрьевна

15.11.2013 | 20:28

Я написала в поисковике как у вас написано и получила ответ:"Ничего не найдено из 2 поисковиков", Вы видимо здесь пошутили.
Антон

16.11.2013 | 07:08

Ага, я вообще шутник. Может быть вы забивали как написано —
site:ваш сайт/& не заменяя «ваш сайт» на адрес своего сайта?
Совет — меньше заморачивайтесь с соплями и больше с качеством контента.
Сергей

03.12.2013 | 11:22

Даже такая строка в гугле уже ничего не выдает:
site:comp-on.ru -site:comp-on.ru/&
Антон, проверь сам. И из-за соплей гугл погубит любой качественный контент. Проверено!
Антон

03.12.2013 | 12:23

Интерфейс гугла изменился, эта ссылка больше не работает. Пользуйтесь основной выдачей — site:comp-on.ru/&
Антон

06.12.2013 | 14:58

результаты по запросу “site:http://сайт.ru/&” минус результаты по “site:http://сайт.ru/” это и будут сопли.
Сергей

23.01.2014 | 02:03

спасибо за плагин, проаналаизировал свой сайт -просто катастрофа. 6% показывает всего в основной выдаче. Но у нас на портале порядка 40000 страниц, в ручную не реально проверять. К кому можно обратиться, где этот процесс оптимизирован и автоматизирован?
Еще раз спасибо за блог, Антон -прям подсел на него)
Антон

23.01.2014 | 02:15

Сергей, лучше всего обратиться к знающему оптимизатору например на любом seo форуме
Татьяна

11.02.2014 | 15:48

Впервые услышала про «сопли» и проверила свой сайт- у меня их 2/3. Не под фильтром гугла 29%. Понятно, что плохо, сейчас начну изучать вашу статью -может получится что-то исправить. Спасибо.
Татьяна

11.02.2014 | 15:58

Появился вопрос. Не поскажете почему страницы поддомена в «соплях» и можно ли их убрать?
Антон

11.02.2014 | 16:28

Татьяна, гугл может убирать в сопли всё что захочет. Наверно страницы вашего поддомена он считает не важными. Либо содержащими дубли или ещё что ему не нравится.
Татьяна

11.02.2014 | 18:04

Там вообще ничего нет, он для опытов. Я не понимаю почему и как основной и поддомен связвны.
Может у меня что-то не так на основном?
Антон

11.02.2014 | 18:11

Татьяна, тем более если там ничего нет и он для опытов то зачем и что там гуглу индексировать? Поддомен по определению связан с основным сайтом на то он и поддомен основного домена.
Татьяна

11.02.2014 | 18:30

Так зачем же он в «сопли» их повесил? Зачем-то же он эти страницы проиндексировал и теперь они портят общую картину?
Я понимаю, что за логику гугла Вы не отвечаете, но хотелось бы узнать, можно ли это исправить/убрать. Спасибо.
Антон

11.02.2014 | 19:02

тогда закройте поддомен от индексации. И удалите ненужные директории из индекса. Это делается в инструментах для вебмастеров google —
На главной странице Инструментов для веб-мастеров выберите нужный сайт.
В меню слева выберите Индекс Google, а затем – Удалить URL-адреса.
Нажмите Создать запрос на удаление.
Укажите URL каталога, который необходимо удалить из результатов поиска, и нажмите кнопку Продолжить.
Обратите внимание, что учитывается регистр: URL должен содержать те же символы и в том же регистре, как и на сайте.
Если вы хотите удалить весь сайт, оставьте это поле пустым.
Выберите Удалить каталог.
Нажмите кнопку Отправить запрос.
Татьяна

11.02.2014 | 19:18

Большое спасибо за подробный ответ!
Александр Борисов

27.04.2014 | 13:07

Дубли это полный треш. Яндекс молодец, культурный и воспитанный робот. Запретили в robots.txt туда то не лезть, он и не лезет, а Гоголь этот везде свой нос сует!
Антон

27.04.2014 | 13:57

Треш трешем а отслеживать всё равно надо. Гугл всё гумно собирает, даже где закрыто.
Александр

23.06.2014 | 16:47

Подскажите, почему так мало страниц в основной выдаче? 10% -нет. Что можно изменить, посоветуйте.
Антон

23.06.2014 | 21:16

В статье выше всё написано что нужно делать.
Татьяна

03.07.2014 | 18:08

Здравствуйте, Антон! При проверке site:lys-eco.com-site:lys-eco.com/& гугл не находит ни одного документа, такое может быть? Я сомневаюсь, так как дубли страниц находит SEO lib иXtool. Не могу понять в чем дело. Может Вы что-то подскажете. Спасибо.
Антон

04.07.2014 | 00:35

Приветствую. Предложенная конструкция кажется прекратила работать.
Используйте такое —
общий индекс — site:lys-eco.com
основной индекс — site:lys-eco.com/&
Вставлять в поисковую строку гугла а не в адресную строку браузера.
Татьяна

04.07.2014 | 07:24

К сожалению и так не работает
Антон

04.07.2014 | 07:35

Татьяна, всё работает. Откройте эту ссылку
Вы наверно в адресную строку вбивали а не в гугл.
Юлия Штрелер

04.07.2014 | 12:52

В очередной раз зашла к вам, Антон, после ажиотажа на блоге Борисова. Его последней статьи про удаление соплей из индекса.
Не буду распространяться про особенности его инфо-бизнеса «с душком»(ИМХО), тем более, что вполне адекватные комменты Борисов всё-таки удаляет, если они не в стиле «спасибо, мой гуру, может еще чего подскажешь, а то как же мы без тебя»)))
Вопрос вот в чём. Хотелось бы узнать ваше мнение о сео-плагине от Йоаста. Там есть много различных функций, в том числе удаление страниц реплитуком, возможность закрытия от индексации отдельных страниц, рубрик... Много всего
У меня он стоит с начала года, не скрою — довольна, и судя по данным из я-вебмастера и вебмастера гугла, количество «соплей» уменьшилось значительно.
Или всё же дело не в плагинах, а в состоянии сайта в целом, в комплексе, так сказать?
Антон

04.07.2014 | 13:21

Юлия, статью Борисова не читал, так что ничего сказать не могу.
Плагин WordPress SEO by Yoast в общем то многие хвалят. Я его не использовал. Какое он оказывает влияние на сопли не знаю.
Татьяна

04.07.2014 | 14:14

Спасибо за ответ, отдельно показывают оба варианта, а в формуле нет.
Чисто арифметически цифру можно вывести, но она на порядок отличается от той, которую показывают при проверке на ссылки сервисы.
Антон

04.07.2014 | 15:01

В статье выше я написал — Конструкция вида site:ваш сайт -site:ваш сайт/& — больше не работает!
Если вы больше верите сервисам чем гуглу то ориентируйтесь на них. Никаких проблем.
Татьяна

05.07.2014 | 12:03

Конечно гуглу верю больше, тем более, что от его реакции зависит посещаемость.
Тут бы найти причину и устранить ее. Спасибо за ответы, давно уже ищу как решить проблему, но пока безрезультатно.
Антон

05.07.2014 | 13:50

Причину чего? Посещаемость идёт не только с гугла но и с других поисковиков.
Татьяна

05.07.2014 | 17:54

Причину большого количества дублей страниц в индексе.
Антон

05.07.2014 | 18:15

Мельком глянул у вас пагинация индексируется, лучше закрыть. Потом редирект нужно сделать чтобы адреса страниц слешем заканчивались и т.д.
Читайте это и делайте как написано — /dubli-stranits-poisk-udalenie-dubley/
Ваши страницы — _https://www.google.ru/search?hl=en&q=site:lys-eco.com/%26&gws_rd=ssl#hl=en&newwindow=1&q=site:lys-eco.com/%26&start=50
Виталий

05.07.2014 | 19:32

Англоязычный сайт сперва в основном индексе, а через недельку весь ушёл в дополнительный. Правда тексты я переводил с русских сайтов, через гугл переводчик. Даже если текст, где-то плохо читабелен, то как это может понять поисковый робот?
Антон

06.07.2014 | 01:29

Ты наверно машинным переводом переводил. А что ты хотел чтобы тебя в топ поставили?)
Татьяна

06.07.2014 | 17:03

У меня со слешем нет, только без него, я так поняла, что главное, чтобы что-то одно из них было. А вот страницы сайта открываются по адресу с www и без www -проблема.
Буду изучать вашу статью, а то пока не всё до конца поняла и про пагинацию не нашла.
Ваша статья наверное самая толковая из всех, что я по этому поводу раньше читала. Спасибо, что отвечаете на вопросы.
Антон

06.07.2014 | 17:34

Пагинация это страницы вида — _http://lys-eco.com/page/14
Закрываются правилом Disallow: */page/* в файле robots.txt
Просто допишите и всё. Это дубли.
Как решить проблему с www и слешем подробно описано в этой статье —
/dubli-stranits-poisk-udalenie-dubley/
Татьяна

06.07.2014 | 20:15

Чем больше читаю, тем глупее вопросы возникают. С www , например —
Еще раз всё перепроверила и вижу, что с WWW перенаправляется на без него ( не дублируется). А в настройках вижу, что стоит выбор зеркала на усмотрение робота. И вот мой вопрос -нужно ли в этом случае указывать основным без WWW?
Спасибо.
Антон

07.07.2014 | 00:18

Не знаю про какой сайт вы говорите но тот что у вас в подписи с www на без www не редиректится.
Татьяна

07.07.2014 | 13:29

Да, тот который в подписи. Не понимаю, как такое может быть, но я сколько не задаю с www открывается без www. Почему у Вас не редиректится?
Тут вроде бы и неправильно задать нельзя, просто голова идет кругом.
Антон

07.07.2014 | 13:46

Я не знаю как вы задаёте адрес но я проверяю так — открываете свои сайт, в адресной строке браузера (вверху) дописываете www перед доменом сайта чтобы получилось _www.lys-eco.com. Нажимаете Enter. Открывается страница с адресом _www.lys-eco.com то есть никакого редиректа нет.
Татьяна

07.07.2014 | 18:29

Спасибо за терпение. Очистила кеш и теперь так как Вы говорите — редиректа нет.
Буду работать над этим. С Яндексом все получилось, а гугл просит подтверждение прав, хотя я их подтвердила при регистрации. Что ему нужно, не понимаю.
Антон

07.07.2014 | 19:00

Татьяна, вам вообще нужно всё это?
Ну подтвердите ещё раз или снова кэш очищайте. Что то у вас много проблем с браузером. Если работаете в каком нибудь хроме выкиньте его на помойку.
Татьяна

07.07.2014 | 20:47

Так точно, в хроме.
Антон

07.07.2014 | 20:50

Работайте в Firefox. Многие проблемы отпадут.
Bossdriver

07.10.2014 | 03:32

Приветствую! Столкнулся с таким: на сайте страница, которая в «соплях» есть в выдаче гугла. Нонсенс? Хотел бы услышать ваше мнение. Спасибо!
Антон

07.10.2014 | 05:16

сайт что в подписи под агс так что тебе не о соплях нужно думать.
Оксана

07.12.2014 | 21:41

Спасибо за статью, но у меня никак не получается увидеть страницы, которые в соплях гугла. На первой странице поиска показывает количество всех страниц, а если перехожу на 10-ю, остаются только те, что в основном индексе. Антон, подскажи пжл, как увидеть урлы страниц в доп. индексе?
Антон

07.12.2014 | 22:13

Можете проверить тут — xseo.in
вбиваете урл в «проверка индексации сайта»
внизу будет показано сколько страниц в в supplemental выдаче Google.
сnраницы в основной выдаче можно проверить запросом в гугл — site:yurisuhanov.ru
Оксана

08.12.2014 | 00:16

Спасибо большое за такой быстрый ответ, а можно как-то узнать, какие именно страницы находятся в supplemental?
Антон

08.12.2014 | 00:37

страницы в основной выдаче запросом в гугл — site:yurisuhanov.ru/&
сопли не знаю. rds бар показывает что у вашего сайта из подписи 81 страница в индексе яндекса и 408 страниц в индексе гугла. в основном индексе 18% проиндексированных гуглом страниц.
Оксана

08.12.2014 | 00:57

У меня показывает еще меньше 15%.
Интересная ситуация: когда вручную удаляла страницы с 404 ошибкой из индекса, % страниц в основном индексе резко повышался, несоизмеримо с количеством удаленных страниц. Но потом опять постепенно падал, и с каждым днем все больше и больше.
Еще недавно было чуть больше 200 страниц в индексе — уже больше 400, хотя добавила всего пару уникальных статей (сайт новый).
Хотела проанализировать, что за страницы вне основного индекса. Жаль, что нет такой возможности(
Антон

08.12.2014 | 01:33

надо искать дубли посмотрите ещё здесь — здесь
сайт добавлен в вебмастер тулс гугла? там ещё можно посмотреть страницы в индексе. а то все эти плагины ошибаются часто бывает.