Как идентифицировать и исправить проблемы с раздуванием индексации

  1. Почему проблема с разметкой?
  2. Выявление проблем с раздуванием индекса
  3. Мониторинг сайта
  4. Как я могу исправить вздутие индексации?
  5. Исправление с помощью мета-роботов
  6. Файл Robots.txt
  7. Канонические метки
  8. пагинация
  9. С помощью Консоль поиска Google Инструмент URL-параметров
  10. Инструмент для удаления URL
  11. Индекс вздутия в результате взлома
  12. Заключение
  13. Хотите быть в курсе последних тенденций поиска?
  14. Хотите быть в курсе последних тенденций поиска?

Раздувание индексации - это когда веб-сайт содержит страницы в «индексе» поисковой системы, которые не следует индексировать, и может вызвать проблемы, если их не отслеживать и не проверять должным образом.

Это чрезвычайно распространенная проблема SEO, которая затрагивает все сайты, начиная от небольших Блоги WordPress на большие сайты электронной коммерции Hybris и Magento.

Более серьезные случаи вздутия индексации обычно происходят на веб-сайтах электронной коммерции, поскольку они, как правило, используют удобные для пользователя фасетные навигации и списки фильтров, что позволяет пользователи быстро определить продукты, которые они хотят.

я видел Примеры простые индексы сайтов Demandware и Open Cart, содержащие всего несколько сотен продуктов с миллионами URL-адресов, появляются в индексе Google из-за фильтров, генерирующих URL-адреса.

Почему проблема с разметкой?

Это известный факт, что когда Google и другие поисковые системы сканировать ваш сайт, они не сканируют ваш сайт в целом. Разрешение и просьба сканировать ненужные URL-адреса тратит впустую этот ресурс.

Если поисковые системы не регулярно сканируют ваши «денежные» страницы и вместо этого застревают в других кроличьих норах, не обращая внимания на обновления, это может повлиять на вашу органическую производительность.

Раздувание также может привести к дублированию контента. Хотя внутреннее дублирование контента веб-сайта не является такой серьезной проблемой, как внешнее дублирование, оно может ослабить значимость и релевантность отдельной страницы для поисковых терминов, если сама страница, как поисковые системы, не уверены, какой URL-адрес будет ранжироваться по этим терминам.

Выявление проблем с раздуванием индекса

Одним из ранних показателей раздувания индекса является количество страниц, отображаемых в поисковый движок Результаты.

Здесь важно отметить, что количество страниц, обычно идентифицируемых с помощью оператора site: в Google и поиске Bing, часто показывают цифры, отличные от того, что вы видите в Google Search Console и Бинг Инструменты для веб-мастеров - это не о чем беспокоиться.

Мониторинг сайта

Несмотря на то, что существуют способы устранения вздутия индекса, по моему опыту, лучший способ справиться с ним - вообще не допустить его возникновения.

Проверяя Google Консоль поиска и Bing Webmaster Tools на ежемесячной основе, особенно при сканировании данных, вы можете записывать, что является обычным поведением вашего веб-сайта, а что нет.

Необычное увеличение или всплеск «Число страниц, сканированных за день» и «Количество килобайт, загруженных за день» может указывать на то, что Google получает доступ к большему количеству URL-адресов, чем было раньше.

Аналогично ведение сайта: поиск в Google и Bing позволит вам увидеть, сколько URL-адресов они имеют в индексе, и вы примерно узнаете, сколько страниц имеет ваш сайт.

Как я могу исправить вздутие индексации?

Выявление проблемы с раздуванием индекса - это только первый шаг, теперь вы должны установить, что является причиной раздувания.

Это некоторые из наиболее распространенных причин раздувания индексации, но также нередко иметь более одной из этих причин.

  • URL-адреса доменов, обслуживаемые по протоколам http и https
  • Печатные версии страниц с дублированием URL
  • URL-адреса параметров, вызванные внутренним поиском
  • URL параметров, вызванные фильтрами товаров
  • пагинация
  • Блог таксономии
  • Идентификаторы сессий в URL
  • Внедрение спам-страниц после взлома
  • Старые URL не перенаправляются должным образом после миграции
  • Конечные косые черты в конце URL-адресов вызывают дублирование
  • UTM источник

Исправление с помощью мета-роботов

Мета-теги уровня страницы - мой предпочтительный метод борьбы с раздуванием индекса, и он особенно полезен, если реализован с уровня сервера на нескольких страницах одновременно.

Мета-роботы на уровне страниц также имеют приоритет над директивами разбиения на страницы и канонизации, а также robots.txt файл (если не заблокирован в файл robots.txt ).

Они также эффективны при удалении URL-адресов, содержащих параметры, вызванные фильтрами продуктов, фасетной навигацией и внутренними функциями поиска. Блокировать их в файле robots.txt не всегда лучше, так как это может вызвать некоторые проблемы между тем, что видят различные пользовательские агенты Google, что может негативно повлиять на платные поисковые кампании.

Лучшей практикой будет использование « noindex, следуй » - таким образом, любой обратные ссылки указание на страницу все равно будет передавать капитал на домен.

Файл Robots.txt

Блокировка параметров URL в robots.txt Файл является отличной профилактической и реактивной мерой, но это не абсолютное решение.

Все, что делает файл Robots.txt, - это заставляет поисковые системы не сканировать страницу, но Google по-прежнему может индексировать страницу, если страница связана с внутренними или внешними сайтами. Если вы знаете, где находятся эти внутренние ссылки, добавьте к ним rel = ”nofollow” .

Канонические метки

Самостоятельная ссылка на канонизацию обычно является лучшей практикой, за исключением раздутых URL-адресов. Платформы электронной коммерции, такие как Open Cart, могут создавать несколько URL для одного и того же продукта и категории.

Добавление канонического тега в заголовки ненужных URL-адресов продуктов и категорий, указывающих на «основной», поможет поисковым системам понять, какую версию страницы следует проиндексировать.

Однако каноническая директива является только директивой и может быть проигнорирована поисковыми системами.

пагинация

Проблемы с разбиением на страницы могут возникать на страницах блога и на странице категории блога, на страницах категории продукта, на страницах результатов внутреннего поиска в основном любой элемент сайта, который имеет несколько страниц.

Поскольку эти страницы будут содержать одну и ту же метаинформацию, поисковые системы могут запутать отношения между ними и решить, что это дублированный контент.

Использование разметки нумерации страниц rel = ”next” и rel = ”prev” поможет поисковым системам понять взаимосвязь между этими страницами и, вместе с настройкой в ​​Google, Консоль поиска решить, какие из них нуждаются в индексации.

С помощью Консоль поиска Google Инструмент URL-параметров

Инструмент параметров URL можно использовать, чтобы сообщить Google, какие конкретные параметры влияют на содержимое страницы (например, сортировать, сужать, фильтровать). Как и другие методы, упомянутые ранее, вам нужно убедиться, что вы случайно не просите Google не индексировать URL-адреса, которые вы хотите включить в индекс, и не указывать поведение параметров неправильно.

Google классифицирует ваши параметры на две категории; активный и пассивный. Активный параметр - это то, что влияет на контент на странице, поэтому фильтр продукта и пассивный параметр - это что-то вроде идентификатора сеанса или источника UTM.

Это должно действительно использоваться только в качестве крайней меры и использоваться правильно в сочетании с другими методами, в противном случае это может негативно повлиять на эффективность органического поиска домена.

Перед использованием этого инструмента, обязательно прочитайте Официальная документация и руководство Google ,

Инструмент для удаления URL

В зависимости от полномочий вашего домена, Google может потребоваться некоторое время, чтобы распознать и отфильтровать URL-адреса, которые вы хотите удалить. После того, как вы внедрили что-то, чтобы запретить Google снова индексировать URL-адрес (метатег тега уровня страницы), вы можете запросить, чтобы Google удалил URL-адрес из индекса через Google. Консоль поиска ,

Это только временная мера, поскольку она будет скрывать URL-адрес в течение 90 дней из результатов поиска Google, но не влияет на сканирование и индексацию Google URL-адреса.

Это полезно, если вы не хотите, чтобы пользователи могли находить определенные страницы, но каждый URL-адрес должен быть представлен индивидуально, так что это не очень хорошее решение, если у вас серьезное раздувание индекса.

Индекс вздутия в результате взлома

Теперь, очевидно, если ваш сайт был взломан, вздутие индекса определенно не будет приоритетной задачей. Но раздувание от взлома может вызвать проблемы для домена.

Ниже приведен скриншот швейцарского домена (.ch), который работает в Европе через несколько недель после взлома:

ch), который работает в Европе через несколько недель после взлома:

Сам сайт имеет всего около 50 страниц, но, как вы видите, Google в настоящее время индексирует 112 000.

Это означает, что, среди прочего эти 50 страниц страниц с информацией о продуктах и ​​продуктах теперь теряются среди тысяч взломанных URL-адресов, поэтому любые обновления этих страниц могут занять несколько недель, чтобы их заметили, особенно если ваш веб-сайт не требует большого бюджета на сканирование.

Другим индикатором этого может быть внезапное увеличение видимости поиска (для не относящихся к делу терминов):

Другим индикатором этого может быть внезапное увеличение видимости поиска (для не относящихся к делу терминов):

Я работал на сайтах ранее, где это был первый показатель. В то время как в Google Search Console проводилась регулярная ежемесячная проверка, веб-сайт, посвященный крещеным платьям, начал занимать место в рейтинге «дешевые майки НФЛ» и другие американские условия спортивной одежды.

Эти всплески видимости часто бывают недолговечными, но могут надолго разрушить доверие между Google и вашим доменом, поэтому можно много сказать о вложениях в кибербезопасность помимо https.

Заключение

Снижение вздутия индекса не происходит в одночасье, поэтому важно сохранять терпение.

Также важно создать процесс или структуру и предоставить право собственности на указанный процесс кому-то, чтобы проводить его на регулярной основе.

Хотите быть в курсе последних тенденций поиска?

Получить лучшие идеи и новости от наших экспертов по поиску.

Хотите быть в курсе последних тенденций поиска?

Получить лучшие идеи и новости от наших экспертов по поиску.

Похожие

Цензура от Google: кто контролирует интернет-контролеров?
... ставьте себе мир, где у Google нет секретов, где все поисковые системы играют честно и где SEO не должно быть синонимом «первой страницы». Звучит как сказка? Интернет часто называют великим демократизатором, а Google - его благородным привратником. Там нет сомнений, что
Быстрый SEO Win: Проверьте свой файл Robots.txt
... инструмент тестирования. Несколько наших любимых инструментов для этого включают в себя: Консоль поиска Google Robots.txt Checker Технический инструмент для тестирования SEO Robots.txt. В GSC нажмите «Сканирование», а затем «robots.txt
Файл Robots.txt: какова его роль и как его создать?
Robots.txt - это файл, который сообщает поисковым системам, какие области вашего сайта они могут индексировать. Какова его точная роль? Как создать это и как использовать это для своего SEO? Что такое файл robots.txt? Robots.txt - это текстовый файл, расположенный в корне вашего сайта. Этот файл предназначен для запрещения роботов поисковых систем
Как измерить SEO с помощью Google Analytics
... вы уже знаете, Метриплицу начали создавать онлайн-тренинг по веб-аналитике чтобы быть в состоянии достичь тех мест, где мы не можем сделать это физически"> Как вы уже знаете, Метриплицу начали создавать онлайн-тренинг по веб-аналитике чтобы быть в состоянии достичь тех мест, где мы не можем сделать это физически. В наше предложение
Урок № 2. Продвижение сайта - как повысить видимость сайта
... поиска. Есть два эффективных способа всегда попадать в результаты поиска. Первый - это SEO оптимизация . SEO - это сокращение от английской фразы для поисковой оптимизации. Оптимизируя ваш сайт, вы повысите свои шансы на появление среди бесплатных результатов поиска . Второй - SEM - поисковая система поиска. Это единственный быстрый и гарантированный способ предоставить вашей бизнес-странице результаты поиска. Реклама в поисковых системах, реклама
Состояние Schema.org: Каковы самые большие проблемы, связанные с разметкой Schema?
... структурированных данных, которая помогает поисковые системы интерпретировать ваши веб-страницы, считается, что это полезно с точки зрения SEO. Хотя это не может напрямую коррелировать с увеличением рейтинга, использование Schema.org Разметка
Как работает поисковая система Google
Мэтт Каттс - инженер, работающий в качественной поисковой группе. Он присоединился к Google в 2000 году назад. В настоящее время он является руководителем группы в Google Webspam. До своей карьеры в Google Мэтт работал над компьютерным графическим дизайном в университете Северной Каролины в Чапел-Хилл. Подобно профессиональным экспертам, этот человек без колебаний раскрывает самые большие секреты в своей работе. Поисковая система или
Как подтвердить свой аккаунт в Twitter за 10 шагов
Twitter объявил, что теперь позволит любому из своих пользователей подать заявку на столь востребованный синий значок подтверждения. Но есть еще ряд критериев, которые вы должны выполнить, чтобы быть принятым в Пантеон в Твиттере , К счастью, это не так сложно, как «быть столь же популярным, как Кэти Перри» или «быть таким же ужасающе непредсказуемым,
Как я могу отправить карту сайта в Google?
... вручную отправить свою карту сайта в Google по двум различным маршрутам, и рекомендуется добавить ссылку на свою карту сайта в файл robots.txt. Просто добавьте URL к вашей карте сайта в самой первой или последней строке вашего robots.txt: карта сайта: http://www.mydomain.com/sitemap.xml Возможность № 1: ручной пинг Вы можете использовать простую команду ping. который вы вводите в адресной строке вашего браузера, чтобы отправить карту сайта в Google.
Планирование, бюджетирование и оценка кампании SEO
... поиска Google. Единственное, что они сделали неправильно, - это поверили в фирму, которая в конечном итоге уничтожила их обычный поисковый трафик и, в некоторых случаях, их бизнес. Это скрытый счет «дешевого SEO». Отказ от планирования = Отказ от планирования Клише верно - без плана невозможно отследить прогресс или измерить успех. Не существует маркетингового плана «один размер для всех». Каждый веб-сайт индивидуален и у каждого свои уникальные
SEO отчеты и метрики: как доказать прогресс
... сяца, и снова пришло время сообщить своим клиентам или вашему боссу о прогрессе SEO, достигнутом в прошлом месяце"> Это начало месяца, и снова пришло время сообщить своим клиентам или вашему боссу о прогрессе SEO, достигнутом в прошлом месяце. Пришло время оправдать вашу стратегию SEO, ваши усилия и вас самих. Звучит знакомо? С непростым ландшафтом SEO приходит непростой ландшафт

Комментарии

Хотите быть в курсе последних тенденций поиска?
Хотите быть в курсе последних тенденций поиска? Получить лучшие идеи и новости от наших экспертов по поиску. Хотите быть в курсе последних тенденций поиска? Получить лучшие идеи и новости от наших экспертов по поиску.
Таким образом, при оптимизации в нашем уме всегда должен быть следующий вопрос: soru Как я могу думать, как Google ebilir?
Таким образом, при оптимизации в нашем уме всегда должен быть следующий вопрос: soru Как я могу думать, как Google ebilir? Заголовки страниц и метаописания начинаются с базовой точки зрения. Если ваш веб-сайт является блогом или веб-сайтом электронной коммерции, он должен быть написан в описательной форме, чтобы облегчить понимание заголовков страниц и легко сканировать и индексировать ботов Google. Аналогично, боты, которые сканируют наш веб-сайт, заботятся как о метаданных, так и о заголовках
В то время как Google Мобильный тест позволяет издателям проверять свои страницы на наличие проблем, как часто вы на самом деле делаете этот шаг?
Но как вы можете быть уверены, что выбрали для своего сайта лучшую рекламную компанию?
Но как вы можете быть уверены, что выбрали для своего сайта лучшую рекламную компанию? Если вы попытались поработать с различными SEO-компаниями и с удивлением заметили, что вы даже не объясняете план действий по оптимизации своего сайта, вам будет приятно узнать, что мы ничего не скрываем и не храним секретов. На самом деле, мы всегда объясняли нашим клиентам, что именно мы делаем для оптимизации сайтов, чтобы они были лучше информированы при выборе наших услуг. Услуги по поисковой оптимизации,
SEO Speed ​​Course Часть 4: Как я могу контролировать качество моего сайта?
Как я могу позиционировать себя в Google в Альбасете? Я не буду отрицать, что вы можете сделать это сами, вы можете прочитать сотни статей в блогах о SEO , провести свое предыдущее исследование с помощью Google Adwords и Google Trend , а затем закончить ссылки на страницы, как можете, а затем скрестить пальцы, чтобы все работало Я не собираюсь это отрицать ... На самом деле здесь я оставляю вам
Где я могу найти файл ROBOTS TXT?
Где я могу найти файл ROBOTS TXT? Файл robots.txt должен находиться на корневом уровне вашего сайта . Если вы хотите проверить, присутствует ли он на вашем сайте, вы должны ввести в адресной строке браузера: http://www.addressedevotresite.com/robots.txt. Если файл: Теперь он будет отображаться, и роботы будут следовать инструкциям в файле. отсутствует
Вы связали Screaming Frog с Google Analytics и Консоль поиска Google?
Вы связали Screaming Frog с Google Analytics и Консоль поиска Google? Затем вы увидите эти данные на вкладках Analytics и Search Console, а также на вкладке Internal: 4. Экспортируйте отчет на свой компьютер Нажмите на экспорт. Screaming Frog теперь экспортирует
Или вы хотите больше информации о том, как работает Google?
Или вы хотите больше информации о том, как работает Google? Подпишитесь здесь на нашу бесплатную рассылку. Почему важно, чтобы ваш сайт появлялся в топ-10 Google? Во Франции более 90% интернет-пользователей используют поисковые системы, чтобы найти бренд, услугу, продукт ... Посещения вашего сайта, таким образом, происходят в основном из Google, который составляет более 94% доли рынка. Исцеление вашего
Что именно там произошло, как это повлияло, на кого повлияло, как проверить и в основном - как исправить?
Что именно там произошло, как это повлияло, на кого повлияло, как проверить и в основном - как исправить? Давайте сделаем заказ. Как все это началось? Любой процесс Создайте сайт WordPress Включает рекомендации по установке плагина Joast. И нет строителя тоже
А как насчет того, что вы хотите, чтобы люди на вашем сайте были как можно дольше?
А как насчет того, что вы хотите, чтобы люди на вашем сайте были как можно дольше? Оба из них показывают поисковую систему о том, насколько привлекателен ваш сайт, а также в качестве инструмента, чтобы увидеть, насколько ваш сайт обеспечивает лучший пользовательский опыт. Один из лучших способов улучшить ситуацию в обеих областях - установить соответствующий плагин публикации или Похожие сообщения. После установки и настройки плагин отображает сообщения и страницы
И как только вы получите эти желанные позиции, как вы будете их сохранять, особенно когда Google постоянно пересматривает свой алгоритм?
И как только вы получите эти желанные позиции, как вы будете их сохранять, особенно когда Google постоянно пересматривает свой алгоритм? Вот где приходят наши SEO-сервисы White Label. Что вы можете ожидать В этой компании мы применяем целостный подход к разработке и реализации стратегии, которая включает в себя исследование ключевых слов, создание контента, естественные ссылки, социальные сигналы и многое другое. Мы получаем подотчетные и измеримые органические результаты для

Почему проблема с разметкой?
Хотите быть в курсе последних тенденций поиска?
Почему проблема с разметкой?
Как я могу исправить вздутие индексации?
Хотите быть в курсе последних тенденций поиска?
Хотите быть в курсе последних тенденций поиска?
Звучит как сказка?
Txt: какова его роль и как его создать?
Какова его точная роль?
Как создать это и как использовать это для своего SEO?