Сервис анализирует релевантность продвигаемой страницы и указывает на слабые места.
По умолчанию ориентируется на ТОП Яндекса.
Облака строятся по релевантным словам. Маленькое облако = слабая релевантность.
В таблице выделены слова, которые не были найдены на вашей странице.
Основные слова представленные в таблице — общие по всем словоформам, и обозначены самой популярной словоформой по заданной выборке.
Точные данные по каждой словоформе представлены в раскрывающемся списке, если нажать на плюсик.
Все данные таблицы можно выгрузить в Excel.
Нормирование затрагивает значения: «медиана», «переспам», «сред. по топу» и «зона <a> по топу».
Коэффициент нормирования равен отношению количества слов на вашей странице к медиане слов по конкурентам.
После чего умножаем этот коэффициент на все значения общих показателей («медиана», «переспам», «сред. по топу» и «зона <a> по топу»).
IDF уменьшает вес широкоупотребительных слов. Для каждого уникального слова существует только одно значение IDF.
TF-IDF отражает важность использования каждого слова на продвигаемой странице.
Переспам — отображает максимальные значения повторов слова по всем конкурентам.
Пассаж здесь это часть текста на сайте, разделённая html-тегами.
Медиана количества элементов каталога — это медиана количества элементов с одинаковым XPath, за исключением тега <p>.
Для страниц типа категория это может быть список КТ, для галереи это список изображений и т.п.В рекомендациях на добавление показаны слова которые по пересечениям встречаются хотя бы у половины конкурентов. Диапазон идёт от наименьшего значения (медиана или среднее) и до переспама.
Нерелевантные слова — это те, которые не встречались ни у одного из конкурентов.
Релевантность URL — это покрытие url трехбуквиями из запроса. (Челябинская лотерея — chelloto. Переводим запрос в транслит, находим трехбуквия которые покрываются (che, hel, lot, olo), смотрим какую долю от всех трехбуквиев покрыли)
Блок Семантические коконы является экспериментальным.
Здесь анализируются анкоры в виде векторов вместо полного контента страниц.
Они распределяются по зонам документа от самого близкого к запросу (1 зона), до самого последнего (последняя зона).
Инструмент даёт рекомендации на основе конкурентов.
Если видите фразы из первой зоны, то их желательно добавить в верхнее меню или в ссылки начала страницы, а последние зоны в конец документа.
Зелёным цветом выделены те, которые уже есть у вас на странице, а красным — те, что были найдены у конкурентов, но нет у вас.
В ТОПе релевантности документов значения релевантности основано на трёх параметрах:
1. Охват семантики по колонке «пересечения»,
2. Сходство облака сайта с облаком основных слов (из графика),
3. Отклонения от закона Ципфа.
Гибридный анализ релевантности classic
Описание