Как составить семантическое ядро сайта: шаги составления СЯ и примеры

Приветствую вас, читатели моего скромного блога. После всех предварительных работ в рамках моего курса SEO мы переходим к очень важному этапу — составлению семантического ядра сайта.

В блоге многие аспекты этой темы освещались неоднократно, но полной картины они не дают, а поэтому данный материал призван стать цельной инструкцией. Чтобы не дублировать уже ранее написанное, я буду делать отсылки из подпунктов на соответствующие записи.

Что такое семантическое ядро сайта?

Семантическое ядро, говоря простым языком, — это список слов и фраз, которые, с одной стороны, характеризуют ваш сайт: материалы, товары и услуги, представленные на нем, и, с другой стороны, которые «ищутся» пользователями поисковых систем в том виде, в котором они присутствуют в семантическом ядре. В общем, это список тех запросов, которые будут вести целевой трафик на сайт.

Части про «ищутся» нет в официальных определениях и любое словосочетание имеет право называется ключевым. Но если его не ищут в таком виде, то это будет запрос-пустышка, а нам они не нужны.

Многие пренебрегают составлением семантического ядра сайта и это не удивительно — очень долгая, нудная и кропотливая работа. Но тогда и не менее удивителен тот факт, что в интернете раскидано огромное множество уникальных и интересных материалов, которые, однако, никто не читает, так как они написаны таким языком и такими словами, которые никто не ищет. И пока системы Яндекс или Google не научатся в совершенстве «читать между строк», то так, к сожалению, и будет.

Недавно я по просьбе одного автомобильного портала проводил анализ — почему рост трафика в последнее время замедлился. Ответ был найден довольно быстро — последние месяцы материалы добавлялись без контроля со стороны семантики. Хорошие, интересные обзоры, но с семантикой беда. Особенно понравился один метазаголовок — «в лицо врага». Сам же материал был на тему тест-драйва нового Nissan.

Вот и кто будет искать врага, чтобы почитать про новую звезду авторынка? :)

Если брать не такие крайности, то на том же портале есть раздел на тему «автомобильное законодательство«. И всё бы хорошо, но в такой форме материалы по этой теме почти никто не ищет, в отличие «авто и закон». Вот это «автомобильное законодательство» в данном случае и является «запросом-пустышкой». Суть, думаю, ясна.

Подробнее о целях и задачах сбора семантического ядра: https://pingoblog.ru/20-zadachi-semanticheskogo-yadra.html

Виды и типы поисковых запросов: классификация

Очень важно разобраться в классификации поисковых запросов. И это не пустая теоретическая вода — это то, что поможет понять, какие именно нам нужны запросы и почему, чтобы не хвататься за нецелевые и неэффективные.

Традиционная классификация поисковых запросов:
- Навигационные — поиск конкретного сайта или сервиса, например, «риа новости».
- Информационные — поиск информации как таковой, например, «как готовить борщ».
- Транзакционные — поиск чего-либо с целью осуществить какое-либо действие «купить утюг».
- Общие — запросы, которые могут быть как информационными, так и транзакционными, например, «машины».
Виды поисковых запросов:
- Конкуренция: высосоконкурентные (ВК), среднеконкурентные (СК) и низкоконкурентные (НК) — насколько сложно продвинуться по этому запросу.
- Частотность: высокочастотные (ВЧ), среднечастотные (СК) и, не поверите, низкочастотные (НЧ) — сколько трафика можно получить с этого запроса.
- Коммерческие и информационные — является ли целью посетителя сделать ваш кошелек более тугим или нет.
- Геозависимые и геонезависимые — относится ли запрос к какому-то конкретному региону или нет.
- Сезонные и внесезонные — имеются ли у частотности запроса циклические колебания, повторяющиеся из года в год.

Что же нам нужно? Если отложить в сторону показатель конкурентности, с которым и так всё понятно, то легче всего продвигать геозависимые информационные запросы (если, конечно, вы продвигаете в регионе, к которому они относятся), а сложнее всего — геонезависимые коммерческие. Геопривязку можно определить через программу Key Collector, сервис SeoPult или же ручками, схема к чем я в одном из следующих материалов.

Определение геопривязки через SeoPult

Примеры геозапросов:

«Куда сходить» — геозависимый информационный запрос.
«Натяжные потолки калькулятор онлайн» — геонезависимый коммерческий запрос.

Высокочастотные запросы нам пока особо не требуются — они по умолчанию высококонкурентны, но если вы нашли высокочастотный низкоконкурентный ключ, то напишите мне — с меня чай с печеньками :)

Но мы поступимся высокочастотными запросами не потому, что сложно продвинуть, а потому что те средства и силы, которые мы затратим на продвижение ВЧ будут несоизмеримо больше, чем в случае с сотней НЧ или нескольких десятков СЧ, а трафика будет больше (эффект длинного хвоста). Неэффективно, одним словом. График распределения частот между типами запросов:

Частотности запросов

Нет-нет, это не значит, что в СЯ не должно быть ВЧ, просто не нужно биться лбом об стенку и бросать на них все силы. По мере подтягивания к топу НЧ и СЧ и прокачке тематических характеристик хоста в целом, ВЧ тоже будут ползти к заветной десятке.

В общем и целом, в своё семантическое ядро мы в первую очередь подбираем геозависимые НЧ и СЧ c как можно меньшей конкурентностью. И лишь затем, на будущее, приправляем его геонезависимыми и высокочастотными.

Для информационного сайта, соответственно, нужные информационные геозависимые запросы, а для коммерческого — коммерческие геозависимые и частично информационные, которые, по логике, могут привести не только зевак, но и клиентов — «как выбрать то-то», «характеристики того-то» и т.д.

Подробнее о типах поисковых запросов: https://pingoblog.ru/21-tipy-poiskovyh-zaprosov.html

Порядок составления семантического ядра: шаг за шагом

Итак, перед составлением семантического ядра убедимся в наличии трёх вещей — головы, рук и программы Key Collector (KC). В случае отсутствия одного из первых двух пунктов я вам не помогу, а вот если нет программы, то, либо приобретите её (пара тысяч за пожизненную лицензию), либо будем собирать по старинке, через Яндекс WordStat (WS), но будет это в разы дольше и мучительнее. Далее я попробую писать в два потока — алгоритм для KC и для WS.

1. Собираем начальный список запросов

Начальный список — это исходный материал, общие ключевые слова, которые характеризуют предлагаемые сайтом товары и услуги. Очень внимательно подходим к этому этапу, чтобы ничего не пропустить. В качестве примера будем работать с сайтом, предлагающим услуги по установке натяжных потолков в Санкт-Петербурге. Итак, откуда же мы будем брать начальный список?

Во-первых из головы, задав себе вопрос — а о чем, собственно, сайт?

натяжные потолки
натяжные потолки спб
натяжные потолки монтаж
натяжные потолки ремонт

Во-вторых — берем названия разделов (и основных страниц) на сайте. Если сайт небольшой, то можно это сделать и вручную, а если же нет, как в случае с интернет-магазином, то можно сделать выгрузку товаров и разделов каталога. Ну, или спарсить сайт любым инструментом для внутреннего анализа и выгрузить все meta title, которые, в случае с неоптимизированным сайтом, скорее всего как раз и будут состоять лишь из названия товара.

каталог натяжных потолков
матовые натяжные потолки
сатиновые натяжные потолки
глянцевые натяжные потолки
натяжные потолки с фотопечатью
многоуровневые натяжные потолки
ремонт натяжных потолков

В-третьих — анализируем пару основных конкурентов. Прогоняем их, например, через сервис XTool или просто смотрим, что у них прописано в meta-тегах. В данном случае будем смотреть конкурента www.sirius-potolki.ru, занимающего в СЕРП первое место по «натяжные потолки»:

Анализ конкурента через XTool: поисковые фразы

Итогом всех вышеописанных бесхитростных операций станет список, который будет называться начальным, исходным. Составляем мы его изначально в Excel.

2. Сбор поисковых запросов через Яндекс Wordstat

Это первый и основной этап расширения нашего исходного СЯ, при котором все запросы прогоняются через WS. Тем самым мы собираем весь спектр этих фраз.

2.1. Сбор запросов семантического ядра через Key Collector

Создаем проект Key Collector, задаем интересующий нас регион и запускаем парсинг левой колонки Яндекс Wordstat:

Парсинг левой колонки WS через Key Collector

Подробнее о сборе семантического ядра через программу Key Collector: https://pingoblog.ru/22-sbor-semanticheskogo-yadra.html

2.2. Сбор поисковых запросов через Яндекс Wordstat

Тут, как я и обещал, будет все немного более рутинно. Переходим по адресу wordstat.yandex.ru и, выбрав нужный регион, поочередно прогоняем запросы из нашего исходного списка, копируя результат и частоты обратно в Excel.

Ручной парсинг левой колонки Yandex Wordstat Ручной парсинг левой колонки Yandex Wordstat

3. Сбор поисковых подсказок

Сбор поисковых подсказок — второй этап расширения списка ключевых фраз. Если вы работаете без Key Collector, то этот этап можно пропустить — ручная работа по нему будет неоправданно долгой.

В случае же с Key Collector — обращаем своё внимание на окно KC, где у нас был добавлен исходный список и по нему произведен парсинг левой колонки Yandex Wordstat. Через правый клик по столбцу «Фраза» копируем все имеющиеся ключевые слова, а затем запускаем по ним парсинг поисковых подсказок. Предварительно советую бегло пробежаться по списку, удаляя лишние запросы — сэкономите время на последующих этапах.

Сбор поисковых подсказок в KC

4. Первый этап чистки СЯ: минус-слова

Итогом предыдущих операций стал огромный список поисковых запросов, который нужно существенно проредить, убрав все определенно лишние и нетематические. Быстрее и легче всего это сделать, вычленив те конструкции, которых точно не должно быть в составленном вами семантическом ядре, т.е. минус-слова. Для каждой тематики этот список может быть свой, но в общем виде это:

бесплатно,
своими руками,
скачать,
смотреть,
самостоятельно,
реферат,
нецелевые города России, которые даже при выбранном регионе парсинга все равно проскакивают в список.

Предлагаю вам такой вот универсальный список минус-слов, а остальное уже зависит от тематики, с которой вы работаете. Так же прилагаю список городов Украины и России в качестве дополнительного минус-списка.

4.1. Чистка по списку минус-слов в KC

В случае KC всё предельно просто — используете специальный инструмент «Стоп-слова». Заносите в него список выше, а также, в зависимости от тематики, дополняете теми словами, которые вы не хотите у себя видеть, но что-то уж больно часто они мелькают.

4.2. Чистка по списку минус-слов в WS

В случае чистки ядра через Excel всё тоже самое, только работа заключается в поиске и поочередном удалении всех запросов в составе которых есть минус слова. Как вариант — можно настроить фильтрацию.

5. Оценка эффективности поисковых запросов семантического ядра

Итак, на данный момент у нас есть ядро, отфильтрованное от самого явного шлака. Теперь, прежде чем приступить к финальной стадии фильтрации, нам нужно определить ряд параметров, по которым, собственно, она будет происходить.

5.1. Оценка ключевых слов через Key Collector

Для KC мной уже разработан и подробнейшим образом описан алгоритм и формула, которая поможет получить более-менее точную оценку конкурентности и стоимости продвижения по поисковым запросам, так что тут нет смысла повторяться. Дополнительно нам потребуется лишь собрать информацию по геопривязке:

Анализ геопривязки через Key Collector

Подробнее об оценке конкурентности поисковых запросов: https://pingoblog.ru/23-konkurentnost-i-chastotnost-poiskovyh-zaprosov.html

5.2. Оценка ключевых слов, полученных через Yandex Wordstat

В случае же с WS все сложнее — у нас есть список запросов, у нас есть их общие частоты и, собственно говоря, всё. Довольно печальная картина, не правда ли? Мы не можем вручную собрать все те параметры, которые используются для оценки ключей как в случае с KC, а других, вроде как и не надо. Поэтому тут мы ограничимся простенькой формулой: K=WS/"!WS".

WS в данном случае — это уже собранная нами ранее общая частотность, а "!WS" — точная частотность запроса, которая проверяется тем же самым образом, что и общая, только ключ немножко трансформируется, т.е. не натяжные потолки, а "!натяжные !потолки" — полученная цифра и будет являться точной частотой, то есть "!WS". Собираем точные частоты, рассчитываем коэффициент по формуле и идем дальше.

Точная и общая частоты в Yandex Wordstat Точная и общая частоты в Yandex Wordstat

6. Финальная чистка СЯ

Поздравляю, вы почти дочитали этот немаленький трактат. Остался финальный рывок, после которого у вас на руках будет законченное семантическое ядро сайта — уберем лишь окончательно весь шлак.

6.1. Если оценка эффективности производилась через KC

Итак, у вас перед глазами окно KeyCollector, в котором у нас заполнены столбы «Фраза», «Частотность WS», «Частотность WS !», масса параметров, собранных после нажатия «Получить данные KEI для ПС Яндекс», «Геозависимость» а также сам KEI. Скрываем параметры для расчета KEI.

У нас остается 5 столбцов и теперь нам нужно настроить фильтр:

Общая частотность: менее 15.
Точная частотность: менее 3.
Геозависимость: да.
KEI: более 15000-30000.

Фильтры применяем не одновременно — сперва удаляем все геонезависимые (если только в их составе нет названия целевого города), потом те, которые удовлетворяют первому и второму условию, ну и под конец — с высоким KEI. В завершение еще раз просматриваем список на предмет пропущенных кривых запросов, которые нещадно трём.

Дополнительная информация по чистке семантического ядра: https://pingoblog.ru/24-finalnaya-otladka-semanticheskogo-yadra.html

6.2. Если оценка эффективности производилась через Яндекс Вордстат

Тут все проще. Удаляем все ключевые слова, у которых значение WS/"!WS" больше 10. Затем опять же врубаем свой аналитический аппарат и, просматривая ядро от начала до конца и удаляя нетематические поисковые запросы.

7. Если нет денег на Key Collector, а через Яндекс Вордстат собирать лень

Еще один вариант составить семантическое ядро в режиме онлайн — воспользоваться сервисами Seopult, Megaindex.ru или Rookee. Регистрируетесь в системе, указываете сайт, задаете и расширяете инструментами системы начальный список и радуетесь жизни. Минус такого способа — базы у них все же не фонтан и множество запросов будет пропущено, а оценке стоимости продвижения верить особо не нельзя.

Сбор семантического ядра через Megaindex

8. Пример семантического ядра

В завершение прикладываю Excel-файл, в котором по столбцам разбиты этапы создания семантического ядра через программу Key Collector. Для Яндекс Вордстат тут все то же самое, лишь набор используемых параметров значительно скуднее. Ядро финальное должно было бы получиться значительно больше, но для примера я урезал многие направления деятельности компании, чтобы файл в итоге получился не такой жуткий: скачать.

Ну... В общем всё :) Тема очень объемная и серьезная. Я более чем уверен, что что-то забыл включить. Если это так и какой-то вопрос в рамках темы «как составить семантическое ядро сайта» для вас остался открытым, то пишите в комментариях и я постараюсь закрыть этот пробел. В следующих материалах в рамках курса мы будем группировать запросы нашего СЯ и назначать для них посадочные страницы.

Материал обновлен: 22 мая 2016 года.

Комментарии (14)

Pantherman

28 мая 2015 17:49
Что делать, если Google c ошибками работает? Сортировка результатов даже простейших поисковых запросов в Google на русском языке некорректна. Если пользователь вводит, например, слово глядъ, то очевидно, что первыми он ожидает увидеть результаты, содержащие именно слово глядъ, однако Google первыми выдает результаты, содержащие слова глядеть, гляд и глядя. Однако, если пользователь вводит слово рядъ, Google все-таки первыми выдает результат со словом рядъ, но уже второй результат со словом рядом, хотя логичнее второй результат показать со словом либо рядъ, либо ряд.

+ -
+1
- Цитата
- Ответить
Jaan

20 октября 2015 18:34
Спасибо за публикацию в продолжении очень хотелось бы увидеть как сгруппировать после запросы и как эти сгруппированные запросы разместить грамотно на сайте в виде раздел подраздел подраздел.

Если будете писать такую публикацию дайте знать обязательно прочту.

+ -
0
- Цитата
- Ответить
Igor

15 ноября 2015 12:33
Спасибо за материал. Есть вопрос к Вам, не является ли более оптимальным слегка другой порядок, а именно: Собираем по правой колонке возможные ключи, отсеиваем их, собираем для них частотности "!слово" и уже на этом этапе убираем варианты с низкими частотностями, а уже после этого собираем данные для рассчета KEI . Так ведь будет существенная экономия времени, или же на Ваш взгляд бывают случаи когда значение KEI важнее показателей частотности?

+ -
+2
- Цитата
- Ответить
Елена

8 июля 2016 23:06
Добрый вечер! Очень полезный материал. Услышала где-то, что нужно зарегистрировать в яндекс новый аккаунт, прежде чем собирать СЯ, так вот зарегистрировала и получается меня сразу же забанили, поскольку аккаунт при сборе СЯ оказался неактивным (было написано внизу). Подскажите, это получается нужно опять новый регистрировать, почему они блокируют?

+ -
0
- Цитата
- Ответить
1. Aluarius
  
  8 июля 2016 23:17
  Если Яндекс видит, что аккаунт используется только для его использования при парсинге, то банит нещадно. Если же учетная запись активно используется по прямому назначению, то тогда вопросов к ней не возникает.
  
  Я осуществляю парсинг огромного количества данных с использованием основного аккаунта Яндекс уже более 10 лет и не было ни одного подобного прецедента.
  
  Также на вероятность бана сильно влияет возраст аккаунта.
  
  + -
  +1
  
  Цитата
  
  Ответить
  1. Елена
    
    20 июля 2016 16:48
    
    Использовала со старого аккаунта, правда только в качестве почты. Но вот уже второй раз забанили
    
    + -
    -2
    
    Цитата
    
    Ответить
    1. Aluarius
      
      20 июля 2016 21:00
      
      Сверьте еще настройки KC, это тоже влияет: http://joxi.ru/KAg9GnHgB8Y1ml
      
      + -
      +1
      
      Цитата
      
      Ответить
Елена

20 июля 2016 13:24
Доброго дня! Спасибо большое. Пытаюсь углубиться в СЕО, чтобы свой сайт поправить. После негативного опыта работы с парочкой агентств и фрилансеров поняла, что никому это не нужно, кроме меня. Остановилась на Вашем блоге, спасибо за подробности и тонкости.

Вопрос такой: редактирую ядро по запросам "детский праздник", "организация детских праздников" т.п.
Последовала Вашему совету и сейчас дополняю таблицу цифрами с точной частотностью "!WS". Но что-то у меня не сходится. Большинство коэффициентов получается далеко больше 10.
Например, "детский праздник": 18933/338= 56; "аниматоры Москва"-3194/82=38... и т.п.
Я что-то неправильно поняла?
Запросы казались мне очень даже адекватными.

+ -
+2
- Цитата
- Ответить
1. Aluarius
  
  20 июля 2016 20:36
  Высокий коэффициент означает несколько вещей. В упрощенном виде это можно объяснить так:
  
  1) Имея конкуренцию в 19 тысяч запросов, вы получите лишь 338 посетителей (в случае с детский праздник). Потратите много сил и денег, а получите мало.
  2) Выбран очень общий запрос. То есть словосочетание ищут 3200 раз, а на долю вашего запроса приходится лишь 82 (в случае с аниматоры москва).
  
  Пример хорошего запроса - "детские аниматоры +на день рождения +в москве". Тут коэффициент точный, как и запрос.
  
  + -
  -2
  
  Цитата
  
  Ответить
Константин

28 сентября 2016 14:38
Доброго здравия! В первую очередь хочу поблагодарить Вас за данный ресурс. Я в СЕО новичок. Совсем чайник. Ввиду данного факта, прошу подсказать! Я создал сайт один на Joomla второй на базе нетхауса. К примеру я создал СЯ. И куда вводить все эти данные? В настройки СЕО сайта(title,discription,keywords)?

+ -
0
- Цитата
- Ответить
1. Aluarius
  
  30 сентября 2016 05:36
  Тут, все же, стоит два вопрос - как и куда.
  
  Как:
  https://pingoblog.ru/380-meta-tegi-description-i-keywords-kak-pravilno-zapolnya
  t.html
  https://pingoblog.ru/370-kak-pravilno-zapolnit-teg-title.html
  
  Куда: в настройках сайта Joomla задаются меты для главной страницы. Вам же нужно прописать их согласно ядру для каждой, в зависимости от того, какую информация сможет получить на ней пользователь.
  
  + -
  0
  
  Цитата
  
  Ответить
Алла

9 декабря 2017 18:47
Здравствуйте! Нарисовался вопрос: есть ключ - настенные круглые часы в интернете и круглые настенные часы в интернете. Фразы абсолютно одинаковы и по смыслу и по содержанию слова, но КЕИ разные определяет. Как это возможно?

+ -
0
- Цитата
- Ответить
1. Aluarius
  
  11 декабря 2017 19:20
  Они не одинаковые. Формула KEI, помимо прочего, учитывает, сколько раз эта фраза используется в метаинформации других сайтов. Само собой разумеется, что кто-то пишет "круглые настенные", а кто-то - "настенные круглые". Так и выходит, что один ключ более конкурентен, а другой - менее. Для того, чтобы определить, с каким ключом работать, снимите частоту [Query], которая учитывает порядок слов в ключе.
  
  + -
  +2
  
  Цитата
  
  Ответить
Михаил

8 февраля 2019 13:50
Здравствуйте.
При фильтрации фраз использовать "И" или "ИЛИ" в фильтре? При "И" получаются, что точные с нулем попадаются.
Общая частотность: менее 15.
Точная частотность: менее 3.

KEI используете экспериментальный который, раз больше 15т ?

+ -
0
- Цитата
- Ответить