Разработка сайтов, создание сайтов
главная / Внутренняя оптимизация / Внутренняя оптимизация сайта – скрытое распределение Дирихле

Внутренняя оптимизация сайта – скрытое распределение Дирихле

Всем привет, сегодня искал дополнительную информацию для своей кандидатской и наткнулся на очень интересную тему, которая напрямую связана с моим хобби – seo. Вобщем-то почти все, что есть в моей работе, так или иначе можно использовать если не для seo то для поисковых машин точно.
Возможно, для многих такая информация будет избыточной, поэтому буду писать максимально обобщенно, чтобы не искушенному в математике читателю было понятно о чем идет речь.
Итак, что такое скрытое распределение Дирихле (LDA) – это статистический метод, который может выявить сходство данных, другими словами если у Вас есть документ, например веб-страница, то используя данный метод можно определить насколько релевантен данный документ определенной теме. Слова, которые встречаются в документа могут отображаться принадлежность документа к набору тем.
Вот так выглядит формула:
внутренняя оптимизация сайта
Простым подсчетом слов тут не обойтись и в дополнение необходимо учитывать встречаемость слов и словосочетаний в разных тематиках. В комплексе, например, с хорошо обученными нейронными сетями алгоритм может значительно улучшить определение тематики текста и с большой вероятностью классифицировать (отнести) документ к правильной теме.
Как Вы уже догадались использовать этот математический аппарат можно для внутренней оптимизации сайта, а именно внутренней оптимизации текстов веб-страниц.
Внутренняя оптимизация сайта – это трудоемкий процесс, особенно когда дело касается оптимизации сайта под конкретные ключевые слова. Многие знают, что релевантность можно приблизительно предсказать с помощью частотной характеристики определенного термина в тексте страницы. Однако этот метод слишком прямолинеен и вероятнее всего не может быть достаточно точным.
Скрытое распределение Дирихле относительно новый метод, для более детального ознакомления рекомендую посмотреть в Вики.
На сайте Seomoz – появился сервис, который позволяет определить релевантность текста или url заданной теме! Таким образом, можно его использовать как более точный, на мой взгляд, индикатор внутренней оптимизации сайта, а именно оптимизации текстов ваших веб-страниц.
Правда он не хочет нормально работать с русским языком, но какие-то результаты он выдает и русские слова, скорее всего, не отсекает при расчетах, а просто не отображает в текстовом поле. Для англоязычных сайтов результаты похожи на правду. Тесты алгоритма проводились по существующей выдаче поисковиков.
Надеюсь, пост оказался полезным, если Вас заинтересовала данная тема, более детально могу ответить по почте или в комментариях.

Источник: seopulse.ru
текущее:

НОВОСТИ

2011 г., «VisMech.ru»