TECHNOLOGY IMPLEMENTATION OF INTELLIGENT SEARCH PROMOTION OF INTERNET RESOURCES
Ващук И.Н.
Кандидат педагогических наук, доцент,
Оренбургский государственный университет
ТЕХНОЛОГИЯ РЕАЛИЗАЦИИ ИНТЕЛЛЕКТУАЛЬНОГО ПОИСКОВОГО ПРОДВИЖЕНИЯ ИНТЕРНЕТ РЕСУРСОВ
Аннотация
В данной статье рассматривается разработка системы правил, которые позволили бы осуществить автоматизацию процесса интеллектуального поискового продвижения по критерию предоставления услуг платного хостинга, что позволит выбирать наиболее оптимальные тарифные планы.
Ключевые слова: интеллектуальный анализ, деревья решений, метод главных компонент, поисковое продвижение.
Vashchuk I.N.
Ph.D., Associate Professor,
Orenburg State University
TECHNOLOGY IMPLEMENTATION OF INTELLIGENT SEARCH PROMOTION OF INTERNET RESOURCES
Abstract
This article discusses the development of a system of rules that would enable automation of intelligent search engine promotion on the criterion of paid hosting services that allow you to select the most optimal tariff plans.
Keywords: intelligent analysis, decision trees, the principal component analysis, search engine promotion.
Автоматизация процессов в продвижении сайтов – тема, которая становится все более актуальной с каждым годом, поскольку с развитием поисковых алгоритмов SEO-специалистам приходится работать с растущим количеством факторов, влияющих на позиции сайта в выдаче. Если десять лет назад конкуренция между сайтами в интернете была ниже и структура сайтов – проще, то сегодня оптимизаторам зачастую приходится продвигать сайты с определенной «историей болезни», с огромным числом накопленных за годы страниц и т.д.
Автоматизация процессов в SEO-компании решает как минимум три ключевые задачи:
- экономия времени специалистов, которым без роботов приходится вручную проводить много рутинной работы;
- повышение качества услуг (робот, в отличие от человека, не может пропустить что-то важное по невнимательности, также мощности, объемы обрабатываемых роботом данных дают более точную аналитическую картину, нежели проведенный вручную анализ небольшой выборки сайтов);
- масштабируемость бизнеса (автоматизированные процессы позволяют, во-первых, увеличивать в разы количество проектов, находящихся в одновременной работе, во-вторых, решают проблемы, которые возникают обычно при уходе специалиста или при расширении штата).
А выявление общих закономерностей, которые отражают работу алгоритмов – это проблема любой SEO-компании, потому что эти знания позволяют выбрать правильную стратегию продвижения.
Создание собственных автоматизированных систем и их поддержка требуют значительных расходов, напрямую не влияющих на прибыль. В этом случае небольшие компании предпочитают пользоваться сторонними разработками и автоматизированными сервисами.
В настоящее время в SEO есть большой простор для автоматизации процессов, однако пользоваться любыми сервисами и роботами должен профессионал, человек, способный правильно оценить и направить работу роботов. Полный переход на автоматическое продвижение сайтов – с каждым годом будет расти.
На основании анализа рассмотренных систем поисковой автоматизации можно сделать вывод, что использование каждой может повлечь за собой значительные финансовые затраты. И то, что предполагается, как интеллектуальное поисковое продвижение не представлено ни в одной системе и поэтому - отсутствуют возможности оптимизации тех факторов, которые и влияют на поисковое продвижение. В результате, возникает потребность применить современные технологии интеллектуального анализа, для построения более совершенных и адаптивных решений в области интеллектуального поискового продвижения. Таким образом, необходимо реализовать задачи, которые позволили бы осуществить извлечение знаний и как следствие их использование в концептуальной предметной области.
Процесс реализации интеллектуального поискового продвижения по критерию предоставления услуг платного хостинга определялся анализом таких компонент, как:
- Цена в месяц = [0.99; 49]
- Цена в год = [10.15; 499]
- Объем = [5;2500]
- Трафик = [0.4;1000]
- Количество сервисов = [1;4]
- Виртуальных серверов = [1;1000]
- FTP входов = [1;1000]
Широкая сфера применения "деревьев классификации" делает их весьма привлекательным инструментом анализа данных, Для построения дерева решений изначально был выбран алгоритм ID3, но реализация на исходных данных показала его не результативность в виду того что он некорректно работает с атрибутами, имеющими уникальные значения для всех объектов из обучающей выборки. Для таких объектов информационная энтропия равна нулю и никаких новых данных от построенного дерева по данной зависимой переменной получить не удастся. Поскольку получаемые после разбиения подмножества буду содержать по одному объекту. Поэтому для построения дерева решений использовался алгоритм C4.5, который является усовершенствованной версией алгоритма ID3. Но реализация алгоритма C4.5 на аналитической платформе Deductor выдала дерево решений, где было много узлов, что определилось как уменьшение процента значимости компонент, т.е. их существенное рассеивание. Это определило необходимость в качестве входных измерений использовать наиболее значимые. Использование метода главных компонент, дало возможность по исходным признакам выделить в общем случае достаточное число главных компонент. В результате тариф, объем и трафик – это те атрибуты которые оказывают существенное влияние на весь процесс выбора оптимального трафика.
Построение дерева решений на аналитической платформе Deductor, с учетом ранее выделенных атрибутов позволило получить следующие 5 продукционных правил:
«Если трафик<535, объем<185 и цена <4.47,то тарифный план GoldНost»
Если трафик<535, объем<185 и цена >4.47,то тарифный план Mastak»
«Если трафик<535, объем>=185, то тарифный планХР-lnostng»
«Если трафик>=535, объем<185, то Arbatek»
«Если трафик>535, объем>=185, то Noserver»
Соответственно достоверность 1-80%, 2-60%,3,4-50%,5-20%, что определяется как достаточно хорошие показатели для такого набора входных данных. Таким образом, полученные правила можно использовать при построении базы знаний, которая позволит осуществлять выбор оптимального тарифного плана хостинга, как одного из критериев в общей схеме организации интеллектуального поискового продвижения.
Литература
- BaseGroup Labs технологии анализа данных. [Электронный ресурс] Режим доступа – http://www.basegroup.ru (дата обращения: 20.02.2015).
- Deductor аналитическая платформа для эффективных бизнес-решений. [Электронный ресурс] Режим доступа – http://deductor.com.ua (дата обращения: 20.02.2015).
References
- BaseGroup Labs tehnologii analiza dannyh. [Jelektronnyj resurs] Rezhim dostupa – http://www.basegroup.ru (data obrashhenija: 20.02.2015).
- Deductor analiticheskaja platforma dlja jeffektivnyh biznes-reshenij. [Jelektronnyj resurs] Rezhim dostupa – http://deductor.com.ua (data obrashhenija: 20.02.2015).