<<
>>

3.1. Описание проекта системы таргетинга интернет-рекламы по типу восприятия

Описываемая информационная система является инструментальным средством поддержки разработанной методики оценки и повышения эффективности рекламных кампаний и предназначена для автоматизации процесса сбора, анализа информации о посетителях сайта-издателя (участников форумов, конференций, чатов), а также осуществления целевого показа рекламных сообщений соответствующим группам посетителей с последующим сбором статистики показов и действий.

Данная глава выполнена на основе государственных стандартов по разработке информационных систем (24.207-80, 24.201-79, 24.204-80).

Целью данной информационной системы таргетинга интернет-рекламы по типу восприятия (далее ИСТТВ) является обеспечение функционирования процесса таргетинга баннерной рекламы по типу восприятия.

Задачи информационной системы:

=> Организация сбора информации о высказываниях зарегистрированных посетителях интерактивного раздела сайта издателя.

=> Анализ и классификация пользователей согласно предложенной типологии (контент-анализ исходного массива данных).

=> Организация корректного вывода (непосредственно таргетинг) рекламных сообщений подходящим по типу восприятия группам посетителей.

=> Сбор статистики о прохождении рекламной кампании для последующего предоставления рекламодателю.

122

Рис. 3.1. Функциональные модули ИСТТВ и взаимосвязи между ними

Диграмма потоков данных ИСТТВ выполненная согласно методологии Гейна-Сарсона показана на рис 3.2.

Высказывания

посетителей

Сбор данных

_Журналы _ " общения

БД

высказываний посетителей

----------- 1---------

Архив высказываний

Посетители

сайтов

Анализ

данных

I

«Досье» посетителя

т

Показы

рекпамных-

сообщений

Показ

рекламы

Характеристики_ " посетителя

БД

характеристик

посетителей

Подсчет

статитстики

Охват,

-число показов, CTR

Набор

-рекламных-

сообщений

БД

рекламных сообщений

--------- 1-----

Данные о

рекламных кампаниях

Статистика

показов

t

Подготовка

рекламной

кампании

БД статистических данных

Макеты рекламных сообщений, данные о целевых группах

I

Статистика

рекламной-

кампании

Подготовка >
отчетности о
рекламных
кампаниях >

-Отчеты-

Рис.

3.2. Диаграмма потоков данных ИСТТВ.

ИСТТВ состоит из модулей, соответствующих указанным выше функциям.

Модуль сбора данных представляет собой дополнительный модуль к механизмам, обеспечивающим работу интерактивного раздела. Его основная задача - накапливать статистику сообщений по каждому пользователю. Иными словами этот модуль фиксирует любое высказывание каждого зарегистрированного посетителя в разделе интерактивного общения (чат, форум и пр.). Поскольку типология пользователей в дальнейшем может изменяться, мы будем накапливать именно первичную информацию. В целях ускорения доступа предполагается хранение истории сообщений пользователей в текстовых файлах, а не с использованием СУБД.

Модуль анализа представляет собой периодически исполняемый код, призванный классифицировать посетителей на основе первичных данных, поступающих из модуля сбора данных. В основе этого модуля лежат механизмы контент-анализа. Периодичность является управляемым параметром и определяется администратором системы. В первую очередь модуль анализа сканирует первичные данные и выделяет оттуда ключевые слова необходимые для классификации, а также частоту их употребления. Результаты хранятся в файле БД, поскольку имеют место частые выборки и поиск по ключевым словам. После этого производится анализ ключевых слов на принадлежность тем или иным группам пользователей по типу восприятия. Наиболее значимая группа (как по количеству используемых выражений, так и по частоте их употребления) принимается как основная и пользователю приписывается членство этой группе. В течение времени привязка посетителя к той или иной группе может меняться - чем чаще производится анализ, чем точнее можно отследить этот переход. Исследование [62] показывает, что психология взрослых посетителей разделов общения не склонна к резким скачкам и изменениям и поэтому средним интервалом между анализами рекомендована величина 6 месяцев.

Разумеется, этот интервал можно варьировать для разных групп посетителей, например, отталкиваясь от возраста (молодые посетители более склонны к внезапным изменениям в стиле общения и используемых фразах).

Кроме того, для каждого посетителя указывается вторичная группа восприятия - группа, которая занимает второе место по количеству и частоте используемых сообщений. Эта группа также может быть задействована в рекламной кампании. В случае равных значимостей у первичной и вторичной группы, эти группы буду использоваться в случайном порядке.

Этот модуль имеет административный интерфейс, где администратор может задать периодичность выполнения процедуры анализа и осуществить сопровождение справочника ключевых слов и его привязку к справочнику групп восприятия (также администрируемого), расставить связи между типами восприятия.

Модуль вывода представляет собой программный код, обеспечивающий показ наиболее «подходящего» рекламного сообщения посетителю исходя из данных о его группе восприятия. Модуль имеет два интерфейса - общепользовательский и административный. Первый предназначен исключительно для показов рекламных сообщений, во втором администратор заносит данные о предстоящей рекламной кампании, добавляет рекламные сообщения и ассоциирует их с группами посетителей и т.д.

Может сложиться ситуация, когда для некой группы посетителей с определенным первичным типом восприятия не будет ассоциировано ни

* одного рекламного сообщения. В этом случае для демонстрации будет

использоваться вторичная группа, либо не будет показано вообще ничего .

Алгоритм работы общепользовательского интерфейса модуля вывода реализуется следующим образом: в тот момент, когда авторизовавшийся тем или иным способом посетитель загружает страницу, содержащую рекламное сообщение, происходит оценка первичной группы этого посетителя и

группы, сопоставленной с рекламным сообщением. В зависимости от группы посетителя отобразится соответствующее PC. В случае если не существует PC подходящего к первичной группе, происходит сопоставление с вторичной группой. Данный механизм также предусматривает параллельные показы нескольких PC на одном и том же месте. В этом случае происходит случайная выборка одного PC из множества подходящих данному посетителю рекламных сообщений.

Помимо этого, модуль вывода может быть настроен на следующие типы показов и идентификацию (во многом обусловлено политикой показов):

1. Показы только зарегистрированным пользователям — идентификация проходит в момент входа в интерактивный раздел.

2. Показы всем пользователям, имеющим «куки» (ранее посещавшим интерактивный раздел). Авторизация в этом случае происходит в момент отправки сообщения. В этом случае имеет место масса ошибок идентификации, о которых мы упоминали в главе 2.

Из двух вариантов предпочтительнее первый, однако, имеют место случаи, когда объем незарегистрированной аудитории существенно превышает объем авторизованных посетителей, даже с учетом ошибок идентификации.

Наконец, модуль статистики предназначен для сбора статистики за время рекламной кампании. Она включает в себя следующие пункты:

=> Статистика показов PC. При этом учитываются как показы, так и непосредственные загрузки рекламного сообщения. В случае

» блокировки графики или прочих ошибок загрузки они

фиксируются отдельным пунктом и используются в методике оценки эффективности рекламных кампаний в Интернет. Кроме того, данная статистика может фиксировать показы с привязкой к пользователям.

=> Статистика переходов по PC (взаимодействий с PC). Учитывается количество совершенных посетителем желаемых действий

Отдельной статьей идет общая статистика по аудитории сайта.

=> Статистика распределения аудитории по типам восприятия (по первичным и вторичным группам) - такая статистика необходима для предоставления потенциальным рекламодателям, желающим воспользоваться методикой повышения эффективности рекламных кампаний и непосредственно таргетингом интернет-рекламы по типу восприятия.

=> Статистика наиболее употребительных выражений - эта статистика несет скорее общеобразовательный смысл и может быть использована в качестве рекомендаций для создателей рекламных сообщений.

Вся базовая статистика хранится в текстовых файлах, последующая обработка данных происходит по расписанию.

Несомненно, модуль статистики может постоянно дополняться и наращиваться, поскольку осуществляется хранение всех первичных данных. Этот факт позволяет выводить различные дополнительные показатели без реструктуризации модуля и системы в целом. Аналогично модулю вывода, описываемый модуль имеет два интерфейса. Общепользовательский интерфейс позволяет авторизовавшимся рекламодателям просматривать статистику своей рекламной кампании. Административный интерфейс же предназначен для администратора системы, желающего получить аналогичные данные.

Надежность ИСТТВ обеспечивается соблюдением следующих условий: => Аппаратная платформа должна обеспечивать максимальную отказоустойчивость: кластер из двух серверов с разделяемым хранилищем данных, либо аппаратный RAID в случае

использования одного сервера; дублирование сетевых подключений.

=> Необходимо ежедневное резервное копирование данных на отдельные носители, чтобы в случае отказа программной платформы иметь возможность восстановить работоспособность системы в течение 3-х часов.

=> Необходим контроль достоверности данных, поступающих от рекламодателей.

Условия эксплуатации предполагают наличие одного оператора системы и одного администратора программной и аппаратной платформ. Оператор системы должен обладать навыками в области интернет- меркетинга (организация рекламных кампаний, контроль за их ходом, составление отчетов). Администратор платформ должен обладать знаниями по установке и конфигурации аппаратных средств и ПО, перечисленных в следующем подразделе «Технические средства».

Система должна быть реализована с применением технологий баз данных, серверных HTML-препроцессоров и должна соответственно иметь Web-интерфейс. Архитектура системы относится к классу «клиент-сервер».

Web-интерфейс обеспечивает гибкость, открытость и масштабируемость, поскольку:

=> пользователям системы нет необходимости устанавливать дополнительное ПО для работы с системой - любой интернет- пользователь на сегодняшний день располагает броузером;

* => снимается проблема распространения обновлений клиентской

части системы — обновляется только серверная часть (интерфейс клиентской части задается языком HTML);

=> любые авторизованные пользователи получают возможность работы с системой вне зависимости от их территориального расположения и проблем с брандмауэрами;

=> протокол HTTP позволяет стандартными средствами реализовывать шифрование каналов (SSL) и аутентификацию/разграничение прав доступа к данным.

В качестве базовой технологии исполнения предлагаются следующие технологии: серверный HTML-препроцессор РНР и СУБД PostgreSQL. Данные технологии выбраны по двум причинам: бесплатная основа и производительность работы. Поскольку нет потребности в оперативной манипуляции большими массивами данных, а потребности в ссылочной целостности минимальны и могут быть запрограммированы на уровне приложений, СУБД PostgreSQL является наиболее оптимальным решением в данном случае. Что касается препроцессора РНР, его использование обусловлено используемой платформой, интеграцией с СУБД на уровне двоичного кода, производительностью работы и открытостью кода. Обработка текстовых файлов и преобразование этих данных в формат СУБД возлагается на интерпретатор Perl, который на сегодняшний день является наиболее производительным обработчиком текстовых данных. В качестве платформы для системы предлагается использование UNIX-системы FreeBSD, поскольку именно она обеспечивает достаточный уровень производительности и надежности. ER-диаграмма информационной системы приведена на рис. 3.3.

Ключевые слова
РК id
Слово

129

Ключевые слова групп
РК id
FK2

FK1

Id группы

Id слова

Группы воспрития
РК id
Название
Посетители
РК id
FK1 Имя пользователя

Id группы

Баннер
РК id
Название

URL

Баннеры_РК
РК Id
FK3 Id баннера
FK2 Id группы
FK1 Id РК
Страницы сайта
РК id
Наименование

URL

Статистика
РК id
FK1 Id рекламной кампании

Id страницы

Дата

Время

Рекламная кампания
РК Id
Имя

Дата начала

Дата окончания Число показов

Страницы РК
РК id
FK2

FK1

Id рекламной кампании id страницы

Рис. 3.3. Диаграмма «Сущность-связь» ИСТТВ.

Отдельного внимания заслуживает оценка размера информационного хранилища для функционирования системы. Анализ, проведенный автором, показал, что среднее сообщение форумах занимает порядка 967 Байт. Для чатов характерна другая цифра - 56 Байт. Например, для сайта Chat.ru (на сайте присутствуют чаты, форумов/конференций нет) как примера объекта внедрения, с ежедневной средней аудиторией равной 14 450 человек в день, и средней частотой высказываний 3,6 сообщения в день, суммарные ежедневные потребности в хранилище составят 2,84 Мбайт/день. Учитывая необходимость проведения контент-анализа только по накоплении не менее 50 сообщений, целесообразно хранить журналы сообщений не более 17 дней, принимая во внимание нерегулярность активности посетителей чата.

Суммарная средняя потребность в хранилище составляет 2,84 * 17 = 48,28 Мбайт. Устаревшие архивы сообщений имеет смысл сжимать и хранить (при этом размер журналов сокращается приблизительно в 10 раз).

Что касается размера базы данных, лежащей в основе информационной системы, ее размеры гораздо менее значительны, и зависят только от числа пользователей, проводимых рекламных кампаний и используемой СУБД. Если оценить размер хранилища для сайта Chat.ru, то при ядре аудитории равном 478 000 (и записи в БД примерно 6 Кбайт на одного пользователя) и 100 одновременно идущих рекламных кампаниях (9 Кбайт), размер файлов СУБД составит порядка 2,9 Гбайт. При этом можно отметить необходимость в оперативном поиске. В данной ситуации рекомендуется более мощная бесплатная СУБД - PostgreSQL. Эта система при правильной загрузке и распределении ресурсов обеспечит нужый уровень работоспособности.

Главным ограничением данной системы является ее привязка к баннерной рекламе. Другими словами, если рассматривать почтовые (E-mail) рассылки в качестве альтернативного способа рекламного воздействия, описываемая система не обеспечивает полного цикла рекламного процесса - она лишь формирует группы пользователей; остальные же действия (составление рекламных сообщений, рассылка их конечным пользователям) производятся с использованием других инструментальных средств. Более того, рекламные почтовые рассылки никогда не осуществляются только с использованием серверных программных технологий (иными словами, они производятся напрямую маркетологами, а не являются полностью

• автоматическими).

Другим немаловажным условием является наличие на сайте издателя раздела интерактивного общения. Именно он является источником первичной информации о посетителях. При этом обязательно должна иметь место их идентификация. В настоящий момент наиболее точным способом идентификации посетителя является регистрация. Только в этом случае

гарантирован точный сбор информации о посетителях. Согласно поставленным задачам система включает в себя следующие модули: модуль сбора данных, модуль анализа, модуль вывода и модуль статистики.

Обязательное наличие интерактивного раздела на сайте накладывает на применение ИС ряд ограничений. Во-первых, далеко не на всех сайтах, обладающих подобным механизмом, основная масса посетителей пользуется разделом общения. Множество сайтов предлагает модули гостевых книг или упрощенных форумов, только как средство обратной связи посетителей с владельцами ресурса. Исследование SpyLog «Российский Интернет сегодня» [59] показывает, что в Рунете лишь 2,9% сайтов обладают реально посещаемыми разделами интерактивного общения (в исследовании таковыми считаются сайты, у которых раздел интерактивного общения имеет не менее 1000 показов в день, за исключением выходных дней). Более того, основная масса таких сайтов узко специализирована, т.е. направлена на определенную тематику. Это несколько снижает ценность этих площадок для таргетинга по типу восприятия, поскольку он ориентирован, прежде всего, на рекламу широкого круга, без видимых тематических/возрастных ограничений. Однако и в случае тематической рекламы потребность в повышении эффективности всегда остается, поскольку CTR в любом случае очень далек от 100 %. Таким образом, описываемая ИС предназначена только для сайтов, где присутствуют посещаемые разделы интерактивного общения. Более того, общение должно носить регулярный характер.

Как показывает то же исследование, необходимая частота высказываний для того, чтобы пользователь считался постоянным участником того или иного форума/конференции (составлял ядро аудитории) - не менее 5 раз в неделю. Для чатов цифры несколько иные - не менее 25 раз в неделю. Обусловлено это тем, что объем сообщений в чатах и конференциях различается в среднем в 5 раз. Регулярность общения коррелирует с ядром аудитории - наиболее адекватным показателем объема

интернет-аудитории. Ядро аудитории - это количество регулярных посетителей (посетителей, совершающих в среднем не менее 1 сессии в неделю на протяжении последних 2 месяцев). Эти цифры предоставляются любым счетчиком показов страниц, различающим страницы и разделы сайта. В среднем по российскому сегменту Интернет эта цифра равна 40%. Таким образом, даже не зная регулярность высказываний, существует возможность определенной вероятностью определить ее на основе данных о посещаемости. Однако анализ корреляционной взаимосвязи в данной работе излишен.

Согласно теории контент-анализа [72], для категоризации необходимы большие массивы информации, в данном случае - не менее 50 сообщений. Таким образом, мы получаем еще несколько ограничений - по размеру аудитории (отбрасываются нерегулярные посетители) и по времени запуска системы в эксплуатацию (среднее время сбора первичной информации).

В третьих, наибольший интерес для интернет-рекламы в основном составляют обеспеченные пользователи. Анализ групп пользователей в исследовании Strana.ru [60] выявил, что основную аудитория чатов составляют пользователи таких групп:

1. Возраст:

=> До 16 лет-7%;

=> 16-20 лет-39%;

21—25 лет - 27%;

=> 26 — 30 лет - 12%;

=> 31-40 лет - 8%;

=> старше 40 лет - 7%.

2. Образование:

=> высшее-33%;

=> неполное высшее - 23%;

=> среднее специальное - 10%;

=> среднее общее - 24%;

=> неполное среднее и ниже - 10%.

3. Род занятий:

=> работаю-47%;

=> учусь-49%;

=> на пенсии - 1 %;

=> другое-3%.

Такая группировка, в нашем случае, носит больше общеинформативный характер, чем предлагает реальное ограничение аудитории, поскольку рекламное воздействие далеко не всегда ограничивается интересами той или иной группы. Как показывает то же исследование, менее четверти интернет-пользователей (22%) принимают участие в каких-либо форумах, интернет-дискуссиях, чатах. При этом лишь 6% пользователей общаются таким образом в каждом своем интернет-сеансе.

Таким образом, конечная аудитория таргетинга по типу восприятия для каждого сайта является пересечением множеств, описанных выше. Согласно исследованию SpyLog [59] на долю крупных сайтов в российском Интернете приходится 73% всей аудитории. Поскольку эта аудитория относится только к крупным сайтам, мы считаем обоснованным применение данного вида таргетинга.

3.2.

<< | >>
Источник: Михалев Сергей Александрович. Инструментальные средства повышения экономической эффективности интернет-рекламы [Электронный ресурс]: Дис. ... канд. экон. наук : 08.00.13 .-М.: РГБ, 2005. 2005

Скачать оригинал источника

Еще по теме 3.1. Описание проекта системы таргетинга интернет-рекламы по типу восприятия:

- Информатика для экономистов - Антимонопольное право - Бухгалтерский учет и контроль - Бюджетна система України - Бюджетная система России - ВЭД РФ - Господарче право України - Государственное регулирование экономики в России - Державне регулювання економіки в Україні - ЗЕД України - Инновации - Институциональная экономика - История экономических учений - Коммерческая деятельность предприятия - Контроль и ревизия в России - Контроль і ревізія в Україні - Кризисная экономика - Лизинг - Логистика - Математические методы в экономике - Международные экономические отношения - Микроэкономика - Мировая экономика - Муніципальне та державне управління в Україні - Налоговое право - Организация производства - Основы экономики - Политическая экономия - Размещение производительных сил (РПС) - Региональная и национальная экономика - Страховое дело - Теория управления экономическими системами - Управление инновациями - Философия экономики - Ценообразование - Экономика зарубежных государств - Экономика и управление народным хозяйством - Экономика отрасли - Экономика предприятия - Экономика природопользования - Экономика труда - Экономическая безопасность - Экономическая география - Экономическая демография - Экономическая статистика - Экономическая теория и история - Экономический анализ -