Построение нейроагентов для предприятий различных сегментов индустрии гостеприимства
Анализ рынка гостиничных услуг и прогноз его развития
В данном разделе проведен анализ рынка высококачественных гостиничных услуг города Москвы. База данных для расчета представлена в пр ил 3 и 4.
Анализ проводился по таким показателям: загрузка гостиницы (Occupancy), средняя цена за день (Average Dayly Rate) и доход на один номер (RevPAR — Revenue Per Available Room). Данные характеризуют два сегмента рынка: четырех- и пятизвездочные гостиницы.
Сначала охарактеризуем общее положение на всем рынке, а затем по двум его сегментам. Для этого построим нейросетевую модель на основе сетей радиального базиса. Такое
предположение основано на характере поведения рядов и желаемом характере прогноза.
Удовлетворительные результаты показала сеть RBF 288(32x9)-100-9 (288 нейронов во входном слое, 100 в скрытом слое и 9 в выходном), то есть количество элементов входного слоя сети, учитывающих в полной мере периодичность изменений равно 32.
Этому предшествовало построение нескольких сетей с параметром окна, равным 7, 14 и т.д. Все эти сети показывали довольно удовлетворительные результаты в области обобщения, что проявлялось в четком определении недельной периодичности и нулевого тренда. Однако было заметно, что это обобщение довольно примитивное и не учитывало некоторые колебания переменных. С целью повышения точности модели было предпринято увеличение
количества входных элементов.
Фактически сеть с 32 входными нодами на каждую переменную отразила сразу две периодичности — недельную и месячную. Вопрос о том, почему именно 32 элемента можно разъяснить следующим очень важным положением: временной ряд с периодичностью N измерений можно смоделировать нейронной сетью с параметром временного окна (количеством входных элементов) равным N(+M), то есть ряд с недельной периодичностью (7) можно моделировать сетью с 8,9 и более входными элементами.
Это представляет следующую важ-
ную возможность и особенность нейросетевых моделей: на основе одной и той же комплексной модели можно анализировать временные ряды с абсолютно разной периодичностью. Кроме того, как и в данном случае, внутри одного и того же ряда могут быть разные периоды циклов (поскольку месяцы имеют различную, хотя и примерно одинаковую, продолжительность).
Характеристики модели показаны в таблице статистик регрессии (табл. 7)
Статистика моделей
Таблица 7
| | 3arp. 5 зв. | 3arp. 4 зв. | 3arp Всего | Цена 5 зв. | Цена 4 зв. | Цена Всего | Revpar 5 зв. | Revpar 4 зв. | Rcvpar Всего |
| Data Mean | 43.4 | 37.16 | 40.25 | 224,1 | 164.5 | 194.1 | 97.25 | 61.88 | 78.94 |
| Data S.D. | 15.36 | 11.89 | 13 18 | 15.37 | 10.66 | 12.55 | 37.17 | 20.93 | 28.14 |
| Error Mean | -1.059c- 13 | -1 .S48e- 13 | -1.133e- 13 | -I. seels | 1.442e- 13 | 1.652e- 13 | 1.421е- 13 | -1.231е- 13 | -L228e- 13 |
| Error S.D. | 1.964 | 2.384 | 1.993 | 3.394 | 2.721 | 2.681 | 4.937 | 4.581 | 4.501 |
| S.D. Ratio | 0.1278 | 0.2004 | 0.1512 | 0.2208 | 0.2553 | 0.2137 | 0.1328 | 0.2189 | 0.16 |
Из нее видно, что модель имеет довольно высокие показатели. Об этом свидетельствует низкое отношение стандартных отклонений и средняя ошибка. Общая ошибка сети составляет 3,304. Поскольку в качестве критерия ошибки используется комплексный показатель, учитывающий как фактические отклонения, таки и размер сети, то можно сказать о довольно высоком качестве модели.
1 в 11 1в 21 26 31 36 41 46
Рис. 101. Активационные функции
Характер поведения ряда можно изучить с помощью графика значений активационной функции (рис. 101). На этом рисунке видна
четкая недельная периодичность ряда. Но это еще не все.
На графике также обнаруживается еще один цикл. Подробности о нем будут приведе-
ны при построении прогноза по этим рядам.
В табл. 8 отражены (в сокращенном виде) результаты работы нейросетевой модели в виде фактических значений, прогнозных значений, ошибки на каждом измерении и общей ошибки. Из таблицы видно, что модель довольно точно определили структуру данных. Об этом свидетельствует как величины ошибки, так и факт соответствия наибольших и наименьших значений, то есть определения выбросов. Первые 32 измерения не указаны, по
скольку для них отсутствуют целевые значения.
Таблица 8
Результаты работы модели
| № изм. | Прогн, загр. 5 зв. | | Прогн. Revpar Всего | Факт. загр. 5 зв. | | Факт. Revpar Всего | Ошибка загр. 5 зв. | | Ошибка Revpar Всего | Ошибка |
| 01-32 | ? | | ? | ? | | 7 | 7 | | ? | 7 |
| 33 | 35.5 | | 60.69 | 36 | | 60 | -0.4973 | | 0.6856 | 0.02124 |
| | | | | | | | | | | |
| 111 | 12.66 | | 22.02 | 13 | | 23 | -0.3429 | | -0.9752 | 0.004031 |
| 112 | 14.53 | | 26.04 | 15 | | 27 | -0.4735 | | -0.9639 | 0.004589 |
| 125 | 47.26 | | 78.64 | 47 | | 78 | 0.2634 | | 0.6365 | 0.002216 |
| 126 | 67.84 | | 128.6 | | | 129 | -0.1627 | | -0.4378 | 0.001122 |
| 127 | 71.8 | | 128.1 | 72 | | 129 | -0.2003 | | -0.945 | 0.001759 |
| 128 | 63.88 | | 119.8 | 64 | | 120 | -0.1244 | | -0.1758 | 0.002326 |
| 129 | 50.11 | | 90.63 | 50 | | 91 | 0.1119 | | -0.3686 | 0.003183 |
| 130 | 27.22 | | 50.47 | 27 | | 51 | 0.2176 | | -0.5298 | 0.004359 |
| 131 | 28.52 | | 46.06 | 29 | | 47 | -0.4834 | | -0.9396 | 0.003879 |
| | | | | | | | | | | |
| 163 | 57.06 | | 109.5 | 59 | | 116 | -1.943 | | -6.451 | 0.01573 |
Прогнозы всех показателей на две недели представлены в табл.
9. Прогноз поведения рынка и отдельных его сегментов
Таблица 9
| № изм | Загрузка 5 звезды | Загрузка 4 звезды | Загрузка Всего | Цена 5 звезды | Цена 4 звезды | Цена Всего | Revρar 5 звезды | Revpar 4 звезды | Revpar Всего |
| 131 | 48,21 | 47,79 | 47,92 | 232,1 | 163,8 | 193,9 | 109,3 | 76,68 | 91,59 |
| 132 | 31,52 | 33,72 | 32,81 | 233,1 | 154,6 | 188 | 70,69 | 51,64 | 60,07 |
| 133 | 19,62 | 22,11 | 21,15 | 215,9 | 140,1 | 173,5 | 39,86 | 28,96 | 33,69 |
| 134 | 17,31 | 21,51 | 19,48 | 220,7 | 146,1 | 176,9 | 37,14 | 30,71 | 33,51 |
| 135 | 31,14 | 29,59 | 30.63 | 224,3 | 155,6 | 184,7 | 67,44 | 47,39 | 56,84 |
| 136 | 43,62 | 44,55 | 44,52 | 238,6 | 165.9 | 197,7 | 102,4 | 76,17 | 88,32 |
| 137 | 49,44 | 50,81 | 50,21 | 229,4 | 166,3 | 194,5 | 112,1 | 82,89 π | 95.99 |
| 138 | 47,42 | 50,93 | 49,29 | 227,6 | 163,2 | 190,5 | 105,7 | 82,15 | 92,44 |
| 139 | 32,09 | 38,26 | 35,52 | 231,5 | 155,2 | 186,4 | 72,35 | 59,89 | 64,96 |
| 140 | 21,43 | 26,67 | 24,26 | 212,7 | 140,7 | 172,6 | 44,22 | 36,59 | 39,72 |
| 141 | 21,52 | 26,43 | 24,16 | 213,4 | 147,9 | 177,1 | 45,59 | 38,52 | 41,54 |
| 142 | 42.97 | 36,76 | 39,99 | 222,9 | 158,3 | 189.8 | 95,29 | 58,07 | 75,67 |
| 143 | 58,11 | 54,05 | 56,27 | 238,3 | 167.1 | 201,6 | 136,9 | 90,33 | 111.9 |
| 144 | 62,57 | 57,77 | 60,18 | 228,9 | 164,7 | 196,2 | 142,4 | 93,16 | 115,8 |
- по -
Графическое отображение прогнозов представлено на рис. 102, 103 и 104
Time Series Projection
Измерение
0 r50 γ1∞ ІЇ50 І200 ЇЖІ Г300
Рис. 102. Загрузка по всему рынку гостиничных услуг
Загрузка по сегментам пяти- и четырехзвездных гостиниц в целом не отличается от поведения всего рынка. Загрузка гостиниц 5 звезд несколько выше и амплитуда колебаний немного шире, чем у гостиниц 4 звезды, В целом колебания сегментов одинаковы, поэтому на рис. 102 отражен график загрузки всего рынка. Он свидетельствует о довольно интересном характере динамики загрузки. Во-первых, пики загрузки приходятся на первую половину месяца и середину недели (а именно — среду). Резкие выбросы соответствуют неделям после замедления деловой активности, например, на неделе, следующей за каким-нибудь государственным праздником (на рисунке — среда после 9 мая).
Рис. 103. Средняя цена на номер по всему рынку гостиничных услуг и его сегментам
- ПІ -
Впадина соответствует самому этому празднику, а вернее, веренице праздников. Это подтверждает все большую переориентацию туризма в Москве на деловой и постоянное увеличение доли корпоративных клиентов.
Из рис. 103 можно заключить, что изменение средней цены на номер отдельных сегментов немного отличается от поведения всего рынка. Средняя цена зависит от дня недели и
соответствует стратегии продавать дороже, когда есть спрос и продавать дешевле, когда
спроса нет. Это указывает на широкое использование метода управления доходами (yield management) в гостини цах-совместных предприятиях и под контрактом на управление
Доход на один номер (RevPAR) служит производным от показателей загрузки и цены, а поэтому соотносится с характером их поведения (рис. 104)
Из него видно, что присутствуют те же колебания по дням недели и в течение месяца. Может оказаться непонятным: зачем рассчитывать прогноз такого показателя RevPAR, поскольку он выступает производным от первых двух. Действительно:
кол-во проданных номеров , доход
загрузка =
Rev∕*4Λ =
номерной фонд доход
номерной фонд
; среди.цена =----------- —-
кол-во проданных номеров
Rev∕Λ4∕f = загрузка х средняяцена ,
_ _ загрузка ? средняя цена , , ..n
Таким образом, ----- —--------------------------- 1 (или, как в данном случае, 100, поскольку
Re vPAR
загрузка выражена в процентах). Такое соотношение позволяет дополнительно проверить
модель. Эта проверка на полученных прогнозных значениях дополнительно характеризует
адекватность построенной нейросетевой модели.
Анализ показателен деятельности гостиниц по сегментам. Цель анализа — установить ценовую политику на основе НС и построить кривые зависимости цены от загрузки по дням недели Для этого входными берутся два показателя: день недели и загрузка. На выход подается средняя цена. Результаты выражаются в виде сети, таблицы результатов сети на фактических значениях, графиков зависимости.
В начале проведем простую кластеризацию гостиничных предприятий на каждом сегменте рынка (рис. 105). По горизонтальной оси показана загрузка гостиниц, по вертикально оси — средняя цена на номер, величина этих показателей отражена с помощью раз
мера пузырька на пузырьковой диаграмме.
-гьш»
33
38
43
48
# Средняя цена
О Загрузка
28
53
33
3S
43
48
53
170--------- —
«Средняя єна О Загрузка
до* і
——i Загрузка 150
_______ L..I
28
Загрузка
Рис. 105. Диаграмма кластеризации предприятий по отдельным сегментам рынка 5-й 4-х звездных гостиниц
Приведенные диаграммы показывают, что взаимозависимость средней цены и средней загрузки обратная. Разброс на рынке четырехзведочных гостиниц гораздо меньше: чем на рынке пяти звезд. Это объясняется меньшей степенью сложности ценовой политики гостиниц четыре звезды.
В сегменте гостиниц 5 звезд, гостиница «Националь» показывает точное совпадение своих характеристик с общим поведением данного сегмента. Скорее всего, это связано с тем,
что гостиница открылась сравнительно недавно и просто следует общему поведению рынка.
Поэтому она становится первым объектом дальнейшего анализа. Для анализа и построения модели ценовой полити
ки гостиницы «Националь» используется сеть с топологией, приведенной на рис. 106. Сразу видны отличия данной
сети от используемых ранее. Это связано с характером
данных, подаваемых на вход сети: дня недели и загрузки.
!---
| 1479 758 | | 3 | 4 | 3 | 7,730E+07 | 0,09 | -0,06 | | | | | Наклон (13) | 3.699О62Е-О5 |
| 4 | 6 | 5 | 7,724E+07 | 0,18 | -0,08 | | | | | | | | |
| 5 | 8 | 7 | 7,710E+07 | 0,35 | -0,17 | | | | | | | | |
| 6 | 10 | 9 | 7,709E+07 | 0,37 | -0,02 | | | | | | | | |
| Наблюдений | | | | 937 | | Наблюдений | 937 | Наблюдений | | 937 |
| Медиана | | | | 1512,963 | | Медиана | 1512,963 | Медиана | | 1512,963 |
| Выбр. Модель | | | ARMA(1,O) | 1 кевдо R-квадрат | 0,000000 | Псевдо R-квадрат | 0,000000 |
| R-квадрат | | | | 0,008006 | MSE | | | 82725,37 | MSE | | | 83394,99 |
| SSE | | | | | 7,737494E+07 | МАЕ | | | 248,1862 | МАЕ | | | 249,1474 |
| MSE | | | | | | 82665,53 | МАРЕ | | | 17,37652 | МАРЕ | | 17,52163 |
| RMS | | | | | | 287,5161 | | | | | | | | |
| Прог | ноз | | | | | | Прогної | | Прогноз |
| Aft | Факт | Остаток | (lpomoj | Aft | Факт | Остаток | Прогноз | Aft | Факт | Остаток | Прогноз |
| 1 | 1343,0 | -169,9 | 1512,9 | 1 | ,343 | -160,038 | 1503,038 | 1 | 1343 | -145,0844 | 1488,084 |
| | | | | | | | | | | | |
| 936 | 1940,0 | 428,3 | 1511,7 | 936 | 1940 | 430,0982 | 1509,902 | 936 | 1940 | 432,8382 | 1507,162 |
| 937 | 1479,0 | -37,8 | 1516,8 | 937 | 1479 | -31,49265 | 1510,493 | 937 | 1479 | -29,07988 | 1508,08 |
| 938 | | | 1512,7 | 938 | | | 1510,449 | 938 | | | 1545,2. |
| 939 | | | 1513,0 | 939 | | | 1510,449 | 939 | | | 1455,726 |
| 940 | | | 1513,0 | 940 | | | 1510,449 | 940 | | | 1514,405 |
| 941 | | | 1513,0 | 941 | | | 1510,449 | 941 | | | 1505,167 |
| 942 | | | 1513,0 | 942 | | | 1510,449 | 942 | | | 1548,731 |
| 943 | | | 1513,0 | 943 | | | 1510,449 | 943 | | | 1515,996 |
| 944 | | | 1513,0 | 944 | | | 1510,449 | 944 | | | 1507,487 |
Построим прогноз на основе использования нейросетевых технологий.
Любая модель на основе RBF-сети сразу же покажет те же результаты, что и все пре
дыдущие стандартные, а именно нулевой тренд на уровне медианы ряда, то есть построения
одной сети достаточно для определения тенденции ряда.
Поскольку нас все-таки интересует более точный прогноз, используем другие виды сетей. Нейросетевая модель многослойного персептрона (MLP: 32-16-1; все активационные функции логистические; параметры — по умолчанию; модель отображена на рис. 124) на 1100 итерациях при достижении ошибки, равной 99,9 методом спуска по сопряженным градиентам показала следующие результаты (табл. 20).
Таблица 20
Прогноз по НС-модели
| № | Прогноз | Целе вое | Фактическое |
| 936 | l^ 1721.5 | 1940 | |
| 937 | 1896.2 | 1479 | |
| 938 | L607.6 | | 1524 |
| 939 | 1195.9 | | 1144 |
| 940 | 1530.3 | | 1950 |
| 941 | 1293.8 | | 1354 |
| 942 | 1920.8 | | 1394 |
| 943 | 1627.2 | | 1729 |
| 944 | 1210.5 | | 1231 |
Как видно из таблицы, результаты гораздо ближе к фактическим, кроме того, нейронная сеть
Рис. 124. MLP-сеть
произвела все-таки обобщение.
Дальнейшее сравнение моделей произведем на основе отклонений последних семи тестовых измерений.
Значения абсолютных отклонений, а также значение RMS-ошибки для всех четырех
моделей на семи тестовых точках приведено в табл. 21.
Таблица 21
Сравнение ошибок моделей
| Модель |
| ARIMA | Простое эксп. сглажива ние | Эксп. сглаживание Винтерса | MLP32- 16-1 |
| -11,3 | -13,551 | +21,2 | +83,6 |
| +369 | +366,449 | +311,726 | +51,9 |
| Л37 | -439,551 | -435,595 | -419,7 |
| + 159 | +156,449 | +151,167 | -60,2 |
| +П9 | + 116,449 | +154,731 | +526,8 |
| -216 | -218,551 | -213,004 | -101,8 |
| +282 | +279,449 | +276.487 | -20,5 |
| RMS-отклонение |
| 227,614 | 227,207 | 223,4157 | 180.6429 |
Из представленных данных можно сделать следующие выводы: общая ошибка нейросетевой модели минимальна; имеются два больших отклонения на третьем (выброс в фактических данных) и на пятом измерении (сделан необоснованно^) большой прогноз). Если удалить эти два значения, то ошибка сети составит около 60(,)∙
Из вышеприведенных расчетов можно заключить, что нейросетевые модели определяют зависимости, как минимум, не хуже стандартных моделей. Кроме того (и самое важ
ное), пытаются и могут находить закономерности даже в рядах, ведущих себя как случайные
колебания.
Нейронные сети становятся инструментом реализации такой науки как теория хаоса.
Хаос — непредсказуемое поведение, возникающее в детерминированной системе из- за большой чувствительности к начальным условиям.
Теория хаоса — горячий лед, структура бесструктурного1. Хаос — неисчерпаемая конкретность существования2.
к
В. Тарасенко Теория хаоса, http://www.iph.ras.ru/~vtar/haos htin 2 Чжуан-цзы. Ле-цзы —М.: Мысль, 1995
Избыточность хаоса порождает конкретное знание, часто называемое порядком. Теория хаоса вводит описание системы хаотической, непредсказуемой на микроуровне, но, тем
не менее, имеющей возможности создавать различные сложные и тонкие структуры на макроуровне, Все это можно отнести «экономической системе как самой хаотичной в современных условиях развивающейся России.
Нейроагент для Guam Hotel and Restaurant Association
Данные для расчета взяты с официального сайта Guam Hotel and Restaurant
Association, расположенного по адресу http://www.ghra.org.gu из раздела Hotel Statistics —
Статистика гостиницы.
В таблице «Статистика гостиницы Guam Hotel and Restaurant Association» (см. прил. 6) представлены четыре показателя деятельности (помесячно): количество гостиничных номеров, общее количество посетителей, коэффициент загрузки и цена на гостиничный номер. Показатели деятельности гостиницы носят как внутренний, так и внешний характер.
Первый шаг в построении нейроагента — прогноз показателей на интересующий срок. Для проверки адекватности модели в процессе обучения будут участвовать 50 точек, три последние оставим для проверки. Прогноз показателей гостиницы производит-
Рис. 125. Топология сети первого этапа по- ся с помощью следующей модели (рис 125): многослойный пер- строения нейроагента
септрон MLP 4S(linear)-4(logistic)-4(linear).
Переменная ТОТ VISIT масштабируется со следующими параметрами: Min∕Mean=0
Max/SD=0,7; остальные переменные — Min∕Mean=0 Max∕SD-- l Параметр размера окна временного ряда Steps=12, горизонт прогноза Lookahead=I. Обучение производится методом сопряженных градиентов (прошло за 1500 итераций).
Сеть с перечисленными параметрами показала результаты, представленные в таблице статистик регрессии (табл. 22). Цифры свидетельствуют о приемлемом качестве модели. На это указывают сравнительно небольшие значения отношений стандартных отклонений.
Таблица 22
Статистика регрессии многофакторной модели
| | NOROOMS | τσrvτsιτ | AVOCCUP | AVRATE |
| Data Mean | 6855 | l.066c+05 | 75.82 | 126.5 |
| Data S.D. | 361.8 | 1.503c+04 | 11.17 | 11.74 |
| Error Mean | -0.4412 | -5.383 | 0.009513 | -0.004896 |
| Eπoτ S.D. | 33.43 | 2232 | 2.078 | 0.6986 |
| S,D. Ratio | 0.0924 J | 0.1485 | 0.1861 | 0.0595 |
fc Используя обученную модель, получаем с помощью окна проекции временного ряда
прогнозы всех показателей. Он строится на 3 имеющихся измерения для проверки плюс 7
, точек. Итого на 10 точек до конца года (табл. 23).
I
Таблица 23
Прогноз показателей гостиницы до конца года
| Epoch | NOROOMS | TOTV1S1T | AVOCCUP | AVRATE |
| 0038 | 7510.6 | l.O538c+O5 | 65.589 | 126.08 |
| 0039 | 7438.4 | 70470 | 50.973 | 100.59 |
| 0040 | 7669.2 | 74116 | 48.54 | 105.68 |
| 0041 | 7407.2 | 77674 | 55.17 | 103.54 |
| 0042 | 7649 | 85563 | 52.739 | 120.23 |
| 0043 | 7662.6 | 79944 1 | 48.613 | 122.69 |
| 0044 | 7644 3 | 73788 | 49,094 | 103.92 |
| 0045 | 7708 | 73657 | 48.801 | 100.2 |
| 0046 | 7662.1 | 69747 | 47.982 | 96.213 |
| 0047 | 7740.8 | 74125 | 47,437 | 105.64 |
| 0048 | 7663 | 72505 | 48,321 | 102.51 |
Среднеквадратические ошибки прогноза на трех тестовых точках составили: CKOnorooms=7 1,07; CKOιorvιsτ[~8829,49, CKOavoccup^S^S; CKOavratf.=7,42, Несмотря на довольно высокую ошибку, можно оставить данную модель для работы, поскольку последующая модификация сети привела к меморизации.
Данные значения ошибок вполне соответствуют (как и должны) показателям статистики регрессии. Самое большое соотношение отклонений было как раз у переменной TOTVISΓT.
Увеличение размера скрытого слоя показывает уменьшение ошибки.
Однако в конфигурации сети с логистической активационной функцией и линейной во входном и выходном слоях осуществляет увеличение крутизны подгоняемой кривой.
Для понимания структуры изменений данных это может быть и допустимым явлением, поскольку фактически указывает о критическом ускорении падения, как коэффициента
загрузки, так и цены номера.
'⅜
В принципе этот факт можно использовать как предупреждение о возможном кризисе в дальнейшей деятельности гостиницы и рекомендовать осуществление управленческих шагов для исправления ситуации.
Графики прогнозов показателей деятельности гостиницы показаны на рис. 126.
Из графиков виден рост одного показателя и падение всех остальных. Кроме того, видно довольно хорошее обобщение сетью входных данных.
Следующий шаг — определение стандартных состояний гостиницы.
Проводим анализ показателей при помощи сети Кохонена Топология сети представлена на рис. 127. В слое
Рис. 127. Топология сети на Кохонена используются 9 нейронов. Ширина — три втором этапе построения
нейроагента слоя.
Параметры обучения, два периода; на первом коэффициент обучения снижался с 0,9 до 0,1, размер окрестности снижался с 3 до 1, обучение проводилось в течение 2000 итераций, на втором коэффициент обучения снижался с 0,1 до 0,01, размер окрестности снижался
- 133 -
с 1 до О, обучение в течение 10000 итераций. Результаты обучения представляются в виде следующих отчетов. Первый — таблица частот выигрышей (табл. 24), которая показывает количество попаданий данных для обучения в тот или иной кластер. Вид таблицы соответствует топологии слоя Кохонена.
Таблица 24
Частота выигрышен
| | 01 | 02 | 03 |
| 01 | 5 | 7 | 11 |
| 02 | 3 | 5 | 6 |
| 03 | 6 | 2 | 5 |
Для того чтобы узнать какие именно наблюдения попали в тот или иной кластер, а также справиться с важнейшей задачей определения близости классов существует топологическая карта (рис. 128).
ft
р» )9Γ^i Г
I opoloQical Мер
i⅝⅛*⅞i∣
| Up* | Р иг* »1005 | |
| | Topdopcal | |
| Elv2 | Яу4 | Я*1 | |
| 0v4 | 0v4 | ■ vβ |
| Hv4 | Hv5 | ИуЗ | |
Рис. 128, Топологическая карта
В левой части окна, называемой Case No (Номер измерения) указывается интересующий номер измерения, процесс упрощается с помощью использования прокрутки. Для каждого измерения показывается выигравший элемент, степень близости классов (интенсивность окраски) и ошибка (в правом углу). В терминах сетей Кохонена эта ошибка является ни чем
иным, как расстоянием от центра кластера.
Таблица 25
Кластеризация состояний гостиницы
| № | С-я | № | С-я | № | С-я | № | С-я | № | С-я |
| 01 | vl | 11 | vl | 21 | v4 | 31 | v4 | 41 | v6 |
| 02 | vl | 12 | vl | 22 | v4 | 32 | v4 | 42 | v6 |
| 03 | vi | 13 | v2 | 23 | v4 | 33 | v4 | 43 | v5 |
| 04 | vl | 14 | v2 | 24 | v4 | 34 | v6 | 44 | v4 |
| 05 | vl | 15 | v2 | 25 | v4 | 35 | v4 | 45 | v6 |
| 06 | vl | 16 | v4 | 26 | v4 | 36 | v6 | 46 | v3 |
| 07 | vl | 17 | v4 | 27 | v4 | 37 | v5 | 47 | v3 |
| ОХ | v2 | IS | v4 | 28 | v4 | 38 | v4 | 48 | v3 |
| 0У | vl | 19 | v4 | 29 | v4 | 39 | v4 | 49 | v3 |
| 10 | lλ1 | 20 | v2 | 30 | v4 | 40 | v6 | 50 | v3 |
В начале окно топологии выдается чистым. Задача исследователя — разметка факти-
веских классов. Поскольку в слое Кохо йена было взято 9 нейронов, то столько же максимум будет и количество кластеров (табл. 25). Данное число предлагалось программным пакетом в соответствии со структурой входных данных.
| Рис. 129. Окно прогона данных |
окно прогона набора данных (рис. 129). Устанавливаем
желаемые параметры принятия и отвержения кластеризации. Фактически это максимальный размер ошибки (расстояния до центра кластера), при котором считается, что данные попали в тот или иной кластер. В противном случае данные помечаются символом «?», означающим неуверенность в правильности попадания в кластер.
В нижней части окна прогона представлена таблица соответствий порядкового номера измерений помеченным в окне топологии классам. Причем, выходные данные могут быть представлены в трех видах; variables — фактические значения, activations — значения функции активации (для сетей Кохонена это означает расстояние до центра кластера) и codebook
— координаты центра кластера
Таблица 26
Значения кодов центров кластеров (Codebook)
| X® измерения | NOROOMS | TOTVISIT | AVOCCUP | [AVRATE Класс |
| 01-07, 09-12 | 0.06823 | 0.6197 | 0,7449 | 10.17 | VI |
| 08, 13-15, 20 | 0.04278 | І0.8534 | 0.8492 | 0.6157 | V2 |
| 16-19, 21-33, 35, 38-39, 44 | 0.166 | jθ.5426 | 0.6435 | 0.5144 | V4 |
| 34, 36, 4(М2, 45 | 0.6331 | 0.354 | 0.3055 | 0.3295 | V6 |
| 37, 43 | 0.4929 | 0.3874 | 0.385 | 0.6514 | V5 |
| 46-50 | 0.8558 | ∣0.1508 | 0.1053 | 0.2982 | V3 |
Координаты центров классов для данной задачи показаны в табл. 26. К сожалению,
они предоставляются пользователю программного пакета в стандартизованном виде. Это ус
ложняет численную интерпретацию результатов, однако дает некоторое представление о примерном расположении центров. Это наглядно видно из таблицы. Характер поведения ко-
ординат центров соответствует характеру данных временных рядов. Так значения координат
для первой переменной возрастает, а для всех остальных — падает. Представленная таблица
значений кодов центров кластеров, пожалуй, выступает одной из основных в задаче
интерпретации результатов.
Таблица 27
Значения активационных функций (расстояний до центра кластера) Activations
| № | V2 | V4 | VI | V4 | ∣V4 рз | V4 | V5 | V3 |
| ,». | | | | | | | | |
| 05 | 0.503 | Р.410 | 0.126 | 0.488 | 0.497 р.772 | 0.718 | 0.777 | 1.121 |
| | і | | | --------- f--------- 1 | | | |
| 21 | р.376 р.041 | 0.352 | 0.241 | 0.416 Р.666 | 0.502 | 0.505 | 1.016 |
| | | | | | | | |
| 48 | 1.264 р.912 | 1.104 р.834 | 0.715 р.336 | 0.929 | 0.511 | 0.185 |
| 49 | 1.322 р.989 | 1.219 ∣0.888 | 0.784 0.462 | 0.937 | 0.546 | 0.305 |
| 50 | 1.346 jl.009 | 1.127 р.918 | 0.734 р.413 | 1.021 р.685 | 0.243 |
Окно прогона данных в режиме Activations демонстрирует (в стандартизованном виде) расстояние до центра кластера (табл. 27). Именно по этому параметру принимается решение о достоверности отнесения измерения к тому или иному кластеру. По данным этой таблицы можно также дополнить отнесение к тому или иному кластеру информацией о месте нахождения внутри самого кластера. Возможен дальнейший анализ рядов показателей с использованием значений окна Activations в качестве входных переменных. Это поможет определить критические значения экономических показателей, при которых есть риск перехода в
другое состояние экономической системы.
Следующий шаг — установление
возможных будущих состояний гостиницы Для этого применяется окно прогона одного нового значения (рис. 130). В верхней части
вручную вводятся спрогнозированные ранее
с помощью MLP значения.
Рис. 130. Окно прогона одного значения (получения прогноза ситуации)
После нажатия на кнопку Run (прогон) в нижней части окна показывается класс, к ко
торому была отнесена введенная комбинация показателей. На рисунке изображено окно про-
гона первой после данных, использованных для обучения, комбинации показателей. Понятно, что горизонт прогноза состояний зависит только от желания пользователя.
В таблице прогноза состояний гостиничного предприятия представлен соответствующий прогноз до конца 1999 года {табл. 28),
Таблица 28
Прогноз состояний гостиничного предприятия
| Epoch | Ситуация |
| 38 | V6 |
| 39-48 | V3 |
Несмотря на довольно большие ошибки прогноза первого этапа на MLP, прогнозные состояния на основе этих значений соответствуют фактическим. Таким образом, с помощью сети Кохонена данной конфигурации удалось несколько сгладить ошибки предыдущего этапа и дать правильный прогноз экономической ситуации. Напомним, что для проверки прогноза оставлялись три конечных измерения.
Приступим к экономическому анализу результатов, поскольку того требует ортодоксальность ученых. Точка зрения автора полностью совпадает с точкой зрения ведущих ученых кибернетиков: фирма не является анализатором; она — распознаватель. Вот почему так
важна скорость распознавания и относительно менее важна мощность анализа. Мы должны
распознавать и затем действовать. Иначе на анализ можно потратить много драгоценных недель и спасительный ответ на угрозу будет слишком запоздалым. Огромное число аналитических работ, проводимых управляющими, оказывается бесполезным по этой причине. Такие
аналитические исследования становятся интеллектуальными играми, сопровождающими
развитие реальных процессов, но не влияющих на них.[XXXIII]
Таблица результатов кластеризации свидетельствует о том, что предприятие находится в наихудшей, со времени начала учета своих статистических данных, ситуации. Однако она довольно стабильна и ожидать наступления какого-то кризисного события не следует.
В то же время, гостиница в свои стратегические цели должна ставить ситуацию V2 — мак
симум цены при максимуме загрузки. Дальнейшее сползание на уровень ниже даже среднемирового приведет к банкротству. К сожалению, невозможно на месте оценить так называемую форму поведения гостиницы с тем, чтобы более четко определить перспективы.
Посетители
--------- - Номер ситуация — -
Рис. 131. Общее колич«
Загрузка
——Номер ситуации -------------------
посетителей,загрузка и
Цена
j l-------------- Номер ситуации —
цена по номеру ситуации
Изменение показателей во времени и по номеру ситуации представлено на рис. 131. Интегрированным показателем для анализа может служить доход. График соответст
вия дохода определенным ситуациям представлен на рис. 132.
Доход Ситуация
Рис, 132. Доход гостиницы по ситуациям
Таблица 29
| Класс | N⅛ измерения | Индекс общий | Индекс дохода |
| VI | 01-07, 09-12 | 0,05 | 0,12 |
| V2 | 08, 13-15,20 | 0,19 | 0,53 |
| V3 | 46-50 | 0,04 | 0,03 |
| V4 | 16-19,21-33,35,38-39,44 | 0,29 | 0,33 |
| V5 | 37, 43 | 0,47 | 0,25 |
| V6 | 34, 36, 40-42, 45 | 0,22 | 0,10 |
Для анализа можно использовать индекс дохода (табл. 29), полученный путем умножения значений кодов
центров кластеров для соответствующих
ситуаций (табл. 26. «Значения кодов центров кластеров (Codebook)»).
Из графика и таблицы можно сделать следующие наблюдения:
Ситуация V3 соответствует минимуму загрузки при минимуме цены и, соответственно, минимум дохода. Для данной гостиницы можно сказать, что это — худшее состояние, кроме того, это последние значения ряда. Видимо, V3 -— кризис перепроизводства на рынке
в целом.
Ситуации VI и V6 соответствуют примерно одному уровню дохода (очень низкому), но имеют различия как по распределению внутренних показателей (высокая загрузка и низкая цена; средняя загрузка и средняя цена, соответственно), так и по внешним показателям.
Ситуация V5, как представляется из предыдущих графиков, служит переходной между V4 и V6. Кроме того, она встречается всего дважды. Ситуация соответствует довольно среднему доходу при максимальной цене и средней загрузке.
Ситуация V4 соответствует в точности средней цене при высокой загрузке. Данная ситуация самая распространенная в течение регистрации показателей и, видимо, соответствовала желаниям руководства по тенденциям общего функционирования. Однако именно она привела к снижению доходности в дальнейшем. Причиной такого явления может выступать несвоевременное распознавание и реагирование на рост до максимума номерного фонда всего региона и падения до минимума общего числа приезжающих.
Наконец, ситуация V2 — максимум дохода при максимуме цены и максимуме загрузки. Кроме того, V2 — максимум количества туристов при минимуме номерного фонда региона, что соответствует высокому спросу при низком предложении. Видимо, такая ситуация может быть целью деятельности гостиницы (с точки зрения максимизации дохода) и, возможно, следует направить действия на развитие и удержание именно такой ситуации. Достичь этого можно только двумя способами. Первый — при помощи стимуляции спроса, что потребует финансовых затрат. Второй — сдерживание объема предложения, что может быть
сделано в виде договора между основными участниками рынка о неувеличении номерного
фонда.