Принятие решений и оперативный анализ данных
Дмитрий Гиглавый
В последние годы пользователи баз данных оказались перед необходимостью освоения самых разнообразных аналитических инструментов. Причина повышенного внимания к "аналитике" проста — в корне меняется структура функционирования рынка в целом. В итоге оказывается, что без опоры на средства оперативного анализа больших и быстро растущих баз данных многим компаниям сегодня просто не выжить.
Широкое распространение получили в последнее время технологии работы с хранилищами данных: добыча данных (data mining), оперативная аналитическая обработка данных (OLAP). В этих технологиях особое значение приобретают отчетные формы представления данных — грамотно составленный отчет зачастую играет решающую роль в принятии важных решений. Для подготовки отчетов требуются эффективные методы анализа информации, выявления закономерностей в больших массивах данных. Комплексный подход к ведению бизнеса, составляющий основу методологии современного предпринимательства, нашел отражение в быстром распространении специальных систем поддержки принятия решений (СППР).
История разработки таких систем в компании Business Objects (http://www.businessobjects.com)
насчитывает уже десять лет — для рынка ИТ это срок солидный. В России интересы
Business Objects c 1997 года представляет компания "Терн" (http://www.tern.ru).
Она осуществляет локализацию системы BusinessObjects, обеспечивает техническую
поддержку, обучение и консалтинг. Сегодня в России систему BusinessObjects используют
около пятидесяти заказчиков.
Объекты вашего бизнеса
Отчет в системе BusinessObjects — это не просто подведение итогов. Часто в нем необходимо объединить информацию из различных источников — скажем, из корпоративной базы данных и с OLAP-сервера.
Чтобы сделать это с помощью языка SQL (Structured Query Language — структурированный язык запросов), нужно как минимум профессионально им владеть. Помимо этого, для быстрого доступа к данным нужно знать структуру конкретной БД. Понятно, что любой администратор базы данных знает и активно использует язык SQL. Сложнее с пользователями. Скажем, большинство менеджеров имеют весьма поверхностное представление о СУБД вообще, а про SQL они и вовсе ничего не слышали. К тому же у менеджеров, как правило, нет ни времени, ни желания серьезно овладевать языком SQL, а оперативный доступ к различным источникам данных им просто необходим.
Поэтому сложные физические и логические модели баз данных необходимо отобразить
в совокупность понятных пользователю бизнес-терминов — "объектов". В BusinessObjects
для этого используется семантический слой — каталог бизнес-терминов
(описание предметной области), в котором описаны правила отображения реляционной
модели в бизнес-модель. Как правило, семантический слой состоит из нескольких
словарей бизнес-терминов, или юниверсов (от universe — вселенная). Каждый юниверс
настраивается на определенный источник данных и предназначен для определенной
группы пользователей.
Для создания юниверсов существует инструмент BusinessObjects Designer,
с помощью которого администратор в интерактивном режиме генерирует полностью
функциональный словарь бизнес-терминов.
Пользователь BusinessObjects при помощи этих юниверсов строит запросы. Формулирование запросов в BusinessObjects сводится просто к выбору и компоновке объектов на панели запросов (рис. 1). Это делается в десятки, а то и в сотни раз быстрее, чем при подготовке SQL-запроса, когда приходится одновременно "держать в голове" сложные модели данных, бесчисленные имена полей и т. д.
Рис. 1. Формулирование запросов в BusinessObjects — это выбор и компоновка объектов на панели запросов.
|
С помощью средств форматирования, опирающихся на технику drag & drop, удается быстро создавать сложные отчеты, в которых данные из различных источников объединены в таблицах, диаграммах и графиках.
Построение дерева решений
Часто менеджеру приходится анализировать представленную в отчете табличную информацию для того, чтобы выявить закономерности в данных и сделать соответствующие выводы.
К примеру, есть таблица с информацией о клиентах банка, в одном из столбцов которой содержатся данные о том, насколько своевременно клиент возвращает кредит. Каждая ячейка в этом столбце содержит одно из следующих значений: "Вовремя", "С опозданием на 30 дней" и "С опозданием на 60 дней". Нужно выяснить, какие клиенты не задерживают возврат кредита.
Допустим, в нашей таблице 4070 клиентов; из них 2470 возвращают кредит вовремя,
870 — опаздывают на 60 дней, а остальные 730 — на 30 дней. Эта информация и
будет корнем дерева решений, которое мы будем строить с помощью инструмента
Business Miner. Затем разделим клиентов на две категории в зависимости
от размера кредита. Пусть в нашем примере 2270 клиентов взяли большой кредит,
а остальные 1800 — очень маленький, маленький и средний кредиты.
Теперь на каждом шаге построения дерева решений для каждой группы клиентов Business Miner автоматически строит таблицу с данными о том, насколько клиент опаздывает с возвратом кредита.
Так, после первого разделения на две категории мы видим, что из 2270 клиентов, взявших большой кредит, только 41,9% возвращают кредит вовремя, а из тех 1800 клиентов, что взяли маленький или средний кредиты, возвращают его вовремя 84,4%. Уже после первого шага можно сделать простой вывод: чем больше кредит, тем меньше процент клиентов, выплативших этот кредит вовремя. Соответствующее дерево решений представлено на рис. 2.
Рис. 2. Дерево решений при анализе своевременности возврата кредита.
|
На следующих этапах построения дерева решений можно получить и более детальные выводы. Вот еще пример: на нашем дереве решений легко увидеть, что клиенты, взявшие большой кредит, состоящие в браке и имеющие детей, гораздо добросовестнее относятся к своевременному возврату кредита, чем холостяки…
Дерево решений — один из наиболее эффективных инструментов систем поддержки принятия решений.
Доступ к информации
Бывает, что какая-то важная информация должна быть доступна только директору корпорации и его ближайшему окружению. Доступ к такой информации должен быть закрыт для рядовых служащих корпорации и тем более для посторонних. В такой ситуации крайне важно организовать эффективное управление доступом к данным.
Для решения подобных задач BusinessObjects предлагает ряд инструментов администрирования
СППР в масштабах предприятия. Модуль Supervisor управляет процессами
обращения пользователей к ресурсам, предоставляя возможность определять права
пользователей и групп с помощью графического интерфейса.
Этот модуль предназначен для управления единым репозиторием, в котором
хранятся как документы, созданные в среде BusinessObjects, так и документы других
приложений — например, Adobe Acrobat, Microsoft Excel и т. д., что очень удобно,
так как дает возможность пользователям обмениваться документами различных форматов.
Репозиторий можно организовать в реляционной СУБД. Supervisor позволяет контролировать
процессы обращения пользователей к ресурсам (как для определенного рабочего
места, так и по всему распределенному окружению). Основанная на объектах модель
системы безопасности позволяет устанавливать и изменять права доступа как для
группы, так и для индивидуального пользователя. Администратор может определять,
какие функции продуктов, разновидности информации и/или конкретные документы
будут доступны каждой группе пользователей. Пользователь может получить доступ
к данным и функциям системы, только пройдя авторизацию и аутентификацию.
Supervisor может использовать и существующие системы обеспечения безопасности, включая процедуру аутентификации Microsoft Windows NT, LDAP (Lightweight Directory Access Protocol — упрощенный протокол доступа к сетевым каталогам) или обычную систему проверки паролей для БД. Это позволяет при необходимости ввести единую процедуру аутентификации. Кроме того, Supervisor может легко импортировать пользовательские конфигурации из внешних систем, что обеспечивает быструю установку.
Сфера применения "тонкого клиента"
Рассмотрим теперь использование Интернет-технологий в продуктах BusinessObjects.
Технологии Web часто опираются на модель "тонкого клиента" — приложения,
для работы которого требуется только Web-браузер и "рабочий стол" пользователя.
Именно этот подход принят в СППР на базе BusinessObjects. В итоге каждый пользователь
системы, находящийся как в своей организации, так и за ее пределами, получает
приемлемую для него по цене возможность доступа к ресурсам СППР.
Еще в 1996 г. у пользователей BusinessObjects появилась возможность публиковать
свои отчеты в среде Web, а через год компания BusinessObjects выпустила продукт
WebIntelligence с полноценной архитектурой "тонкого клиента". WebIntelligence
дает пользователям возможность получать доступ к данным и строить отчеты, пользуясь
привычными бизнес-терминами, анализировать информацию и разрабатывать системы
корпоративной отчетности в сетях класса интранет и экстранет. Архитектура WebIntelligence
основана на схеме работы с распределенными компонентами, что позволяет обеспечить
как доступность, так и высокую производительность СППР в приложениях с большим
числом пользователей. Распределенная компонентная архитектура WebIntelligence
реализована по CORBA-совместимой технологии.
При разработке архитектуры WebIntelligence были учтены стандарты безопасности для Web. Эти средства обеспечивают защиту передачи данных по сети благодаря использованию улучшенных алгоритмов кодирования, таких как SSL (Secure Socket Level — спецификация протокола защиты данных, которая широко применяется для проверки полномочий и шифрования данных на транспортном уровне при работе Web-браузера с Web-сервером).
Для обеспечения безопасности WebIntelligence использует функционально выделенный слой безопасности BusinessObjects. Это означает, к примеру, что, когда отчет включается в список рассылки, пользователи увидят различное его содержимое в зависимости от их прав авторизации. Таким образом, WebIntelligence использует настроечные параметры BusinessObjects как из семантического слоя, так и из профилей безопасности. В итоге можно создать среду поддержки принятия решений, которая включает в себя как приложения класса клиент-сервер, так и Web-приложения.
Займемся анализом
Встроенный OLAP-модуль позволяет непосредственно в отчете осуществлять операции детализации и обобщения, делать срезы информации (Slice&Dice), работать с перекрестными таблицами. Пользователи могут также исследовать интересующие их зависимости в массивах информации, находящейся вне их корпоративной БД, — на внешнем сайте в Интернете (для этого используются гиперссылки). Таким образом, между WebIntelligence и BusinessObjects существует тесная интеграция; в них могут использоваться одни и те же юниверсы либо созданные в обеих программах отчеты.
Для расширения функциональных возможностей WebIntelligence и BusinessObjects
разработан инструмент Set Analyser. С его помощью пользователь может
проводить углубленный анализ очень больших баз данных, ускоряя процесс создания
запросов. Для анализа используется специальная методика, основанная на моделях
теории множеств, благодаря которой становится возможным проведение наиболее
трудоемких исследований. Set Analyzer интегрирован с BusinessObjects и WebIntelligence
на уровне метаданных (метаданные — это данные о структуре, форматах и семантике
предметно-ориентированных данных). Кроме того, он может интегрироваться с другими
корпоративными приложениями, такими как средства автоматизации продаж, картографические
приложения.