3-е изд. — СПб.: БХВ-Петербург, 2009. — 512 с. — (Учебная литература для вузов). — ISBN: 978-5-9775-0368-6.
Излагаются основные направления в области разработки корпоративных систем: организация хранилищ данных, оперативный (OLAP) и интеллектуальный (Data Mining) анализ данных. В третьем издании по сравнению со вторым, выходившем под названием "Технологии анализа данных: Data Mining, Text Mining, Visual Mining, OLAP", добавлены визуальный (Visual Mining) и текстовый (Text Mining) анализ данных, анализ процессов (Process Mining), анализ Web-ресурсов (Web mining) и анализ в режиме реального времени (Real-Time Data Mining). Приведено описание методов и алгоритмов решения основных задач анализа: классификации, кластеризации и др. Описание идеи каждого метода дополняется конкретным примером его использования.
Data Mining и перегрузка информацией
Системы поддержки принятия решенийЗадачи систем поддержки принятия решений
Базы данных — основа СППР
Неэффективность использования OLTP-систем для анализа данных
Выводы
Хранилище данныхКонцепция хранилища данных
Организация ХД
Очистка данных
Концепция хранилища данных и анализ
Выводы
OLAP-системыМногомерная модель данных
Определение OLAP-систем
Концептуальное многомерное представление
Архитектура OLAP-систем
Выводы
Интеллектуальный анализ данныхДобыча данных — Data Mining
Задачи Data Mining
Практическое применение Data Mining
Модели Data Mining
Методы Data Mining
Процесс обнаружения знаний
Управление знаниями (Knowledge Management)
Средства Data Mining
Выводы
Классификация и регрессияПостановка задачи
Представление результатов
Методы построения правил классификации
Методы построения деревьев решений
Методы построения математических функций
Прогнозирование временных рядов
Выводы
Поиск ассоциативных правилПостановка задачи
Представление результатов
Алгоритмы
Выводы
КластеризацияПостановка задачи кластеризации
Представление результатов
Базовые алгоритмы кластеризации
Адаптивные методы кластеризации
Выводы
Визуальный анализ данных — Visual MiningВыполнение визуального анализа данных
Характеристики средств визуализации данных
Методы визуализации
Выводы
Анализ текстовой информации — Text MiningЗадача анализа текстов
Извлечение ключевых понятий из текста
Классификация текстовых документов
Методы кластеризации текстовых документов
Задача аннотирования текстов
Средства анализа текстовой информации
Выводы
Стандарты Data MiningКратко о стандартах
Стандарт CWM
Стандарт CRISP
Стандарт PMML
Другие стандарты Data Mining
Выводы
Библиотека XelopesАрхитектура библиотеки
Диаграмма Model
Диаграмма Settings
Диаграмма Attribute
Диаграмма Algorithms
Диаграмма DataAccess
Диаграмма Transformation
Примеры использования библиотеки Xelopes
Выводы
Распределенный анализ данныхСистемы мобильных агентов
Использование мобильных агентов для анализа данных
Система анализа распределенных данных
Выводы
Data Mining в реальном времени (Real-Time Data Mining)Идея Data Mining в реальном времени
Рекомендательные машины
Инструменты Data Mining в реальном времени
Выводы
Извлечение знаний из Web — Web MiningWeb Mining
Методы извлечения Web-контента
Извлечение Web-структур
Исследование использования Web-ресурсов
Выводы
Средства анализа процессов — Process MiningАвтоматизация выполнения бизнес-процессов
Анализ процессов
Методы Process Mining
Библиотека алгоритмов Process Mining — ProM
Выводы
Приложение 1. Нейронечеткие системыСпособы интеграции нечетких и нейронных систем
Нечеткие нейроны
Обучение методами спуска
Нечеткие схемы рассуждений
Настройка нечетких параметров управления с помощью нейронных сетей
Нейронечеткие классификаторы
Приложение 2. Особенности и эффективность генетических алгоритмовМетоды оптимизации комбинаторных задач различной степени сложности
Сущность и классификация эволюционных алгоритмов
Классификация генетических алгоритмов
Особенности генетических алгоритмов, предпосылки для адаптации
Классификация адаптивных ГА
Двунаправленная интеграция ГА и нечетких алгоритмов продукционного типа
Приложение 3. Описание прилагаемого компакт-диска