СПб.: Питер, 2017. — 336 с. — (Библиотека программиста). — ISBN: 978-5-496-02989-6.
Данная книга рассчитана на тех, кто хочет решать самые разнообразные задачи при помощи машинного обучения. Как правило, для этого нужен Python, поэтому в примерах кода используется этот язык, а также библиотеки pandas и scikit-learn. Вы познакомитесь с основными понятиями ML, такими как сбор данных, моделирование, классификация и регрессия, а главное, получите практический опыт обработки реальных данных. Эта книга позволит программистам, аналитикам данных, статистикам, специалистам по обработке данных и всем остальным применить машинное обучение к решению реальных задач или хотя бы просто понять, что оно собой представляет. Читатели, не прибегая к глубокому теоретическому изучению конкретных алгоритмов, получат практический опыт обработки реальных данных, моделирования, оптимизации и развертки систем машинного обучения. Для тех, кому интересна теория, мы обсуждаем математическую основу машинного обучения, объясняем некоторые алгоритмы и даем ссылки на материалы для дополнительного чтения. Основной акцент делается на практических результатах при решении поставленных задач.
Последовательность действий при машинном обучении
Что такое машинное обучение?Как обучаются машины
Принятие решений на основе данных
Рабочий процесс: от данных до внедрения
Усовершенствованные способы повышения эффективности
Заключение
Терминология
Реальные данныеПервый этап: сбор данных
Подготовка данных к моделированию
Визуализация данных
Заключение
Терминология
Моделирование и прогнозированиеОсновы моделирования с машинным обучением
Классификация: распределение по классам
Регрессия: предсказание численных значений
Заключение
Терминология
Оценка и оптимизация моделиОценка прогностической точности на новых данных
Оценка моделей классификации
Оценка моделей регрессии
Оптимизация модели путем подбора параметров
Заключение
Терминология
Основы проектирования признаковМотивация: в чем польза проектирования признаков?
Основные этапы проектирования признаков
Выбор признаков
Заключение
Терминология
Практическое применение
Пример: чаевые для таксистовДанные: сведения о чаевых и плате за проезд
Моделирование
Заключение
Терминология
Усовершенствованное проектирование признаковБолее сложные текстовые признаки
Признаки, извлекаемые из изображений
Признаки временных рядов
Заключение
Терминология
Пример обработки естественного языкаИзучение данных и сценарии их применения
Генерация базовых NLР-признаков и построение первого варианта модели
Усовершенствованные алгоритмы и тонкости процесса внедрения
Заключение
Терминология
Масштабирование процесса машинного обученияПеред началом масштабирования
Масштабирование конвейера МL-моделирования
Масштабирование предсказаний
Пример с цифровой рекламойПоказ рекламы
Данные, связанные с цифровой рекламой
Проектирование признаков и стратегия моделирования
Размер и форма данных
Сингулярное разложение
Оценка и оптимизация ресурсов
Моделирование
Метод k-ближайших соседей
«Случайные леса»
Другие практические моменты
Заключение
Терминология
Подводим итоги
Приложение. Популярные алгоритмы машинного обучения