Описание
В течение последнего десятилетия произошел взрыв в области вычислений и информационных технологий. Вместе с ним появились огромные объемы данных в различных областях, таких как медицина, биология, финансы и маркетинг. Проблема понимания этих данных привела к разработке новых статистических инструментов и породила новые научные дисциплины, такие как интеллектуальный анализ данных, машинное обучение и биоинформатика. Многие из этих инструментов имеют общие научные основания, но часто описываются с помощью другой терминологии. В настоящей книге описываются важные идеи в этих областях с единой теоретической точки зрения. Хотя этот подход является статистическим, упор делается на концепции, а не на математику. Приводится много примеров с широким использованием цветной графики. Книга представляет собой ценный источник информации для статистиков и всех, кто интересуется интеллектуальным анализом данных в науке или промышленности. Охват книги широк: от обучения с учителем (прогнозирования) до обучения без учителя. В ней описаны нейронные сети, метод опорных векторов, деревья классификации и бустинг, который впервые всесторонне рассмотрен в книге, а не в отдельных публикациях.
В данном глубоко переработанном издании представлены многие темы, не охваченные в первом издании, включая графовые модели, случайные леса, ансамблевые методы, алгоритмы регрессии наименьших углов и алгоритмы построения траекторий для методов LASSO, неотрицательной факторизации матриц и спектральной кластеризации. В книге также есть глава о методах анализа "широких" данных (когда p больше, чем n), включая множественное тестирование и долю ложных отклонений гипотезы.
Об авторах:
Тревор Хасти, Роберт Тибширани и Джером Фридман — профессора статистики в Стэнфордском университете. Они являются выдающимися исследователями в этой области. В частности, Хасти и Тибширани разработали обобщенные аддитивные модели и написали популярную книгу с таким названием. Хасти в составе коллектива разработчиков разработал значительную часть программного обеспечения и среды для статистического моделирования на языках R и S-PLUS, а также изобрел метод главных кривых и поверхностей. Тибширани изобрел метод LASSO и является соавтором очень успешной книги An Introduction to the Bootstrap. Фридман является соавтором многих методов интеллектуального анализа данных, в том числе CART, MARS, поиска наилучшей проекции и градиентного бустинга.
Все иллюстрации к книге в цветном варианте доступны на сайте издательства.
Характеристики
Автор(ы) | Тревор Хасти, Роберт Тибширани, Джером Фридман |
Переводчик | Д. А. Клюшин |
Издательство | Диалектика |
Год выпуска | 2020 |
ISBN | 978-5-907144-42-2 |
Кол-во страниц | 768 |
Формат страниц | 70x100/16 (170x240 мм) |
Язык | Русский |
Переплёт | Твердый |
Доп. сведения | Офсетная бумага |
Иллюстрации | черно-белые |
Вес | 1140 г |