Описание
Библиотека pandas - популярный пакет для анализа и обработки данных на языке Python. Он предлагает эффективные, быстрые, высокопроизводительные структуры данных, которые позволяют существенно упростить работу. Данная книга познакомит вас с обширным набором инструментов, предлагаемых библиотекой pandas, - начиная с обзора загрузки данных с удаленных источников, выполнения численного и статистического анализа, индексации, агрегации и заканчивая визуализацией данных и анализом финансовой информации.
Во второе издание добавлены новые приложения, посвященные предварительной подготовке данных и настройке гиперпараметров, работе с датами, строками и предупреждениями. Подробно освещены алгоритмы случайного леса, градиентного бустинга CatBoost и логистической регрессии.
Издание предназначено всем разработчикам на языке Python, интересующимся обработкой данных.
Прочитав книгу, вы научитесь:
- планировать процесс сбора и анализа данных;
- применять объекты библиотеки pandas Series и DataFrame для представления одномерных и многомерных данных;
- разбивать данные и соединять их воедино, а также объединять, группировать и агрегировать данные из нескольких источников;
- загружать данные из внешних сточников (файлов, баз данных, веб-сервисов);
- работать с временными рядами, справляться со сложностями, связанными с этим типом данных;
- визуализировать статистические данные;
- использовать pandas для работы с финансовыми данными.
Об авторе:
Артем Груздев - директор исследовательского центра «Гевисста», основанного им в 2009 г. Основное направление деятельности - разработка, валидация, внедрение и мониторинг риск-моделей, моделей оттока, моделей отклика на базе ПО IBM SPSS, SAS, R, Python, а также подготовка специалистов в сфере прогнозного моделирования и анализа данных. Клиентами компании являются Citibank NA, TransUnion, DBS Bank и др.
Артем является переводчиком «Скрапинг веб-сайтов с помощью Python» и «Введение в машинное обучение с помощью Python», автор более 30 статей по прогнозному моделированию,а также оригинального курса «Машинное обучение в R, Python и Н20».
Характеристики
Автор(ы) | Артем Груздев |
Издательство | ДМК Пресс |
Год выпуска | 2019 |
ISBN | 978-5-97060-670-4 |
Кол-во страниц | 682 |
Формат страниц | 70x100/16 (170x240 мм) |
Язык | Русский |
Переплёт | Твердый |
Доп. сведения | Офсетная бумага |
Иллюстрации | цветные |
Тираж | 200 экз. |
Вес | 1210 г |
Отзывы посетителей(0)
- Категории:
- Python
- Анализ и обработка данных