Python для сложных задач: наука о данных и машинное обучение

Python для сложных задач: наука о данных и машинное обучение
Питер
sku: 48478454
ACCORDING TO OUR RECORDS THIS PRODUCT IS NOT AVAILABLE NOW
871.00 грн.
Shipping from: Ukraine
   Description
[html]Книга "Python для сложных задач: наука о данных и машинное обучение" (оригинал "Python Data Science Handbook") - это подробное руководство по самым разным вычислительным и статистическим методам, без которых немыслима любая интенсивная обработка данных, научные исследования и передовые разработки. Читатели, уже имеющие опыт программирования и желающие эффективно использовать Python в сфере Data Science, найдут в этой книге ответы на всевозможные вопросы, например: 1) как мне считать этот формат данных в мой скрипт? 2) Как преобразовать, очистить эти данные и манипулировать ими? 3) Как визуализировать данные такого типа? Как при помощи этих данных разобраться в ситуации, получить ответы на вопросы, построить статистические модели или реализовать машинное обучение?Оглавление книги "Python для сложных задач: наука о данных и машинное обучение"Предисловие ........................................................................................................ 16Что такое наука о данных.......................................................................................16Для кого предназначена эта книга.........................................................................17Почему Python........................................................................................................18Общая структура книги..........................................................................................19Использование примеров кода...............................................................................19Вопросы установки.................................................................................................20Условные обозначения...........................................................................................21Глава 1. IPython: за пределами обычного Python ................................... 22Командная строка или блокнот?.............................................................................23Запуск командной оболочки IPython.................................................................23Запуск блокнота Jupiter....................................................................................23Справка и документация в оболочке IPython..........................................................24Доступ к документации с помощью символа ?..................................................25Доступ к исходному коду с помощью символов ??............................................27Просмотр содержимого модулей с помощьюTab-автодополнения.........................................................................................28Сочетания горячих клавиш в командной оболочке IPython.....................................30Навигационные горячие клавиши.....................................................................31Горячие клавиши ввода текста.........................................................................31Горячие клавиши для истории команд..............................................................32Прочие горячие клавиши.................................................................................33"Магические" команды IPython..............................................................................33Вставка блоков кода: %paste и %cpaste...........................................................34Выполнение внешнего кода: %run...................................................................35Длительность выполнения кода: %timeit..........................................................36Справка по "магическим" функциям: ?, %magic и %lsmagic............................36История ввода и вывода.........................................................................................37Объекты In и Out оболочки IPython..................................................................37Быстрый доступ к предыдущим выводам с помощью знака подчеркивания......38Подавление вывода..........................................................................................39Соответствующие "магические" команды........................................................39Оболочка IPython и использование системного командного процессора.................40Краткое введение в использование командного процессора.............................40Инструкции командного процессора в оболочке IPython..................................42Передача значений в командный процессор и из него.....................................42"Магические" команды для командного процессора...............................................43Ошибки и отладка..................................................................................................44Управление исключениями: %xmode...............................................................44Отладка: что делать, если чтения трассировок недостаточно..........................47Профилирование и мониторинг скорости выполнения кода....................................49Оценка времени выполнения фрагментов кода: %timeit и %time.....................50Профилирование сценариев целиком: %prun...................................................52Пошаговое профилирование с помощью %lprun...............................................53Профилирование использования памяти: %memit и %mprun...........................54Дополнительные источники информации об оболочке IPython...............................56Веб-ресурсы.....................................................................................................56Книги...............................................................................................................56Глава 2. Введение в библиотеку NumPy ..................................................... 58Работа с типами данных в языке Python.................................................................59Целое число в языке Python - больше, чем просто целое число......................60Список в языке Python - больше, чем просто список.......................................62Массивы с фиксированным типом в языке Python.............................................63Создание массивов из списков языка Python....................................................64Создание массивов с нуля................................................................................65Стандартные типы данных библиотеки NumPy.................................................66Введение в массивы библиотеки NumPy.................................................................67Атрибуты массивов библиотеки NumPy............................................................68Индексация массива: доступ к отдельным элементам.......................................69Срезы массивов: доступ к подмассивам............................................................70Изменение формы массивов.............................................................................74Слияние и разбиение массивов........................................................................75Выполнение вычислений над массивами библиотеки NumPy:универсальные функции.........................................................................................77Медлительность циклов...................................................................................77Введение в универсальные функции................................................................79Обзор универсальных функций библиотеки NumPy..........................................80Продвинутые возможности универсальных функций........................................84Универсальные функции: дальнейшая информация.........................................86Агрегирование: минимум, максимум и все, что посередине....................................86Суммирование значений из массива.................................................................87Минимум и максимум.......................................................................................87Пример: чему равен средний рост президентов США.......................................90Операции над массивами. Транслирование............................................................91Введение в транслирование.............................................................................92Правила транслирования.................................................................................94Транслирование на практике...........................................................................97Сравнения, маски и булева логика.........................................................................98Пример: подсчет количества дождливых дней.................................................98Операторы сравнения как универсальные функции........................................100Работа с булевыми массивами........................................................................102Булевы массивы как маски.............................................................................104"Прихотливая" индексация..................................................................................108Исследуем возможности "прихотливой" индексации......................................108Комбинированная индексация........................................................................109Пример: выборка случайных точек.................................................................110Изменение значений с помощью прихотливой индексации.............................112Пример: разбиение данных на интервалы......................................................113Сортировка массивов............................................................................................116Быстрая сортировка в библиотеке NumPy: функции np.sort и np.argsort.........117Частичные сортировки: секционирование......................................................118Пример: K ближайших соседей.......................................................................119Структурированные данные: структурированные массивыбиблиотеки NumPy...............................................................................................123Создание структурированных массивов..........................................................125Более продвинутые типы данных...................................................................126Массивы записей: структурированные массивыс дополнительными возможностями...............................................................127Вперед, к Pandas............................................................................................128Глава 3. Манипуляции над даннымис помощью пакета Pandas ............................................................................. 129Установка и использование библиотеки Pandas....................................................130Знакомство с объектами библиотеки Pandas.........................................................131Объект Series библиотеки Pandas...................................................................131Объект DataFrame библиотеки Pandas............................................................135Объект Index библиотеки Pandas....................................................................138Индексация и выборка данных.............................................................................140Выборка данных из объекта Series.................................................................140Выборка данных из объекта DataFrame..........................................................144Операции над данными в библиотеке Pandas.......................................................149Универсальные функции: сохранение индекса...............................................149Универсальные функции: выравнивание индексов.........................................150Универсальные функции: выполнение операциимежду объектами DataFrame и Series..............................................................153Обработка отсутствующих данных........................................................................154Компромиссы при обозначении отсутствующих данных..................................155Отсутствующие данные в библиотеке Pandas.................................................155Операции над пустыми значениями................................................................159Иерархическая индексация...................................................................................164Мультииндексированный объект Series..........................................................164Методы создания мультииндексов..................................................................168Индексация и срезы по мультииндексу...........................................................171Перегруппировка мультииндексов..................................................................174Агрегирование по мультииндексам.................................................................177Объединение наборов данных: конкатенация и добавление в конец....................178Напоминание: конкатенация массивов NumPy................................................179Простая конкатенация с помощью метода pd.concat.......................................180Объединение наборов данных: слияние и соединение..........................................184Реляционная алгебра.....................................................................................184Виды соединений...........................................................................................185Задание ключа слияния..................................................................................187Задание операций над множествами для соединений.....................................191Пересекающиеся названия столбцов: ключевое слово suffixes.......................192Пример: данные по штатам США....................................................................193Агрегирование и группировка...............................................................................197Данные о планетах.........................................................................................198Простое агрегирование в библиотеке Pandas.................................................198GroupBy: разбиение, применение, объединение.............................................200Сводные таблицы.................................................................................................210Данные для примеров работы со сводными таблицами..................................210Сводные таблицы "вручную".........................................................................211Синтаксис сводных таблиц.............................................................................212Пример: данные о рождаемости.....................................................................214Векторизованные операции над строками............................................................219Знакомство со строковыми операциями библиотеки Pandas...........................219Таблицы методов работы со строками библиотеки Pandas.............................221Пример: база данных рецептов......................................................................226Работа с временными рядами...............................................................................230Дата и время в языке Python..........................................................................231Временные ряды библиотеки Pandas: индексация по времени........................235Структуры данных для временных рядов библиотеки Pandas.........................235Периодичность и смещения дат.....................................................................238Где найти дополнительную информацию.......................................................246Пример: визуализация количества велосипедов в Сиэтле..............................246Увеличение производительности библиотеки Pandas: eval() и query()..................252Основания для использования функций query() и eval():составные выражения....................................................................................254Использование функции pandas.eval() для эффективных операций................255Использование метода DataFrame.eval() для выполнения операцийпо столбцам...................................................................................................257Метод DataFrame.query()................................................................................259Производительность: когда следует использовать эти функции.....................259Дополнительные источники информации.............................................................260Глава 4. Визуализация с помощью библиотеки Matplotlib ................. 262Общие советы по библиотеке Matplotlib................................................................263Импорт matplotlib...........................................................................................263Настройка стилей...........................................................................................263Использовать show() или не использовать?Как отображать свои графики........................................................................264Сохранение рисунков в файл.........................................................................266Два интерфейса по цене одного...........................................................................267Интерфейс в стиле MATLAB............................................................................267Объектно-ориентированный интерфейс.........................................................268Простые линейные графики.................................................................................269Настройка графика: цвета и стили линий.......................................................271Настройка графика: пределы осей координат................................................273Метки на графиках.........................................................................................276Простые диаграммы рассеяния.............................................................................278Построение диаграмм рассеяния с помощью функции plt.plot.........................279Построение диаграмм рассеяния с помощью функции plt.scatter....................281Сравнение функций plot и scatter: примечание относительно производительности.......................................................................................283Визуализация погрешностей.................................................................................283Простые планки погрешностей.......................................................................283Непрерывные погрешности............................................................................285Графики плотности и контурные графики.............................................................286Гистограммы, разбиения по интервалам и плотность...........................................290Двумерные гистограммы и разбиения по интервалам.....................................292Ядерная оценка плотности распределения.....................................................294Пользовательские настройки легенд на графиках................................................295Выбор элементов для легенды.......................................................................297Задание легенды для точек различного размера............................................298Отображение нескольких легенд....................................................................300Пользовательские настройки шкал цветов............................................................301Выбор карты цветов.......................................................................................302Ограничения и расширенные возможности по использованию цветов............305Дискретные шкалы цветов.............................................................................306Пример: рукописные цифры...........................................................................306Множественные субграфики.................................................................................308plt.axes: создание субграфиков вручную........................................................309plt.subplot: простые сетки субграфиков..........................................................310Функция plt.subplots: создание всей сетки за один раз...................................311Функция plt.GridSpec: более сложные конфигурации......................................313Текст и поясняющие надписи...............................................................................314Пример: влияние выходных дней на рождение детей в США..........................315Преобразования и координаты текста............................................................317Стрелки и поясняющие надписи.....................................................................319Пользовательские настройки делений на осях координат.....................................321Основные и промежуточные деления осей координат....................................322Прячем деления и/или метки.........................................................................323Уменьшение или увеличение количества делений..........................................324Более экзотические форматы делений...........................................................325Краткая сводка локаторов и форматеров.......................................................328Пользовательские настройки Matplotlib: конфигурации и таблицы стилей............328Выполнение пользовательских настроек графиков вручную...........................329Изменяем значения по умолчанию: rcParams..................................................330Таблицы стилей.............................................................................................332Построение трехмерных графиков в библиотеке Matplotlib...................................336Трехмерные точки и линии............................................................................337Трехмерные контурные графики....................................................................338Каркасы и поверхностные графики................................................................340Триангуляция поверхностей...........................................................................341Отображение географических данных с помощью Basemap..................................344Картографические проекции..........................................................................346Отрисовка фона карты...................................................................................351Нанесение данных на карты...........................................................................353Пример: города Калифорнии..........................................................................354Пример: данные о температуре на поверхности Земли...................................355Визуализация с помощью библиотеки Seaborn.....................................................357Seaborn по сравнению с Matplotlib..................................................................358Анализируем графики библиотеки Seaborn....................................................360Пример: время прохождения марафона.........................................................368Дополнительные источники информации.............................................................377Источники информации о библиотеке Matplotlib.............................................377Другие графические библиотеки языка Python...............................................377Глава 5. Машинное обучение ....................................................................... 379Что такое машинное обучение..............................................................................380Категории машинного обучения.....................................................................380Качественные примеры прикладных задач машинного обучения....................381Классификация: предсказание дискретных меток...........................................381Резюме...........................................................................................................390Знакомство с библиотекой Scikit-Learn..................................................................391Представление данных в Scikit-Learn..............................................................391API статистического оценивания библиотеки Scikit-Learn...............................394Прикладная задача: анализ рукописных цифр................................................403Резюме...........................................................................................................408Гиперпараметры и проверка модели....................................................................408Соображения относительно проверки модели................................................409Выбор оптимальной модели...........................................................................413Кривые обучения...........................................................................................420Проверка на практике: поиск по сетке...........................................................425Резюме...........................................................................................................426Проектирование признаков..................................................................................427Категориальные признаки..............................................................................427Текстовые признаки.......................................................................................429Признаки для изображений............................................................................430Производные признаки..................................................................................430Внесение отсутствующих данных...................................................................433Конвейеры признаков....................................................................................434Заглянем глубже: наивная байесовская классификация.......................................435Байесовская классификация...........................................................................435Гауссов наивный байесовский классификатор................................................436Полиномиальный наивный байесовский классификатор.................................439Когда имеет смысл использовать наивный байесовский классификатор.........442Заглянем глубже: линейная регрессия.................................................................443Простая линейная регрессия..........................................................................443Регрессия по комбинации базисных функций.................................................446Регуляризация...............................................................................................450Пример: предсказание велосипедного трафика..............................................453Заглянем глубже: метод опорных векторов..........................................................459Основания для использования метода опорных векторов...............................459Метод опорных векторов: максимизируем отступ...........................................461Пример: распознавание лиц...........................................................................470Резюме по методу опорных векторов.............................................................474Заглянем глубже: деревья решений и случайные леса.........................................475Движущая сила случайных лесов: деревья принятия решений.......................475Ансамбли оценивателей: случайные леса.......................................................481Регрессия с помощью случайных лесов..........................................................482Пример: использование случайного леса для классификации цифр...............484Резюме по случайным лесам..........................................................................486Заглянем глубже: метод главных компонент........................................................487Знакомство с методом главных компонент.....................................................487Использование метода PCA для фильтрации шума.........................................495Пример: метод Eigenfaces...............................................................................497Резюме метода главных компонент................................................................500Заглянем глубже: обучение на базе многообразий...............................................500Обучение на базе многообразий: HELLO.........................................................501Многомерное масштабирование (MDS)...........................................................502MDS как обучение на базе многообразий.......................................................505Нелинейные вложения: там, где MDS не работает.........................................507Нелинейные многообразия: локально линейное вложение.............................508Некоторые соображения относительно методов обученияна базе многообразий....................................................................................510Пример: использование Isomap для распознавания лиц.................................511Пример: визуализация структуры цифр..........................................................515Заглянем глубже: кластеризация методом k-средних............................................518Знакомство с методом k-средних....................................................................518Алгоритм k-средних: максимизация математического ожидания.....................520Примеры........................................................................................................525Заглянем глубже: смеси Гауссовых распределений..............................................532Причины появления GMM: недостатки метода k-средних................................532Обобщение EM-модели: смеси Гауссовых распределений...............................535GMM как метод оценки плотности распределения..........................................540Пример: использование метода GMM для генерации новых данных...............544Заглянем глубже: ядерная оценка плотности распределения...............................547Обоснование метода KDE: гистограммы.........................................................547Ядерная оценка плотности распределения на практике.................................552Пример: KDE на сфере...................................................................................554Пример: не столь наивный байес...................................................................557Прикладная задача: конвейер распознавания лиц................................................562Признаки в методе HOG.................................................................................563Метод HOG в действии: простой детектор лиц...............................................564Предостережения и дальнейшие усовершенствования...................................569Дополнительные источники информации по машинному обучению......................571Машинное обучение в языке Python...............................................................571Машинное обучение в целом..........................................................................572Об авторе ............................................................................................................ 573[/html]
   Technical Details
categoryTitle: Научная и техническая литература
   Price history chart & currency exchange rate

Customers also viewed