Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными
sku: 40101696
1,500.00 грн.
Shipping from: Ukraine
Description
[html]В полноцветной книге "Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными" описывается как можно самостоятельно и c удивительной легкостью построить модели машинного обучения (Machine Learning, ML). Прочитав эту книгу, вы сможете построить свою собственную систему машинного обучения, которая позволит выяснить настроения пользователей Твиттера или получить прогнозы по поводу глобального потепленияЭта книга научит вас практическим способам построения систем МО, даже если вы еще новичок в этой области. В ней подробно объясняются все этапы, необходимые для создания успешного проекта машинного обучения, с использованием языка Python и библиотек scikit-learn, NumPy и matplotlib. Авторы сосредоточили свое внимание исключительно на практических аспектах применения алгоритмов машинного обучения, оставив за рамками книги их математическое обоснование. Данная книга адресована специалистам, решающим реальные задачи, а поскольку область применения методов МО практически безгранична, прочитав эту книгу, вы сможете собственными силами построить действующую систему машинного обучения в любой научной или коммерческой сфере.Книга "Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными" является вводной и не требует предварительных знаний в области машинного обучения или искусственного интеллектаОб авторах:Андреас Мюллер получил ученую степень доктора наук по машинному обучению в Боннском университете. В течение года он работал на должности специалиста по машинному обучению в компании Amazon, занимаясь решением прикладных задач в области компьютерного зрения. В настоящий момент Андреас работает в Центре изучения данных Нью-Йоркского университета. В течение последних четырех лет он стал куратором и одним из ключевых разработчиков библиотеки scikit-learn - популярного инструмента машинного обучения, широко используемого в промышленности и науке. Кроме того, Андреас является автором и разработчиком еще нескольких популярных пакетов машинного обучения. Свою миссию он видит в том, чтобы создавать инструменты с открытым программным кодом, которые позволяют устранить препятствия, мешающие более активному использованию машинного обучения в прикладных задачах, а также содействуют продвижению воспроизводимой науки (reproducible science) и упрощают применение высокоточных алгоритмов машинного обучения.Сара Гвидо - специалист по анализу данных, имеет большой опыт работы в стартапах. Она имеет степень магистра по информатике, которую получила в Мичиганском университете. В настоящее время проживает в Нью-Йорке. Сфера ее интересов - язык Python, машинное обучение, большие объемы данных и мир новейших технологий. Совсем недавно Сара стала ведущим специалистом по анализу данных в компании Bitly. Помимо этого, она является постоянным спикером на конференциях по машинному обучению. Содержание книги "Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными" Об авторах 11Об изображении на обложке 11Благодарности 13От Андреаса 13От Сары 14От редакции 14Предисловие 15Кому стоит прочитать эту книгу 15Почему мы написали эту книгу 16Структура книги 16Онлайн-ресурсы 18Условные обозначения, принятые в этой книге 18Пиктограммы, используемые в этой книге 19Использование примеров программного кода 19От издательства "Диалектика" 20Глава 1. Введение 21Зачем нужно использовать машинное обучение 22Задачи, которые можно решить с помощью машинного обучения 23Постановка задач и знакомство с данными 26Почему нужно использовать Python 27Библиотека scikit-learn 28Установка библиотеки scikit-learn 28Основные библиотеки и инструменты 29Пакет Jupyter Notebook 30Пакет NumPy 30Пакет SciPy 31Пакет matplotlib 32Библиотека pandas 33Библиотека mglearn 35Сравнение Python 2 и Python 3 36Версии библиотек, используемые в этой книге 37Пример 1: классификация сортов ириса 38Загружаем данные 39Метрики эффективности: обучающий и тестовый наборы 43Сперва посмотрите на свои данные 45Построение первой модели: метод k ближайших соседей 47Получение прогнозов 48Оценка качества модели 49Выводы и перспективы 50Глава 2. Методы машинного обучения с учителем 53Классификация и регрессия 53Обобщающая способность, переобучение и недообучение 55Взаимосвязь между сложностью модели и размером набора данных 58Алгоритмы машинного обучения с учителем 59Некоторые наборы данных 59Метод k ближайших соседей 64Линейные модели 75Наивные байесовские классификаторы 103Деревья решений 105Ансамбли деревьев решений 123Ядерный метод опорных векторов 134Нейронные сети (глубокое обучение) 147Оценки неопределенности для классификаторов 163Решающая функция: decision_function 164Прогнозирование вероятностей: predict_proba 167Неопределенность в мультиклассовой классификации 169Выводы и перспективы 174Глава 3. Методы машинного обучения без учителяи предварительная обработка данных 177Типы машинного обучения без учителя 177Проблемы машинного обучения без учителя 178Предварительная обработка и масштабирование 179Виды предварительной обработки 180Применение преобразований данных 181Масштабирование обучающего и тестового набороводинаковым образом 184Влияние предварительной обработки на машинноеобучение с учителем 187Снижение размерности, выделение признакови множественное обучение 189Анализ главных компонент (PCA) 189Факторизация неотрицательных матриц (NMF) 207Множественное обучение с помощью алгоритма t-SNE 216Кластеризация 221Кластеризация по методу k-средних 221Агломеративная кластеризация 235Алгоритм DBSCAN 241Сравнение и оценка качества алгоритмов кластеризации 246Выводы по методам кластеризации 265Выводы и перспективы 266Глава 4. Типы данных и конструирование признаков 269Категориальные переменные 270Прямое кодирование (дамми-переменные) 271Для кодирования категорий можно использовать числа 277Биннинг, дискретизация, линейные модели и деревья 280Взаимодействия и полиномы 285Одномерные нелинейные преобразования 294Автоматический отбор признаков 298Одномерные статистики 299Отбор признаков на основе модели 302Итеративный отбор признаков 304Применение экспертных знаний 306Выводы и перспективы 317Глава 5. Оценка и улучшение качества модели 319Перекрестная проверка 320Перекрестная проверка в библиотеке scikit-learn 321Преимущества перекрестной проверки 322Стратифицированная k-блочная перекрестная проверкаи другие стратегии 324Решетчатый поиск 331Простой решетчатый поиск 332Опасность переобучения параметров и проверочный набор данных 333Решетчатый поиск с перекрестной проверкой 335Метрики качества модели и их вычисление 350Помните о конечной цели 350Метрики для бинарной классификации 351Метрики для мультиклассовой классификации 377Метрики регрессии 380Использование метрик оценки для отбора модели 381Выводы и перспективы 383Глава 6. Объединение алгоритмов в цепочки и конвейеры 385Отбор параметров с использованием предварительной обработки 386Построение конвейеров 388Использование конвейера, помещенного в объект GridSearchCV 390Общий интерфейс конвейера 393Удобный способ построения конвейеровс помощью функции make_pipeline 395Работа с атрибутами этапов 397Работа с атрибутами конвейера, помещенногов объект GridSearchCV 397Находим оптимальные параметры этапов конвейерас помощью решетчатого поиска 399Выбор оптимальной модели с помощью решетчатого поиска 402Выводы и перспективы 404Глава 7. Работа с текстовыми данными 407Строковые типы данных 407Пример применения: анализ тональности киноотзывов 410Представление текстовых данных в виде "мешка слов" 413Применение модели "мешок слов" к синтетическому набору данных 415Модель "мешка слов" для киноотзывов 417Стоп-слова 422Масштабирование данных с помощью метода tf-idf 424Исследование коэффициентов модели 427Модель "мешка слов" для последовательностей из несколькихслов (n-грамм) 429Продвинутая токенизация, стемминг и лемматизация 436Моделирование тем и кластеризация документов 440Латентное размещение Дирихле 441Глава 8. Подведение итогов 451Общий подход к решению задач машинного обучения 451Вмешательство человека в работу модели 453От прототипа к производству 453Тестирование производственных систем 455Создание собственного класса Estimator 455Куда двигаться дальше 457Теория 457Другие фреймворки и пакеты машинного обучения 458Ранжирование, рекомендательные системы и другие виды обучения 459Вероятностное моделирование, теория статистического выводаи вероятностное программирование 460Нейронные сети 461Масштабирование на больших наборах данных 462Оттачивание навыков 463Заключение 464Предметный указатель 465[/html]
Technical Details
categoryTitle: | Научная и техническая литература |
Price history chart & currency exchange rate