Когда дело доходит до выбора подходящей книги, вы сразу же поражаетесь изобилием возможностей: выбрать ли вы классическую книгу для прочной основы или книгу прямо из духовки для новейших тенденций? Какого уровня придерживаться? Будет ли руководство для новичков слишком простым?
В этом обзоре мы собрали наши 10 лучших книг по НЛП и анализу текста за все время, от новичков до экспертов.
1. Обработка естественного языка с помощью Python
Авторы Стивен Берд, Эван Кляйн и Эдвард Лопер.
Он настолько популярен, что кажется, что он есть в списке всех топов. Что ж, это вечная классика, которая дает введение в НЛП с использованием Python и его библиотеки NLTK.
Целевые читатели:
Новички в НЛП, компьютерные лингвисты и разработчики искусственного интеллекта
Почему это хорошо:
Книга очень ориентирована на практику: вы не познакомитесь со сложными теориями, а только с большим количеством кода и концепций, чтобы сразу же начать экспериментировать.
Где найти:
- Обработка естественного языка с помощью Python: анализ текста с помощью набора инструментов для естественного языка (на Amazon)
- Обработка естественного языка с помощью Python (бесплатная версия!)
2. Основы статистической обработки естественного языка
Кристофер Мэннинг и Хинрих Шютце.
Эта книга предлагает подробное введение в статистические методы НЛП и охватывает как основы лингвистики, так и основные статистические методы по состоянию на 1999 год.
Целевые читатели:
Новички в обработке естественного языка без обязательных знаний лингвистики или статистики.
Почему это хорошо:
Хотя эта книга довольно старая, она дает прочную основу для лингвистики и статистических методов, а также для лучшего понимания новых методов и кодировок.
Где найти:
3. Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи.
Авторы Дэн Джурафски и Джеймс Х. Мартин
Также довольно старая книга предлагает единое видение обработки речи и языка, охватывающее статистические и символические подходы к обработке языка, и представляет алгоритмы и методы распознавания речи, исправления орфографии и грамматики, извлечения информации, поисковых систем, машинного перевода и создания агентов разговорного диалога.
Целевые читатели:
Новички в естественном языке и обработке речи
Почему это хорошо:
Книга дает солидные фундаментальные знания, поскольку она всесторонне знакомит с лингвистикой, информатикой и статистикой.
Где найти:
- Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи (на Amazon)
- Обработка речи и языка: Введение в обработку естественного языка, компьютерную лингвистику и распознавание речи (бесплатная версия)
4. Оксфордский справочник по компьютерной лингвистике.
В этом справочнике описаны основные концепции, методы и приложения в компьютерной лингвистике, начиная с лингвистических основ, понятных даже для студентов и неспециалистов из других областей лингвистики, и заканчивая обзором текущих задач, методов и инструментов в обработке естественного языка. для более опытных исследователей вычислительного языка.
Целевые читатели:
Лингвисты, а также исследователи в области информатики, искусственного интеллекта, лингвистической инженерии и когнитивных наук.
Почему это хорошо:
Это академическое издание, что означает, что оно ориентировано на теорию и обеспечивает более глубокое понимание основных концепций их функционирования.
Где найти:
- Оксфордский справочник по компьютерной лингвистике (на Amazon)
- Оксфордский справочник компьютерной лингвистики (бесплатная версия)
5. Анализ текста с помощью R
Авторы Джулия Сильдж и Дэвид Робинсон.
Эта книга представляет собой введение в интеллектуальный анализ текста с использованием пакета tidytext и других инструментов tidy в R. Она демонстрирует статистические методы обработки естественного языка в ряде современных приложений.
Целевые читатели:
Практикующие хотя бы немного знакомы с Р.
Почему это хорошо:
Это довольно ново; поэтому он имеет практическое и современное представление о демонстрациях и предоставляет примеры реальных проблем интеллектуального анализа текста.
Где найти:
- Интеллектуальный анализ текста с помощью R: аккуратный подход (на Amazon)
- Домашняя страница книги (и бронируйте бесплатно)
- Репозиторий книги на GitHub (код и данные)
6. Методы нейронных сетей в обработке естественного языка (Лекции-синтезаторы по технологиям человеческого языка)
Авторы Йоав Гольдберг, Грэм Херст
Эта книга посвящена применению моделей нейронных сетей к задачам обработки естественного языка. В книге рассматриваются основы машинного обучения с учителем и работы с машинным обучением над языковыми данными, а также рассматриваются более специализированные архитектуры нейронных сетей, такие как одномерные сверточные нейронные сети, рекуррентные нейронные сети, модели условного поколения и модели, основанные на внимании.
Целевые читатели:
Разработчики программного обеспечения и отраслевые практики, уже знакомые с нейронными сетями.
Почему это хорошо:
Книга предлагает подробный обзор современных моделей нейронных сетей, которые могут быть полезны для НЛП.
Где найти:
- Методы нейронной сети в обработке естественного языка (на Amazon)
- Нейросетевые методы обработки естественного языка (бесплатный образец)
7. Укрощение текста
Авторы Грант Ингерсолл, Томас Мортон и Дрю Фаррис.
Эта книга представляет собой введение в несколько инструментов и проблем NLP, включая Apache Solr, Apache OpenNLP и Apache Mahout с примерами кода на Java.
Целевые читатели:
Разработчики программного обеспечения, которые хотят познакомиться с инструментами НЛП корпоративного уровня для рабочих проектов.
Почему это хорошо:
Эта книга предлагает из первых рук ознакомиться с NLP на основе Apache, одним из основателей проекта Apache Mahout. Кроме того, это редкая книга, в которой есть примеры кода Java.
Где найти:
- Укрощение текста: как его найти, организовать и манипулировать (на Amazon)
- Домашняя страница книги
- Репозиторий книги на GitHub (код и данные)
8. Глубокое обучение в обработке естественного языка
В этой книге представлен обзор современных методов глубокого обучения и их успешного применения для решения основных задач НЛП, таких как распознавание и понимание речи, диалоговые системы, лексический анализ, синтаксический анализ, графы знаний, машинный перевод, ответы на вопросы и т. Д. анализ настроений, социальные вычисления и создание естественного языка из изображений.
Целевые читатели:
Продвинутые студенты и аспиранты в области компьютерной лингвистики и информатики, а также академические и промышленные исследователи.
Почему это хорошо:
Во-первых, это издание 2018 года, поэтому в нем рассматривается реальное состояние дел. Кроме того, он предоставляет глубокие и фундаментальные знания о глубоком обучении, выходящие далеко за рамки практических приложений.
Где найти:
- Глубокое обучение в обработке естественного языка (на Amazon)
- Глубокое обучение в обработке естественного языка (главы книги)
9. Прикладной анализ текста с помощью Python: использование продуктов данных, зависящих от языка, с помощью машинного обучения
Автор: Бенджамин Бенгфорт, Ребекка Бильбро, Тони Охеда
В книге представлены надежные, воспроизводимые и масштабируемые методы анализа текста с помощью Python, включая разработку контекстных и лингвистических функций, векторизацию, классификацию, тематическое моделирование, разрешение сущностей, анализ графов и визуальное управление.
Целевые читатели:
Разработчики программного обеспечения на Python, которые заинтересованы в применении обработки естественного языка и машинного обучения в своих инструментах разработки программного обеспечения.
Почему это хорошо:
В этой практической книге представлен взгляд специалиста по обработке данных на создание языковых продуктов с использованием прикладных методов машинного обучения.
Где найти:
- Прикладной анализ текста с помощью Python: использование продуктов данных с поддержкой языка с помощью машинного обучения (на Amazon)
- Прикладной анализ текста с помощью Python: использование продуктов данных, зависящих от языка, с помощью машинного обучения (электронная книга)
10. Практическое машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и методы для создания интеллектуальных систем, 1-е издание
Хотя эта практическая книга не особо посвящена обработке естественного языка, она представляет самые популярные библиотеки, которые можно использовать для НЛП и анализа текста.
Целевые читатели:
Разработчики программного обеспечения, имеющие хотя бы небольшой предыдущий опыт в машинном обучении.
Почему это хорошо:
В книге дается исчерпывающий обзор самых последних разработок в области машинного обучения, начиная с простой линейной регрессии и заканчивая глубокими нейронными сетями - и все это на двух самых популярных библиотеках: Scikit-Learn и TensorFlow.
Где найти:
- Практическое машинное обучение с помощью Scikit-Learn и TensorFlow (на Amazon)
- Практическое машинное обучение с помощью Scikit-Learn и TensorFlow (бесплатная версия)
Мы уверены, что у каждого есть свои фавориты, которые помогли им освоить анализ текста и речи. Как обычно, мы будем рады услышать ваши истории успеха и проверить ваши намеки и предложения хорошей литературы в комментариях.