Когда дело доходит до выбора подходящей книги, вы сразу же поражаетесь изобилием возможностей: выбрать ли вы классическую книгу для прочной основы или книгу прямо из духовки для новейших тенденций? Какого уровня придерживаться? Будет ли руководство для новичков слишком простым?

В этом обзоре мы собрали наши 10 лучших книг по НЛП и анализу текста за все время, от новичков до экспертов.

1. Обработка естественного языка с помощью Python

Авторы Стивен Берд, Эван Кляйн и Эдвард Лопер.

Он настолько популярен, что кажется, что он есть в списке всех топов. Что ж, это вечная классика, которая дает введение в НЛП с использованием Python и его библиотеки NLTK.

Целевые читатели:

Новички в НЛП, компьютерные лингвисты и разработчики искусственного интеллекта

Почему это хорошо:

Книга очень ориентирована на практику: вы не познакомитесь со сложными теориями, а только с большим количеством кода и концепций, чтобы сразу же начать экспериментировать.

Где найти:

2. Основы статистической обработки естественного языка

Кристофер Мэннинг и Хинрих Шютце.

Эта книга предлагает подробное введение в статистические методы НЛП и охватывает как основы лингвистики, так и основные статистические методы по состоянию на 1999 год.

Целевые читатели:

Новички в обработке естественного языка без обязательных знаний лингвистики или статистики.

Почему это хорошо:

Хотя эта книга довольно старая, она дает прочную основу для лингвистики и статистических методов, а также для лучшего понимания новых методов и кодировок.

Где найти:

3. Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи.

Авторы Дэн Джурафски и Джеймс Х. Мартин

Также довольно старая книга предлагает единое видение обработки речи и языка, охватывающее статистические и символические подходы к обработке языка, и представляет алгоритмы и методы распознавания речи, исправления орфографии и грамматики, извлечения информации, поисковых систем, машинного перевода и создания агентов разговорного диалога.

Целевые читатели:

Новички в естественном языке и обработке речи

Почему это хорошо:

Книга дает солидные фундаментальные знания, поскольку она всесторонне знакомит с лингвистикой, информатикой и статистикой.

Где найти:

4. Оксфордский справочник по компьютерной лингвистике.

Руслан Митков

В этом справочнике описаны основные концепции, методы и приложения в компьютерной лингвистике, начиная с лингвистических основ, понятных даже для студентов и неспециалистов из других областей лингвистики, и заканчивая обзором текущих задач, методов и инструментов в обработке естественного языка. для более опытных исследователей вычислительного языка.

Целевые читатели:

Лингвисты, а также исследователи в области информатики, искусственного интеллекта, лингвистической инженерии и когнитивных наук.

Почему это хорошо:

Это академическое издание, что означает, что оно ориентировано на теорию и обеспечивает более глубокое понимание основных концепций их функционирования.

Где найти:

5. Анализ текста с помощью R

Авторы Джулия Сильдж и Дэвид Робинсон.

Эта книга представляет собой введение в интеллектуальный анализ текста с использованием пакета tidytext и других инструментов tidy в R. Она демонстрирует статистические методы обработки естественного языка в ряде современных приложений.

Целевые читатели:

Практикующие хотя бы немного знакомы с Р.

Почему это хорошо:

Это довольно ново; поэтому он имеет практическое и современное представление о демонстрациях и предоставляет примеры реальных проблем интеллектуального анализа текста.

Где найти:

6. Методы нейронных сетей в обработке естественного языка (Лекции-синтезаторы по технологиям человеческого языка)

Авторы Йоав Гольдберг, Грэм Херст

Эта книга посвящена применению моделей нейронных сетей к задачам обработки естественного языка. В книге рассматриваются основы машинного обучения с учителем и работы с машинным обучением над языковыми данными, а также рассматриваются более специализированные архитектуры нейронных сетей, такие как одномерные сверточные нейронные сети, рекуррентные нейронные сети, модели условного поколения и модели, основанные на внимании.

Целевые читатели:

Разработчики программного обеспечения и отраслевые практики, уже знакомые с нейронными сетями.

Почему это хорошо:

Книга предлагает подробный обзор современных моделей нейронных сетей, которые могут быть полезны для НЛП.

Где найти:

7. Укрощение текста

Авторы Грант Ингерсолл, Томас Мортон и Дрю Фаррис.

Эта книга представляет собой введение в несколько инструментов и проблем NLP, включая Apache Solr, Apache OpenNLP и Apache Mahout с примерами кода на Java.

Целевые читатели:

Разработчики программного обеспечения, которые хотят познакомиться с инструментами НЛП корпоративного уровня для рабочих проектов.

Почему это хорошо:

Эта книга предлагает из первых рук ознакомиться с NLP на основе Apache, одним из основателей проекта Apache Mahout. Кроме того, это редкая книга, в которой есть примеры кода Java.

Где найти:

8. Глубокое обучение в обработке естественного языка

автор: Ли Дэн, Ян Лю

В этой книге представлен обзор современных методов глубокого обучения и их успешного применения для решения основных задач НЛП, таких как распознавание и понимание речи, диалоговые системы, лексический анализ, синтаксический анализ, графы знаний, машинный перевод, ответы на вопросы и т. Д. анализ настроений, социальные вычисления и создание естественного языка из изображений.

Целевые читатели:

Продвинутые студенты и аспиранты в области компьютерной лингвистики и информатики, а также академические и промышленные исследователи.

Почему это хорошо:

Во-первых, это издание 2018 года, поэтому в нем рассматривается реальное состояние дел. Кроме того, он предоставляет глубокие и фундаментальные знания о глубоком обучении, выходящие далеко за рамки практических приложений.

Где найти:

9. Прикладной анализ текста с помощью Python: использование продуктов данных, зависящих от языка, с помощью машинного обучения

Автор: Бенджамин Бенгфорт, Ребекка Бильбро, Тони Охеда

В книге представлены надежные, воспроизводимые и масштабируемые методы анализа текста с помощью Python, включая разработку контекстных и лингвистических функций, векторизацию, классификацию, тематическое моделирование, разрешение сущностей, анализ графов и визуальное управление.

Целевые читатели:

Разработчики программного обеспечения на Python, которые заинтересованы в применении обработки естественного языка и машинного обучения в своих инструментах разработки программного обеспечения.

Почему это хорошо:

В этой практической книге представлен взгляд специалиста по обработке данных на создание языковых продуктов с использованием прикладных методов машинного обучения.

Где найти:

10. Практическое машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и методы для создания интеллектуальных систем, 1-е издание

Автор Орелиен Жерон

Хотя эта практическая книга не особо посвящена обработке естественного языка, она представляет самые популярные библиотеки, которые можно использовать для НЛП и анализа текста.

Целевые читатели:

Разработчики программного обеспечения, имеющие хотя бы небольшой предыдущий опыт в машинном обучении.

Почему это хорошо:

В книге дается исчерпывающий обзор самых последних разработок в области машинного обучения, начиная с простой линейной регрессии и заканчивая глубокими нейронными сетями - и все это на двух самых популярных библиотеках: Scikit-Learn и TensorFlow.

Где найти:

Мы уверены, что у каждого есть свои фавориты, которые помогли им освоить анализ текста и речи. Как обычно, мы будем рады услышать ваши истории успеха и проверить ваши намеки и предложения хорошей литературы в комментариях.