То, как и тон, которым люди передают свои мысли, высоко ставит мир, развивается, если все понимают и практикуют смирение по отношению друг к другу, тогда не будет ничего меньше, чем счастье и мир. Ну, это заставляет нас понять, как анализ тональности простых предложений может иметь большее влияние в любой области. Анализ настроений может быть выполнен двумя методами обучения:

  • Обучение без учителя. Поскольку у всех нас есть четкое представление о том, что такое обучение без учителя, то здесь мы можем создать вложение для каждой группы слов и найти семантическое сходство встраивания любого предложения с получить группу, к которой может принадлежать конкретное предложение.
  • Обучение с учителем. В качестве аналога метода обучения без учителя здесь мы будем использовать помеченные данные для моделирования.

Конвейеры Spacy:

Если вы раньше не слышали слова spaCy, вам следует быстро перейти по ссылке выше, они являются одними из пионеров мира НЛП. spaCy предоставляет более надежные и эффективные конвейеры и функции по сравнению с другими, такими как TectBlob, NLTK и т. д. Теперь они добавили возможность включать преобразователи в свой модуль для целей обучения и вывода. К сожалению, в spaCy нет встроенного модуля анализа настроений, хотя, к счастью, у них есть модуль классификации текста, который можно обучить и использовать в качестве модели. Все, что вам нужно сделать, это выбрать набор данных, пометить и настроить их в соответствии с форматом spaCy, выбрать конфигурацию базовой модели и все. Я обучил и упаковал простой модуль анализа настроений, который можно легко установить на вашу машину через pip.

Обучение:

Обучить пайплайн spaCy сейчас как никогда просто, нам нужны данные в нужном формате, выбрать конфигурацию базовой модели и обучить ваш пайплайн. Для модели анализа настроений я использовал обзорные комментарии IMDB к набору данных из репозитория UCI ML. Для обучения собственного пайплайна достаточно заглянуть в следующую тетради. Ниже приведен пример фрагмента из блокнота

Упаковка

После обучения и сохранения модели, которую вы создали с помощью пайплайнов spaCy, вы можете упаковать и отправить их на сервер в виде скомпилированных и исполняемых версий. Для упаковки сохраненной модели используйте следующую команду, указанную в spaCy CLI.

python -m spacy package input_dir output_dir
  • input_dir: Каталог, в котором находится ваша скомпилированная модель.
  • output_dir: каталог, в котором создается распространяемый файл, который можно установить с помощью pip.

Остальные параметры уточняйте на официальном сайте пакетов spaCy. После упаковки вы должны следовать обычным методам загрузки папки dist/ в свой репозиторий PyPi, чтобы сделать ее доступной для сообщества, если хотите.

eng_spacysentiment

Поскольку мы видели, как обучать и упаковывать конвейер spaCy, теперь давайте посмотрим на него в действии. Ниже приведена простая библиотека Python для анализа тональности английских предложений. Вы можете установить пакет, используя следующее

pip install eng-spacysentiment

  • Простая реализация

Хорошо, это подведение итогов, теперь мы можем легко обучить конвейер с помощью spaCy, упаковать и развернуть его как исполняемый файл с помощью python. Как всегда, безмерно благодарен и рад за поддержку, которую вы мне оказываете. До следующего раза, берегите себя, ребята, и хлопайте в ладоши за статью, если она вам понравилась. Следуйте за мной, чтобы узнать больше, и я сделаю то же самое, чтобы мы все могли узнать все взаимно.