Статьи по теме large-language-models

Публикации по теме 'large-language-models'

Семантический поиск в машинном обучении, часть 1

Поиск по смыслу, намерению и контексту Это четвертая статья из серии Создание ИИ-приложений на базе LLM . Из предыдущей статьи мы представили вложения/векторы, которые являются вспомогательными технологиями для семантического поиска. Мы ввели семантический поиск во вторую статью серии . Краткий обзор : семантический поиск понимает намерения искателя и контекстуальное значение терминов. Другая статья о семантическом поиске. Обзор Семантический..

Древо мыслей (ToT) LLM Подсказка

Документ Древо мыслей от Google DeepMind был популярной темой. Он основан на подсказках Chain of Thought (CoT), которые улучшают выходные данные языковой модели, заставляя ее размышлять о своих предыдущих ответах. Это делается для сложных задач, где недостаточно просто спросить модель, чтобы получить правильный ответ, и это соответствует принципу разбиения задач на более мелкие подзадачи (динамическое программирование моделей на больших языках). Tree of Thoughts использует..

Тонкая настройка Llama 2 для предсказания категорий новостей: подробное пошаговое руководство по тонкой настройке…

Подробное пошаговое руководство по тонкой настройке любого LLM. В этом блоге я проведу вас через процесс тонкой настройки модели Meta Llama 2 7B для категоризации новостных статей по 18 различным категориям. Я буду использовать набор данных инструкций по классификации новостей, созданный ранее с помощью GPT 3.5 . Если вам интересно, как я создал этот набор данных и мотивация этого мини-проекта, вы можете обратиться к моему предыдущему блогу или блокноту , где я обсуждаю детали...

Технический отчет Google PaLM 2 подробно описывает достижения в области исследований нового семейства моделей

В апреле 2022 года Google представила свою языковую модель Pathways ( PaLM ) с 540 миллиардами параметров, которую они разработали с использованием нового подхода Pathways (Barham et al., 2022), который обеспечивает эффективное обучение модели на нескольких модулях TPU v4 (в PaLM). корпус, чипы 6144 TPU v4). Благодаря тому, что большие языковые модели (LLM) в настоящее время привлекают беспрецедентное внимание общественности и…

Точная настройка LLM с ограниченным бюджетом: история Muwa-OPT

В постоянно меняющейся области машинного обучения модели большого языка (LLM) изменили правила игры, революционизировав обработку естественного языка. Многие сложные модели обладают удивительной способностью генерировать человекоподобный текст, что делает их подходящими для широкого круга как повседневных, так и специализированных задач. Однако, как следует из названия, эти модели большие. Все модели, которые рассматривались до дебюта LLM, не могут сравниться с этими огромными..

Добро пожаловать в увлекательный мир генеративного ИИ

День 2 серии #100daygenai Добро пожаловать во второй день серии 100 дней . В качестве справки вы можете найти ссылку на День 1 здесь , где я обсуждал запуск сериала и его намерения. Сегодня мы раскроем невероятные возможности этой широко обсуждаемой технологии. От создания сюрреалистического искусства до синтеза человеческих голосов, от создания реалистичных человеческих лиц до написания целых эссе — что, если я скажу вам, что все это было создано не людьми, а машинами,..

Слишком много запросов за 1 час. Попробуйте позже.

Трудности заядлого пользователя chatGPT Если вы знакомы с chatGPT, вы, вероятно, видели это сообщение. На данный момент это проклятие моего существования. Итак, что нам делать, когда мы внезапно теряем доступ к инструментам будущего? Почему это так раздражает? Что это говорит о том, как мы будем использовать его в своей работе?