Публикации по теме 'large-language-models'


Инструменты и агенты HuggingFace Transformers: практический опыт
Трансформеры версии 4.29.0, основанные на концепции инструментов и агентов, предоставляют API на естественном языке поверх трансформеров. Как их использовать? Давайте углубимся в них, используя изучение языка в качестве примера использования! Что такое агенты и инструменты? «Агент» здесь — это большая языковая модель, и мы подсказываем ему, чтобы он имел доступ к определенному набору инструментов. LLM хорошо генерируют небольшие образцы кода, поэтому этот API использует это..

Правильный способ делать подсказки с несколькими выстрелами
Заставить LLM выполнять определенные задачи долгое время было постоянной проблемой. В то время как LLM демонстрируют впечатляющий интеллект и возможности естественного языка, заставить LLM выводить определенные структурированные форматы по-прежнему сложно. Например, если LLM проходит тест с множественным выбором — в то время как люди могут выбирать конкретные варианты ответов или кружиться в кружке на листе ответов, LLM могут отвечать только с выходным текстом. Чтобы автоматически..

Лучший способ определить релевантность слова: понять TF-IDF в спешке
Как Интернет узнает, какие термины наиболее точно отражают содержание документа? Подсказка: дело не только в громкости вступление Уходя корнями в 1950-е годы, TF-IDF является краеугольным камнем для современных приложений, которые пытаются определить релевантность каждого слова в документе. На первый взгляд, можно было бы использовать простой подход, рассматривая количество слов или количество терминов (т. е. «сколько раз появлялся каждый термин?»). TF-IDF делает большой шаг..

Навигация в мире генеративного ИИ: руководство по основной терминологии
Изучите основные термины и понятия, которые вам необходимо знать, чтобы ориентироваться в быстро развивающемся мире генеративного ИИ. Генеративный ИИ — увлекательная и быстро развивающаяся область, которая может изменить то, как мы взаимодействуем с технологиями. Однако при такой шумихе…

Gorilla: Расширение возможностей языковых моделей с массовой интеграцией API
В последние годы в области обработки естественного языка (NLP) произошли значительные успехи, особенно благодаря разработке больших языковых моделей (LLM), таких как GPT-3.5. Одним из новаторских проектов, поднявших NLP на новый уровень, является Gorilla, лицензированный Apache 2.0 LLM, специально разработанный для точного взаимодействия с более чем 1600 API. Благодаря своей исключительной способности вызывать API-интерфейсы на основе запросов на естественном языке, Gorilla уменьшила..

Использование Azure OpenAI для пользовательского чат-бота
Наконец-то я получил доступ к Azure OpenAI, поэтому пересоздал свой предыдущий пример для работы с Azure OpenAI. В целом он похож, а различия выделены в этом документе Azure . Также есть небольшие изменения в LangChain и LlamaIndex. Вам необходимо выполнить предварительные шаги , задокументированные до продолжения. Это может занять несколько дней, так как вам нужно отправить форму, и кто-то в Microsoft должен ее утвердить. Шаги аналогичны описанным ранее ( пожалуйста, смотрите..

NVIDIA выпустит Megatron530B, LLM в 3 раза больше, чем GPT-3!
Что сейчас произойдет? NVIDIA собирается выпустить NeMo LLM, сервис, предоставляющий средства использования больших языковых моделей, обученных на различных платформах. Разработчики могут использовать NeMo LLM для развертывания корпоративных ИИ-приложений в облаке. Самым захватывающим аспектом является то, что пользователи могут испытать Megatron 530B, одну из крупнейших языковых моделей, через службу NeMo LLM. Что такое Мегатрон 530B? В 2021 году NVIDIA и Microsoft совместно..