Публикации по теме 'information-retrieval'


Коррекция смещения выборки на основе LSH для поиска
В литературе по рекомендательным системам есть хорошо известный метод исправления этой предвзятости . Этот метод коррекции смещения выборки, также известный как коррекция log-Q, описан в этой статье Google . Основная идея состоит в том, чтобы получить хорошее приближение к знаменателю soft-max (также известному как функция разделения), используя документы в мини-пакете: q = query_embedding d_k = k-th document embedding d_0 = correct document embedding partition_function = sum over the..

WebGPT от OpenAI сканирует текстовую веб-среду для достижения производительности на уровне человека на длинных формах…
Любой, кто сдает экзамен, понимает лингвистические и другие проблемы, связанные с предоставлением ответов длиной в абзац на открытые вопросы по сравнению с простыми вопросами «да/нет» или вопросами с несколькими вариантами ответов. Такой развернутый вопрос-ответ (LFQA) представляет аналогичные проблемы в обработке естественного языка (NLP)…

Понимание методов поиска на основе терминов в поиске информации
Интуиция, стоящая за наиболее распространенными методами поиска на основе терминов, такими как BM25, TF-IDF, модель правдоподобия запроса. 1. Что такое поиск информации? Значение термина информационного поиска (IR) может быть очень широким. Например, достать свой идентификатор из кармана, чтобы вы могли напечатать его в документе, — это простая форма поиска информации. Хотя существует несколько определений IR, многие согласны с тем, что IR — это технология, позволяющая людям..

Вопросы по теме 'information-retrieval'

Хранение текстовых аннотаций NLP и доступ к ним
У меня есть большой корпус текста (около 10 миллионов предложений), который я хотел бы предварительно обработать с помощью различных инструментов НЛП (теггер POS, анализатор синтаксиса, анализатор зависимостей и т. д.). Мне нужно каким-то образом...
902 просмотров