Публикации по теме 'compositionality'


Композиционное обучение и анализ
В последнее время появилось много моделей глубокого обучения, дающих удивительно отличные результаты в мультимодальных задачах преобразования текста в изображение. Производительность DALL-E, GLIDE, Imagen и различных других моделей, хотя и имеют разные подходы к этой проблеме, но все они зависят от одного фактора: насколько хорошо текстовая модель способна создавать представления входной подсказки. И это не ограничивается только моделями генерации текста в изображение, но и всеми теми..