Еженедельник AI Scholar: 4

Простая визуализация CNN, безопасные приложения Web ML, улучшенный поиск изображений лица, платформа для состязательного тестирования вредоносных программ на основе DL, эффективный синтез звука и многое другое!

Получайте стипендию AI: еженедельно прямо на свой почтовый ящик, подписавшись на информационный бюллетень

Ученый ИИ (AI 大事件) 现在有中文大了来读我们的每周时事通讯获取最新的 AI 研究见解

Включение визуализаций, готовых к публикации, с помощью Net2Vis

Основная цель Net2Vis - улучшить читаемость визуализаций за счет соблюдения правил визуальной грамматики за счет использования грамотно составленных визуальных кодировок. Он также включает абстракцию уровней за счет накопления уровней, что значительно снижает сложность сетевой архитектуры. Net2Vis также решает проблему времени, резко сокращая много часов, которые в прошлом использовались для создания готовых к публикации сетевых визуализаций. Не только это, но и подход также обеспечивает целостный и четкий дизайн визуализации.

Возможное использование и эффекты

Такой подход, как Net2Vis, упростит работу исследователей, позволив им легко создавать визуализации, которые уменьшают расплывчатость визуализации CNN. С другой стороны, читатели смогут понимать визуализацию без необходимости изучать языки визуального дизайна, специфичные для бумаги, что снижает вероятность ошибки на обоих концах. Если бы только этот же метод можно было бы расширить для визуализации для всех архитектур.

Подробнее: https://arxiv.org/abs/1902.04394v1

Код: https://github.com/viscom-ulm/Net2Vis

Разработка веб-приложений безопасного машинного обучения с помощью TensorSCONE Framework

Если вы хотите разрабатывать надежные и безопасные приложения машинного обучения (ML), исследователи рекомендуют TensorSCONE, безопасную аппаратно-ориентированную структуру машинного обучения на основе Intel SGX. TensorSCONE обеспечивает прозрачность и высокую производительность без ущерба для точности. В отличие от предыдущих моделей обеспечения конфиденциальности и целостности данных, дизайн и архитектура TensorSCONE основаны на TensorFlow и поддерживают как обучение, так и классификацию.

Эта структура использует достижения Intel SGX, чтобы обеспечить строгую конфиденциальность и гарантии целостности для любого приложения машинного обучения, развернутого в ненадежной веб-инфраструктуре. TensorSCONE был протестирован с помощью нескольких тестов, а также в реальном приложении и показал высокие характеристики безопасности и высокую производительность.

Возможное использование и эффекты

TensorSCONE предоставляет инженерам машинного обучения модель, которая помогает им разрабатывать и выполнять безопасные приложения машинного обучения с использованием частных и конфиденциальных данных без ущерба для точности и производительности. Кроме того, поскольку он основан на TensorFlow, одном из самых популярных фреймворков машинного обучения, он может поддерживать широкий спектр немодифицированных существующих приложений машинного обучения.

Подробнее: https://arxiv.org/abs/1902.04413v1

Улучшение оценки глубокой позы экстремальных и диких движений

В выпущенном методе применяется Post-Data Augmentation, чтобы помочь улучшить глубокую оценку позы человека при экстремальных и диких движениях. Как это работает? Путем дополнения входных данных техникой увеличения вращения и использования процедуры оценки позы более одного раза для каждого кадра. После этого наиболее последовательная поза и ее движения реконструируются для сглаживания. Новая модель систематически тестировалась, и результаты показывают, что это эффективный метод улучшения общего качества в сценариях оценки экстремальных или диких поз и нестандартных поз.

Возможное использование и эффекты

Этот алгоритм оценки глубокой позы можно использовать для различных захватов дикого / экстремального движения человека и модификации виртуальных аватаров, что было чрезвычайно сложно применить в прошлом. Метод дополнения пост-данных также может быть эффективно использован во многих приложениях HCI, UI и спортивной науки. Кроме того, этот метод вдохновляет на применение техник DNN для пользователей в областях приложений, выходящих за рамки полей машинного обучения.

Подробнее: https://arxiv.org/abs/1902.04250v1

Эффективное извлечение изображения лица с помощью техники (CMH-ECC)

Исследователи представили новую модель глубокого кросс-модального хеширования с исправлением ошибок (CMH-ECC), которая реализует растровое изображение для определения определенных лицевых атрибутов для достижения релевантного извлечения изображения лица из систем баз данных с использованием заданного атрибута запроса. Результаты тестирования, основанные на двух стандартных общедоступных наборах данных, показывают, что новая модель превосходит традиционные алгоритмы поиска изображений.

Хотя современные методы поиска изображений лиц дают впечатляющие результаты, правда в том, что они все еще не имеют эффективных процедур для уточнения атрибутов лиц при поиске изображений. Коды с исправлением ошибок в предлагаемой модели реализованы для уменьшения расстояния Хэмминга и повышения эффективности поиска за счет глубокого кросс-модального хеширования.

Кроме того, CMH-ECC выполняет поиск изображения лица с использованием точечных данных без необходимости использовать парные или тройные входные данные для обучения, что делает его масштабируемым до чрезвычайно огромных наборов данных.

Возможное использование и эффекты

Благодаря новой модели CMH-ECC исследователи, дизайнеры и разработчики теперь могут получать изображения лиц с точным соответствием и улучшенными результатами. Модель также может стать началом эволюционных высокопроизводительных приложений машинного обучения нового поколения, основанных на изображениях лиц. Это может улучшить системы безопасности на основе камер.

Подробнее: https://arxiv.org/abs/1902.04139v1

Простые универсальные настройки для обучения модели обнаружения объектов для повышения точности

Исследователи недавно изучили настройки обучения универсальной модели, которые могут помочь повысить производительность модели обнаружения объектов без увеличения вычислительных затрат. Результаты тестирования показали, что с помощью этих перков можно достичь примерно 5-процентного увеличения абсолютной точности при обучении обнаружению объектов, о чем должен подумать каждый инженер ИИ, подающий заявку.

Во-первых, исследователи изучают метод смешивания при обнаружении объектов и распознают особые свойства в нескольких задачах обнаружения объектов, которые помогают в преобразованиях с сохранением пространства. Исходя из этого, они предлагают смешанное визуально связное изображение для любых задач обнаружения объектов. Во-вторых, они исследуют комплексные конвейеры обучения, такие как планирование скорости обучения, снижение веса и скоординированный BatchNorm. Наконец, они исследуют эффективность предлагаемых улучшений обучения, постепенно собирая их для обучения одно- и многоступенчатых моделей обнаружения объектов.

Возможное использование и эффекты

Кому в сообществе исследователей ИИ не нужны бесплатные подарки, которые помогают улучшить их работу? Объединение и внедрение этих настроек означает, что исследователи получают легкий путь для обучения моделей детекторов объектов с дополнительными вычислительными затратами. Подобные исследования также помогают ученым и инженерам разрабатывать усовершенствованные и более эффективные алгоритмы обнаружения объектов в будущем.

Подробнее: https://arxiv.org/abs/1902.04103v1

Примеры состязательных программ IoT-систем для надежной среды тестирования

Ученые и исследователи в области безопасности искусственного интеллекта считают критически важным наличие основы для тестирования надежности систем обнаружения вредоносных программ Интернета вещей. Признавая, что современные методы создания состязательных выборок в основном требуют параметров обучающей модели и большинство из них нацелены на данные изображений, исследователи предложили методику проверки F для L основанные на доходах системы защиты A ndroid M для устройств IoT (TLAMD), которые помогают защитить устройства IoT от злонамеренных образцов.

Это просто - если результаты тестирования фреймворка показывают, что система обнаружения вредоносных программ не может защитить от вредоносных образцов, то это красный флаг, и система требует усиления. TLAMD фокусируется на создании эффективных состязательных образцов, которые являются ключевым элементом инфраструктуры тестирования без знания параметров модели.

Возможное использование и эффекты

За счет интеграции генетических алгоритмов и конкретных технических усовершенствований TLAMD может создавать состязательные образцы для приложений Android IoT с почти 100% -ным успехом, а также может использоваться для тестирования системы черного ящика. Это преимущество для аналитиков и разработчиков в области безопасности машинного обучения, поскольку такой подход показывает надежду и высокий потенциал в отношении разработки надежных алгоритмов обнаружения вредоносных программ Android на основе обучения для устройств Интернета вещей.

Подробнее: https://arxiv.org/abs/1902.04238v1

Достигните деидентификации, не теряя лица

Новое исследование предлагает новый метод деидентификации лица, который не только скрывает личность, но и сохраняет высокое визуальное качество необходимых черт лица. Основанный на глубокой нейронной сети, новый алгоритм не вносит изменений в исходные лица и не синтезирует новые, а использует предварительно обученную модель переноса атрибутов лица для сопоставления неидентификационных атрибутов лица ряду согласованных доноров лица, что позволяет получить естественное лицо. внешний вид, одновременно обеспечивая идентичность изменений синтезируемых данных. Результаты тестирования на множестве наборов данных изображений и видео оказались положительными, что демонстрирует эффективность модели.

Возможное использование и эффекты

С помощью этого нового метода исследователи искусственного интеллекта могут быть уверены, что смогут добиться деидентификации лиц без потери исходного качества данных и при этом избежать возможных судебных исков по идентификации лиц. Это также значительно способствует развитию приложений компьютерного зрения в том смысле, что позволяет улучшить разнообразие исходных наборов данных за счет введения случайности в процесс генерации изображения / видео. Кроме того, этот подход может быть расширен для обработки окклюзий лица и вариаций позы головы.

Подробнее: https://arxiv.org/abs/1902.04202v1

Частотно-временные характеристики с TiFGAN для эффективного синтеза звука

Генеративные состязательные сети (GAN) позволили добиться огромного прогресса в генеративном моделировании, особенно в области манипулирования изображениями и открытия лекарств. Однако их использование выходит за рамки этих приложений и может применяться для обеспечения эффективного естественного воспроизведения звука. По крайней мере, согласно презентации в этой недавней исследовательской работе.

Обучая GAN кратковременным функциям Фурье, исследователи продемонстрировали потенциальный потенциал продуманного генеративного моделирования TF. Они предлагают основанную на TF модель, TiFGAN, которая использует GAN для достижения высококачественного синтеза звука, узнавая, как оценивать качество представления TF.

TiFGAN был протестирован на обычных моделях. Он превосходит современные алгоритмы генерации сигналов GAN, несмотря на то, что в обеих и традиционных моделях реализована схожая сетевая архитектура. TiFGAN также является недорогим в вычислительном отношении с большим потенциалом для упрощения оценки сходимости во время обучения модели.

Возможное использование и эффекты

Этот новый подход к моделированию устраняет ухудшение качества и искажения при синтезе звука и действительно демонстрирует потенциал сна в сетях GAN, который можно исследовать и использовать для генерации единовременных полных сигналов для еще более эффективного синтеза звука. И если состязательная генерация частотно-временных характеристик может быть применена для эффективного синтеза звука, это также означает начало прогрессивного пути для исследовательского сообщества ИИ в попытках углубиться в GAN для более эффективного и действенного синтеза звука.

Подробнее: https://arxiv.org/abs/1902.04072v1

Краткий рассказ о влиянии технологий искусственного интеллекта

Семейный альбом

У меня старое семейное фото. Он блеклый, местами с рваными краями и порванный на одном из углов, и из-за этого я люблю его больше всего на свете. Из-за другого фото.

На этой другой фотографии был показан день на пляже, когда мы, дети, играем со смехотворно дружелюбным золотистым ретривером, которого мы встречали на один день и которого вспоминали на долгие годы.

Вот только я не помнил ту собаку - я вспомнил, что это был наш шоколадный лабрадор.

"Но тогда у нас не было даже Бесси!" - сказала мама, когда я нашла фото и задала вопрос. «Именно тот день на пляже убедил нас купить для вас собаку».

Я хочу сказать, что воспоминания - это не то, что люди думают о них.

Поговорите с друзьями, поговорите со своими семьями о былых временах и послушайте, что они говорят в первую очередь - прежде чем у вас будет возможность сравнить записи и прийти к единому мнению о реальности прошлого.

Воспоминания - это в лучшем случае руководство.

Когда-то у людей не было фотографий, а если они были богаты и имели портреты, то требовалась и даже требовалась определенная художественная лицензия. Позже у всех был семейный альбом, который просуществовал столько, сколько он существовал, прежде чем он был утерян из-за некачественной обработки фотографий, или пожара, или просто неуместного.

В те дни люди понимали, что прошлое - это мнение, а мнения расходились.

Затем у нас появилась цифровая фотография, хранилище и резервное копирование, и внезапно прошлое навсегда ушло в прошлое.

Мы вступили в эпоху телефонных камер, камер видеонаблюдения, нательных камер. С таким потоком информации было невозможно найти достаточное количество людей, чтобы потратить достаточно времени, чтобы изучить все это с какой-либо целью, какой бы важной она ни была. Нам было нужно признание, и мы его получили.

Однако это был кратковременный бум. Автоматическое распознавание объекта или человека на изображении не так уж и далеко от предположений о том, как объект будет выглядеть на изображении. Вставляем его. До того, как признание достигло своего пика, его ценность была ограничена ужасной истиной о том, что ничто в изображениях, неподвижных или движущихся, хранимых или хранимых в реальном времени, больше не может считаться надежным.

Конечно, люди утверждали, что могут отличить разницу - это можно было определить по некоторым пикселям, - но это все еще было вопросом мнения среднего человека, который ничего не понимал. Дни, когда изображения были доказательством чего-либо, прошли.

Уверена, что с нашими детьми все будет хорошо. Они растут в мире, где изображения ненадежны, субъективны, временны. Раньше все работало нормально, и после этого все будет нормально. Но для нескольких поколений, которые привыкли доверять увиденному, все изменится. Мы хранили наши воспоминания в этих вещах, а потом эти вещи нас подвели.

Итак, я сижу здесь с этими семейными фотографиями, слишком старыми, слишком аутентичными, слишком аналоговыми на самом деле и по происхождению, чтобы кто-то мог манипулировать или подделать, и я пытаюсь вспомнить.

Они будут длиться столько, сколько будут.

Спасибо за чтение. Если у вас есть предложения, комментарии или другие мысли, вы можете связаться со мной по адресу [email protected] или написать мне в Твиттере
@cdossman

Еженедельник AI Scholar: 4