Привет!

Надеюсь у тебя все хорошо. Это вторая неделя моего путешествия по GSoC с mlpack, и это действительно потрясающе. Итак, я предполагаю, что вы знаете о mlpack и проекте, в противном случае просмотрите страницу mlpack’s GitHub и мой предыдущий блог.

Прогресс на этой неделе

На этой неделе я работал над реализацией загрузчика данных изображений с поддержкой набора данных PASCAL-VOC, а также CIFAR-10 / CIFAR-100. Он имеет следующие функции:

Класс увеличения.

Добавлено определение класса аугментации. Итак, теперь пользователи могут выполнять увеличение данных. Есть много дополнений, которые можно добавить, и, поскольку mlpack является организацией с открытым исходным кодом, мы будем очень признательны, если вы найдете время, чтобы внести свой вклад.

Использование

Загрузить набор данных обнаружения объектов

Читает все XML-файлы в каталоге и загружает соответствующие изображения в другой каталог. Если в наборе данных несколько объектов, я предлагаю использовать тип поля для загрузки данных, чтобы каждое изображение соответствовало всем его ограничивающим рамкам. В качестве альтернативы мы также поддерживаем загрузку данных в матрицы броненосцев.

Использование

Мы понимаем, что разные наборы данных обнаружения объектов могут не использовать одни и те же теги, поэтому вы также можете указать, какие теги синтаксический анализатор должен искать.

Интересным дополнением может стать преобразователь CSV в XML, который принимает CSV и генерирует XML, который может использоваться загрузчиком данных.

Расширением этой функции является загрузка изображений с использованием файлов XML для классификации, а не для обнаружения.

Загрузить изображения из каталога

Это обеспечивает функциональность, аналогичную потоку из каталога в Keras. Он загрузит все изображения и сгенерирует соответствующие ярлыки.

Какие новые наборы данных вы можете использовать?

Подводя итог, теперь мы поддерживаем набор данных PASCAL-VOC для обнаружения и классификации, а также CIFAR-10 для классификации.

Их можно просто использовать следующим образом:

На прошлой неделе я также работал над некоторыми служебными функциями, а также над документацией для загрузчика данных, которые теперь являются репозиторием моделей деталей.

Что дальше?

На этой неделе я планирую объединить загрузчик данных изображений с кодовой базой.

Помимо этого, я буду писать документацию по новым функциям и классу дополнений.

Я также буду внедрять класс Darknet, который предоставит пользователям предварительно обученные модели Darknet 19 и Darknet 53.

Некоторые рекомендации

В фильмах настоятельно рекомендую посмотреть «Основатель».

Что касается музыки, то я слушал Electric Guest’s Troubleman и RÜFÜS DU SOL’s Innerbloom.

В области машинного обучения в рамках исследования Facebook была опубликована статья Сквозное обнаружение объектов с использованием трансформаторов. Также взгляните на Open AI’s GPT-2, обученный написанию кода Python.

Благодарственное письмо

Спасибо замечательным наставникам и участникам сообщества за то, что помогли мне с предложениями и отзывами.