Привет!
Надеюсь у тебя все хорошо. Это вторая неделя моего путешествия по GSoC с mlpack, и это действительно потрясающе. Итак, я предполагаю, что вы знаете о mlpack и проекте, в противном случае просмотрите страницу mlpack’s GitHub и мой предыдущий блог.
Прогресс на этой неделе
На этой неделе я работал над реализацией загрузчика данных изображений с поддержкой набора данных PASCAL-VOC, а также CIFAR-10 / CIFAR-100. Он имеет следующие функции:
Класс увеличения.
Добавлено определение класса аугментации. Итак, теперь пользователи могут выполнять увеличение данных. Есть много дополнений, которые можно добавить, и, поскольку mlpack является организацией с открытым исходным кодом, мы будем очень признательны, если вы найдете время, чтобы внести свой вклад.
Использование
Загрузить набор данных обнаружения объектов
Читает все XML-файлы в каталоге и загружает соответствующие изображения в другой каталог. Если в наборе данных несколько объектов, я предлагаю использовать тип поля для загрузки данных, чтобы каждое изображение соответствовало всем его ограничивающим рамкам. В качестве альтернативы мы также поддерживаем загрузку данных в матрицы броненосцев.
Использование
Мы понимаем, что разные наборы данных обнаружения объектов могут не использовать одни и те же теги, поэтому вы также можете указать, какие теги синтаксический анализатор должен искать.
Интересным дополнением может стать преобразователь CSV в XML, который принимает CSV и генерирует XML, который может использоваться загрузчиком данных.
Расширением этой функции является загрузка изображений с использованием файлов XML для классификации, а не для обнаружения.
Загрузить изображения из каталога
Это обеспечивает функциональность, аналогичную потоку из каталога в Keras. Он загрузит все изображения и сгенерирует соответствующие ярлыки.
Какие новые наборы данных вы можете использовать?
Подводя итог, теперь мы поддерживаем набор данных PASCAL-VOC для обнаружения и классификации, а также CIFAR-10 для классификации.
Их можно просто использовать следующим образом:
На прошлой неделе я также работал над некоторыми служебными функциями, а также над документацией для загрузчика данных, которые теперь являются репозиторием моделей деталей.
Что дальше?
На этой неделе я планирую объединить загрузчик данных изображений с кодовой базой.
Помимо этого, я буду писать документацию по новым функциям и классу дополнений.
Я также буду внедрять класс Darknet, который предоставит пользователям предварительно обученные модели Darknet 19 и Darknet 53.
Некоторые рекомендации
В фильмах настоятельно рекомендую посмотреть «Основатель».
Что касается музыки, то я слушал Electric Guest’s Troubleman и RÜFÜS DU SOL’s Innerbloom.
В области машинного обучения в рамках исследования Facebook была опубликована статья Сквозное обнаружение объектов с использованием трансформаторов. Также взгляните на Open AI’s GPT-2, обученный написанию кода Python.
Благодарственное письмо
Спасибо замечательным наставникам и участникам сообщества за то, что помогли мне с предложениями и отзывами.