Простое сопоставление строк и контролируемая модель для BioNER

Стефан Тулкенс, инженер по машинному обучению в Slimmer AI, недавно провел тематическое исследование в журнале Towards Data Science под названием « Делать почти столько же с гораздо меньшими затратами: пример биомедицинского распознавания именованных сущностей ».

В начале любого нового проекта НИОКР я стараюсь найти наиболее подходящее решение проблемы - внедрение решения в производство без ущерба для результатов, которые я хотел бы поддержать.

В своем исследовании Стефан использовал систему сопоставления строк QuickUMLS в качестве классификатора для набора данных MedMentions. Его цель заключалась в том, чтобы увидеть, сможет ли он конкурировать с контролируемой моделью в задаче биомедицинского распознавания именованных сущностей (BioNER). В отсутствие огромного количества обучающих данных этот подход дал надежные результаты и является простым способом реализации в продукте.

Подпишитесь на нас в LinkedIn и Twitter, чтобы увидеть больше подобных историй.