Распознавание текста используется в рукописном или печатном тексте в машинно-кодированном тексте, будь то из отсканированного документа, фотографии документа, фотографии сцены или из текста субтитров, наложенного на изображение. мы будем говорить как о печатном, так и о почерке.

При распознавании печатных символов мы использовали алгоритм OCR, и это простой способ конвертировать изображения в текст, а затем мы можем сделать много вещей с этим текстом, например, заставить браузер произнести его.

OCR (оптическое распознавание символов) — это распознавание печатных или письменных текстовых символов компьютером. Это включает в себя фотосканирование текста посимвольно, анализ отсканированного изображения, а затем преобразование изображения символа в коды символов, такие как ASCII, обычно используемые при обработке данных.

Итак, чтобы использовать OCR в javascript... сначала нам нужно включить файл ocrad.js в файл HTML, а затем использовать функцию OCRAD следующим образом.

let image = document.getElementById(“image”);
let string = OCRAD(image);

как показано, функция OCRAD берет изображение и преобразует его в строку.

Распознавание рукописного ввода
Я использовал онлайн-распознавание и работает исключительно с цифровыми чернилами в качестве ввода. Цифровые чернила можно определить как серию штрихов. Штрих определяется как траектория движения пальца или стилуса с момента его касания области письма до момента, когда он снова поднимается. Он представлен в виде последовательности двумерных точек (x;y), упорядоченных по времени (t). Таким образом, цифровые чернила относятся к динамическому процессу, который учитывает, где начинаются штрихи, где они заканчиваются и в каком порядке они были нарисованы.

он использует анализ признаков с использованием базового метода, такого как u. Например, буквы «a», «c», «e» полностью находятся в средней зоне, а такие буквы, как «b», «d», также расширены до верхней зоны. Такие символы, как «i», «j», имеют бинарное свойство наличия точки. [13] Кроме того, небинарные признаки также могут быть разделены на пространство решений с помощью пространства признаков коэффициентов Фурье.

мы можем использовать API MyScript для преобразования рукописного текста в текст, поскольку он берет холст, где почерк пишется на холсте, затем преобразуется в изображение, а затем распознает текст внутри него. MyScript использует нейронную сеть для обучения данных.

Таким образом, мы можем делать то, что хотим, с помощью JavaScript ❤

Наслаждайтесь демонстрацией

Исходный код вы можете найти здесь.