71
Tesseract.js е библиотека с JavaScript, която извлича думи на почти всеки език от изображения.Двигателят на Tesseract OCR беше един от първите 3 двигателя в теста за точност на UNLV от 1995 г.Между 1995 и 2006 г. не беше свършено много работа по него, но вероятно е един от най-точните налични OCR двигатели с отворен код.Изходният код ще чете двоично, сиво или цветно изображение и извежда текст.Вграден е тифър четец, който ще чете некомпресирани TIFF изображения или може да се добави libtiff за четене на компресирани изображения.Има езикови файлове за много езици, дори за набор от текст във шрифтове Fraktur и blackletter ....
tesseract
Характеристика
Категории
Алтернативи на Tesseract за Linux
35
GImageReader
gImageReader е обикновен Gtk / Qt преден край на Tesseract OCR Engine. Характеристики: - Импортиране на PDF документи и изображения от диск, сканиращи устройства, клипборд и екранни снимки
9
8
6
5
5
4
4
3