Tesseract

Tesseract

Tesseract.js е библиотека с JavaScript, която извлича думи на почти всеки език от изображения.
Tesseract.js е библиотека с JavaScript, която извлича думи на почти всеки език от изображения.Двигателят на Tesseract OCR беше един от първите 3 двигателя в теста за точност на UNLV от 1995 г.Между 1995 и 2006 г. не беше свършено много работа по него, но вероятно е един от най-точните налични OCR двигатели с отворен код.Изходният код ще чете двоично, сиво или цветно изображение и извежда текст.Вграден е тифър четец, който ще чете некомпресирани TIFF изображения или може да се добави libtiff за четене на компресирани изображения.Има езикови файлове за много езици, дори за набор от текст във шрифтове Fraktur и blackletter ....
tesseract

Характеристика

Алтернативи на Tesseract за Linux

GImageReader

GImageReader

gImageReader е обикновен Gtk / Qt преден край на Tesseract OCR Engine. Характеристики: - Импортиране на PDF документи и изображения от диск, сканиращи устройства, клипборд и екранни снимки
CuneiForm

CuneiForm

CuneiForm (OpenOCR) е софтуер за разпознаване на текст за печатни шаблони.Ръкописи или PDF-файлове, програмата обаче не може да разпознае, но структурите на таблиците.
CopyFish

CopyFish

Извличане и превод на текст от изображения / видео / PDF на всеки уебсайт.
OCRFeeder

OCRFeeder

OCRFeeder е анализ на оформлението на документи и система за разпознаване на оптични символи.
  • Безплатно
  • Linux
GOCR

GOCR

GOCR е програма за OCR (оптично разпознаване на символи), разработена съгласно GNU Public License.Той преобразува сканирани изображения на текст обратно в текстови файлове.
OCRopus

OCRopus

OCRopus (tm) е съвременен анализ на документи и OCR система, включващ подвижен анализ на оформлението, разпознаване на символи, статистическо моделиране на естествен език ...
  • Безплатно
  • Linux
VietOCR

VietOCR

Java / .NET GUI интерфейс за Tesseract OCR двигател.Поддържа оптично разпознаване на символи за виетнамски език.
OCRmyPDF

OCRmyPDF

OCRmyPDF добавя текстов слой OCR към сканирани PDF файлове, което им позволява да бъдат търсени или поставени чрез копиране.
WatchOCR

WatchOCR

WatchOCR е OCR сървър с отворен код, който създава pdfs за търсене от изображения от папка в гледана папка.
  • Безплатно
  • Linux
YAGF

YAGF

YAGF, още един графичен интерфейс за CuneiForm, е графичен интерфейс за ...
  • Безплатно
  • Linux