Nwlapcug.com


Come utilizzare Tesseract OCR in Java

Librerie di Tesseract OCR offrono agli sviluppatori un metodo per eseguire la scansione documenti e testo a un'immagine. Si utilizzano le librerie di Tesseract per memorizzare le immagini dei documenti che non sono più necessari in formato cartaceo. Si utilizzano librerie di Tesseract in Java scorrendo la pagina di ogni personaggio e il carattere di scrittura in un file. Per utilizzare le librerie, è necessario includere lo spazio dei nomi di Java per le funzioni di OCR.

Istruzioni

1

Pulsante destro del mouse il file Java che si desidera utilizzare per creare il documento di OCR. Fare clic su "Apri con" e selezionare il vostro editor preferito di Java.

2

Aggiungere lo spazio dei nomi di libreria OCR nella parte superiore del file. Copiare e incollare il codice seguente al file di codice sorgente:

com.tplan.robot.imagecomparison.tesseractocr

3

Creare il codice che analizza i caratteri nel file. Per esempio, il codice riportato di seguito scorre in ciclo ogni carattere in un file e lo scrive in un file immagine:

Linee di var = 0
Metodo CompareTo = "tocr" cmparea = ": x33, y:2, w:200, h:22"
per (i = 1; {i} < {linee} + 1; i = {i} + 1) {
TypeLine "{_TOCR_LINE {i}}"
}

4

Fare clic sul pulsante "Salva" dell'editor Java e clicca su "Esegui" per eseguire il codice in un debugger di Java.