I migliori free software per l’OCR

ocr, optical character recognitionIn questi ultimi anni la tecnologia OCR (Optical Character Recognition) è molto migliorata: rispetto a prima, si nota una maggiore accuratezza e fedeltà al testo originale, e molti meno errori nel riconoscimento dei caratteri e dei segni di punteggiatura. Ora si riesce anche a conservare la formattazione del testo (colonne, tabelle, stili, ecc.), purché non ci sia nulla di troppo complicato.

Ciò permette di convertire piuttosto agevolmente qualsiasi testo cartaceo in formato digitale; da un’immagine (tiff, jpeg, ecc.) ricavata da un dispositivo di acquisizione (scanner, fotocamera o anche cellulare) si passa al txt, con tutti i vantaggi che ne conseguono: rintracciabilità, modificabilità, recupero di spazio, ecc.

Certo, pretendere sempre la perfezione è impossibile; il software OCR non può fare miracoli da solo: è tutto il processo di acquisizione che deve essere condotto in maniera ottimale e, obiettivamente, ci possono essere delle condizioni molto critiche, per cui anche un ottimo software avrebbe difficoltà. I risultati migliori si ottengono quando l’originale è in buono stato, quando si acquisiscono immagini ad alta risoluzione, quando i caratteri sono di dimensioni adeguate e non troppo fantasiosi.

Una volta l’OCR era possibile solo tramite specifici software a pagamento: tra i più diffusi, Omnipage e ReadIris. Ma ora  si può fare anche con software gratuiti, e addirittura con tool online (di cui parlerò in un prossimo articolo).

Ecco i migliori free software per l’OCR; ho avuto cura di indicare quali lingue supportano perché, per un risultato ottimale, è importante che il software riconosca la lingua in cui è scritto il testo che sta elaborando:

  1. Tesseract-ocr: la sua tecnologia è forse la migliore tra tutti i software OCR gratuiti. Funziona in ambiente Unix/Linux. Il suo sviluppo è sponsorizzato da Google. Molti software qui di seguito sono stati sviluppati basandosi su questo.
  2. FreeOCR: versione compilata per Windows di Tesseract-ocr;  è considerato il miglior software OCR che supporta anche la lingua italiana.
  3. OpenOCR (CuneiForm): supporta 20 lingue, tra cui l’italiano; riconosce il layout del testo (tabelle, colonne, ecc.).
  4. MoreDataFast: basato su Tesseract-ocr, funziona anche su Windows ed è decisamente più user-friendly. Supporta la lingua italiana.
  5. Ocropus: funziona su Linux e Mac, è molto promettente; il suo sviluppo è sponsorizzato da Google.
  6. TopOCR: pensato per essere usato con immagini acquisite da fotocamere digitali e telefonini. È multilingua (supporta l’italiano), e ha molte funzioni interessanti, tra cui anche un software Text-to-Speech incorporato. Funziona su Windows.
  7. OCR Desktop Application: riconosce 4 milioni di variazioni di font e supporta la lingua italiana.
  8. simpleOCR: supporta solo due lingue, inglese e francese, ma presto ne verranno aggiunte altre. Funziona su Windows.
  9. freeOCR: molto usabile, supporta la lingua italiana. Accetta vari formati di immagini, scansioni e pdf, e restituisce txt e word. Funziona con Windows.
  10. PDF OCR: funziona su Windows e supporta varie lingue, tra cui l’italiano.
  11. Omniformat: è un programma in grado di convertire vari tipi di file; scaricando un apposito modulo separato, svolge anche la funzione di software OCR: si basa su Tesseract-ocr, quindi funziona bene per la lingua inglese ma peggio per le altre lingue.

5 thoughts on “I migliori free software per l’OCR

  1. Pingback: I migliori strumenti online gratuiti per l'OCR | NoSatisPassion

  2. Con la presente chiedevo cortesemente se esiste un programma free ocr che oltre a leggere la zona rilevata,salva in automatico il file con il nome o la descrizione rilevata all’interno del file.
    Esempio dentro al file è presente il nome “MARIO ROSSI” chiedo se esiste un programma che identificando la zona dove è presente la scritta “MARIO ROSSI” salva il file automaticamente nominandolo MARIO ROSSI.
    Cordiali Saluti
    Giordano Degli Esposti

  3. Ciao Giordano, purtroppo non mi viene in mente nessun programma che faccia questo, mi spiace! ;(

  4. Possiedo un vecchio scanner HPscanjet 2200c, che funziona benissimo. Dove posso trovare un programma OCR più recente compatibile con lo scanner e con Word?

  5. @Alvaro Coli: Ciao Alvaro, dovrebbero essere compatibili tutti quelli elencati qua sopra.

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>