Pagina 1 di 2
OCR Scanner riconoscimento
Inviato: domenica 6 settembre 2020, 23:21
da dinfh
Domandona da un milione di dollaroni.
ma esiste un programma che riesce a riconsocere le parole degli atti, per la parte scritta a mano ( a volte con scrittura pessima)
So che è impossibile e mi toccherà gestire tutto a mano, ma magari qualcuno ha trovato la pietra filosofale del ricercatore disperato. Almeno per gli indici.
Grazie a tutti
Re: OCR Scanner riconoscimento
Inviato: lunedì 7 settembre 2020, 8:53
da Matteorm83
Penso che un algoritmo di intelligenza artificiale per l'analisi di immagini opportunamente progettato e "allenato" potrebbe produrre qualche risultato. Ovviamente, qualunque risultato prodotto andrebbe comunque validato da un umano.
Re: OCR Scanner riconoscimento
Inviato: lunedì 7 settembre 2020, 21:52
da dinfh
Ve’ certamente. Ma già se fa una parte del lavoro sarebbe un bel risultato. Sapere se esiste qualcosa in commercio da cui partire ?
Re: OCR Scanner riconoscimento
Inviato: lunedì 23 novembre 2020, 15:46
da dinfh
ma nessuno vuole approfondire l'argomento ? nessuno sente la necessita' di farsi aiutare da Machine Learning, Algoritmi, AI, etc ?
Riporto: "
Proprio per preservare l’immenso patrimonio culturale e digitalizzare i manoscritti di ogni epoca, rendendoli accessibili al pubblico, è nato nel gennaio 2016 il progetto europeo READ (Recognition and Enrichment of Archival Documents) e lo sviluppo della piattaforma Transkribus. Austria, Svizzera, Germania, Grecia, Spagna, Finlandia, Francia e Regno Unito collaborano unite alla realizzazione di un software che, opportunamente istruito, può riconoscere la grafia di un manoscritto e proseguire automaticamente al riconoscimento dei caratteri. Ad oggi con un margine d’errore fino al 3,5% circa." ... ed aggiungo ..."N
on solo. Siamo tutti chiamati a dare un contributo, partecipando attivamente alle trascrizioni.
Il motore che sta dietro a questa tecnologia viene continuamente affinato, imparando anche dai propri errori. Quindi, più manoscritti vengono inseriti ed elaborati nel sistema, maggiore sarà la capacità di elaborazione e la percentuale di riconoscimento corretto." cit. (
https://www.webnauta.it/wordpress/trans ... noscritti/).
Nei prossimi giorni e con la clausura forzata che viviamo di questi tempi, spero di approfondire un po' di piu'. Chiunque voglia seguirmi ed aiutarmi (a comprendere e migliorare) e' benvenuto.
Dino

Re: OCR Scanner riconoscimento
Inviato: lunedì 23 novembre 2020, 15:59
da dennisangemi02
Sono super interessato e ti ringrazio per questo link spettacolare che non avevo ancora trovato. Lo proverò presto, puoi contattarmi anche in privato se vuoi (potremmo scambiarci consigli/dritte)
Re: OCR Scanner riconoscimento
Inviato: lunedì 23 novembre 2020, 22:23
da Matteorm83
Ragazzi,
Bisogna iniziare a smanettarci subito, anche perché istruire l'AI con testi giá trascritti richiederá del tempo! Peccato che a questa collaborazione non partecipi nessuna realtá italiana.
Re: OCR Scanner riconoscimento
Inviato: lunedì 23 novembre 2020, 22:31
da dennisangemi02
Matteorm83 ha scritto: ↑lunedì 23 novembre 2020, 22:23
Peccato che a questa collaborazione non partecipi nessuna realtá italiana.
Sono d'accordo sul cominciare a lavorare subito ma pare che ci siano due enti italiani che collaborano con il progetto transkribus
https://readcoop.eu/members/ : Fondazione Banco di Napoli e Max-Planck Gesellschaft zur Förderung der Wissenschaften e.V.
Re: OCR Scanner riconoscimento
Inviato: martedì 24 novembre 2020, 12:25
da dinfh
nel provo a vedere come funziona il tutto e come si puo' collaborare. approccio pratico. vi aggiorno non appena riesco a dedicarci il tempo necessario. per adesso loggato e scaricato il programma.
Re: OCR Scanner riconoscimento
Inviato: martedì 24 novembre 2020, 15:49
da Jfk105
nel provo a vedere come funziona il tutto e come si può collaborare. approccio pratico. vi aggiorno non appena riesco a dedicarci il tempo necessario. per adesso loggato e scaricato il programma.
Ciao ho scaricato anch'io il programma e anche l'app di scansione DocScan sullo smartphone (non ho la tenda che mostrano però, eh ehe eh)...
Mi sono autenticato e ho provato a caricare un documento (non scansionato ma upload direttamente dal pc).
Al momento non c'è la lingua italiana tra quelle che usano ma, va beh, proviamo lo stesso

PURTROPPO a me il programma Transkribus su Windows non parte (credo sia un problema con Java ma non posso smanettare troppo poichè è il pc che uso per lavoro, ho provato anche con il batch allegato e da riga di comando ma non c'è verso...).
Quindi al momento sono fermo al mio documento caricato ma che mi dice che occorre (in inglese) "eseguire un'analisi del file" ma visto che il programma in locale non mi funziona qui mi sono fermato...
Devo dire che è tutto molto poco spiegato (per nulla, direi) e quindi anche un po' ostico...
Ciao,J
ps: Cmq è davvero un bel progetto
Re: OCR Scanner riconoscimento
Inviato: domenica 6 dicembre 2020, 0:35
da dinfh
Proseguo nel lavoro, con lentezza, ma mi sono un po' perso. Provo a scrivere ai signori del sito per avere assistenza
Re: OCR Scanner riconoscimento
Inviato: domenica 27 dicembre 2020, 14:05
da dinfh
Il lavoro prosegue, anche se molto lentamente. Mi hanno autorizzato ad iniziare un modello apposito per la scrittura dei miei archivi. Ho provato ad applicare il modello ai testi scritti e devo dire che ha un ottimo livello di accuratezza. Certo siamo ancora lontani dalla perfezione, ma l'algoritmo funziona così: va per curva di esperienza ed adattamento.
Re: OCR Scanner riconoscimento
Inviato: domenica 27 dicembre 2020, 14:07
da dinfh
... volevo aggiungere una foto del lavoro, ma non mi ricordo come si fa
Re: OCR Scanner riconoscimento
Inviato: domenica 27 dicembre 2020, 16:23
da dinfh
Re: OCR Scanner riconoscimento
Inviato: domenica 27 dicembre 2020, 19:04
da Matteorm83
Mi sembra un ottimo risultato! Io non ho ancora avuto tempo di mettermici ma ho grandi aspettative. Ho una domanda: funziona bene anche nel caso di manoscritti elaborati a piú mani? Ad esempio ho degli atti di 15/20 pagine dove compaiono 3 o 4 calligrafie differenti.
Re: OCR Scanner riconoscimento
Inviato: domenica 27 dicembre 2020, 20:11
da Jfk105
@Dinfh
Il lavoro prosegue, anche se molto lentamente. Mi hanno autorizzato ad iniziare un modello apposito per la scrittura dei miei archivi. Ho provato ad applicare il modello ai testi scritti e devo dire che ha un ottimo livello di accuratezza. Certo siamo ancora lontani dalla perfezione, ma l'algoritmo funziona così: va per curva di esperienza ed adattamento.
Ciao scusa ma da dove lo usi? pc? Che versione hai? (Windows, intendo)
Perchè a me proprio non funziona su Windows 10, tu come hai proceduto per l'installazione? Siccome ho letto che volevi contattare il loro supporto, ti hanno dato per caso una sorta di procedura / di guida?
Grazie mille
Ciao
J
ps se hai un walkthrough oppure un link dove seguire passo passo il setup te ne sarei grato
