OCR: riconoscimento ottico dei caratteri e l’archiviazione facile

La scorsa settimana abbiamo trattato l’argomento ricerca Full Text, come trovare un documento anche quando ci si ricorda solo una parola del testo in esso contenuto. Oggi poniamo l’accento sull’archiviazione dei documenti cartacei, inserendoli ad esempio con uno scanner.

In questo modo diventano documenti digitali e possono essere indicizzati utilizzando i metadati, le informazioni sul documento. Esiste però una forma di acquisizione che può supportare l’utilizzo della ricerca Full Text anche sui documenti testuali acquisiti per scansione: si chiama OCR (Optical Character Recognition). E’ un sistema in grado di riconoscere il testo dall’immagine del documento, interpretarlo e trasformarlo in testo digitale modificabile con un normale editor (word, notepad o altri). Cliccando questo link è possibile approfondire la storia e le varie peculiarità di questa utile tecnologia.

Tra gli sviluppi e le applicazioni più interessanti possiamo segnalarvi quella di Laserfiche con il modulo Quick Fields permette la cattura automatica delle informazioni critiche sia dai documenti di carta che elettronici e li organizza per un veloce ricupero. Migliora, inoltre, la qualità delle immagini scannerizzate con funzionalità quali rotazione, rimozione linee, ritaglio immagine, aggiustamento immagine, ecc… Lo strumento Zone OCR è una estensione di Quick Fields riconosce il testo in zone prescelte nei documenti che si vogliono processare (un esempio è l’estrazione dei codici fiscali da un bollettino ICI) per una rapida cattura e riempimento dei campi di indicizzazione.

Archiviazione file: qualche idea…

L’azione di archiviare è una delle operazioni più frequenti quando si utilizza un PC (a volte è anche automatizzata). Più conosciuta come ‘Salva’ (o ‘Salva con nome’) tutti, anche i meno confidenti e preparati la effettuano almeno una volta al giorno.

Ci troviamo quindi di fronte a due scelte: la posizione in cui mettere il nostro file e il nome da affidargli. Spesso, in questo ultimo caso, la realtà supera la fantasia… :-) . Dopo alcune esperienze con nomi, acronimi, codici e denominazioni al limite del criptico, abbiamo pensato di condividere un elenco di consigli su come nominare i file, non esaustivo ma nel quale speriamo possiate trovare qualche utile spunto.

  1. Utilizzare nomi brevi e semplici da ricordare;
  2. Evitare gli acronimi formati da una o due lettere;
  3. Il file potrebbe necessitare di una data. Utilizzando la notazione americana (anno/mese/giorno), l’ordinamento dei file andrà di conseguenza secondo l’anno, il mese e il giorno;
  4. Se volete ordinarli numericamente (o per data) i numeri da 1 a 9 è meglio farli precedere da 0, così l’ordine rimarrà invariato anche con numeri da due cifre in su;
  5. Meglio evitare gli spazi, piuttosto utilizzate gli underscore (trattino basso): _ ;
  6. Utilizzare delle sigle per sintetizzare qualche cosa di inerente al documento stesso (‘rev’ al fondo del nome per dire che è una revisione, iniziali nome e cognome per indicare chi l’ha creato, V o A per documenti di vendita o acquisto, ecc…)

Avete altri suggerimenti? Che piccoli trucchetti utilizzate per ‘salvare’ i vostri file? Se volete condivideteli nei commenti, in questi campi, c’è sempre da imparare… :-)

Ecologia e firme automatiche…

Una buona percentuale della nostra vita si concentra sul posto di lavoro. Escludendo quelli che ancora oggi possiamo annoverare tra i commessi viaggiatori, purtroppo o per fortuna stiamo all’interno di uffici, fabbriche, studi, scuole e altri ambienti per parecchie ore durante l’anno. Possiamo dire che, proprio questi luoghi, sono il nostro ‘habitat’.

I consigli per comportamenti sostenibili non bastano mai e devono essere sempre tenuti a mente, quindi ci siamo chiesti se esistessero delle regole per praticare la sostenibilità proprio nell’ambiente di lavoro. Cercando sul web, abbiamo selezionato un post in particolare, brillante e spiritoso: Eco Business 10 regole per un ufficio ecologico!

Ci vogliamo soffermare sul punto 3.
Go Paperless non è solo una questione di affidarsi ad un sistema di gestione elettronica dei documenti, ma soprattutto di non stamparli quando non è necessario. Specie quando si tratta di e-mail… vi facciamo un piccolo, ma utile regalino, aggiungete queste righe alla vostra firma automatica:

Before printing think about environment and costs
Prima di stampare pensa ai costi ambientali

photocredits: bombilladesign