fredag 25 oktober 2013

How to make a searchable pdf of a scanned document

This is a translation of an earlier article in swedish here on Blogger.


Karlstad has a long history of learning.
High-school and senior high school has it's origin in the  15th/16th century.
-.

Besides his targe collection of portrait photos  (6.000!), collected by  Major CE Nygren (born 1874), he was a very productive author of books in local history. (scanning and publication on Internet of some of his works has just started).

Among his publications:
"Biografiska anteckningar öfver lärjungar intagna vid Karlstads högre allm. läroverk
Approx. "Biographical notes on pupils attending the high-school in Karlstad""

The first to be scanned is the volume 1850-63,

Example of pages in the pdf-version.


The scanning of this first volume is somewhat of a pilot project and it's goal is to produce a searchable pdf-document.

To produce this pdf I have used the following /hardware/programs:

  • Epson Perfection V750 PRO
  • VueScan Scanning in "Text-mode" 300 dpi
  • Photoshop CS5 - remove some imperfections
  • Scan Tailor Final adjustment - create files for the pdf-production.
  • Acrobat X Pro. Create pdf, OCR.


The result is a PDF approx. 3,7 MB. The original is a 136 page document.  


This PDF is now published in the Album "Karlstads Kommunarkiv" at wermlandsbilder.se and can be regarded as a compliment to the portrait photo collection also in the same album. (per 20131025 610 pcs).

torsdag 17 oktober 2013

Scanning av "Biografiska anteckningar"

Karlstad har ett långt förflutet som lärdomsstad.
Läroverk och gymnasium har funnits sedan 1500/1600-talet.
Se artikel av Lektor Karl-Åke Mossberg.

Förutom den stora samling av porträttfoto (6.000 st) som Major CE Nygren samlade (scanning och utläggning på nätet pågår), var han en mycket flitig författare av hembygdslitteratur.

Bland hans skrifter finns
"Biografiska anteckningar öfver lärjungar intagna vid Karlstads högre allm. läroverk"

Den första som scannas gäller Åren 1850-63,

 

Inscanningen av den första delen är lite av ett pilotprojekt och innebär att jag skapat ett sökbart pdf-dokument.

Vid inscanningen har jag använt följande hårdvara/program:

Epson Perfection V750 PRO
VueScan Inscanning i "Text-mode" 300 dpi
Photoshop CS5 - ta bort en del felaktigheter
Scan Tailor Finjustera slutresultatet, skapa underlagsfiler för pdf.
Acrobat X Pro. Skapa pdf, OCR.

Resultatet blir en sökbar pdf på ca 3,7 MB. Originalboken är på 136 sidor.  

Detta dokument finns nu utlagt i Karlstads Kommunarkivs album på wermlandsbilder.se och kan ses kan ses som ett komplement till de porträttbilder som finns där (per 20131016 ca 430 st)