Im Media-Lab haben wir für dich einen Buchscanner eingerichtet. Hier kannst du deine Bücher ganz einfach einscannen und abspeichern. Wenn du den fertigen Scan am Computer durchsuchbar machen möchtest, kannst du anschließend die OCR-Erkennung mit ABBYY FineReader 16 durchführen.
Der Scanner sollte eingeschaltet sein und auf dem Display steht Ready to Scan.
Ist der Scanner aus, drückst du zwei Sekunden auf den grünen Startknopf. Der Scanner fährt dann hoch, das dauert ca. eine Minute.
Damit der Scan ordentlich aussieht, muss das Buch korrekt ausgerichtet werden.
So sollte ein ausgerichtetes Buch im Scanner liegen:
Mit diesen Tasten richtest du das Buch aus:
Einzelne Platten verschieben:
Die jeweils außen liegenden Knöpfe fahren die Platten auf dieser Seite hoch bzw. runter.
Beide Platten gleichzeitig verschieben:
Die genau mittig liegenden Knöpfe fahren beide Platten hoch bzw. runter.
Beide Platten diagonal zueinander verschieben:
Die mittig-außen liegenden Knöpfe verschieben beide Platten diagonal zueinander.
Scanprofile
Wenn du ein Scanprofil gewählt hast,
Abspeichern
Entf
-Taste löschen.)Wenn du fertig bist, kannst du das Programm schließen.
Nimm nun dein Buch aus dem Scanner, indem du die Glasplatte anhebst.
Bitte fahre nun die schwarzen Platten runter.
Schalte den Buchscanner aus. Dazu hälst du ein paar Sekunden den roten Knopf gedrückt. Ggf. fahren erst die schwarzen Platten herunter. Sobald auf dem Display des Buchscanners Shutdown in process steht, kannst du loslassen.
In ABBYY FineReader kannst du nun deine Datei bearbeiten. Du kannst:
Dokument im OCR-Editor öffnen
Um Änderungen zu machen, klicke auf Bild bearbeiten:
Seiten zuschneiden (Ränder entfernen)
Falls du die Seiten zurechtschneiden möchtet:
Hier findest du die Option Zuschneiden
Alles innerhalb des blauen Rechtecks bleibt bestehen:
Seiten trennen (Aus Doppelseiten einzelne Seiten machen) BCS-2 scannt immer zwei Blätter als eine Seite. Mit ABBYY kannst du sie wieder trennen.
Und so sieht ein geteiltes Buch dann aus:
Die Seiten sollten nun getrennt sein.
OCR einrichten
Zunächst solltest du die richtige(n) Sprache(n) auswählen:
Du kannst einfach mehrere Sprachen wählen. ABBYY erkennt diese dann automatisch.
Historische Schriftarten mit OCR lesen
ABBY FineReader kann historische Schriftarten in den Sprachen Englisch, Deutsch, Französisch, Italienisch, Spanisch und Lettisch erkennen. Dafür gibt es die folgenden Sprachen:
Wähle dafür, wie oben genannt, bei unter weitere Sprachen die gewünschte Sprache aus und drücke anschließend auf Erkennen.
Falls du möchtest, dass die Resultate der OCR-Erkennung in einer historischen Schrift angezeigt werden, so unterstützt ABBY FineReader die folgenden Schriftarten:
Sollte keine historische Schriftart installiert sein, so wird die Schriftart Arial, Times oder Courier verwendet.
OCR anwenden
OCR korrigieren
Du siehst in deinem gescannten Dokument nun mehrere blaue Felder. Rechts siehst du ein Editor-Feld mit Text und unten dein Dokument, in vergrößerter Form.
Im Editor kannst du nun die OCR-Erkennung korrigieren.
Muster erstellen und selbst trainieren
Die OCR-Erkennung hat manchmal Probleme Schriften oder Zeichen zu erkennen. Das passiert häufiger bei alten Büchern, mathematischen Symbolen oder Ligaturen (zwei oder drei zusammengeklebte Zeichen wie fi, fl, ffi etc.). Aus diesem Grund ist es ratsam Benutzermuster zu erstellen und selbst zu trainieren.
Muster bearbeiten
Bevor du ein vorhandenes Muster verwenden möchtest, solltet du es vielleicht nochmal bearbeiten, da es die OCR-Qualität beeinträchtigen könnte. Ein Muster sollte nur ganze Zeichen oder Ligaturen enthalten. Sollten Ränder von Zeichen abgeschnitten oder falsche Buchstabenpaarungen vorhanden sein, so sollten diese entfernt werden.
Muster verwenden
Um ein Muster wiederzuverwenden, mache folgendes:
Muster exportieren und importieren
Um Muster auch für andere OCR-Projekte zu verwenden können, diese in einer Datei gespeichert werden.
Export:
Import:
Wichtige Hinweise zu Mustern
Dokument abspeichern
ABBYY-Projekt speichern
Falls die Zeit knapp wird, oder du eine Pause brauchst, kannst du auch deine Fortschritte als OCR-Projekt speichern:
Jetzt kannst du zu einem späteren Zeitpunkt dein Projekt weiter bearbeiten. Das geht nur am Buchscanner-PC.