Text per OCR erkennen
Erkennen Sie Text in gescannten PDFs per OCR — direkt im Browser, kostenlos und ohne Upload.
PDF-Datei hochladen
Klicken oder Datei hierher ziehen
Maximum: 25 MB, bis zu 200 Seiten
So funktioniert's
PDF hochladen
Per Klick oder Drag & Drop hochladen. Bis zu 25 MB und 200 Seiten.
Sprache wählen & OCR starten
Wählen Sie die Dokumentsprache und starten Sie die automatische Texterkennung.
Erkannten Text herunterladen
Kopieren Sie den erkannten Text oder laden Sie ihn als TXT-Datei herunter.
Häufig gestellte Fragen
Wie funktioniert die OCR-Erkennung?
Jede PDF-Seite wird als Bild gerendert und anschließend mit Tesseract.js analysiert. Die OCR-Engine erkennt Buchstaben, Wörter und Absätze und gibt den extrahierten Text zurück. Die gesamte Verarbeitung erfolgt lokal in Ihrem Browser.
Welche Sprachen werden unterstützt?
Aktuell werden Deutsch, Englisch, Französisch, Spanisch und Italienisch unterstützt. Die Sprachauswahl beeinflusst die Erkennungsgenauigkeit — wählen Sie die Sprache, in der der Großteil des Textes verfasst ist.
Werden meine Dateien auf Servern gespeichert?
Nein, niemals. Die gesamte OCR-Verarbeitung erfolgt lokal in Ihrem Browser. Ihre PDF-Dateien werden nicht hochgeladen und verlassen nie Ihren Computer. Die Sprachmodelle werden einmalig vom CDN geladen und im Browser-Cache gespeichert.
Wie genau ist die Texterkennung?
Die Genauigkeit hängt von der Qualität des gescannten Dokuments ab. Bei sauberen Scans mit gutem Kontrast erreicht Tesseract.js typischerweise 90–99 % Erkennungsgenauigkeit. Schiefe Scans, niedrige Auflösung oder ungewöhnliche Schriftarten können die Genauigkeit reduzieren.