Mehr brandheiße Inhalte
zur Gruppe
Handjob
2784 Mitglieder
Das Thema ist für dich interessant? Jetzt JOYclub entdecken

64283 und Überregional

*****t64 Mann
3.948 Beiträge
Themenersteller 
64283 und Überregional
Wer hat schon einmal seine Büchersammlung eingescannt und als epub für einen eBook-Reader verfügbar gemacht? Wer kann mit Ratschlägen zur Seite stehen?
Danke schön im Voraus aus Darmstadt
*********egler Paar
1.540 Beiträge
Sehr gute Frage. Ich bin gespannt auf die Antworten.
@*****t64 An welche Buecher denkst du dabei?
******aas Mann
1.552 Beiträge
TL;DR: Der Aufwand für jedes Buch ist ungleich höher als das Buch einfach als epub-Format zu kaufen.

Um auch nur ein Buch komplett einzuscannen, braucht es mehrere Dinge:
• Leistungsfähigen Scanner (Hochauflösend)
• Leistungsfähigen PC (für Schrifterkennung)
• Scan-Programm mit Texterkennung
• ePub-Bearbeitungsprogramm
• Geduld, Geduld, Geduld
• Zeit, Zeit, Zeit

Warum?
Man muss jede Buchseite / Doppelseite nacheinander scannen. Ohne sich zu verblättern, ohne falsch aufzulegen, ohne die Orientierung zu ändern.
Nach jedem Scan muss man kontrollieren ob die Seiten richtig erkannt wurden oder das Scanprogramm Justierungen braucht. Das braucht pro Buch 2-3 Anläufe.
Epub ist ein Volltextformat, der PC "liest" den Text. Dabei macht er Fehler, unweigerlich. Man muss also jede gescannte Seite noch einmal nachlesen und ggf. korrigieren.
Silbentrennung, Seitenwechsel, eingedruckte Kopf- und Fußzeilen sind immer ein Problem und verschlingen Zeit.
Zum Abschluss des Scans muss das Epub ggf. überarbeitet werden, um Inhaltsverzeichnisse oder Glossare wieder auf die richtigen Textstellen zu lenken.

Daumenregel - rechne pro Buchseite mit der doppelten Zeit, die Du zum einmal lesen brauchst. Mindestens.
*****t64 Mann
3.948 Beiträge
Themenersteller 
@******aas
Hochleistungsscanner, Dokumentenscanner, Duplexscan, entsprechender PC, Acrobat etc alles auf der Arbeit vorhanden. Für ein Buch mit 400 Seiten rechne ich mit vier Minuten Scandauer. Dann generiere ich ein PDF. Diese Datei dann umzuwandeln in epub, da kenne ich mich überhaupt nicht aus. Es braucht ja nur ein lesefähiges epub sein, Inhaltsstruktur zum springen etc braucht es nicht zu haben.

@*********egler
Es sind alles nur Taschenbücher (Horror, Krimi, Thriller), eigene. Schon vor Jahrzehnten mal gekauft und gelesen. Ich möchte einfach auch den benötigten Platz reduzieren. Momentan ca 10 Bücherkisten.
******aas Mann
1.552 Beiträge
Ein paar Anmerkungen, da ich in dem Bereich professionell gearbeitet habe:

4 Minuten für 400 Seiten? Also pro Seite 0,6 Sekunden, mit Umblättern, Belichten, Verarbeiten, Speichern?
Respekt. Ich habe mit Geräten von Canon, RoWe und HP, samt automatischer pneumatischer Umblättermechanik gearbeitet - wie das zu schaffen ist möchte ich gerne sehen.
Es sei denn, man schneidet den Buchrücken ab und steckt den Stapel Papier in den automatischen Einzug, das beschleunigt, zerstört aber das Buch - und die Fehlerrate bei Nicht-A4-Papier ist bei 0,3-0,5%, also 1-2 der 400 Seiten rutschen durch oder verursachen einen Stau.

PDF "optisch" ist einfach nur ein Bild der Buchseite, ohne Texterkennung - das geht natürlich auch viel schneller. Allerdings lässt sich daraus kein ePub erzeugen, da das Format ein Textcontainer ist. Man kann optische PDFs durch eine OCR-Software laufen lassen um den Text zu extrahieren, aber das Ergebnis ist bedeutend schlechter, als direkt vom Papier zu scannen.

"Alles auf Arbeit vorhanden" heißt meistens nicht, dass man privat seine Dokumente durchjagen kann. Unsere Scanner sind an ein Überwachungssystem angeschlossen, das die Anzahl der gescannten Dokumente an den Administrator und den Hersteller weiter meldet, samt Benutzer und einem Abbild der jeweils ersten Textseite. Ein Kollege, der da mal schnell alle seine Partituren eingescannt hat, hat ziemlichen Ärger bekommen - es geht da u.a. um Urheberrechte.
*******mcat Mann
3.239 Beiträge
Ich möchte anmerken, dass ich mir eine ähnliche Aufgabe gesetzt habe und mein Erfahrungshorizont ist dieser, dass ich mit KINDLE-Reader von Amazon lese. Der KINDLE-Reader als App auf dem PC ist in der Lage, pdf-Dateien darzustellen und ähnlich den Amazon-Kindle-E-Books zur Verfügung zu stellen. jedoch reines Lesen - keine weiteren Funktionalitäten. Kosten auf dieser Seite also "Null", von der PC-Hardware mal abgesehen (ich lese auf Tablet-PC).

Die Frage des schnellen Scannens ist natürlich gegeben. Ich setze momentan CANON-Zweiseitenscanner ein für A4-Dokumente. Das sind Skripten und Fotokopien aus alten Tagen - keine Bücher.

Was Bücher angeht, habe ich mir angeschaut und noch nicht gekauft (auch bei AMAZON). Eine "JOURIST" Buchwiege und einen "JOURIST" Buchscanner mit Software - Kostenpunkt kleiner 350 EUR zusammen. Geht bis A3.

Blättern muss man noch selbst - wie schnell der Scanvorgang selbst ist, würde mich interessieren. Damit aber sollte so ein Projekt machbar sein. Jeden Tag ein Buch - irgendwann hat man es geschafft.

Das könnte auch eine Lösung für den TE sein.

Gibts zu der von mir genannten Ausrüstung (oder vergleichbare) Erfahrungen hier in der Gruppe ?
*****t64 Mann
3.948 Beiträge
Themenersteller 
@******aas
Natürlich werden die Bücher aufgeschnitten und die einzelnen Blätter im Block dzrchgescannt. Es macht nichts, da das Buch danach zerstört ist.
Ich dachte, es gibt ein Programm, mit dem man aus einem PDF ein epub generieren kann. Rein zum lesen, ohne jeglichen Komfort.
*******geur Mann
21.339 Beiträge
Gruppen-Mod 
Geht das denn nicht mit "Calibre"?
https://calibre-ebook.com/
*****t64 Mann
3.948 Beiträge
Themenersteller 
@*******geur
Weiß ich nicht. Erst muss ich mal kleine PDFs erstellen. Zu groß sollen die ePubs auch nicht werden. Muss da vorher noch eine Texterkennung drüber laufen?
Dachte, es würde sich jemand mit dieser speziellen Erfahrung melden.
*******bil Paar
1.014 Beiträge
Wenn das allgemeine Belletristik ist, wäre da nicht ein Abo bei einem Newgroups-Server angeraten und in den einzelnen Gruppen können dann die fertigen Bücher als pdf und e-pub heruntergeladen werden.

Ich habe das vor Jahren gemacht und habe jetzt auf einem !! NICHT ÖFFENTLICH !! zugängigen Rechner an die 40.000 Bücher der verschiedensten Richtungen.

Ich weiß, der WEG ist das ZIEL.

Aber bevor ich mir da Probleme mit dem Besitzer der Hardware mache (bei uns wurde JEDES Dokument, dass durch den XEROX gelaufen ist, sowohl für den Benutzer, als auch für´s Archiv gespeichert)
Und die Firma ist dann bezüglich copyright verantwortlich.

Apropo Kindle: funktioniert der überhaupt mit den Dateien, wenn die Datei nicht zertifiziert ist, sprich entsprechende copyright-Prüfsumme haben.
Wir hatten einen KOBO und nach einem Sicherheits-update hat er meine e-pub´s nicht mehr akzeptiert und nach einem Zertifikat für das Buch verlangt.
*******mcat Mann
3.239 Beiträge
@*******bil KINDLE und pdf-Dateien. Ich bekomme oft geschäftlich, aber auch privat, Dateien der unterschiedlichsten Art, die ich einfach nur lesen muss bzw. sollte. Ich wandle diese in pdf-Dateien über einen virtuellen pdf-Drucker - und konnte bisher alles in KINDLE lesen. So kann man einen Teil der Arbeit bequem auf dem Sofa erledigen (oder im Sommer auch Outdoor im Biergarten *zwinker* ). Alles, wozu ich keinen großen Bildschirm benötige - und da nutze ich hochlösende 24" Mehrmonitorsysteme - lese ich in ausreichend großer Darstellung auf dem Tablet-PC (unter Windows, Kostenpunkt neu ca 150,00 ). Beine hoch - Schriftgröße variabel - man kann sich das Leben auch angenehm machen.
*******bil Paar
1.014 Beiträge
@*******mcat

*top* So ist es.

Wir sind auf Android-Tablet´s umgestiegen und können jetzt auch alles wieder lesen.
Bei uns hat nur der KOBO (Weltbild-Thalia-Verlag) uns zwingen wollen, IHRE Bücher lesen zu "dürfen"
*******_you Mann
1.442 Beiträge
Zitat von *******geur:
Geht das denn nicht mit "Calibre"?
https://calibre-ebook.com/

Da war schon der richtige Hinweis in perfekter Form,
wobei ich den Umstand gelesener Buecher noch nicht verstanden habe.
Verfuegbar machen?
Da gibt es ganz schlimme Richtlinien,
bis das es nicht mal ausgeliehen werden darf.
******aas Mann
1.552 Beiträge
Zitat von *****t64:
@******aas
Natürlich werden die Bücher aufgeschnitten und die einzelnen Blätter im Block dzrchgescannt. Es macht nichts, da das Buch danach zerstört ist.
Ich dachte, es gibt ein Programm, mit dem man aus einem PDF ein epub generieren kann. Rein zum lesen, ohne jeglichen Komfort.

Zu Punkt 1: Das war nicht klar.

Zu Punkt 2:
PDF ist ein sogenanntes Containerformat, das dazu gedacht war, Schriftstücke originalgetreu wiederzugeben. Erstellt man ein "simples" PDF aus einem Scan, enthält es einfach nur ein Bild der gescannten Seite.
EPUB ist ein sogenanntes Strukturformat, das dazu gedacht ist, Texte strukturiert zu speichern und darzustellen. ePub kann tatsächlich auch Bilder einbinden, aber das ist ein Hilfskonstrukt.

Daher ist es technisch möglich, aus einem PDF voller Bilder von Buchseiten ein EPUB voller Bilder von Buchseiten zu machen, aber dazu ist es nicht gedacht. ePub möchte Text, den es in einem eBook-Reader dynamisch darstellen kann, mit größeren und kleineren Schriftarten, Anpassung an die Bildschirmgröße, und einer Struktur, die es dem Reader möglich macht, sich zu merken wo im Text er gerade ist.
Ein ePub voller Bilder kann das nicht - es wird die Bilder in der Größe darstellen, in der sie gescannt wurden, egal ob sie auf den Bildschirm passen oder nicht. Je nach Konvertierung wird das ePub alle Bilder auf quasi einer "Seite" darstellen - der Ebookreader wird nicht wissen, wo man mit dem Lesen aufgehört hat.
Und letztlich wird die Größe der Datei vermutlich sehr hoch sein - PDF benutzt für seine Bilder das TIFF-Format mit nur zwei Farben, schwarz und weiß, sehr platzsparend. EPUB verwendet PNG, JPEG, oder GIF, im Vergleich sehr viel platzhungrigere Formate als die im PDF.

Daher meine Anfangsargumentation: Um ein nutzbares ePub zu erstellen, braucht es Textextraktion.
******aas Mann
1.552 Beiträge
Zitat von *******mcat:
Was Bücher angeht, habe ich mir angeschaut und noch nicht gekauft (auch bei AMAZON). Eine "JOURIST" Buchwiege und einen "JOURIST" Buchscanner mit Software - Kostenpunkt kleiner 350 EUR zusammen. Geht bis A3.
(...)
Gibts zu der von mir genannten Ausrüstung (oder vergleichbare) Erfahrungen hier in der Gruppe ?

Zum Jourist gibt es eine recht gute Rezension, die sich mit meinen Erfahrungen deckt: https://www.gadget-rausch.de … -test-digitalisiere-buecher/

Zusammenfassung:
• 40 Seiten pro Minute ist die technische Obergrenze, die leider durch Fehler, Justierungsbedarf oder unregelmäßige Verarbeitungsgeschwindigkeit gebremst wird, ich halte 20-30 Seiten/min. für realistisch - für das reine Scannen
• Die mitgelieferte Software ist gewöhnungsbedürftig und relativ instabil
• Die Texterkennung ist relativ gut, bei einer Nachbearbeitungsquote von ca. 5%
• Optische Schwächen bei Seitenwölbung (die Idee der Wiege ist gut) und bei glänzenden Seiten
*******mcat Mann
3.239 Beiträge
alle Systeme sind kompatibel
Gestern - es war ein "Buch" der besonderen Art. Nämlich eine Fachwissen-CD, über irgendeine Java-Script-Programmierung. Aufmachung wie ein E-Book, auch zum Anspringen einzelner Kapitel.

Ich hätte es am Schreibtisch sitzend auf dem großen Monitor lesen können - wollte es aber bequemer haben und vom Tablett-PC im Bett liegend lesen. Das hat den Vorteil, dass ich "einfach schlafen kann wenn es genug ist, rücken schonend und kuschelig. So geht Fortbildung heut zutage ...

Dieses "Fachbuch" hat sich nicht über einen pdf-Drucker in eine pdf-Datei wandeln lassen, aber wohl auf Papier ausdrucken lassen.

Nach dem Motto "alle Systeme sind kompatibel - ausdrucken und wieder einscannen" habe ich das dann gemacht. Der schnelle Laserdrucker und der schnelle Scanner mit Automatischem Einzug erledigten das in einer halben Stunde. Es waren "nur" 170 Seiten.

Danach Transfer per USB-Stick (die Datei hatte mehr als 100 MB) auf den "Kleinen" und Dateiimport einer pdf-Datei in KINDLE .... *fiesgrins*

Schade um das Papier aber - wenn Verlage auf diese Weise ihr geistiges Eigentum schützen wollen ??????
Ich mag mir halt nicht vorschreiben lassen, wo ich lese und ich mag mir auch kein CD-Laufwerk ins Bett einbauen müssen *zwinker*

Übrigens - ein interessantes Buch welches ich gerade eben gelesen habe (kostenlos über das KINDLE-Unlimited-Abo): "Jens Wiese, Papier Los werden" - auch mit guten Tipps zur Hardware !
********n299 Frau
1.643 Beiträge
Zitat von *******mcat:
"Jens Wiese, Papier Los werden"
wie passend.. wie wirst du jetzt die 170 Seiten los ? *haumichwech*

*sorry* *offtopic* aber das war eine Steilvorlage
*******_you Mann
1.442 Beiträge
Lol,
fuer Asbachbuecher waren ja schon viele gute Vorschlaege da,
u.a. von Umweltsuenden, Ressourcenverschwendung bis Investitionen.

Vermute das davon 80% eh schon freebooks sind, also aus der Kiste.
Lohnt sich der Aufwand? ...mal abgesehen von anderen Quellen?

Schade um die zerlegten Buecher,
ich liebe diese ausgemusterten Telefonzellen, Posthaeuschen, Kisten etc. in den Strassen mit Lesestoff
Anmelden und mitreden
Du willst mitdiskutieren?
Werde kostenlos Mitglied, um mit anderen über heiße Themen zu diskutieren oder deine eigene Frage zu stellen.