Nowość: Włącz alerty cenowe na e-booki i kupuj taniej!

Przepis na szybką konwersję PDF

Raport w Kindle for PC

Napiszę tutaj, w jaki sposób na podstawie pliku PDF przygotowałem plik MOBI, wspomniany ostatnio przy okazji Otwartego Mandatu.

Powyżej macie jego zrzut ekranowy w Kindle for PC.

Założenia są takie:

  • Przede wszystkim szybko, a więc nie musi być idealnie. Chcę po prostu mieć  zamiast PDF wersję na Kindle.
  • Zero ręcznych poprawek – tak naprawdę większość PDF wymaga ponownego składania, gdy chcemy mieć z nich porządny plik EPUB/MOBI.
  • Sam tekst ma być czytelny.
  • Mają pozostać obrazki.
  • Ma działać spis treści i nawigacja między rozdziałami.

Oto metoda, którą stosuję wtedy gdy muszę szybko mieć PDF w formacie czytnikowym:

  1. Wrzucam PDF do programu Mobipocket Creator, korzystając z opcji „Import from existing file” – Adobe PDF.
    Importowanie do Mobipocket Creator
    Po wrzuceniu plik od razu jest przerabiany do HTML – i tego właśnie potrzebuję, nie będę go tam dalej konwertował.
  2. Z katalogu „Moje dokumenty/My Publications/Tytuł pliku”, który został utworzony przez Creatora wyciągam plik HTML i otwieram w przeglądarce, żeby sprawdzić czy wszystko jest w porządku.
    Plik HTML w katalogu Mobipocket
  3. Sprawdzam też źródło pliku HTML, aby upewnić się, w jaki sposób tworzone są tytuły rozdziałów – tutaj najczęściej wykorzystano znacznik H2.
  4. Plik HTML importuję do Calibre i konwertuję do MOBI z ustawieniami spisu treści wskazującymi na to, aby oprzeć go właśnie na H2.W polu „pierwszy poziom spisu treści” wpisuję „//h:h2”.
    Calibre i konwersja pliku PDF - ustawienia pierwszego poziomu treści: //h:h2
  5. Jeśli nie masz pewności, jakie nagłówki zastosowano – wpisz na czuja:
    pierwszy poziom – //h:h1
    drugi poziom – //h:h2
    trzeci poziom – //h:h3
    – możliwe że ładny spis z tego wyjdzie. :-)
  6. Ustawiłem też wszystkie opcje w „Przetwarzaniu heurystycznym” – to jest magia której nie rozumiem – czasami pomaga, czasami nie.

Efekt jest akceptowalny – tam gdzie jest zwarty tekst, opisana metoda radzi sobie bardzo dobrze.

Są jednak zauważalne błędy:

  • nie działają przypisy (przypisy to generalnie trzeba poprawiać ręcznie, nie znam metody automatycznej)
  • część tekstu się rozjeżdża, a niektóre wyrazy sklejają się ze sobą.
  • pozostawiłem też oryginalny spis treści z numerami stron, który wygląda po prostu paskudnie.

Do szybkiego przeczytania jednak wystarczy.

Dodam, że jest to skuteczniejsza metoda, niż użycie samego Calibre, który nie radzi sobie z usuwaniem numerów stron, a także często brzydko rozwala akapity.

Uwaga: gdy instalujemy program Mobipocket Creator, należy wybrać przy instalacji wersję „Publisher Edition” – tylko w niej otworzymy plik PDF.

Czytaj dalej:

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Korzystanie z Kindle i oznaczony tagami , , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

68 odpowiedzi na „Przepis na szybką konwersję PDF

  1. Witam!

    Mam pytanie odnośnie punktu pierwszego powyższej instrukcji :)
    Jak wrzucić PDF do programu? PDF nie ma na liście obsługiwanych plików, a przeciąganie do okna programu też niczego nie daje. Z góry dziękuję za poradę!

    ZS

    0
  2. nfp pisze:

    Napisałeś, że ten sposób radzi sobie z usuwaniem numeracji stron. A w jaki sposób się to odbywa? Czy poradzi sobie też z usuwaniem nagłówków i stopek stron?

    0
    • Robert Drózd pisze:

      W jaki sposób to ja nie wiem, ale HTML wypuszczony z Mobipocket Creatora nie ma już zwykle numerów, stopek i nagłówków.

      0
      • nfp pisze:

        To będę musiał spróbować, nic tak nie irytuje jak numer strony, czy tytuł książki ze stopki w środku zdania.

        0
  3. Wolbashi pisze:

    Czy istnieje wersja mobipocket creator na linuxa? Na stronie producenta jest mowa tylko o windowsie, ale może ktoś zna inny program warty polecenia :)

    0
    • asymon pisze:

      Mobipocket Creatora niestety nie ma, ale są np. tekstowe pdftotext i pdftohtml.

      Tylko trochę z polskimi znakami trzeba powalczyć i najlepiej wcześniej przyciąć (crop) pdf-a, żeby pozbyć się numerów stron.

      0
    • Robert Drózd pisze:

      Sam Mobipocket Creator korzysta z opensourcowego programu „pdf2xml”
      http://www.mobipocket.com/dev/pdf2xml/

      „pdf2xml was compiled and tested on Win32 but it should compile and run on many other POSIX compliant OSes (UNIX, VMS, OS/2, Linux, MacOS X…).”

      – ale podobne narzędzia podał asymon.

      0
    • eep8chuiti3C pisze:

      Próbuję to odpalić na lapku z Debianem testing pod Wine 1.3, ale bez powodzenia. Wyświetla się główne okienko programu, ale nie da się nawet zaimportować PDF-a. Po prostu żadne opcje programu nie działają.

      0
  4. faure pisze:

    Jest taki program pdfpub, czy jakos tak, o ktorym na tym blogu juz wspominano. Konwertuje pdf do mobi bezposrednio i calkiem dobrze. Wskazujac obszar konwersji mozna pozbyc sie numeru strony.

    0
  5. Tomee pisze:

    Dzięki za artykuł :).

    A w jaki sposób ręcznie poprawić/zrobić przypisy w pliku htm? Próbuję zrobić ebooka przy pomocy FineReadera. Skanuję z pliku PDF do html (później konwertuję do MOBI). Wszystko jest ok, z tym, że część przypisów działa, a część nie. Googlowałem, ale niestety nic nie znalazłem. Mam nadzieję, że ktoś mi pomoże, bo już nie mam żadnych pomysłów.

    Próbowałem nawet przy pomocy Sigila zrobić przypisy, ale coś mi nie wychodzi…

    0
    • ATR pisze:

      wczoraj robiłem konwesję pdf 360 stron przy pomocy mobicreator który utworzył plik prc – czytany przez kindla
      Po otwarciu okazało sie iż b ładnie przekonwertował też odnosniki ale nie sprawdzałem czy wszystkie :(

      0
  6. Leszek pisze:

    Faktycznie – połączenie MC i Calibre to bardzo dobre rozwiązanie. Żadne tam PDF2Epub się nawet nie umywa, zwłaszcza w przypadku pdf na stronach których jest tekst w zmiennej ilości kolumn (zwłaszcza na jednej stronie).
    Dodatkowo edycja HTML w etapie pośrednim (np. za pomocą dowolnego edytora HTML, nawet/zwłaszcza „wizualnego”) pozwala dostosować wygląd naszego pliku wynikowego mobi.

    Dzięki za solucję!

    0
  7. Azahiel pisze:

    Szybko robiąc konwersje, uważam że o wiele lepiej sobie radzi z tym- PDF2Epub. Nie rozumiem co akurat źle robi, koledze wyżej. Patrząc że ten program jest ciągle rozwijany i można go za darmo dostać jeszcze, więc. Brakuje tylko tagów w nim. Mobipocket jakoś mnie nie urzekł i robił błędy czasami. Mówimy tu o szybkiej konwersji, bo jednak Mobipocket + calibre to już nie jest aż tak szybka.

    0
    • Robert Drózd pisze:

      No w zasadzie najszybsze to jest wysłanie PDF na email kindle z tematem „convert”, wyjdzie mniej więcej to samo co z Mobipocketa – ale właśnie bez rozdziałów i spisu, a tego mi zawsze bardzo brakuje, dlatego ten etap pośredni czyli Calibre.

      Co do szybkości – to nie jest dużo czynności, najwięcej trwa wygenerowanie MOBI przez Calibre, bo czasami parę minut mieli.

      0
      • Leszek pisze:

        Dokładnie tak. Mi też brakowało przy tych „szybkich automatycznych” konwersjach rozdziałów i spisów.

        Jak już pisałem PDF2Epub rozkłada się na szpaltowych pdfach, zwłaszcza jeśli są szpalty mieszane (najpierw jedna kolumna, później dwie, gdzieniegdzie znowu jedna itd.), spróbowałem, pierwszy tekst (prymitywnie prosty) był OK, na kolejnych było coraz gorzej.

        Sposób zaproponowany przez Roberta jest dobry zwłaszcza, że wreszcie wiem, jak definiować spis treści: /h:h2 – aczkolwiek sprawdzam to w źródle html. Szybki przegląd pliku w przeglądarce pozwala zadecydować, czy trzeba coś poprawić w html’u, czy też można szybko wygenerować mobi. Czasami warto poświęcić minutę więcej, żeby poprawić coś, co później będzie bardzo raziło w pliku wynikowym.

        Efekt? Próbowałem ostatnio przerobić kilka instrukcji obsługi sprzętu na czytnik na telefonie z androidem (wkrótce KT) i PDF2Epub kompletnie się wykładał – tekst był mieszanką dwóch kolumn. Po przeczytaniu niniejszego artykułu wygenerowałem poprawnie wyglądający tekst w nieco tylko dłuższym czasie (niż generowany PDF2Epubem), zawierającym spis treści (i okładkę ;-)). Jak będę miał kilka chwil więcej to ze źródłowego html’a usunę znaki dzielenia wyrazów („-„), łącząc wyrazy, poprawię formatowanie i wygeneruję mobi raz jeszcze. Ale to co uzyskałem „na szybko” jest i tak więcej niż zadowalające. Dzięki ;)

        0
      • Bartek pisze:

        Dla mnie, jako nowicjusza – na razie „convert” wystarczy. Z jednej przyczyny, tekst PDF skonwertowany ktory zamierzam czytac – bede z regoly czytac tylko 1 raz. Stad znacznik ostatnio przeczytanego miejsca mi wystarczy. w/w opisane toole to na razie dla mnie wyzsza magia ;)

        0
      • Rafal pisze:

        Dzięki za artykuł i za cala stronę.
        Jestem nowicjuszem w tych sprawach wiec sorki za naiwne pytania ;)
        Piszesz ze wyciągasz z Creatora plik HTML i otwierasz w przeglądarce, żeby sprawdzić czy wszystko jest w porządku. W jakiej przeglądarce? to pierwsze pytanie a drugie to jak sprawdzić źródło pliku HTML?

        0
        • Robert Drózd pisze:

          Przeglądarka dowolna – ja używam systemowej czyli Firefoksa.

          Firefox ma pod prawym klawiszem myszy opcję „Pokaż źródło strony”, działa również skrót CTRL+U – to jest podobnie jednak w każdej innej przeglądarce, np. Internet Explorerze.

          0
  8. atr pisze:

    niestety mój mobipocket creator wersja 4.2 po otwarciu nie ma opcji pdf nie wiem dlaczego?
    Przeinstalowałem i tak samo.
    Do konwersji używam Fine Reader 11, który ma pdf > HTML, word i w którym można podać które strony z pdf chcemy skanować.
    Jeśli chcemy wystandaryzować formatowanie to najlepszym sposobem jest skopiować cały tekst do notatnika i potem do pustego Worda zapisać jako RTF i przy pomocy Calibra na mobi.

    0
    • Gosia pisze:

      Pewnie zainstalowałeś mobipocket creator w wersji home, tu nie ma pdf. W wersji profesjonalnej pdf już jest. Przy instalacji jest możliwość wyboru albo wersji home albo profesjonalnej.

      0
      • Robert Drózd pisze:

        Zgadza się – kiedyś profesjonalna była płatna, teraz obie są darmowe.

        Warto pobierać, bo kto wie, kiedy strona zostanie zamknięta. Amazon wykupił Mobipocket parę lat temu, aby wykorzystać ich format pliku, no i od tych paru lat nic się w serwisie nie zmieniło.

        0
    • Misiek pisze:

      Uwaga: gdy instalujemy program Mobipocket Creator, należy wybrać przy instalacji wersję „Publisher Edition” – tylko w niej otworzymy plik PDF.

      http://swiatczytnikow.pl/przepis-na-szybka-konwersje-pdf/

      0
  9. atr pisze:

    dzięki moja wina :(
    jestem zdumiony szybkością konwersji z pdf,
    tylko jeśli Kindle czyta prc to po co robić mobi?
    W Kindle jest słownik angielski, w Kindle dla PC są jeszcze inne słowniki 5 nie angielskie.

    0
  10. Emeryt pisze:

    Konwersję z html lub epub na mobi proponuję robić konsolowym kindlegen z Amazonu – konwertuje przypisy.

    0
    • Robert Drózd pisze:

      Chyba jeśli HTML (a tym bardziej EPUB) już ma przypisy, to konwersja dowolnym narzędziem wyjdzie porządnie.

      0
  11. Anem pisze:

    Nie wiem co prawda czy gdzieś tego nie ma na stronie, ale mam pytanie czy Kindle obsłuży mi pdfa, ale nie tekstowy tylko taki, który został utworzony wskutek skanowania do pdfa?

    0
    • ATR pisze:

      kindle widzi każdy pdf niezależnie jak zrobiony jak obrazek, czyli po powiększeniu widzimy tylko kawałek obrazka jak lupa w aparacie fotograficznym

      0
  12. hoot pisze:

    pytanie: czym może być spowodowany alert zabezpieczeń ‚bieżące ustawienia zabezpieczeń nie zezwalają na pobranie tego pliku’ – natychmiast po próbie uruchomienia Mobipocket Creatora.

    Co ciekawe – na tym samym komputerze kiedyś normalnie działał. Adobe Editions (DRM)?
    Coś innego?

    Antywirusa wykluczyłem, reinstalacje wersji home/pro, zmiany folderów, restarty – nie pomogły, WTH? :/

    0
  13. ATR pisze:

    W Kindle Touch jest możliwość przewijania pomiędzy początkami rozdziałów poprzez przesuwanie palcem po ekranie góra – dół.
    Pytanie jak zaznaczyć w tekście DOC?? html?? aby to działało??

    0
    • Robert Drózd pisze:

      Ale to jest wyjaśnione. :)

      W DOC/HTML muszą być nagłówki H1, H2 itd. Potem przy konwersji w Calibre dodajesz odpowiednio //h:h1 //h:h2 w zakładce Spis treści.

      Mam zamiar od dawna to opisać dokładniej, ale to działa w ten sposób.

      0
  14. Artur pisze:

    To ma być szybka konwersja ?
    Dwa programy, 20 minut na jednego PDF-a ?
    Żenada

    0
  15. Hoxie pisze:

    Mi konwersja z pomocą Mobicreator+calibre nie pasowała. Tekst za bardzo i zbyt często się rozjeżdżał przez co ciężko się czytało. Słowa się łączyły lub przeskakiwały do kolejnych akapitów gdzie egzystowały samiutkie jak palec.
    Jako, że do tej pory korzystałem z PDFtoEPUB postanowiłem połączyć oba sposoby i wyszło perfekcyjnie. Pierw konwertuję książkę przez PDFtoEPUB, dodaję strony tytułowe i nadaję odp. akapitów, a następnie wrzucam do calibre, tam „formatuje” to ponownie z MOBI do MOBI i dodaję spis treści i rozdziały oraz zmieniam cyferki przy akapitach – powstawały zbyt duże wcięcia i wysyłam na kindla. Sprawdziłem na 5 książkach (fantastyka. Bez żadnych obrazków, tabelek i innych zawiłości) i na każdej było to czego mi potrzeba – rozdziały i swobodne przemieszczanie się pomiędzy nimi, spójny tekst bez żadnych niespodzianek (tylko sporadyczne, nieprzeszkadzające w czytaniu) oraz strony – chociaż te nie były zbyt dokładne, a ze wspomnianym na stronie pluginem Count Pages jeszcze się zbytnio nie zaznajomiłem.

    0
  16. olek pisze:

    MAM PYTANIE . CZY DA SIĘ PRZEKOWERTEROWAĆ PLIK MOBI NA FORMAT PDF LUB TXT ? Jeśli tak to poproszę o podpowiedź. Z góry dzięki.

    0
  17. scoby pisze:

    A wie ktoś jak skonwetować pdfa z dużą ilością tabel?

    0
  18. starszawy pisze:

    a nie prościej zrobić te konwersje online na stronie:
    http://www.2epub.com/

    0
  19. Scoby pisze:

    Wszystko fajnie, tylko co zrobić aby zachować akapity?

    0
    • Duszolap pisze:

      Sposób skuteczny jednakże nie perfekcyjny. Przy konwersji zwykłej ksiązki (bez obrazkow) nadal występuje problem z którym nie bardzo wie jak sobie poradzic

      Przykład:
      W oryginalnym pdf jest następujacy układ tekstu (treść nieważna:)
      Twój adres e-mail nie zostanie opublikowany. Pola,
      których wypełnienie jest wymagane, są oznaczone symbolem

      W HTML po konwersji mam
      Twój adres e-mail nie zostanie opublikowany. Pola,
      których wypełnienie jest wymagane, są oznaczone symbolem

      Problem w tym ze gdy Calibre zamieni to na mobi tekst będzie urywał się nienaturalnie w połowie linijki. Usunięcie wszytskich tagów powoduje zbicie tesktu w mase przez co jest to mało czytelne.

      Czy macie jakieś sposoby na ten problem?

      0
      • para pisze:

        Też chętnie się dowiem jak usunąć niepotrzebne „entery”. Coś mi nawet świta o ile mi ktoś powie jak wyszukać „entery” za pomocą skrótu Ctrl+F (tabulacje się da)

        0
        • Alabama pisze:

          No masz! Udało mi się pozbyć enterów: Jak usunąć znak ENTER z dokumentu WORD poprzez Znjadź-Zamień
          1. Ctrl + H (Czyli Znajdź – Zamień)
          2. Wybieramy opcję: Więcej –> Specjalne –> Znak akapitu
          (ten ch..y Znak akapitu to właśnie poszukiwany ENTER)
          3. … i zamienić na np. „Spację”.
          przetestowałam i działa.
          Alabama

          0
  20. Marek pisze:

    Mam problem – przy próbie konwersji Mobipocket Creator-em do Html-a otrzymuję coś takiego:
    „Starzec na pró Ŝno usiłował otworzyć oczy, cięŜar powiek sprawiał,Ŝe było to bardzo trudne.”
    Jak to przeskoczyć :/
    Przepraszam za dwa wpisy pod rząd, ale poprzedni komentarz źle wstawiłem.

    0
  21. Shake pisze:

    Dzięki :)

    0
  22. Alabama pisze:

    A można konwertować tak po babsku?:
    1. PDF zapisz jako .txt
    2. Plik .txt kopiujemy do Worda
    3. Tekst z Worda zapisz jako HTML
    4. Plik HTML konwertujemy na MOBI przez Calibre …
    Sama doszłam do punktu 3, później pobawię się dalej. Czysta konwersja z PDF na MOBI przez Calibre sprawiła, że tekst się zaczął zawijać i zdanie kończy się w połowie linijki, a te wszystkie opcje wsadowe w Calibre niewiele mówią dyletantowi.

    0
  23. Kowalska pisze:

    Spróbowałam swoich sił w PDF Scissors – wszystko pięknie i ładnie, podziabałam pdfa, który był dwustronicowym skanem książki, tak aby jedna strona książki pierwotnie papierowej była jedną stroną pdfu. Zapisałam, otwieram w Adobe, wszystko cacy. Wrzucam na nooka/próbuję przekonwertować do epuba – i Calibre i Nook nadal mi pokazują na jednej stronie dwie zeskanowane. Ktoś wie o co chodzi i może mi pomóc? Większość pozostałych propozycji programów nie działa, albo wymaga zbyt dużego paprania się w 300-stronicowym dokumencie.

    Proszę o poradę i pomoc!

    Pozdrawiam

    0
  24. Marcin pisze:

    Mam swój sposób na konwersję PDF do mobi bez zwijania się tekstu albo innych niespodzianek. Otwieram PDF w programie do rozpoznawania tekstu ABBY FineReader i zapisuję jako RTF. Potem konwertuję RTF do MOBI w programie Calibre.

    0
  25. Magda pisze:

    Mam pytanie – zrobilam wszystko dokladnie tak jak jest tu opisane. Wszystko wyglada ok poza jednym – moj plik .mobi ma zbędne spacje, glownie miedzy pierwsza a druga litera wyrazu lub miedzy ostatnia i przedostatnia. Czy jest jakis prosty sposob, zeby sie tego pozbyc, moze powinnam zaznaczyc jakas dodatkowa opcje przy konwersji? Kindla mam od niedawna i jestem zielona w temacie ;)

    0
    • Alabama pisze:

      Po zapisaniu pliku jako RTF zobacz jak on wygląda w środku. Podwójne spacje można wywalić za pomocą opcji „znajdź i zamień”. Znajdź: „dwie spacje” (kiedy to wpisujesz to nie widać znaku bo spacją jest niewidoczna, ale program to raczej rozumie) i zamień na „delete”.

      0
  26. UncleGoogle pisze:

    Witam,
    czy ten mechanizm konwersji opiera się na detekcji tekstu z pdf? Chodzi mi o to czy jest szansa na przerobienie pdf-a który jest zrobiony z obrazów (skanów).

    Próbowałem na 2 plikach: przy jednym wywala po prostu „import failed”. Przy drugim rozdziala całą książkę na pliki jpg (w źródle html są odnośniki do obrazów).

    0
    • Robert Drózd pisze:

      Nie, jeśli mamy PDF ze skanów – trzeba skorzystać z programu OCR. Ja mialem zawsze bardzo dobre doświadczenia z FineReaderem. Nowsze wersje potrafią zapisywać już od razu formaty czytnikowe (EPUB przynajmniej), chociaż pewnie dalej może się opłacić etap posredni z eksportem do HTML i konwersją w Calibre.

      0
  27. Paweł pisze:

    Bardzo dobry poradnik. Ważne jest to o czym autor wspomniał – mobi zrobione z htmla (z kolei html z pdf za pomocą Mobipocket Creator) jest dużo lepsze od mobi zrobionego bezpośrednio z pdfa za pomocą Calibre. Gdy przerobimy bezpośrednio pdf na mobi za pomocą Calibre to otrzymamy tekst z rozrzuconymi akapitami. Co ważne po konwersji (html–>mobi) warto przesłać przerobione mobi na Kindle za pomocą calibre dzięki temu zyskamy numeracje stron 1:1 (tak jak w pdfie). Dodatkowo w Kindle Paperwhite II da się ustawić na sztywno, aby na samym dole był wyświetlany numer strony np. zamiast lokacji. Przeprowadzenie tej całej procedury daje znakomity efekt (mowa o konwertowanych plikach). Wszystko dzięki Robertowi. Gdyby nie ten portal nie udałoby się nam tyle osiągnąć w kwestii szeroko pojętego komfortu korzystania z naszych Kindle. Dzięki.

    0
  28. Zuza pisze:

    Jak importować plik HTML to programu Calibre?

    0
  29. W. pisze:

    Mam bardzo głupie pytanie, ale jestem zupełnym laikiem: jak powinien wyglądać gotowy plik mobi po przekonwertowaniu? Bo u mnie wychodzi identyczny jak pdf, w formie obrazka, na którym nic nie można zaznaczać, zmieniać czcionki itd. Myślałam, że konwersja służy zmianie pdf na formę normalnego e-booka…

    0
    • Robert Drózd pisze:

      Odpowiem z opóźnieniem, ale może się komuś przyda. PDF może być plikiem tekstowym, a może być obrazkowym, składającym się ze skanów. Jeśli potrzebujesz go przerobić, trzeba najpierw odzyskać z niego tekst – czyli trzeba skorzystać z programu OCR w rodzaju FineReader.

      0
  30. Edyta pisze:

    Zrobilam wszystko jak tutaj opisane, po wyciagnieciu xml z pdfa otrzymalam bialy tekst na czarnym tle, nie wiem dlaczego i jak zrobic zeby bylo odwrotnie. Prosze o jakies wskazowki.

    0
  31. Basia pisze:

    Czy jest może jakiś sposób na przerobienie zeskanowanej książki w formacie PDF na PDF przeszukiwalny (na przerabianie na MOBI mam swój sposób, który mnie zadowala, jednak nie działa na plikach skanowanych). Niestety, na zeskanowanych plikach czcionka jest tak maleńka, że nawet powiększanie na full nie pomaga. :(

    Będę wdzięczna za pomoc.
    Pozdrawiam :)

    0
    • Robert Drózd pisze:

      Jeśli PDF to wyłącznie skany – jedyny sposób to skorzystać z programu do rozpoznawania tekstu (OCR) takiego jak FineReader. Większość tych programów jest niestety płatna. Jakąś formę rozpoznawania tekstu mają dokumenty Google – można tam dodać PDF i wyciągnąć tekst, ale nie testowałem tego nigdy.

      0
  32. JemKanapke pisze:

    Mam problem z dwoma książkami w PDF (trzy udało mi się z sukcesem przekonwertować w ten sposób)
    Chodzi o to, że mimo obecności polskich czcionek w PDF’ie, po przerobieniu na HTML nie ma części polskich znaków (a część jest). Tak samo ma Word 2013 z tymi dwoma plikami. Ktoś się z tym spotkał?

    Jedna to PDF: Cialdini R. – Wywieranie wpływu na ludzi. Teoria i praktyka

    0
  33. Piotrek pisze:

    Uwaga, może mam debilne pytanie, ale podobno kto pyta, nie błądzi ;-)

    Czy da się zrobić ebooka w formacie epub lub mobi z pliku pdf, który jest skanem? Mam wydania gazety, której jest autorem i mogę je zeskanować do pliku pdf, ale niestety nie ma już oryginalnych plików, z których był on drukowany.

    Nie muszę robić tego sam, mogę za to zapłacić. Tylko, czy jest to w ogóle realne?

    pozdrawiam

    0
    • Robert Drózd pisze:

      Można to zrobić, o ile wcześniej przetworzymy plik PDF do tekstu przy pomocy oprogramowania OCR. Najlepiej tutaj radzą sobie niestety programy płatne, np. FineReader czy PDF Transformer firmy ABBYY. Nowe wersje potrafią konwertować bezpośrednio do EPUB, w starszych zrobisz plik RTF lub HTML, który potem można przerobić na EPUB/MOBI.

      0

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania. Jeśli chcesz mieć swój obrazek przy podpisie, zarejestruj swój adres mailowy na stronie gravatar.com.

Zapisz się także do newslettera Świata Czytników


Komentarze do tego artykułu można śledzić także w formacie RSS.