Za drogo? Ustaw alerty cenowe na e-booki i kupuj taniej!

Jak pozbyć się wiszących spójników w Calibre?

Zrobiła nam się malutka seria na temat wykorzystania programu Calibre, do poprawy wyglądu naszych książek, dlatego pójdę za ciosem i opiszę, jak w e-bookach usunąć tzw. wiszące spójniki i przyimki, zwane też sierotkami.

Operacja to dość prosta i nie zawsze konieczna, ale niektórym może się przydać.

Czym są wiszące spójniki?

Porównajmy jeden cytat:

Co do wzroku, nie poczułem się dotknięty, gdyż agresywność uchodzi w
przekonaniu niemal wszystkich Polaków za zaletę.

I drugi:

Co do wzroku, nie poczułem się dotknięty, gdyż agresywność uchodzi
w przekonaniu niemal wszystkich Polaków za zaletę.

W pierwszym na końcu wiersza zalazł się samotny spójnik „w”, co nie wygląda najładniej. Według słownika ortograficznego:

54.8.1. Jednoliterowe spójniki i przyimki (a, i, u, w itd.) mogą pozostawać na końcu wiersza w tekście ciągłym, natomiast w tytułach książek i ich rozdziałów winny być przenoszone do następnego wiersza.

Autorzy poradni językowej PWN precyzują, że bezwarunkowe przenoszenie sierotek do następnego wiersza to zasada edytorska, a nie ortograficzna. Najczęściej zależy nam po prostu na estetyce tekstu.

Usuwanie w Calibre

Jak temu zaradzić? Wstawiając między spójniki (oraz przyimki) i następujące po nich wyrazy tzw. spację niełamliwą, która w HTML ma kod „ ”.

Można to zrobić na różnych etapach przygotowania e-booka, ale zawsze tam, gdzie mamy dostęp do źródła książki. Ja skorzystam z najpopularniejszego programu Calibre.

Klikamy przycisk konwersji w Calibre – pokaże się okno z ustawieniami. Tam wybieramy „Wyszukaj i zamień”, gdzie wpisujemy następujące wyrażenia:

  • Wyszukaj wyrażenie regularne:
    (\s[iuawzoIUAWZO])(\s)
  • Tekst zastępujący:
    \1 

Wyglądać to będzie tak.

(uwaga: na zrzucie ekranowym brakuje średnika na końcu tekstu zastępującego – proszę  przeklejać z artykułu)

Po wpisaniu klikamy „dodaj” – a reguła doda się na samym dole.

Jeśli zamieniać chcemy nie tylko jednoliterówki, ale także dłuższe słowa, wyrażenie może wyglądać np. tak:

(\s(Do|W|We|Z|Za|Ze|I|O|U|A|do|w|we|z|za|ze|i|o|u|a))(\s)

Albo tak:

(\s\b.{1,2}\b)\s

(To wyrażenie będzie działało dla wszystkich słów jedno i dwuliterowych – podpowiedział je fenux z forum.eksiazki.org)

Jeśli nie jesteśmy pewni, czy reguła zadziała – klikamy ikonkę różdżki po prawej stronie wyrażenia – wyświetli się okienko ze źródłem HTML e-booka i będziemy mogli sprawdzić, do których miejsc pasuje nasza reguła.

Jeśli chcemy regułę zastosować przy każdej konwertowanej książce – warto dodać ją w Ustawieniach Calibre – Konwersja – Opcje wspólne.

Ja mam tam dodane np. reguły usuwające podpisy z e-booków niektórych księgarni.

Co jest jeszcze ważne

Usuwanie wiszących spójników/przyimków daje najlepsze efekty, gdy w książce mamy tekst wyjustowany oraz stosujemy podział wyrazów.

Justowanie wymuszamy w opcjach konwersji „Wygląd i zachowanie”.

Z kolei na temat podziału wyrazów był osobny artykuł – można to zrobić jedynie w formatach EPUB i KF8 (AZW3), korzystając z wtyczki do Calibre.

Porównajmy dwa zrzuty ekranowe z Paperwhite.

Tutaj usunąłem spójniki ale nie podzieliłem wyrazów.

 

Tutaj podzieliłem wyrazy.

 

Przenoszenie spójników do następnego wiersza zwiększa jeszcze odległość między wyrazami, która jest wadą układu wyjustowanego. Podział wyrazów sprawia, że ta odległość jest mniejsza, a tekst wygląda bardziej naturalnie. Inna sprawa, że specjalista od składu znajdzie i tak kilka innych błędów na powyższych zrzutach z Opowiadań wszystkich Leopolda Tyrmanda. :-)

Warto jeszcze dodać, że:

  • część e-booków z polskich księgarni ma dodane niełamliwe spacje przed spójnikami – dlatego wyglądają znacznie lepiej, gdy podzieli się tam wyrazy.
  • niełamliwe spacje przetrwają wysyłkę mailową na Kindle, w przeciwieństwie do podziału wyrazów.

Aktualizacja z 15 grudnia 2014: – podział wyrazów też przetrwa wysyłkę mailową na Kindle, pod warunkiem że wysyłamy tzw. hybrydowy plik MOBI – złożony ze starego i nowego formatu. Aby uzyskać taki plik w Calibre, w opcjach konwersji w zakładce „Wyjściowy MOBI” w polu „Typ pliku” ustawiamy „both”.

Czytaj dalej:

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Korzystanie z Kindle i oznaczony tagami , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

84 odpowiedzi na „Jak pozbyć się wiszących spójników w Calibre?

  1. YuukiSaya pisze:

    A mi się ten mini-cykl szalenie podoba, bo Calibre ma mnóstwo opcji i opcyjek, do tego różne pluginy i zwyczajnie można zgłupieć albo popsuć albo jedno i drugie.

    0
  2. Tomek pisze:

    O tych opcjach (twarda spacja w .mobi i możliwość wyjustowania tekstu) dowiaduję dopiero teraz. Mam kilka pytań.
    1. Czy jeżeli w jakaś książka ma już wyjustowany tekst to wpłynie to jakoś na jej wygląd?
    2. Czy jeżeli dodam te opcje do wszystkich posiadanych książek w Calibre (blisko 500) to bardzo mi „zamuli” komputer?
    3. Jak wygląda kwestia dodania twardej spacji do „Opcji wspólnych”. Czy zawszę w książce zakupionej w formacie .mobi zmieniać „Metadane” i ciągle ustawiać twardą spację i justowanie?
    4. Czy działa to w książkach robionych własnoręcznie w wordzie, a konwertowanych do .mobi w Calibre?

    0
    • Dam pisze:

      Wszystkie zmiany zachodzą dopiero podczas konwersji, a nie automatycznie tylko z racji, że masz książke w Calibre.

      0
  3. Julian pisze:

    Pytanie: czy jeśli w USA z oficjalnego sklepu Amazona (1-dniowa darmowa przesyłka) zamówię Kindle-a Paperwhite (tego bez reklam) to czy będę miał oficjalną międzynarodową gwarancję? Wyszłoby to o 56$ taniej, a mam akurat taką okazję.
    Dziękuję za pomoc ;)

    0
    • leszcz pisze:

      oczywiscie ze tak , nawet jak kupisz uzywanego na allegro ktory jest na gwarancji /warunek: Rachunek zakupu przez poprzedniego wlasciciela/

      pozdrawiam

      0
  4. doradora pisze:

    „w” to przyimek a nie spojnik

    0
  5. danan72 pisze:

    Z tego co pamiętam, użycie niełamliwych spacji ma niekorzystny efekt uboczny – dla połączonych nimi słów nie działa wyszukiwanie definicji w słowniku :(

    0
    • kpalka pisze:

      Prawda, tak samo denerwujący jest—w książkach anglojęzycznych—myślnik. Tam używa się go tak jak w moim wcześniejszym zdaniu – bez spacji między pauzą a wyrazem i niestety wyszukiwanie w słowniku też nie działa.

      1
  6. Momus pisze:

    Dodałem „Ustawieniach Calibre – Konwersja – Opcje wspólne.” tego regexa, jednak jak wybieram konwersje książki, to nie widzę tego, jest puste, muszę to wkleić jeszcze raz per książka. Tak samo przetwarzanie heurystyczne jest wyłączone, chociaż we wspólnych to włączyłem. Jakiś sugestie? Mam najnowsze calibre.

    0
    • Momus pisze:

      Po pierwszym przetworzeniu pamięta… fajnie to teraz wygląda :) szkoda że trzeba to robić sobie samemu.

      0
    • Momus pisze:

      Pytanie jeszcze o tego regexa, czy tam na końcu przy tym (\s) nie powinien być tam jakiś +, zauważyłem że niekiedy zostanie mi np w Potterze, albo Kodzie da Vinci „w” czasem „i”. Wygląda jakby, były tak po prostu dwie, 3 spacje. Nie znam składni regexów dla pythona, ale w JS, PHP, c++, znak plusa zmienia „liczebność” selektora na 1 i więcej.

      0
      • Jak plik jest dobrze przygotowany to są raczej pojedyncze spacje, więc można użyć s. Ale jako, że s+ złapie to wszystko co złapie s to raczej nie zaszkodzi :)

        W Pythonie „+” też oznacza „jeden lub więcej”.

        0
  7. alfbrajn pisze:

    „Ja mam tam dodane np. reguły usuwające podpisy z e-booków niektórych księgarni”
    Moglibyśmy jakoś to dostać?

    0
    • Robert Drózd pisze:

      Ale to każdy musi sobie ustawić zgodnie z tym jakie ma podpisy. ;-)

      Np. podpis z Woblinka (przynajmniej starszych książek, bo teraz nawet nie pamiętam) to tekst zaczynający się od „==” co każdy rozdział. On jest normalnie na czytniku niewidoczny, ale w Kindle for PC tak. Jeśli go sobie skopiujemy i każemy Calibre zamieniać na pusty ciąg – wtedy go z książki usunie. Zaznaczam że to nie jest pewnie jedyne zabezpieczenie takiej książki.

      Usuwałem też podpisy z książek ebookpoint, ale to już od pewnego czasu jest niepotrzebne: http://swiatczytnikow.pl/ebookpoint-zmienia-oznaczenie-ksiazek-m-in-po-waszych-uwagach/

      0
      • Zaznaczam że to nie jest pewnie jedyne zabezpieczenie takiej książki.

        Jeśli celem usuwania jest użytek prywatny to nie ma co się martwić :)

        Kiedyś analizowałem pliki z pewnej polskiej księgarni i tam jest jeszcze jedna fajna sztuczka w kodzie, która nie ma wpływu na wygląd książki niezależnie od tła, więc nie przeszkadza w czytaniu, ale jednak zabezpieczenie jest.

        0
  8. sanchopan pisze:

    To wszystko prawda, choć trzeba przyznać, że łamanie tekstu dzisiaj robi się – jak wszystko – niechlujnie i byle jak. Ale…
    Robercie Drogi! Zajmij się też po sierotkach – bękartami, czyli krótkimi wyrazami pozostawionymi na końcu akapitu.
    Na przykład
    to.

    0
  9. carac pisze:

    Ponieważ korzystam z podkreśleń i często udostępniam te podkreślenia np. na fb (share) – zauważyłem, że te podkreślenia z przekonwertowanych książek nie sposób udostępnić. Pojawia się komunikat: Sharing Not Supported.
    Czy dzieje się tak dlatego, że korzystam z formatu AZW3? Co można zrobić, żeby jednak share działało?

    0
  10. Radek pisze:

    Bardzo fajny poradnik. Ja jednak przeważnie po konwersji np. z PDF mam problem z niechcianymi pustymi liniami lub podziałem akapitu w połowie zdania. Czy jest jakis sposób, aby zautomatyzować korektę takich błędów?

    0
    • quiris pisze:

      Jeśli masz akapity sformatowane prawidłowo z użyciem tagów <p> to możesz wychwycić sztucznie rozdzielone akapity np. takim wyrażeniem:
      ([^.:?!])</p>\n<p>

      Zamieniasz to na ” \1″ (przed \1 jest spacja)

      Powyższe wyrażenie odnajduje akapity, które nie kończą się ani kropką, ani dwukropkiem, ani pytajnikiem, ani wykrzyknikiem. Jednak zalecam dużą ostrożność i kontrolę tego co będzie zamieniane. Oczywiście powyższy sposób nie odnajdzie akapitów sztucznie rozdzielonych w miejscu wystąpienia opisanych znaków przestankowych.

      0
      • @quiris

        Zamiast n lepiej używać \s+ – po pierwsze jeśli książka była tworzona na Windowsie to n nie zadziała (bo na Windowsie znak nowej linii to \r\n) a po drugie jeśli kod jest wcięty to \r\n też nic nie da. Dlatego \s+ jest lepsze, bo łapie wszystkie białe znaki, niezależnie od platformy.

        1
    • Ja osobiście polecam to wyrażenie które wyszukuje akapity zaczynające się małą literą – łapie ono trochę za dużo przypadków, ale lepiej tak niż w drugą stronę :)

      </p>\s+<p>([a-z])

      zamień na

      \1 (tu jest spacja przed \1, a po nie ma)

      Z tym, że jeśli konwertujesz z PDF-a za pomocą calibre to żadne z tych wyrażeń raczej Ci nie pomoże, bo może być sporo dodatkowego kodu, nazwy klas, puste tagi (albo z białymi znakami) itd.

      0
  11. qoqosz pisze:

    Czy ktoś może wie jak zamienić wszystkie minusy „-” na ?
    Testuję w calibre wyrażenie regularne -\s\b i znajduje wszystkie wystąpienia tak jak chciałem, ale przy konwersji MOBI->AZW3 już w skonwertowanym ebooku nie są zamienione minusy na początku akapitu, reszta jest ok. Próbowałem też >-\s ale nic to nie dało.

    0
  12. niepco pisze:

    Przydatna funkcja – czy po jej zastosowaniu i ponownym wrzuceniu książek na czytnik, książki się na nim zduplikują czy też bezboleśnie się podmienią?

    0
  13. Marcin pisze:

    Robercie, mam dla Ciebie pomysł na biznes – zrób polskim wydawcom szkolenia z przygotowywania książek w wersjach elektronicznych (mobilnych?), bo biedactwa jeszcze nie wszystko ogarniają ;-)

    Bardzo fajny cykl, choć ogólnie jestem zbyt leniwy, a poza tym z moim pedantyzmem jakbym zaczął poprawiać ebooki to bym nie miał czasu na ich czytanie. Choć niektórym zdecydowanie przydałoby się np. odchudzenie – z niedawno kupionych kilku książek w InformIT jedna ma 6 MB jako PDF, 46 MB jako EPUB i 87 MB jako MOBI. Do tego ostatniego pliku mam wrażenie zapakowali dwa formaty (dwie różne wersje MOBI? MOBI + EPUB?).

    0
    • Robert Drózd pisze:

      Jeśli to propozycja do mnie – to ja się na tym zdecydowanie nie znam. :-) Bo my tu sobie ładnie teoretyzujemy, a potem w krótkim czasie trzeba zrobić plik MOBI który zadziała na 8 modelach Kindli i EPUB który zadziała na 100 modelach czytników. Jak zwykle na drodze perfekcji staje budżet i rzeczywistość. :-)

      E-booka z InformIT odchudzisz bez problemu w Calibre. Do EPUB pewnie zapakowali też obrazki z minimalną kompresją, co można sprawdzić po rozpakowaniu.

      0
  14. wicikumoza pisze:

    Brakowało mi takich poradników tutaj. Przydałaby się jeszcze instrukcja, jak okiełznać strony tytułowe i cytaty na początku rozdziału (źle się wyrównują – raz mi się udało poprawić, ale nie wiem dlaczego zadziałało :D), albo usuwanie odstępów między akapitami tak, żeby nie stracić odstępów, które jednak powinny być (np. gdy akcja przenosi się do innego miejsca/czasu).

    0
  15. pieluchowaty pisze:

    a czy jest taka mozliwość w calibre, aby przy konwersji np. z rtf do epub, program sam, automatycznie dzielił książkę na pliki html w miejscu gdzie jest nagłówek (h1, h2, h3) – coś jak ręcznie mozna zrobić w sygil-u.
    np plik rtf np. ma 60 stron w tym 4 rozdziały oznaczone nagłówkiem (h1) – normalnie calibre utworzy 1 plik html (wewnętrzna struktura epub), a ja chce aby każdy rozdział był zapisany jako odzielny html

    0
  16. Iwona pisze:

    pozbyłam się spójników, to znowu mi znikły znaczniki rozdziałów… powiem szczerze, ze już coraz częściej czytam takie niewyjustowane i byle jakie, bo mi się nie chce tyle zmieniać, z pewnością jest wygodniej jak sklep wyśle na kindla od razu.

    0
  17. pieluchowaty pisze:

    zrobiłem wg szukaj zamień w calibre tak jak koledzy wyżej podawali – usuwanie spójników
    i tu jest problem, w epub jest dobrze ale jak przekonwertuję epub do azw3 to pojawiają mi sie znaczki w tekście „&nbsp”
    czyli coś tu jest nie tak

    0
  18. KonradK pisze:

    Teraz dochodzę do wniosku, że w tym przeładowanym funkcjami programie, jakim jest Calibre, brakuje mi warunkowego Search&Replace, aktywującego daną operację tylko w określonych okolicznościach. Np. opisywaną zamianę tylko dla tekstów w języku polskim (a inną tylko dla tekstów w innym danym języku).

    I mam jeszcze pytanie do Roberta: jakim narzędziem robisz zrzuty ekranu Kindle?

    0
    • Robert Drózd pisze:

      W Paperwhite gest taki: jednoczesne dotknięcie lewego dolnego i prawego górnego rogu. Trzeba nabrać wprawy w sytuacji gdy na ekranie wyświetlony jest dialog, którego zamyka pojedyncze dotknięcie gdziekolwiek.

      0
  19. Grigori pisze:

    Jak w Calibre usunąć podziały stron między rozdziałami?

    0
  20. b pisze:

    To w końcu co trzeba tam wpisać? Bo w tekście jest „1 ” a na zrzucie ekranu „1&nbsp” – czyli bez średnika

    0
  21. Daniel pisze:

    Po wprowadzeniu w życie powyższego poradnika mam problem, polegający na tym, że przy konwersji dzieli mi wers po wyrażonych w komendzie wyrażeniach i dodaje pusty wers po każdym takim spójniku. Wiecie może co robię źle?

    0
  22. encelados pisze:

    Super poradnik, działa.
    Jednak jeżeli w tekście znajdują się po sobie dwa spójniki rozdzielone spacją – np:
    „a i to niewszystko”
    „i w środku”
    „a o tym sza”
    – pozostają one wiszące.
    Jak zmodyfikować podanego regexa (albo jakiego dodatkowego użyć) – aby usuwać takie „podwójne” wiszące spójniki?

    0
    • kaliban pisze:

      Podbijam prośbę, będę wdzięczny tęgiej głowie za tę formułę oraz jeszcze jedną: przenoszącą wiszące spójniki, które znajdują się zaraz za nawiasem: (a / (w / (i itd. – one również są pomijane przez tę ogólną formułę.

      0
      • encelados pisze:

        Jak się okazuje, rzadko bo rzadko, ale bywają nawet i „potrójne” wiszące spójniki:

        „(…), a w z tru­dem do­by­wa­nym gło­sie wy­raź­nie za­brzmiał strach (…)”

        Pełne zdanie:
        „Zim­ny wzrok Som­me­ra pa­ra­li­żo­wał je­go ru­chy, a w z tru­dem do­by­wa­nym gło­sie wy­raź­nie za­brzmiał strach, któ­re­go nie po­tra­fił ukryć.”

        Ale nikt nam nie odpowiada na nasze pytania. Chyba pozostaje poprawiać to ręcznie…
        :-D

        0
  23. Qfwfq pisze:

    Jak może wyglądać taka formuła dla języka angielskiego, ktoś wie?

    0
    • klaman pisze:

      W j. angielskim nie obowiązują takie reguły edytorskie. Pojedyncze znaki mogą występować na końcach wierszy.

      0
  24. contrame pisze:

    Czym może być spowodowane to, że podane reguły nie działają? Próbowałem przy konwersji z epub do epub/mobi/azw3, „Test” w konstruktorze wyrażeń regularnych (ta „różdżka”) pokazuje miejsca, w których reguła występuje, ale wyrażenie jest dodane, ale po kliknięciu OK i konwersji w tekście nie ma żadnych zmian. Testowałem wszystkie trzy reguły (średnik dodany) i za każdym razem to samo. Z góry wielkie dzięki.

    0
  25. Marek68 pisze:

    A ja mam taki problem. Chciałbym aby każdy nowy rozdział zaczynał się od nowej strony. W wordzie zatem na końcu rozdziału ustawiam znak końca strony. Po konwersji książki (na przykład z *. docx) uzyskuję plik AZW3 . I tak jak założyłem nowy rozdział zaczyna się na początku strony. Do momentu podziału wyrazów. Gdy tekst „poupycha się” po podziale wyrazów zostaje mi na końcu rozdziału pusta strona. Wygląda to tak, jakby na rozdział zarezerwowana została jakaś konkretna ilość stron i podział wyrazów tej ilości stron nie zmniejszył.
    Jest to dla mnie dosyć frustrujące, ponieważ po walce z kompletnie „rozsypanym” tekstem nie mogę cieszyć się efektami kilkugodzinnej pracy.
    Gmyram w Calibre już dłuższy czas i nie mogę znaleźć nigdzie miejsca, w którym mógłbym taką pustą stronę usunąć. W edytorze (w Calibre) każdy rozdział wygląda normalnie i nie widać nigdzie pustej strony. Zatem gdzie ta strona jest zapisana?

    Mam nadzieję, że w miarę konkretnie opisałem mój przypadek. I mam cichą nadzieję, że jakaś dobra dusza coś podpowie…

    0
  26. Stefan pisze:

    Dzień dobry, pytanie z mojej strony – czy jest możliwość takiej konwersji w Calibre, żeby usunąć losowo wstawione znaki nowej linii? Przykład:
    „Kiedy mama
    poszła do sklepu kupiła dużo chleba.” =>
    „Kiedy mam poszła do sklepu kupiła dużo chleba.”

    0
  27. kolecki2 pisze:

    Chciałbym zrobić z pdf -> epub i docelowo mobi.
    Jednak natrafiam na pewnie powtarzający się problem. Tzw puste linie, często po jednym wyrazie.
    Z tego co widzę na podglądzie Calibre w zakładce wyszukaj i zmień, po kliknięciu różdżki, po każdej linijce PDFa mam (fonetycznie) . I taki stoi w środku zdania na końcu wiersza z pdf.

    Przykład:
    Bo te trzy setne, jak sobie od miliona sztywniaków policzysz, to liczba
    wychodzi taka, że włosy z głowy rwać.

    po liczba *

    Jak usunąć automatycznie nadmierne , które są pozostałością formatowania pdf’a?

    Z góry dziękuję za jakaś radę
    CZYTAĆ bez GWIAZDEK

    0
  28. kolecki2 pisze:

    Chodzi o to, że w środku zdania zaczyna się nowy wiersz. Chciałbym się pozbyć tego znacznika.
    Daję link , bo nie moge go wpisać :)

    http://zapytaj.onet.pl/Category/007,007/2,1546428,Co_to_znaczy_ltBRgt_.html

    a problem wygląda tak:

    http://torg.pl/showthread.php?445183-Mini-Poradnik-Konwersja-plik%F3w-PDF-do-MOBI-bez-zb%EAdnych-spacji-oraz-pustych-wierszy

    tyle że rozwiązanie mnie nie zadowala. Chcę zachować część formatowania.

    0
    • Marek68 pisze:

      A ja w końcu przestałem kopać się z koniem.
      Przerabiam PDF-a na dokument Word-a, a tam mam większe możliwości poprawiania książki. Chociażby poprzez wyrażenia regularne.
      Poprzez funkcję znajdź/zamień z włączoną opcją „użyj symboli wieloznacznych” pozbywam się wkurzających znaków końca akapitu w środku zdania.
      Zapewne w Calibre byłoby to bardziej elegancko ale…
      W polu znajdź wpisuję:
      ^13([abcćdefghijklłmnoópqrstuvwxyzźż”]*)
      a w polu zamień na wpisuję:
      \1
      przed „\1” jest spacja
      Szukam znaku końca akapitu, po którym występuje mała litera i ten znak usuwam.
      Działa bez pudła. Niekiedy trzeba później zamienić dwie spacje na jedną ale to banał…

      PDF-a na Word-a zamieniam przy u życiu Word-a 2013. Poprzednio korzystałem z Abbyy Fine Reader-a lub Adobe Acrobat Pro.
      Odkąd mam dostęp do Word-a 2013 korzystam tylko z niego. Zamienia najlepiej.

      Trzeba przyjąć, że nie da się przerobić (oczyścić) książki z PDF-a jednoprzebiegowo w Calibre. Aby otrzymać porządnie przygotowana książkę do czytania na czytniku trzeba trochę nad nią popracować…

      0
      • Winter pisze:

        Czy to działa tylko na Word 2013? Bo mam starszego i chciałabym zastosować metodę, ale nie działa.
        Mam plik w Wordzie i chciałabym pozbyć się tych sztucznie stworzonych akapitów.

        0
  29. Edyta pisze:

    Dostałam plik PDF w którym wyrazy są podzielone w środku np. Spoj rzał w j ej zielone oczy. To by ł ostatni m om ment. Próbowałam różnych metod przeróbki między innymi do HTML i potem w Calibre do Mobi , przetestowałam hyphenate oraz różne konfiguracje konwersji i nic . Pomocy :)

    0
    • klaman pisze:

      To przecież są spacje, więc jakim cudem sama konwersja formatu miałaby je usunąć? Gdyby miała to robić, to uzyskałabyś w efekcie coś takiego: „Spojrzałwjejzieloneoczy.Tobyłostatnimoment.”
      Na to raczej patentu nie znajdziesz, bo musiałby pracować w oparciu o słownik, a i tak przez to robiłby inne błędy (łącząc prawidłowo zapisane wyrażenia). Jeśli te spacje są już w PDFie, to nic z tym nie zrobisz, oprócz ręcznej edycji.

      0
  30. Fox pisze:

    Po przekonwertowaniu książki z pdf do mobi mam enter co dwie linijki. Jak to naprawić?

    0
    • Athame pisze:

      Przekonwertować lepszym narzędziem… Inna droga to ręczne, żmudne poprawianie. Możesz też spróbować wyrażeń regularnych, ale niemal na 100% „poprawią” za dużo.

      0
  31. Quayaseal pisze:

    Można command line’owo:

    ebook-convert –mobi-ignore-margins –change-justification=justify –search-replace=replace

    gdzie plik replace:

    (\s[iuawzoIUAWZO])(\s)
    \1 
    (po jedynce jak w opisie w artykule, „zjada” mi autoedycja forum)

    Podana jednak recepta wywali się na jednym – podwójnych sierotkach: „i w tym”, „a o tym”, „i z tym”…

    1
  32. Guayaseal pisze:

    [code](\s[iuawzoIUAWZO])(\s)([iuawzoIUAWZO])(\s)
    \1 \3 

    (\s[iuawzoIUAWZO])(\s)
    \1 [/code]

    0
  33. Guayaseal pisze:

    (\s[iuawzoIUAWZO])(\s)([iuawzoIUAWZO])(\s)
    \1 \3 

    (\s[iuawzoIUAWZO])(\s)
    \1 

    0
  34. Ania pisze:

    Mnie wpieniają przeokrutnie te niełamliwe spacje po spójnikach. Kupiłam kiedyś blisko dwadzieścia książek Lema z Virtualo i Publio i wszystkie to mają. Nie mogę sprawdzić w słowniku słowa, jeśli przed nim był spójnik, bo Kindle rozumie spójnik+niełamliwą+słowo jako jedno słowo. Pomyślałam ostatnio, że może w ciągu tych pięciu lat odkąd kupiłam te ebooki ktoś pomyślał, że wypadałoby je zaktualizować do obecnych standardów i pobrałam na próbę po jednym z Virtualo i Publio, ale nadal są takie paskudne i wygląda na to, że będzie mi trzeba gmerać w Calibre, szkoda.

    1
    • Robert Drózd pisze:

      Na ogół jest niestety tak, że jak plik został raz przygotowany przez wydawcę, to już go przez lata nie ruszają, no chyba że ktoś zgłasza duże zastrzeżenia, albo pojawi się nowe wydanie.

      1
    • W. pisze:

      Dziwne, nie mam takiego efektu na PW2. Pliki przepuszczam przez epubQTools.

      0
      • Athame pisze:

        Ja też nie mam takiego problemu na Voyage. Irytują mnie „wiszące spójniki” i brak podziału wyrazów, więc zawsze poprawiam sobie pliki, które nie mają tego domyślnie. Mogę bez problemu zaznaczyć tylko słowo po spójniku i dalej sprawdzić je w słowniku.

        Bardzo dobrze, że e-booki dostępne w księgarniach są robione coraz porządniej. A jak ktoś ma dziwne wymagania, to może pogmerać sobie w calibre.

        1
      • Ania pisze:

        Ja po prostu ściągam mobi i wysyłam mailem na czytnik (PW3). Obecnie przeważnie ląduję z plikiem bez okładki, za to ładnie sformatowanym, ale te Lemy mnie bolą, bo wciąż dość często Lema czytam, a takie to nieładne. No ale cóż, po prostu pokombinuję w Calibre.

        Robiłam sobie nadzieje, że znajdę po latach w biblioteczkach sklepów internetowych ulepszone pliki, bo to jednak Lem, teraz mamy rok Lema i tak dalej.

        0
        • Athame pisze:

          Przecież to są ulepszone pliki – dodanie niełamliwych spacji i znaków podziału wyrazów, to dodatkowa praca.

          1
          • Ania pisze:

            Jeśli te niełamliwe spacje nie pozwalają sprawdzić niektórych słów normalnie w słowniku na Kindle, to to nie jest ulepszenie. A i podziału wyrazów w tych plikach nie uświadczysz.

            No ale czytam teraz „Ziemię obiecaną” z WL. Sierot brak, dzielenie wyrazów jest. Słowo po spójniku mogę sprawdzić w słowniku bez problemu… na czytniku. W aplikacji z iOS nie (dopiero to zauważyłam). Tak więc chyba można wysnuć hipotezę, że to sam Kindle niełamliwą spację inaczej traktuje w tych archaicznych mobi (Lemy) niż w nowszych („Ziemia obiecana”). I nie ma pod tym względem spójności między apką a oprogramowaniem czytnika. To może wystarczy jak w Calibre zapiszę Lemy jako hybrydowy mobi i wyślę na czytnik.

            0
  35. słowa ze spacją między literami pisze:

    Czy jest jakaś mozliwość aby przekonwertować w Calibre ebooka, który ma w treści słowa, które wydawca sformatował tak, że każda litera w nim oddzielona jest spacją? Przykład: „s ł o w o” – a chcę aby było „słowo”.
    Przeszkadza mi to bo aplikacja Książki Google czytając na głos powoduje, że literowane słowa są nieczytelne. „es eł o wu o”
    brrrr

    0
    • asymon pisze:

      Zaglądałeś do arkusza stylów w ebooku?Czy tam są faktycznie spacje? Otwierzasz w Calibre przez „Edytuj książkę” i potem:

      – jeśli są tam faktycznie spacje, to słabo, trzeba ręcznie poprawić tekst, bo automat nie odróżni chyba „poprawnej” spacji od takiej. Można pobawić się w wyrażenia regularne, szujać wyrażenia typu: ” (\w) ” (jedna litera ze zwykłą spacją na początku i końcu), ale to zabawa, choć mniejsza niż ręczne poprawianie. Spacja może być zastąpiona spacją niełamiącą: &nbsp; – czyli szukasz np. „&nbsp;(\w)&nbsp;”

      – jeśli w arkuszu stylów jest zdefiniowany parametr letter-spacing, to można go zmienić albo w ogóle usunąć. Tylko nie pamiętam, czy letter-spacing jest w ogóle obsługiwany w standardzie epub/mobi, bo coś-gdzieś kojarzę, że czasem użycie go wywala ostrzeżenia, ale nie pamiętam w jakim kontekście :-/

      Najprościej zajrzeć do pliku epub.

      0
  36. batum pisze:

    Cześć,

    w sytuacji kiedy używam słownika wyrazów obcych, zaznaczając słowo, łączy się z poprzedzającym spójnikiem. Między nimi jest spacja ale jakby mniejsza. Efektem tego jest brak rozpoznawalności słowa przez słownik. Jak temu zapobiec. Przykład zdjęcia w linku.
    https://drive.google.com/file/d/13t9ZdpyBB3ZqlkG2kC5vC1ws1iVoH2BY/view?usp=share_link

    0

Skomentuj Quayaseal Anuluj pisanie odpowiedzi

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania i polityką prywatności

Komentarze do tego artykułu można śledzić także w formacie RSS.