Masz problemy z podziałem wyrazów w Calibre? Zmień konfigurację wtyczki Hyphenate This!

15 grudnia 2020 Autor: Robert Drózd. Tematy: Calibre • EPUB • Konwersja. Komentarze (21) »

•

Niedawna aktualizacja programu Calibre do wersji 5.0 przyniosła trochę problemów, z którymi powoli sobie radzimy.

Jak pamiętamy, program został przepisany w 3 wersji Pythona, a to spowodowało konieczność zaktualizowania wszystkich wtyczek. Przez jakiś czas np. nie mieliśmy dostępnej wtyczki Hyphenate This!, odpowiadającej za dzielenie wyrazów w plikach EPUB/AZW3.

Działanie tej wtyczki opisywałem tutaj dwukrotnie:

Jak podzielić wyrazy w e-bookach KF8 lub EPUB? (rok 2013)
Jak przy pomocy Calibre poprawić e-booki wysyłane na Kindle? (rok 2015)

Wtyczka została zaktualizowana, ale zauważyłem, że czasami dzieli wyrazy… dość dziwnie.

Problem

Oto przykład z książki Euro. W jaki sposób wspólna waluta zagraża przyszłości Europy autorstwa Josepha Stiglitza.

Przy niektórych słowach polskie znaki znajdują się nieprawidłowo w następnym wierszu.

Np. rozwi-ązaniami, albo zamkni-ętymi.

Co się stało?

Wtyczka Hyphenate This! korzysta z dostępnego publicznie pliku słownika hyph_pl_PL.dic, który ma wiele lat i stosowany jest choćby w programie Libre Office. Nawet ustawienia wtyczki odsyłają do Libre Office.

Co więcej, z identycznego pliku korzysta program Calibre, który w ramach funkcji „Dopracuj książkę” ma również dodawanie łączników opcjonalnych – jako „Add soft hyphens”.

No i podział przez „Dopracuj książkę” działał, przez wtyczkę już nie.

I tu czas na dygresję: skoro ta funkcja jest wbudowana w Calibre, po co korzystać z dodatkowej wtyczki? Z dwóch powodów.

Pierwszy jest taki, że wtyczka daje dodatkowe możliwości – np. pominięcie nagłówków i krótkich wyrazów.

Drugi, że „Dopracuj książkę” działa co najmniej dziwne – jeśli poprawimy w ten sposób plik EPUB, to przy konwersji do MOBI program z niego… nie korzysta, a bierze niezmodyfikowaną kopię oryginału, oznaczoną jako „ORIGINAL EPUB”. Uznałem że to błąd, zgłosiłem w bugtrackerze Calibre, na co odpowiedział mi sam Kovid Goyal, twórca Calibre, że tak ma być. No cóż, niezbadane są ścieżki myślenia developerów.

Jeśli uprzemy się przy korzystaniu z „Dopracuj książkę”, w zaawansowanych ustawieniach Calibre można tworzenie kopii wyłączyć – ustawiamy następujący parametr:

save_original_format_when_polishing = False

Dobre i to.

Rozwiązanie

Na rozwiązanie wpadł nasz czytelnik Dariusz.

Okazuje się, że plik hyph_pl_PL.dic korzystał ze starego kodowania znaków, popularnego w swoim czasie w internecie ISO 8859-2. Obecnie większość stron, ale również e-booków zapisywana jest w formacie UTF-8.

I wystarczyło przekodować plik słownika do UTF-8. Tu możecie go pobrać. Jeśli otwiera się zamiast zapisywania, skorzystajcie z opcji „zapisz link jako…” lub podobnej pod prawym klawiszem myszki. Ewentualnie link do pliku ZIP.

Sprawdziłem na paru książkach i już jest w porządku. Wracamy do Stiglitza.

Plik instalujemy tak jak opisywałem we wcześniejszych artykułach. Z menu wtyczki Hyphenate This (będzie dostępna w głównym pasku Calibre jako „Dziel wyrazy”) wybieramy „Settings”.

Następnie dodajemy z dysku plik słownika („hyph_pl_PL.dic”). Jest to czynność jednorazowa. Potem możemy już przerabiać pliki EPUB lub AZW3.

Jeśli mieliście podobnie jak ja problemy z podziałami wyrazów, sprawdźcie nowy plik słownika.

PS. Jeśli ktoś wysyła przekonwertowane w Calibre pliki na Kindle w formacie MOBI „both” (patrz artykuł 50 twarzy MOBI), może zauważyć, że ostatnio część plików konwertuje się nieprawidłowo. Napiszę o tym niedługo artykuł, tymczasem wspomnę tylko, że konieczne jest tutaj użycie konwersji przy pomocy amazonowego programu Kindle Previewer.

Podobne wpisy

Tweetnij

•

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Książki na czytniki i oznaczony tagami Calibre, EPUB, Konwersja. Dodaj zakładkę do bezpośredniego odnośnika.

21 odpowiedzi na „Masz problemy z podziałem wyrazów w Calibre? Zmień konfigurację wtyczki Hyphenate This!”

rudy102 pisze:
15 grudnia 2020 o 21:02
Ja po prostu nie aktualizuję calibre bo i po co skoro działa
0
Odpowiedz
- Robert Drózd pisze:
  15 grudnia 2020 o 21:21
  No, biorąc pod uwagę te problemy, żałowałem że nie zostałem przy wersji 4.x. Ale problem z PS. występuje też przy 4.23, którą w desperacji zainstalowałem, więc pozostanie nie rozwiązuje wszystkiego.
  Zaletą Calibre 5 jest jednak znacznie większa szybkość, np. konwersji, ale również wyszukiwarki. Jak w starym wpisałem w wyszukiwarce tytuł książki, międlił i międlił dysk przez kilkanaście sekund nawet. W nowym działa to natychmiast (co nie jest pewnie zaletą pythona tylko nowego formatu bazy danych, może wreszcie indeks dodali).
  1
  Odpowiedz
  - rudy102 pisze:
    15 grudnia 2020 o 22:02
    Ja mam 4.21 i nigdy nie miałem problemów z mielącą wyszukiwarką, ułamek sekundy i są wyniki.
    0
    Odpowiedz
    - Robert Drózd pisze:
      15 grudnia 2020 o 22:06
      A ile masz książek w Calibre? Ja 3870.
      1
      Odpowiedz
      - rudy102 pisze:
        15 grudnia 2020 o 22:08
        4x mniej ale to i tak chyba całkiem sporo xd
        0
        Odpowiedz
      - mjm pisze:
        16 grudnia 2020 o 13:43
        U mnie jest ponad 5000 pozycji i też zero problemów z wydajnością wyszukiwarki, zarówno w wersji 5.x jak i 4.x.
        0
        Odpowiedz
Marek pisze:
16 grudnia 2020 o 08:49
Ja od jakiegoś czasu zamiast Hyphenate This! używam epubQTools, jest nawet nowsza wersja przekonwertowana na pythona3 – https://github.com/johnykvsky/epubQTools ostatnio na nią trafiłem, sprawdzałem i działa, chociaż nie jest to oficjalne wydanie (program jest już nierozwijany?)
Plik po konwersji wygląda lepiej niż po Hyphenate – tak to ustawiłem, że mam skrypt, który wszystkie pliki w danym katalogu konwertuje, jak kupuję książkę, to zapisuję do niego, odpalam skrypt, mieli, jak gotowe, to dodaję do calibre epub i mobi.
0
Odpowiedz
- Robert Drózd pisze:
  16 grudnia 2020 o 08:55
  Dzięki, muszę potestować jak to działa pod windows. Faktycznie sądziłem, że program nie jest już rozwijany.
  0
  Odpowiedz
- HerC pisze:
  16 grudnia 2020 o 17:21
  I z tego co pamiętam epubQTools tworzył plik mobi z podziałem wyrazów (!).
  0
  Odpowiedz
Adam pisze:
16 grudnia 2020 o 11:59
„Następnie dodajemy z dysku wtyczkę.” – chyba chodzi o słownik?
0
Odpowiedz
- Robert Drózd pisze:
  16 grudnia 2020 o 12:19
  Tak, moja pomyłka. Już poprawione.
  0
  Odpowiedz
QRAKAO pisze:
16 grudnia 2020 o 19:34
Ktoś mógłby mi wyjaśnić jak pobrać ten przekodowany słownik z podanego linku w artykule? Moja przeglądarka go wyświetla zamiast pobrać (Opera i Egde).
0
Odpowiedz
- asymon pisze:
  16 grudnia 2020 o 19:49
  Prawy przycisk myszy i „Zapisz link jako”
  2
  Odpowiedz
  - Robert Drózd pisze:
    17 grudnia 2020 o 13:23
    Podaję też link do pliku zip:
    https://swiatczytnikow.pl/downloads/hyph_pl_pl.zip
    0
    Odpowiedz
  - QRAKAO pisze:
    17 grudnia 2020 o 16:15
    To nie może być takie pros…
    …
    …
    …
    A jednak 🤣
    0
    Odpowiedz
Agnen pisze:
17 grudnia 2020 o 10:37
No nie wiem, czy jest dobrze po przekonwertowaniu do utf-8? Po podmianie słownika w czytniku nadal występują kwiatki typu: stoj – ący.
0
Odpowiedz
- Robert Drózd pisze:
  17 grudnia 2020 o 10:41
  Upewniłbym się czy na czytniku nie masz starej wersji książki. No i przed ponownym podzieleniem trzeba usunać podziały (remove soft hyphens), a także jeśli trzeba, przekonwertować z epub do mobi.
  0
  Odpowiedz
  - Agnen pisze:
    17 grudnia 2020 o 12:16
    Już to robiłem. Podział przy pomocy wtyczki i słownika w utf-8, zamiana słowników w czytniku, usunięcie słownika z czytnika. Wynik za każdym razem do d… Przypuszczam, że jest to konflikt wtyczka – opcja w dopracuj książkę. Zadałem sobie trud odszukania w słowniku błędnie podzielonego słowa i w słowniku był zakaz dzielenia w tym miejscu (o zakazie lub możliwości dzielenia decyduje parzysta lub nieparzysta cyfra). W chwili obecnej używam „dopracuj książkę” , słownik wywalam z czytnika, w css ustawiam blokadę podziału nagłóków.
    2
    Odpowiedz
Marek Wojtaszek pisze:
6 kwietnia 2023 o 09:08
Ja mam taki problem, że po wrzuceniu na mojego Kindle’a przekonwertowanego pliku AW3, po operacji dzielenia wyrazów, słowa są niewyszukiwalne na urządzeniu – Kindle ich po prostu nie widzi w wyszukiwarce. Jedyny sposób to zaznaczenie jakiegoś wyrazu i kliknięcie lupki, żeby znaleźć pozostałe takie same wyrazy w książce czy na urządzeniu.
Czy jest na to jakieś rozwiązanie?
0
Odpowiedz
- Agnen pisze:
  6 kwietnia 2023 o 10:02
  To wina oprogramowania kindla i nie tylko kindla. Gdy wstawiasz podział słów wstawiasz „znaczniki”, które są niewidoczne na ekranie, ale wyszukiwanie ich nie ignoruje.
  1
  Odpowiedz
Antoni pisze:
29 lipca 2026 o 19:31
Znowu nie działa podział wyrazów. Myślałem, że starą konfigurację wgrałem. Usunąłem słownik, katalog. Wgrałem wskazany słownik i nadal dzieli „mi-ędzy”. Calibre „Dopracuj książki” działa poprawnie.
0
Odpowiedz

Dodaj komentarz Anuluj pisanie odpowiedzi

Komentarze do tego artykułu można śledzić także w formacie RSS.

kjonca on Premiera z Wolnych Lektur: Alicja w Krainie Czarów w nowym przekładzie!: “Ja p0prostu nie wiem co się za te 8% dostaje. Dlatego osobiście nie wiem czy to OK czy nie-OK :)…”

Robert Drózd on Premiera z Wolnych Lektur: Alicja w Krainie Czarów w nowym przekładzie!: “Tam jest zdaje się 10%, w tym jest już prowizja od bramki płatności.”

Marcin Palka on Premiera z Wolnych Lektur: Alicja w Krainie Czarów w nowym przekładzie!: “A jak sprawa prowizji wyglada w serwisach typu „buy me a coffee”?”

Robert Drózd on Premiera z Wolnych Lektur: Alicja w Krainie Czarów w nowym przekładzie!: “Rozważam z niechęcią zrobienie profilu ŚCz na Patronite i jak sprawdzałem, to faktycznie było 8% + chyba jeszcze prowizje płatności.…”

kjonca on Premiera z Wolnych Lektur: Alicja w Krainie Czarów w nowym przekładzie!: “A z tego co kojarzę patronite wcale tani nie jest. (kiedyś czytałem o 8%). Nie wiem jaka jest wartosć dodana…”

Masz problemy z podziałem wyrazów w Calibre? Zmień konfigurację wtyczki Hyphenate This!

Problem

Rozwiązanie

Podobne wpisy

21 odpowiedzi na „Masz problemy z podziałem wyrazów w Calibre? Zmień konfigurację wtyczki Hyphenate This!”

Dodaj komentarz Anuluj pisanie odpowiedzi

Szukaj na blogu

Przewodniki

Legimi

Kindle z Amazon.pl

Kindle z Amazon.de

Popularne artykuły

Dziś w Ebookpoint

Gdzie kupisz e-booki?

Promocje z Kindle Store

Nasz serwer

Śledź wpisy w serwisie

Informacja o cookies

Stopka redakcyjna

Wspieraj serwis

Ostatnie komentarze

Masz problemy z podziałem wyrazów w Calibre? Zmień konfigurację wtyczki Hyphenate This!

Problem

Rozwiązanie

Podobne wpisy

21 odpowiedzi na „Masz problemy z podziałem wyrazów w Calibre? Zmień konfigurację wtyczki Hyphenate This!”

Dodaj komentarz Anuluj pisanie odpowiedzi

Śledź nowości

Szukaj na blogu

Przewodniki

Legimi

Kindle z Amazon.pl

Kindle z Amazon.de

Popularne artykuły

Dziś w Ebookpoint

Gdzie kupisz e-booki?

Promocje z Kindle Store

Nasz serwer