Za drogo? Ustaw alerty cenowe na e-booki i kupuj taniej!

Powakacyjna promocja: Kindle Paperwhite o 30 euro, a Voyage o 40 euro taniej!

Jak poprawić e-booka w Sigilu: zapisane wyszukiwania

Kila razy na Świecie Czytników omawiany był temat automatycznej poprawy wyglądu e-booków w Calibre, np. usuwanie wiszących spójników. Wykorzystywano w tym celu możliwość wyszukiwania i zamiany w kodzie książki w EPUB.

W większości wypadków takie rozwiązanie ma jeden minus, poprawa taka jest widoczna dopiero po konwersji e-booka.

Chcę tu przedstawić metodę, która pozwoli widzieć efekt działania „w locie”, tak by można było wykonać drobne poprawki. Życie nauczyło mnie, że jakiekolwiek proste makro traktuje wszystko w pliku tak samo, czy to jest to, co chcemy poprawić, czy nie.

Od RD: artykuł gościnny Roberta Hnatiuka, który zajmuje się też tłumaczeniem Sigila na język polski. Jeśli jakiś obrazek jest nieczytelny – kliknięcie w niego otworzy pełną wersję.

Wyszukiwanie i zamiana w Sigilu

Każdy, kto w bardziej zaawansowany sposób zajmuje się e-bookami, zna pewnie program Sigil, przeznaczony do edycji plików EPUB i na pewno korzystał w nim z opcji szukania/zamiany. Aby wywołać takie okienko jako poniżej, przyciśnij Ctrl+F.

Sigil_2

Jednak powtarzanie „na okrągło” tych samych czynności może najspokojniejszą osobę doprowadzić do ich zarzucenia. I nie pomoże tu nawet korzystanie z wyrażeń regularnych.

Tu Sigil trochę nam pomaga. Jeżeli chcemy wcześniej użyć na e-booku szeregu podmian, możemy skorzystać z swoistego makro. W menu narzędzia, znajdziemy polecenie „Zapisane Wyszukiwania…”.

Sigil_3

Po kliknięciu na polecenie pojawia się okienko:

Sigil_5

Oczywiście, jeżeli ktoś ma pierwszy raz zainstalowanego Sigila, to ono nie jest puste, ma już wprowadzone kilka przykładów. Wszelkie usunięcia, czy edycje w tym okienku wykonujemy przy pomocy prawego klawisza myszy, oto menu jakie się pojawi.

Sigil_6

Grupy czyli zestawy poleceń

Jeśli chcemy przygotować zestaw poleceń dla różnego rodzaju e-booków, najlepiej utworzyć grupę.

Nową grupę tworzymy wybierając polecenie z menu:

Sigil_7

Nadajemy jej nazwę („Grupa testowa”):

Sigil_8

Oraz ponownie klikając prawym klawiszem myszy na nazwie tak utworzonej grupy, dodajemy nazwę nowego wpisu – tu nazwa „Zamiana kodów”.

Sigil_9

W efekcie widzimy wprowadzone polecenie zamiany o nazwie jaką wybraliśmy.

Sigil_10

Teraz można wprowadzać to, co ma się dziać w danym poleceniu – klikamy na wiersz pod odpowiednią kolumną.

Sigil_11Zapisane wyszukiwania

Ja również przygotowałem sobie zestaw takich poleceń (do pobrania), podzielonych na trzy grupy.

Sigil_12

Może wyjaśnię po kolei, co znajduje się w oknie.

  • Wczytaj Wyszukiwania – przepisuje polecenie zamiany zaznaczone w tym oknie do okna głównego programu (zrzut na samym początku artykułu).
  • Zlicz Wszystko – program liczy, ile wykona zamian danego polecenia (lub grupy poleceń) – pokaże konkretną liczbę w dole ramki okna.
  • Zastąp Wszystko – wykonywane jest polecenie, lub grupa poleceń, zamiany. Na końcu program podliczy, ile wykonał tych zamian.
  • Znajdź, Zastąp, Zastąp/Znajdź – robią to co opisują, wyniki widać „pod spodem” w oknie głównym programu, gdzie widać otwartego ebooka.
  • Save – zapisuje na stałe w Sigilu całą listę poleceń szukania/zamiany. Przyda się na przyszłość.
  • Close  zamyka okno zestawów poleceń.
Uwaga od tłumacza – te dwa ostatnie klawisze nie pojawiły się jeszcze w opcji tłumaczenia programu ;)

Jak realizujemy dany zestaw poleceń? Klikamy lewym klawiszem myszy na wybranej grupie zaznaczając ją. Teraz wystarczy kliknąć na klawisz „Zastąp Wszystko” i czekamy na wynik. Zostaną wykonane szukania/zamiany tylko grupy/pozycji którą wybraliśmy. Jeżeli e-book zawiera tylko tekst, zobaczymy na dole okna komunikat:

Sigil_14

Jeżeli e-book był bardzo dobrze „złożony” to liczba ta sięgnie kilkunastu zamian.

Kilka uwag

  • W oknie powyżej widać pomieszane polecenia „zwykłej” zamiany z poleceniami „Wyrażeń regularnych”. Warunkiem działania takiego zestawu jest to, by w oknie głównym Sigila wybrana był tryb pracy „Wyrażenia regularne”.
    Sigil_13
  • Następną sprawą jest odznaczenie (ciągle w głównym oknie programu) opcji „Zawiń”. Opcja ta powoduje, że wyszukiwanie/zamiana, po osiągnięciu końca e-booka jest kontynuowana od początku do miejsca gdzie program zaczął realizować wyszukiwanie/zamianę. Można powiedzieć, że tak powinno być, jednak niektóre e-booki mają wstawioną okładkę „na sztywno” (podane współrzędne, oraz rozmiar), co powoduje, że jedno z poleceń wprowadzonych wyżej uszkadza te współrzędne (pomiędzy liczby wprowadzany jest przez makro kod twardej spacji), pozycja okładki nie da się wtedy ustawić tak jak chcemy. Dlatego odznaczenie opcji „Zawiń”, oraz rozpoczęcie szukania/zamiany od następnej strony (w Sigilu – sekcji) po „pliku z okładką” załatwia sprawę (strona HTML okładki jest pomijana).
  • Ktoś może zapytać, patrząc na powyższe okno poleceń, po co mi sekcja „Grupa znaków nadmiarowych”. Już wyjaśniam. Niektóre wydawnictwa preferują dodanie twardej spacji przed myślnikiem polecenia, które ja stosuję dodają twardą spację po myślniku. A w ten prosty sposób prostuję to na taką modłę, jak ja to lubię.
  • Natomiast grupa „Awizou” ma inne uzasadnienie. Na początku zdań często występują „samotne” litery (A, W, I, Z, O, U). Zaobserwowałem, że dodanie twardej spacji przy pomocy wyrażenia regularnego podczas konwersji w Calibre, często nie jest wykonywane, gdy litery te „sąsiadują” z kodem HTML. Działanie tej grupy poprawia ten stan rzeczy. I tu okazało się, że Sigil jednak lepiej korzysta z wyrażeń regularnych, w ten sposób te reguły wylądowały w osobnej grupie „na wszelki wypadek”. Jak wyżej zauważyłem, każdy może te grupy inaczej tworzyć, z innym zamysłem. Ja tu tylko podaję przykład.
  • Jeszcze jeden drobiazg. Co wtedy, gdy ktoś reinstaluje system i na nowo instaluje Sigila? W menu, które wyżej zostało pokazane, jest polecenie: Import/Eksport… Dotyczy ono całej listy zapisanych wyszukiwań.

Jak ktoś chce u siebie sprawdzić te receptury – są dostępne do ściągnięcia. Wystarczy pobrać, rozpakować i zaimportować. Można je też podejrzeć na PasteBin.

Dla mniej zorientowanych dodam na koniec, że Sigil, w najnowszej wersji, obsługuje pliki ePub2 i ePub3. Ale także, po zainstalowaniu odpowiedniej wtyczki, pliki Mobi.

Pozdrawiam Wszystkich,
Robert Hnatiuk

Czytaj dalej:

Informacje o Robert H.

Koń jaki jest każdy widzi... A że oko pańskie konia tuczy... ;)

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Książki na czytniki i oznaczony tagami , , , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

41 odpowiedzi na „Jak poprawić e-booka w Sigilu: zapisane wyszukiwania

  1. pieluchowaty pisze:

    bardzo przydatny artykuł, mam nadzieję, że temat będzie rozwijany
    w Sygilu moznaby dodać opcje, aby dodawać własne przyciski do belki z ikonami, do których moznaby przypisać te”makra” lub „grupy makr”. Nie trzebaby było biegać po menu tylko klik – bo przecież każdy ma jakieś swoje preferowane szukaj/zamień
    przydałoby sie także okreslanie w tym makarach opcji z wyszukiwania np. zaznaczone/odznaczone wyrażenia regularne

    0
  2. Bociek pisze:

    Ech, dlaczego ebooki nie mogą być po prostu identyczne w treści i wyglądzie z wydaniami papierowymi? Lenistwo? Ograniczenia techniczne? Nieudolność? Kupujemy ebooka, którego potem i tak musimy to przerabiać, po to by móc komfortowo czytać. Przy okazji jesteśmy zmuszani do łamania licencji.

    1
    • Athame pisze:

      Bo z reguły czytelnicy oczekują od e-book’a choćby możliwości zmiany wielkości fontu, a to prosta droga do tego by układ się posypał, nie wspominając już o tym, że „sierotki” i inne bzdurki są nie do opanowania. Poza tym fikcyjny standard EPUB sprawia, że nie można stosować zaawansowanego CSS-a, bo inaczej ryzykuje się plikiem nieczytelnym (lub wyświetlającym niepożądane znaki) na różnych czytnikach / programach.

      Jak chcesz e-book identyczny w treści i wyglądzie to ciągle możesz użyć PDF, z tym że w zastosowaniu czytnikowym, w ujęciu masowym, w grę wchodzi tylko w rozmiarze A6 / ew. B6.

      5
      • Bociek pisze:

        Czyli jednak opcja „ograniczenia techniczne”. W takim razie inżynierowie muszą jeszcze trochę nad czytnikami popracować.

        0
        • asymon pisze:

          Nie do końca „ograniczenie techniczne”, jeśli dopuścisz zmianę rozmiaru fontu, to ebooka po prostu NIE DA się zrobić tak jak książki, np. poprawnego układu akapitów na stronach. Przeczytaj sobie sekcję typowe błędy i zaproponuj jak się ich pozbyć na czytniku.

          Wyświetlanie pliku epub/mobi na ekranie przypomina bardziej stronę internetową w przeglądarce, książkę przypomina bardziej format pdf. Po co na siłę trzymać się stałego, jedynie słusznego układu i usuwać zalety ebooków? One po to właśnie powstały, żeby nie musieć czytać pdf, bo przecież nie jest problemem (poza kosztami) przygotowywanie pdf w formacie B6, jak pisze Athame.

          No ale co kto lubi, kończę właśnie „Pod sztandarem nieba” Jona Krakauera, jak na razie nie miałem żadnych uwag do składu, robiła to firma d2d.pl, polecam tego Allegrowicza :-)

          4
          • Bociek pisze:

            No właśnie w tym rzecz, że teraz się NIE DA, a chciałoby się, żeby się dało i żeby to jeszcze robiło się samo :-)

            Żaden czytnik nie posiada umiejętności złamania tekstu w poprawny sposób, aby uniknąć błędów jakie opisano w we wskazanym artykule w Wikipedii.
            Niemożliwym jest również, żeby księgarnie przygotowywały osobną wersję pliku pod każdy możliwy czytnik i każde możliwe ustawienie fontu. To byłby dopiero bezsens! Z kolei osobista obróbka ebooka, pomijając kwestie licencyjne, wymaga czasu i pewnych umiejętności, które do powszechnych nie należą.
            Wychodzi na to, że jednak kwestie techniczne zawodzą, a czytniki są jeszcze „za głupie” ;-)

            0
            • asymon pisze:

              Nie do końca się rozumiem chyba. Skład książki nie robi się „sam”, to ręczny proces, z ręczną korektą źle wyglądających rzeczy. Książka różni się od dokumentu z Worda.

              W programach typu InDesign czy Quark musisz czasem coś ręcznie poprawiać, żeby to jakoś wyglądało, ponoć dobrze jest zrobić kurs, nie robiłem, więc się nie będę wymądrzał ;-)

              System TeX robi to półautomatycznie, algorytmami, których nie podejmuję się tłumaczyć, ale chodzi o to, że tak ustawia i rozsuwa literki, żeby zminimalizować parametr badness, który oddaje jakoś nasze postrzeganie tekstu jako „ładny”. Ale czasem sobie z tym nie radzi i też musisz ręcznie korygować akapit.

              Jeszcze raz: nie da się tego zrobić automatycznie oprogramowaniem czytnika, bo książki też nie są składane automatycznie.

              2
              • Bociek pisze:

                W tym sęk, parafrazując Dziewońskiego.

                Brakuje technicznej możliwości, żeby czytnik automatycznie sam łamał tekst poprawnie stosując ogólnie przyjęte reguły składu. Żeby po każdorazowej zmianie rozmiaru tekstu nie okazywało się, że „i” zostało z tyłu, a nowa „strona” zaczyna się od samotnie wiszącego słowa.
                W tej kwestii jeszcze sporo czytnikom brakuje, przez co użytkownicy zmuszeni są do korzystania z narzędzi takich jak Sigil i zgłębiania języka HTML, CSS, itd.

                0
              • asymon pisze:

                Te dwie rzeczy akurat są do zrobienia:

                Żeby po każdorazowej zmianie rozmiaru tekstu nie okazywało się, że „i” zostało z tyłu
                – to jest w standardzie html, tzw. spacja niełamiąca, brak podpada pod „lenistwo”.

                a nowa „strona” zaczyna się od samotnie wiszącego słowa.
                – też do zrobienia, ale tu uczciwie napiszę, że nie wiem czy jest to w standardzie i czy wszystkie czytniki to rozpoznają, więc „ograniczenia techniczne”/”lenistwo”, bo to dwie linijki w stylach akapitu (orphans i widows), najwyżej czytnik nie rozpozna.

                1
    • Mietek pisze:

      Identyczne w treści przecież są. No, poza drobnymi wyjątkami gdy brakuje zdjęć.
      A co do wyglądu.. W życiu nie chciałbym aby ebook wyglądał jak papierowa książka. Nie po to mam czytnik i możliwość zmiany kroju pisma, jego wielkości, marginesów, odstępów między wierszami itd. żeby tkwić przy czymś, co wymyślił sobie składający papierowe wydanie. Nie każdy font sprawdzi się przecież na czytniku.
      Z mojej obserwacji wynika, że większość ebooków jest skopana właśnie wtedy, gdy ktoś konwertujący za bardzo stara się aby wyglądał on jak papierowa książka.

      2
      • Bociek pisze:

        Z tym identycznym wyglądem miałem na myśli raczej pełną zgodność z oryginałem, w sensie: brak literówek, podwójnych spacji, sierot, bękartów i wdów, itp.

        W każdym razie Athame wyjaśnił mi już, że problemem są tutaj możliwości techniczne. Mam nadzieję, że uda się kiedyś pokonać te ograniczenia i nie będzie już potrzeby żmudnego przerabiania plików.

        1
        • Athame pisze:

          Literówki są karygodne, podwójne spacje są ignorowane, chyba że to niełamliwe spacje (typowy błąd OCR) – wtedy ewidentna wina osoby konwertującej (składu nikt nie robi w takich przypadkach). Sierotki (ich pozbycie się) mają zły wpływ na różne badziewne czytniki/programy (np. nie działa wyszukiwanie, słownik itp.).
          Bękarty i wdowy wymagają instrukcji CSS, nieuwzględnionych w pseudostandardzie EPUB. Kindle poradzi sobie z nimi tylko po modyfikacji oprogramowania, iPad w dobrze złożonym pod niego EPUB-ie, a reszta sobie nie poradzi. To więc można podciągnąć pod ograniczenia techniczne.

          Dla mnie pełna zgodność z oryginałem to pełna zgodność. Także, a może przede wszystkim, pod względem układu. Do tego by czytniki robiły skład na podstawie makrodefinicji w pliku z modyfikowalnymi wartościami fontu, interlinii, marginesów i innych wcięć nie jest daleko. Odpowiednia technologia istnieje dłużej niż czytniki – po prostu brak implementacji w czytnikach. To na wyjściu generuje PDF lub inny sztywny format, ale uwzględnia „rozmiar kartki”, marginesy, zmianę fontu, poprawne dzielenie wyrazów, sieroty i pozostałe cechy poprawnego składu DTP, a cały proces dopasowania zajmuje na sprzęcie takim jak Kindle ok. 3-5 s, przy książce 300 stron, więc akceptowalne opóźnienie (nie zmieniamy tego przecież non stop).

          2
        • Gosc Weselny pisze:

          Ksiazka to przede wszystkim tresc, a nie sposob formatowania akapitow/wierszy. Zes Pan wrazliwy, jak wloski poeta owiniety szaliczkiem w lipcu.

          8
          • Bociek pisze:

            Jak pokazuje liczba wpisów związana z obróbką ebooków, nie wyłączając niniejszego artykułu, takich wrażliwców jest całkiem sporo, przy czym większość jest zdecydowanie bardziej pracowita ode mnie ;-)

            1
    • winter pisze:

      Znam wydawnictwo, które próbuje sprawić by e-book był dokładnie taki jak książka papierowa. Efekt? Książka ma dwa typy czcionek, które na czytniku (PW2 – Bookerly) wyglądają: jedna normalnie, a druga jest o dwa rozmiary mniejsza i szara(!). Koszmar jakiś.
      Wygląda to ok tylko dla Publisher Front, ale ten z kolei nie za bardzo pasuje do czytnika, bo czcionki są za cienkie (a i tak drugi tym czcionki jest szary).

      0
    • kanis pisze:

      Ja nie sądzę, żebym łamał licencję poprawiając w Calibre marginesy.

      0
    • dfs pisze:

      Bociek pisze:
      > Przy okazji jesteśmy zmuszani do łamania licencji.

      Jakiego łamania licencji? Jakiej licencji? To jest mój egzemplarz! Na własny użytek mogę z plikiem zrobić, co chcę. Co to kogo obchodzi? Jeśli mam książkę w .mobi, a chcę ją czytać w komórce, która obsługuje tylko format tekstowy UTF-8, to nikt mi tego nie może zabronić.

      0
      • Athame pisze:

        Zależy czy mówimy o prawie czy o własnym przekonaniu.

        2
        • sdf pisze:

          Oczywiście, że o prawie. Pytanie kontrolne: czy mogę zreprodukować – na własny użytek – zakupionego przeze mnie ebooka za pomocą zeszytu i długopisu?

          Pytanie drugie: co mi grozi za przerobienie – na własny użytek – .mobi na .txt?

          0
    • Ris pisze:

      Właśnie, właśnie, mam podobne skojarzenie. Z doświadczenia wiem, że wiele
      e-booków złożonych jest niechlujnie (e-czasopisma zwłaszcza), a czytelnik płaci i jeszcze musi poprawiać.
      Zwłaszcza do szału doprowadza mnie przenoszenie wyrazów w tytułach rozdziałów.

      1
  3. Robert H pisze:

    Dlatego, że są takie problemy, staramy się je eliminować. Ale tak, by się nie napracować… ;)

    0
  4. Robert pisze:

    W języku polskim nie istnieje dywiz otoczony spacjami, więc każde wystąpienie takiej sytuacji należałoby poprawić/zbadać/wyjaśnić/zgłosić/zignorować.

    Znaki nadmiarowe z przykładu można wyszukać za jednym zamachem:
    spacja-niełamiąca([-|–|—])spacja-niełamiąca

    A spacja niełamiąca jest dodawana „przez niektóre wydawnictwa” przed myślnikami właśnie dlatego, aby taki znak nie pojawił się na początku wersu. Jest to zgodnie z zasadami wspomnianymi np. tutaj.

    0
    • Robert H pisze:

      Dlatego każdy może poprawić te ustawienia „pod siebie”. Ja tylko daję przyklad jak to zrobić. Nic nie stoi na przeszkodzie, by ktoś dołączył/zmienił ustawienia, a tu się pochwalił.
      Krytyka jest zawsze mile widziana, o ile jest konstruktywna. Za co dziękuję.

      2
  5. Athame pisze:

    \\s\\b.{1,2}\\b)\\s

    Typowy gruby błąd. W ten sposób w wyrażeniach typu „projekt X”, „plan B”, „małpa je banana” itp. do nowej linii zostaną przeniesione niepożądane wyrazy (nie tylko niepotrzebnie, ale też sprzecznie z intencją). W języku polskim istnieje tylko 6 pojedynczych liter, które powinny być przenoszone. Jeśli do tej listy dodajemy coś jeszcze to fanaberia niezgodna z regułami typograficznymi. Czasami dopuszcza się przenoszenie takich zwrotów jak: na, od, że itp., ale nie jest to wymagane do tego by praca była w 100% idealna typograficznie.

    2
  6. Agnieszka pisze:

    Mam pytanie: jak tworzyć przypisy w Sigilu? Gdyby ktoś opisał mi to krok po kroku, byłabym bardzo wdzięczna, bo jest to problem, którego nie potrafię rozgryźć i za każdym razem, aby przypisy działały muszę – po zrobieniu ebooka – „przepuścić” go w Calibre.

    0
      • Agnieszka pisze:

        Serdecznie dziękuję, nie wiedziałam, że taki artykuł już jest na blogu. Muszę zgłębić temat :)

        0
        • Robert H pisze:

          Sigil ciągle się zmienia i ewoluuje. Tak że nie zdziw się jak niektóre nazwy menu trochę się zmieniły…

          0
          • Agnieszka pisze:

            Po szybkim przejrzeniu posta stwierdzam, że problem opisany jest jasno i przejrzyście – z odnośnikami już sobie poradziłam (też nie potrafiłam ich zrobić). Poza tym obrazki dużo ułatwiają. Jeszcze raz dziękuję.

            3
            • Robert H pisze:

              Dlatego piszę, choć brak mi biegłości, takie artykuły. Sukcesem dla mnie jest, gdy pomogą choć jednej osobie. Ale to bardziej zasługa Roberta że mnie namówił…

              1
      • pieluchowaty pisze:

        nie każdy zna angielski (dziwne co???)

        0
        • Robert H pisze:

          Zdziwiłbyś się. Mimo, że po angielskim menu poruszałbym się bez problemu. Zawsze denerwuje mnie, że nie jest po polsku. No i postanowiłem coś z tym zrobić. A że poprzednik zarzucił tłumaczenie, ciągnę to. Jest to dalekie od ideału, zapewne są i pomyłki, ale osoba niezaznajomiona z programem, poradzi sobie z menu po polsku.

          0
          • pieluchowaty pisze:

            z menu programów nie mam problemu, na tyle jestem kumaty z obcym angielskim, ale jezeli chodzi opisy dotyczące róznych rozwiązań to zostaje tylko translator
            a za tłumaczenie sygila chylę czoła i dziekuję

            4
  7. Mietek pisze:

    Jeszcze jedno, choć pewnie już nikt tego mojego pytania nie znajdzie.
    Często mam w ebookach tak, że treść przypisu jest na końcu akapitu, w którym występuje sam przypis. W niektórych ebookach pełnych przypisów szpetnie to wygląda. Czy da się jakoś łatwo i szybko przenieść wszystkie takie przypadki np. na koniec danego rozdziału czy pliku html?

    0
    • Robert H. pisze:

      Wydaje się, że najłatwiej przenieść cały kod HTML (z nazwą odnośnika) do nowej strony… Ale to nie będzie szybko… :(

      0

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania. Jeśli chcesz mieć swój obrazek przy podpisie, zarejestruj swój adres mailowy na stronie gravatar.com.

Zapisz się także do newslettera Świata Czytników


Komentarze do tego artykułu można śledzić także w formacie RSS.