Za drogo? Ustaw alerty cenowe na e-booki i kupuj taniej!

Calibre 6.0 i nowa funkcja: wyszukiwanie pełnotekstowe wszystkich e-booków!

Ukazała się dziś kolejna, szósta już wersja programu Calibre. Ma ona jedną nową funkcję, która wielu użytkownikom e-booków się przyda.

Mowa o wyszukiwaniu pełnotekstowym w treści wszystkich e-booków dodanych do bazy.

Dotąd w Calibre mogliśmy wyszukiwać wyłącznie książki po metadanych – czyli tytule, autorze, wydawcy albo słowach kluczowych, czy fragmentach opisu. Możliwość przeszukania treści pozwoli na korzystanie z naszej bazy jeszcze wygodniej – szczególnie jeśli mamy setki lub tysiące e-booków.

Nową wersję dziś zainstalowałem i krótko ją dla Was przetestowałem.

Indeksowanie

Przed pierwszym użyciem wyszukiwarki pełnotekstowej, Calibre musi przygotować indeks wszystkich książek.

Klikamy przycisk „FT” po lewej stronie paska wyszukiwania, wyświetli się okno wyszukiwarki z informacją, że musimy przeindeksować naszą bazę. W tym momencie większość komunikatów nie została jeszcze przetłumaczona na polski.

Do wyboru mamy dwa tryby indeksowania.

  • Wolne (slow) – działa w tle i pozwala na jednoczesną pracę przy komputerze. W bazie mam 7115 plików, Calibre obiecuje, że przeindeksuje je w około 8 godzin
  • Szybkie (fast) – korzysta z pełnej mocy komputera, jednak może spowalniać jego działanie. Tutaj mam obietnicę indeksacji w 1-2 godziny.

W praktyce – indeksowanie zacząłem o godzinie 9 rano, w trybie wolnym. Po jakimś czasie przełączyłem na szybki, nie przeszkadzało to w pracy.

Indeks był gotowy o godzinie 12:30. Można więc powiedzieć, że indeksowanie odbyło się w tempie około 30 plików na minutę. Oczywiście w Waszym przypadku będzie to zależeć od szybkości komputera, wybranego trybu, no i rodzaju książek.

Ile miejsca na dysku zajmuje indeks?

  • Mój folder Calibre z bazą e-booków to 43 GB.
  • Indeks znajdziemy w pliku full-text-search.db wewnątrz folderu Calibre. Jest to baza w formacie SQLite. W moim przypadku ma rozmiary 9 GB czyli około 20% miejsca zajmowanego przez wszystkie książki.

Co się dzieje gdy dodamy do programu nowe książki? Indeksowanie ruszy ponownie w tle, w trybie wolnym.

Jeden wyjątek dotyczy sytuacji, gdy w komputerze mamy również starszą wersję Calibre 5 i dodajemy książki przez niego – wtedy „szóstka” ich automatycznie nie zindeksuje i będziemy musieli uruchomić przebudowę bazy.

Wyszukiwanie

Gdy skończyliśmy indeksowanie, klikając „FT” możemy przejść do wyszukiwania.

Program dopuszcza różne opcje wyszukiwania, zgodne z SQLite. Możemy korzystać z fraz (np. „Bolesław Bierut”), operatorów logicznych (np. Bierut NOT Michael), albo wyszukiwać słowa, które są w pobliżu siebie.

Tak wyglądają wyniki wyszukiwania.

Jeśli w książce znaleziono frazę, wyświetlany jest fragment książki – ale tylko jeden.

Po kliknięciu przechodzimy do książki z zaznaczonym wybranym fragmentem.

Ale tutaj program mnie oszukuje. Bo gdy książkę otworzę i wyszukam ponownie daną frazę, to dowiaduję się że występuje ona np. 314 razy – tu w przypadku Bieruta w książce Torańskiej.

To chyba największe ograniczenie tej wyszukiwarki – nie wszystkie wyniki wyszukiwania zobaczymy w kontekście.

Drugim problemem jest brak jakiegoś widocznego algorytmu sortowania wyników.  Nie mogę na przykład posortować listy książek według liczby znalezionych słów. Jak szukałem frazy „Gomułka”, to biografię autorstwa Piotra Lipińskiego, w której to słowo występuje ponad 900 razy program pokazał mi dopiero na drugim ekranie.

Przydatną funkcją jest za to możliwość zaznaczenia wszystkich książek ze znalezioną frazą w bibliotece, tak że potem możemy sobie je spokojnie przejrzeć.

Przeszukiwane są także pliki PDF, oczywiście tylko te z warstwą tekstową. Dodałem do Calibre tegoroczne numery „Teraz Rocka” i oto wyniki wyszukiwania informacji o zespole Luxtorpeda.

Odkąd w przypadku tego pisma przerzuciłem się na wersję cyfrową, korzystałem z wyszukiwarki w Adobe Reader, ale w Calibre będzie łatwiej.

Działa też wyszukiwanie słów z polskimi znakami.

Wydajność jest całkiem niezła. Bazę mam na dysku HDD, wstępne wyniki widzę po 2-3 sekundach. Następnie z książek na dysku dociągane są fragmenty.

Podejrzewam, że przerzucenie bazy na dysk SSD przyspieszy zarówno indeksowanie, jak i prezentację wyników, ale nie wydaje mi się to konieczne.

Co poza tym nowego w Calibre 6.0?

Oto inne inne zmiany w wersji 6.0 zgodnie z komunikatem na stronie programu:

  • Koniec obsługi Windows 8 – jeśli ktoś jeszcze korzysta z tej wersji systemu, powinien pozostać przy wersji 5.44.
  • Obsługa nowych procesorów Apple Silicon (macOS) and ARM64 (na Linuksie), jednocześnie koniec wsparcia dla procesorów 32-bitowych.
  • Funkcja „Czytaj na głos” w podglądzie książek. Calibre korzysta z systemowych lektorów, w moim przypadku windowsowy lektor wypada dość słabo – np. dlaczego „znajomość” przeczytał jako „znajotomość”? :-) No, ale to problem systemowy, a nie Calibre. Jeśli mamy w systemie dobre głosy, Calibre z nich skorzysta.
  • Możliwość ustawienia trybu ciemnego w preferencjach.
  • Calibre obsługiwać będzie schemat URL jako „calibre://” – co daje możliwość linkowania do książek Calibre z poziomu innych programów, albo wewnętrznych stron HTML. Więcej o tym w instrukcji programu.

[Aktualizacja] Potencjalne problemy

Z Calibre 6.0 przestała działać stara wtyczka deDRM do ściągania zabezpieczeń w e-bookach. Jest już nowa edycja prowadzona przez nowego autora: NoDRM, która według deklaracji autora działa. Jeszcze nie testowałem.

 

Podsumowanie

Jak dotąd nowe wersje Calibre, choć przynoszą nowe funkcje, nie oznaczają rewolucji, bo większość z nas od lat używa tego programu do przechowywania e-booków, a także do poprawek i konwersji między formatami.

Calibre 6.0 przynosi wyszukiwanie pełnotekstowe, które nie przyda się każdemu, ale jestem pewien, że będą osoby, które się z niego ucieszą. Ja się ucieszyłem. :-)

Bo nie ma wielu ogólnie dostępnych narzędzi pozwalających na indeksowanie treści e-booków. Jeśli jakieś możecie polecić, dajcie znać w komentarzach. A tutaj mamy wyszukiwarkę wbudowaną w program, z którego i tak korzystamy na co dzień. I mimo kilku wad, o których wspominam wyżej – uważam tę funkcję Calibre za przydatną.

Dlatego jeśli uważacie, że możliwość przeszukania wszystkich Waszych e-booków będzie będzie Wam potrzebna, warto Calibre do wersji 6.0 zaktualizować jak najszybciej.

PS. Jeśli szukacie narzędzia do wyszukania e-booków po nazwie pliku, polecam opisany dwa lata temu Everything.

Czytaj dalej:

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Książki na czytniki i oznaczony tagami , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

17 odpowiedzi na „Calibre 6.0 i nowa funkcja: wyszukiwanie pełnotekstowe wszystkich e-booków!

  1. Robert pisze:

    43 GB książek :-D

    Robisz kiedyś takie rachunki, że jakbyś czytał jedną tygodniowo, to musiałbyś żyć xxx lat, zanim przeczytasz. Ja mam dużo mniej, ale nie ma szans na przeczytanie wszystkiego.

    2
    • Robert Drózd pisze:

      Większości nigdy nie zamierzam przeczytać. :) Mam w szkicach artykuł o sensie budowania biblioteki (czy to cyfrowej czy papierowej).

      7
    • kjonca pisze:

      du -sh ~/CalibreLibrary/
      100G /home/kjonca/CalibreLibrary/

      Mam większą :). Inna sprawa, że oszukaną, bo ja do swojej wrzucam „wszystko” (czasopisma w szczególności, sporo w pdf)

      2
    • Czerwek pisze:

      U mnie biblioteka to tylko 15 GB (889 pozycji). Znacznie większą mam bibliotekę audiobooków. 1,5 TB (jakieś 1800 pozycji)…

      I też nie wiem kiedy tego wszystkiego posłucham. Ale nie mogę się powstrzymać.

      0
  2. Radek pisze:

    Czy jest jakiś przewodnik po Calibre, by od podstaw poznać i ogarnąć ten program?

    0
    • kjonca pisze:

      https://calibre-ebook.com/help
      Tu bym szukał. Acz przygotuj się, że czasami coś może być trochę niedokładne (różnice między wersjami)
      No i po angielsku – nie wiem na ile dla Ciebie to problem.

      0
    • Robert Drózd pisze:

      Dawno temu miałem tutaj przewodnik konfiguracji:
      https://swiatczytnikow.pl/jak-skonfigurowac-calibre-po-instalacji/
      Ale on jest naprawdę stary. :)

      Co do ogarnięcia – ten program można odkrywać przez lata, niestety ja sam nie znam wszystkich funkcji, przypuszczam, że niektóre zna tylko autor. :)

      0
      • Radek pisze:

        Dzięki Robercie za odpowiedź.Jestem podziwu dla ogromu Twojej pracy przy prowadzeniu portalu. I za Twoją pasję, którą zarządza innych Ci dziękuję! Wiem, że odmawiasz od czasu do czasu różne zagadnienia dotyczące Calibre i tego jak użytkownicy Kindle mogą go wykorzystać w codzienności. Czy mógłbyś kiedyś stworzyć bazę linków do wszystkich Twoich artykułów związanych z Calibre? Pomogłoby to w poszukiwaniach i poznawaniu programu.

        0
  3. Czytacz pisze:

    Czy udało się komuś zainstalować Calibre 6.0 na systemie Windows 7 (np. przy pomocy programu Orca i zmianie wpisu w LaunchControl)?

    0
  4. Robert pisze:

    Dwie sprawy dla wyjaśnienia:
    1. Wspominasz „Ale tutaj program mnie oszukuje.”
    To nie jest prawda – zauważ, że wyszukiwany jest dłuższy fragment (razem z kontekstem do frazy) i dlatego wyświetlany jest tylko jeden wynik. Gdy w edytorze szukasz pojedynczego wyrazu to oczywiście znajduje wszystkie wyniki.
    2. Wyszukiwanie pełnotekstowe nie działa dla książek, które mają wstawione znaki dzielenia (shy) np. przez wtyczkę Hyphenate This! To spore utrudnienie dla tych, którzy w bibliotece trzymają tylko takie książki. Wniosek: albo książki z dzieleniem, albo wyszukiwanie pełnotekstowe.

    0
    • Robert Drózd pisze:

      Dziękuję za uzupełnienia.
      ad 1. No, ale z pomocy programu czy kontekstu nie wiem, że to tak ma działać. Oczekiwałbym jednak, że jeśli klikam w książkę to mam podgląd wszystkich wystąpień frazy, a nie że muszę ją wpisywać ponownie ręcznie.

      ad 2. I to bardzo cenna uwaga. Przypuszczałem, że coś musi być nie tak, bo wydawało mi się, że niektórych książek mi nie znajduje. Czyli profilaktycznie wszystkie epuby powinienem zaznaczyć i usunąć znaki dzielenia. Po konwersji i wgraniu na czytnik nie są one dla mnie aż tak potrzebne. Sprawdzę to jak będę przy domowym komputerze z główną biblioteczką.

      0
    • Robert pisze:

      Odpowiadam sam sobie, aby uaktualnić informacje. Otóż autor calibre dodał poprawkę, która będzie usuwała znaki dzielenia i wyszukiwanie pełnotekstowe powinno działać także dla książek z wstawionym dzieleniem wyrazów.
      Poprawka ta zadziała w calibre od wersji 6.2.

      0
  5. symeon pisze:

    Podepnę się pod ten artykuł, mam nadzieję, że będzie mi to wybaczone.
    Z jakiegoś niezrozumiałego dla mnie powodu książki prawnicze sprzedawane tylko w PDF. Chcę je przerobić do EPUB/MOBI, ale niestety Calibre – przynajmniej w przypadku domyślnych ustawień – konwertuje tekst ciurkiem, nie odróżniając tekstu właściwego od tytułów rozdziałów i przypisów. Efekt jest tragiczny. Szukam sposobu, żeby plik docelowy miał spis treści i żeby przypisy działały jak przypisy. Będę wdzięczny za radę :)

    0

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania i polityką prywatności

Komentarze do tego artykułu można śledzić także w formacie RSS.