Formaty czytnikowe – EPUB i MOBI wciąż nie do końca sobie radzą z tekstami naukowymi, naszpikowanymi wzorami i symbolami. A już konwersja z zachowaniem wszystkich wzorów bywa ciężka. Często pozostaje w tym przypadku korzystanie z plików PDF.
Ten problem na swoim blogu opisuje pracujący we Wrocławiu fizyk Remigiusz Durka:
Niestety pdfy (zwłaszcza naukowe) nie są już tak wygodne w obsłudze. Artykuły naukowe pochodzące z arxive.org (gdzie trafia większość naukowych preprintów przed publikacja z fizyki lub matematyki) są wygenerowane z z latex’owego kodu i udostępniane jako pdfy o rozmiarze A4.
Ich czytanie używając Kindle Classic przypomina używanie internetu na telefonach przed erą ekranów dotykowych. Sytuację ratuję odrobinę obrócenie ekranu gdzie dodatkowo w miarę możliwości są odcinane boczne marginesy co widać na zrobionym przeze mnie zdjęciu:
Zawsze też można pobawić się w automatyczne docinanie pdfów za pomocą szeregu narzędzi (np. papercrop świetnie daje sobie radę nawet z dwukolumnowymi dokumentami). W nowszych wersjach Kindla (Touch i Paperwhite) działa też dotykowe smartfonowo-tabletowe “pinch and zoom”, ale ciągłe pomniejszanie i powiększanie ekranu E-Ink też nie jest za wygodne.
Jakie jest rozwiązanie? Użytkownicy LaTeXa mogą wygenerować pliki PDF dostosowane do ekranu 6-calowego. Na swojej stronie pan Remigiusz umieścił pomocne skrypty oraz trzy przykładowe PDF z różną wielkością tekstu – oto dwa przykłady.
Jak widać – z tego samego artykułu można wygenerować PDF-y o liczbie 37 albo 26 stron, tak upakowane tekstem, jak nam odpowiada.
Jeśli ktoś korzysta z LaTeXa, odsyłam do artykułu, jednocześnie zastrzegam, że nie jestem w stanie podpowiedzieć nic więcej, bo temat jest mi kompletnie nieznany. Najlepiej zwracać się do autora. Warto też zajrzeć do wątku na StackExchange, gdzie toczyła się dyskusja na temat właściwych opcji konwersji.
Bardzo ciekawe, dzięki!
a jak się ma nowy kindle do czytelności pdf-ów? Czy podwyższona rozdzielczość coś pomaga?
Z jednej strony fajne, z drugiej większość artykułów jest tylko w pdf bez LaTeXowych źródeł…
… a jeśli mamy źródła, tzn. plik txt, html czy nawet msword, to łatwiej wygenerować z tego mobi czy epub. Sam się przymierzałem do zrobienia takiego szablonu, ale wrodzona prokrastynacja i istnienie calibre…
Z drugiej strony, jeśli ktoś jest estetą i przeszkadza mu brak dzielenia wyrazów i czasem kiepskie justowanie, to w pdf przygotowanym na ekran 6″ powinno to wyglądać dużo ładniej niż w mobi. Ale za to bez możliwości zmiany czcionki.
Jak ktoś się boi kodu, jest edytor „prawie jak ms word”: http://www.lyx.org/
No, wygenerowanie mobi/epub/html ze źródła (La)TeXowego – jakkolwiek możliwe – do trywialnych zadań nie należy…
@mbork: sprawdzałeś pandoc?
Pandoc jest ok, dopóki nie przerabia się domyślnych LaTeXowych ustawień za mocno, i nie używa się „egzotycznych” pakietów… Podejrzewam, że tex4ht dałby lepsze rezultaty.
LaTeX – moja niedawno odkryta miłość. Cieszę się bardzo, że powstaje klasa dokumentów „dedykowana” Kindle’om. Może pobawię się w przerobienie tej czysto matematycznej preambuły na bardziej przydatną naukowcom zajmującym się humanistyką…
Świetnie, że Świat Czytników informuje o takich rzeczach :D
Jeśli przerobisz, to się podziel. :) Chętnie udostępnię Ci łamy, albo dam znać, jeśli np. gdzieś to opublikujesz. W razie czego: rd @ webaudit.pl
Hm. Super pomysł (szczególnie użycie fontów z serii Concrete, które faktycznie są podobne do Caecilii). Trochę szkoda, że kod jest nieco zabałaganiony (i np. ładuje wzajemnie się wykluczające pakiety fontowe, z których wówczas tylko ostatni „działa”). Chyba zakaszę rękawy i zrobię to po swojemu… Warto też (skoro jesteśmy w temacie narzędzi TeXowych dla czytników) spojrzeć tu: http://randomdeterminism.wordpress.com/2012/04/09/a-style-file-for-eink-readers/ i tu: http://randomdeterminism.wordpress.com/2012/05/26/a-context-style-file-for-formatting-rss-feeds-for-kindle/
Miałem w tej sprawie do Ciebie pisać po przeprowadzeniu własnych testów.
Do rozpoczęcia pracy z TeXem warto polecić „Nie za krótkie wprowadzenie do systemu LaTeX”, najlepiej najnowszą wersję – podtytuł „w 129 minut”, a później hulaj dusza (jeśli ktoś zna lepszy tutorial w języku polskim to proszę o tytuł). Po frustrujących godzinach spędzonych przed Wordem w TeXu człowiek zakochuje się od pierwszego spotkania.
Uwaga do Panów powyżej:
Często można znaleźć alternatywne źródła artykułów, z których można pobrać zarówno wersję PDF, jak i TeX, np. http://web.ihep.su/owa/dbserv/hw.fulltextlist . Poza tym, jeśli nie ma wersji TeXowej, to łatwo znaleźć wersje PDF przygotowane do analizy, z wielkimi marginesami pod własne komentarze. Po przycięciu takowych dostajemy PDF niemal kindlowy.
Na arxiv.org właściwie da się ściągnąć pliki źródłowe, lecz w dużej ilości przypadków kończy się to problemami. Na przykładzie pierwszego lepszego artykułu: http://arxiv.org/abs/1210.6761 -> Other formats -> wybieramy „Download source”. Następnie musimy to co się ściągnie wyposażyć w rozszerzenie (.tex lub .tar.gz). Pierwsze od razu można otworzyć w edytorze latexa a drugie trzeba wypakować (oczywiście nie mamy pojęcia, które ściągamy). Niestety pliki często zawierają jakieś podefiniowane zewnętrznie komendy, dziwne tricki autorów, a oprócz tego często to co ściągnęliśmy nie zawiera rysunków, albo korzysta z jakieś paczki, która nie jest w dystrybucji na PC a na MACa. Wszystko to wydaje się trochę dziwne, bo uploadując tex’a trzeba uploadować również wszelkie dodatkowe klasy, bibliografie, style, obrazki, itp. i nie wiem dlaczego nie ściaga się to w całości.
W podanym przeze mnie przykładzie dostajemy plik tex, ale nie chce się on kompilować. Chwilę zajęło by dostrzec za preambułą:
\begin{document}
\input amssym.tex
czyli zupełnie niezrozumiałe dla mnie odniesienie do zewnętrznego pliku (o nazwie, którą kojarzę jako klasę matematycznych czcionek: amssym). Po skasowaniu tej jednej linijki kompilacja przeszła bez problemów, ale nie wiem tak naprawdę co było pod danym linkiem do pliku (trzeba by było porównać dokładnie plik wynikowy i pdf z arxiv).
Adampe: dzięki za link; podane artykuły to naprawdę niezła „klasyka” gatunku!
Mbork: jakby co to chętnie przetestuję. Kwestia użycia polskich znaków przy różnych fontach to rzecz, która mnie zawsze rozkłada na łopatki. Kiedyś napisałem opis (bliżej końca artykułu) na temat fontów na windowsie i linuksie http://users.ift.uni.wroc.pl/~rdurka/blog/2008/10/26/latex/ (ale np. przy kompilatorze online http://latex.informatik.uni-halle.de/latex-online/latex.php mój sposób na uzyskanie tam polskich liter przestał jakiś czas temu działać).
Font do szablonu na kindla znalazłem kiedyś przy okazji robienia swojej prezentacji będąc znudzonym standardową czcionkę, a drugi plik znalazłem przed chwilą (może okażą się pomocne):
http://faq.ktug.or.kr/wiki/uploads/MathFonts.pdf
http://www.tug.org/pracjourn/2006-1/hartke/hartke.pdf
Ps. Ktoś mógłby mi powiedzieć jak wybrać czcionkę z tej prezentacji: http://cift.fuw.edu.pl/users/kostecki/zakopane08/kowalski-glikman.pdf ? Nie znam nazwy tego kroju, a autorowi zagubił się plik źródłowy, więc mi nie pomoże :)
Żaden problem. Znalazłem tę stronę niedawno i zbieram się do przeczytania większości tej klasyki, ale PWr nie zostawia zbyt dużo wolnego czasu :):)
@czcionka z prezentacji.
Krój to Avant Garde Book. Podobny do Century Gothic, który moim skromnym zdaniem jest bardziej stonowany i elegancki.