W poniższym artykule gościnnym Krzysztof Palka wyjaśnia, jak skonwertować słownik języka polskiego PWN do formatu używanego przez Kindle.
Na górze widzimy żywy przykład z Kindle Paperwhite.
Obecnie nie ma żadnego oficjalnego słownika języka polskiego na czytnik Kindle, ale przy odrobinie wysiłku możemy sobie taki zrobić. Jako bazy definicji użyjemy słowników na CD dodawanych do wersji drukowanych wydawanych przez PWN.
Aby ułatwić sobie konwersję, zakładając, że kupiliśmy już słownik, możemy pobrać bazę słownikową np. wątku na forum Android. Na zachętę przed przystąpieniem do konwersji warto pokazać jak może wyglądać efekt końcowy:
Tu słownik połączony jest z encyklopedią, opiszę jak to zrobić, ale po kolei.
Będziemy potrzebować pliku z definicjami w formacie (nazwijmy go „tab”):
hasło 1[tabulator]definicja 1
hasło 2[tabulator]definicja 2
oraz pliku z bazą odmian oraz narzędzi do konwersji.
Zaczynamy. :)
- Pobieramy interpreter skryptów w języku Python: http://www.python.org/ftp/python/2.7.3/python-2.7.3.msi, gdyż skrypt do konwersji jest w nim napisany.
- Włączamy wyświetlanie rozszerzeń znanych typów plików (w różnych Windowsach różnie to wygląda, jak nie wiesz jak to zrobić, to wyszukaj w Google)
- Potrzebne nam są pliki z bazą słownikową.
- Jeśli mamy słowniki na płycie CD, to o konwersja do formatu tab jest opisana tutaj [http://my.opera.com/mziab/blog/2010/02/11/pwn2dict-2-0], najnowsza wersja skryptu tutaj [http://gitorious.org/pwn2dict/pwn2dict/blobs/master/pwn2dict.py], ale obsługa wymaga używania linii poleceń, a my chcemy iść na łatwiznę, więc zerkamy niżej na drugi sposób…
- Jeśli mamy słowniki na płycie CD, ale chcemy pobrać je z internetu i przekonwertować w inny sposób odwiedzamy wątek na forum i pobieramy słowniki które mamy w formacie Stardicta, ja np. pobieram pliki „Słownik Języka Polskiego” oraz „Encyklopedia PWN ’99” (z podanych mirrorów – pod linkami do Dropboxa) i rozpakowuje np. WinRARem.
- Teraz krok dotyczących słowników w formacie Stardicta. Jedna baza zazwyczaj składa się z plików dict, idx oraz ifo – odpowiednio definicji, indeksu z definicjami oraz opisu słownika. Niestety pobrane bazy nie mają pliku ifo, więc musimy go stworzyć. Dodam, że wszystkie półprodukty staramy się przechowywać w jednym folderze. Instalujemy program Stardict: http://stardict-3.googlecode.com/files/stardict-3.0.3.exe. W edytorze Notepad++ wybieramy ustawienia → preferencje → Nowy dokument i jako format wybieramy Unix. Zamykamy okienko ustawień, tworzymy nowy dokument, wklejamy przykładowe dane:StarDict’s dict ifo file
version=3.0.0
idxoffsetbits=32
wordcount=100000
idxfilesize=100000
bookname=SJP
sametypesequence=m
Na końcu pliku musi znajdować się jedna pusta linijka.Jeśli mamy plik „Slownik Jezyka Polskiego.idx” to zapisujemy z nazwą „Slownik Jezyka Polskiego.ifo”. We „wszystkich progamach” Szukamy folderu StarDict, a w nim linku do programu StarDict-editor, otwieram go i w zakładce „DeCompile/Verify” Otwieramy stworzony plik ifo, klikamy Decompile i folderze ze słownikami pojawia się nowy plik, tu „Slownik Jezyka Polskiego.txt”.
Analogicznie robimy z pozostałymi bazami. Ja mam teraz w folderze mam 2 pliki: „Slownik Jezyka Polskiego.txt” oraz „Encyklopedia PWN 99.txt”. W Notepad++ tworzymy jeszcze jeden dokument, otwieramy otrzymane pliki txt i kopiujemy ich zawartość do stworzonego dokumentu, który następnie zapisujemy jako slo.tab - Aby możliwe było wyszukiwanie wyrazów, które nie są w podstawowej formie potrzeba będzie baza odmian. Możemy ją pobrać stąd: http://www.sjp.pl/slownik/odmiany/.
Następnie trzeba ją rozpakować i zmienić jej kodowanie z WINDOWS-1250 na UTF-8. W tym celu otwieramy plik „odm.txt” w Notepad++, wskazujemy, że obecne kodowanie to WINDOWS-1250 (Format → Zestaw znaków → Środkowoeuropejskie → Windows-1250). Następnie wybieramy Format → Konwertuj na format UTF-8 bez BOM) i zapisujemy plik. - Zapisujemy w folderze, gdzie mamy pliki „slo.tab” oraz „odm.txt” ten skrypt: https://raw.github.com/palkakrzysiek/scripts/master/tab2opf.py
Jeśli mamy zainstalowany interpreter Pythona klikamy dwukrotnie na pobrany skrypt, a jeśli do rozszerzenia „*.py” May przypisany inny program klikamy na pobrany skrypt PPM i wybieramy otwórz za pomocą → python. W zależności od tego jak duży mamy słownik pojawi nam się od kilku do kilkudziesięciu plików html (u mnie było 20) oraz plik „slo.opf” - Otwieramy plik „slo.opf” za pomocą programu Notepad++ i edytujemy opis:<dc:Identifier id=”uid”>[identyfikator, kilka symboli opisujących słownik]</dc:Identifier>
<dc:Title><h2>[Tytuł]</h2></dc:Title>
<dc:Language>[język]</dc:Language>
<DictionaryInLanguage>[język haseł]</DictionaryInLanguage>
<DictionaryOutLanguage>[język definicji]</DictionaryOutLanguage>U mnie element metadata wygląda tak:
<metadata>
<dc-metadata>
<dc:Identifier id=”uid”>pwn</dc:Identifier>
<!– Title of the document –>
<dc:Title><h2>PWN: SJP oraz Encyklopedia ’99 </h2></dc:Title><dc:Language>PL</dc:Language>
</dc-metadata>
<x-metadata>
<DictionaryInLanguage>pl</DictionaryInLanguage><DictionaryOutLanguage>pl</DictionaryOutLanguage>
</x-metadata>
</metadata>Po dokonaniu edycji zapisujemy plik.
- Pobieramy program KindleGen i wypakowujemy plik „kindlegen.exe” tam gdzie mamy plik „slo.opf”. Następnie przeciągamy plik „slo.opf” na „kindlegen.exe”. Rozpocznie się konwersja. W konsoli mogą pojawiać się ostrzeżenia, jednak nie przejmujemy się nimi. ;) Całość może potrwać nawet kilka minut.
Uwaga: konwertery mogą potrzebować chwilami kilkaset MB RAMu, więc jeśli nie mamy go w nadmiarze, to lepiej zamknąć na chwilę nieużywane programy, sama konwersja trwa długo, a jeszcze gdyby zamiast RAMu trzeba było korzystać dysku oczekiwanie jeszcze się wydłuży. - Trzeba jeszcze skopiować otrzymany plik „slo.mobi” do folderu „documents” na Kindlu. Prawdopodobnie będzie to jedyny słownik polskiego, więc zostanie automatycznie wybrany jako domyślny dla tego języka. U mnie na Paperwhite wylądował w kolekcji „Dictionaries”. Można go też otworzyć i posprawdzać jak wygląda wyszukiwanie definicji.
To już wszystko. Mam nadzieję, że instrukcja się przyda, komentarze mile widziane. :)
Uwagi od Roberta:
- Jeśli nie mamy słowników PWN na CD i nie chcemy korzystać z plików z sieci, format stardict jest dość popularny (korzysta z niego np. czytnik Onyx) i znajdziemy w tym formacie także inne, darmowe słowniki.
- W podobny sposób na podstawie plików PWN można zrobić słownik angielsko-polski. Tutaj odpowiednie mobi już krąży po różnych serwisach…
- Aby zobaczyć definicję słownikową w książce polskojęzycznej, musi mieć ona ustawiony w metadanych język polski. Książki z polskich księgarni, a także konwertowane przy pomocy Calibre zwykle nie wymagają już poprawek, ale w razie kłopotów odsyłam do artykułu na temat ustawień języka.
- Jeżeli mamy kilka słowników języka polskiego, musimy w ustawieniach wybrać domyślny – co ciekawe, niby Kindle nie obsługuje języka polskiego, ale odpowiednią etykietę „Polish” wyświetla.
- Tak, wiem że byłoby najprościej podać link do takiego gotowego słownika, ale nie możemy tego zrobić i proszę tego nie robić w komentarzach. Pamiętajmy też, że modyfikacja plików słownika kupionego na CD może naruszać licencję, więc robimy to na własną odpowiedzialność.
Czytaj dalej:
- Słownik języka polskiego dla Kindle – nowa wersja (luty 2023)
- Wielki powrót: „Wielki słownik angielsko-polski” dla Kindle jest ponownie dostępny w sprzedaży!
- Jak działa funkcja Send To Kindle for Microsoft Word? Przetestowałem eksport z Worda na Kindle!
- Po wielu zapowiedziach, stało się: na Kindle nie wyślemy już mailowo plików MOBI
- Amazon zapowiada Send To Kindle from Word – czyli możliwość eksportu plików bezpośrednio z Worda na Kindle
- Chocolatey – czyli jak automatycznie aktualizować takie programy jak Calibre czy Sigil?
Wyrazy uznania dla autora tekstu. Nie wiem, czy dam radę sobie z taką przeróbką, ale jest to wielka rzecz. Mam nadzieje, że zaroi się od nowych, świetnych słowników w pl.
Pozdrawiam
Ja dotąd korzystam na moim PW z BuMato i jestem b. zadowolony:) Jak piszą na stronie – „pierwszy darmowy słownik do kindle’a”. Zgodnie z prośbą Roberta powyżej – nie podaję linku.
Rzecz jasno w tym przypadku jest to słownik tylko angielsko – polski…
Akurat Bumato pochodzi z materiałów udostępnionych na wolnych licencjach – do niego można i warto linkować. :)
http://swiatczytnikow.pl/bumato-nowy-slownik-angielsko-polski-dla-kindle/
http://www.bumato.pl/
Witam, czy jest jakiś sposób na edytowanie słownika Bumato?
To plik .mobi.
A może delikatnie podpowiedzieć PWN, że pojawiła się kindlowa nisza i można cokolwiek zarobić dodatkowo, zamiast samemu dziergać jakieś cuda?
„Tutaj odpowiednie mobi już krąży po różnych serwisach…”-ciekawe ile osób robi szuka googli… :)
A ja mam pytanie z troszkę innej beczki – czy da się w Paperwhite ustawić na fest, żeby bez względu na język książki przeszukiwał angielską Wikipedię?
Zawartość ifo wyświetla mi się tutaj powyżej w jednej linijce, bez spacji nawet między słowami. Tak chyba nie powinno być? Używam Firefoxa.
Ale po poprawieniu i tak stardict nie chce mi tego pliku zdekompilować, wyświetla, że nie jest to właściwy format pliku ifo.
U mnie podobnie, a próba zdekompilowania takiego pliku kończy się komunikatem:
Building…
[critical] Error, file version is not 2.4.2.
Done!
Miałem to samo, poradziłem sobie ściągając inny plik .ifo z tej samej stronki ze słownikami – słowniki en-pl albo pl-en mają ten plik i wystarczy zmienić mu nazwę.
nvm – niżej już odpowiedź autora ;)
I jak, działa po zastosowaniu poniższych instrukcji?
Krzysztofie, od dziś czytanie na moim Kindle staje się jeszcze lepsze :)
Wystarczy poprawić numer wersji w linii pliku ifo:
version=3.0.0
na
version=2.4.2
U mnie zadziałało :)
A u mnie niestety nie. Mam ten sam komunikat i zmiana wiersza wersji na 2.4.2 nie pomaga. Próbowałem odnaleć gotowy plik .ifo, ale bez skutku. Jestem w kropce. Ktoś coś?
Dlaczego nie użyjesz legalnego i nowszego słownika na bazie SJP.PL? Linki masz pod artykułem. Jeśli koniecznie chcesz wersję PWN, to poszukaj „gotowca” (dość łatwo znaleźć) – i tak nie podejrzewam, byś miał legalną wersję, więc wszystko jedno skąd weźmiesz.
Dzięki za odpowiedź. Akurat mam oryginalny słownik USJP PWN z 2008 roku. Staram się korzystać z takich rzeczy na legalu. Plan był taki, żeby na próbę przygotować to, co jest dostępne w sieci, a potem wykorzystać słownik na płycie CD. Słownik SJP.pl oczywiście znam, ale nie wiedziałem, że jest dostępny na urządzenia Kindle. Fajnie, że został połączony z Wikisłownikiem. Sprawdzę go. Dziękuję za namiary. :)
Ponieważ mogły by być problemy ze stworzeniem pliku ifo (tutaj nie ma przejścia do nowej linii), oraz edycja pliku opf, to podam jeszcze linki do przykładowych konfiguracji:
cała przykładowa konfiguracja (po wygenerowaniu pliku opf zmieniamy tylko część … )
https://raw.github.com/palkakrzysiek/scripts/master/slo.opf
a plik ifo zapisujemy z odpowiednią nazwą
https://raw.github.com/palkakrzysiek/scripts/master/example_of_stardict_description.ifo
Tak nawiasem mówiąc na nazwisko mam Palka, nie Pałka :). Jakoś dużo osób dorabia kreskę do „L” przy moim nazwisku :D
Jeszcze dla świętego spokoju spakowałem powyższe 2 pliki http://kpalka.vot.pl/temp/dict_examples.zip . Plik ifo najlepiej wziąć z tego archiwum i odpowiednio zmienić nazwę. Taka uwaga, że ifo musi być zapisany z Unixowymi przejściami do nowej linii (są inne niż np. z Windowsowego notatnika). Opisałem jak to zrobić w Notepad++, ale sposób z pobraniem gotowego pliku powinien być łatwiejszy.
Działa! Jeszcze raz wielkie dzięki :)
Zawsze wydawało mi się, że do pojedynczych skryptów najlepiej nadaje się githubowski gist…
na przyszłość dobrze wiedzieć :)
Sorry za off-topic ale tak się od dłuższego czasu zastanawiam czy ktoś nie stworzył może jakiegoś zautomatyzowanego sposobu podmianki obrazków wygaszacza ?
Oczywiście widziałem opisy jak to zrobić „ręcznie” ale trochę mnie to przerasta i nie chciałbym przekombinować. Zaznaczam, że nie jestem fanem tuningowania Kindla, ale jak trafiam na obrazek z Emily Dickinson to przechodzą mnie dreszcze :)
Będę zobowiązany za podpowiedź.
z góry dziękuję
Nie wiem jak u Was, ale u mnie w Operze umieszczone tu skrypty są nieczytelne.
Nieprawidłowe formatowanie, sklejone wyrazy.
autopoprawka: nie zauważyłem, że już było :)
U mnie plik jest taki:
StarDict’s dict ifo file
version=3.0.0
idxoffsetbits=32
wordcount=100000
idxfilesize=100000
bookname=SJP
author=PWN
sametypesequence=m
To działa!
prośba o wrzutkę końcowego mobi ze słownikiem może tu:
http://forum.eksiazki.org/amazon-com-kindle-f146/slownik-jezyka-polskiego-t13100.html
skoro na blogu nie mozna,
nie wszyscy programują ;):)
Programować, to trochę byś musiał umieć, żeby zrozumieć ten [http://swiatczytnikow.pl/test-kindle-paperwhite-czesc-ii-codzienne-czytanie/#comment-139758] wpis :D. Tutaj się postarałem i napisałem wszystko krok po kroku, żeby osoby mniej w tym temacie zorientowane mogły przygotować słownik, przeczytaj uważnie instrukcję jeszcze raz :D
Przepraszam, przy kolejnym zapisywaniu się popsuło. :(
Już poprawione.
Dostaje takie info: co robię źle?
ABAKANOWICZPiotr
Traceback (most recent call last):
File „C:\Python27\tab2opf.py”, line 259, in
dtstrip = normalizeUnicode( dt )
File „C:\Python27\tab2opf.py”, line 98, in normalizeUnicode
text = unicode(text, 'utf-8′)
UnicodeDecodeError: 'utf8′ codec can’t decode byte 0xd1 in position 5: invalid c
ontinuation byte
Hmm, dziwne. Na pewno używasz odpowiedniej wersji skryptu podanej instrukcji? I sprawdź, czy plik slo.tab ma odpowiednie kodowanie (czy jeśli klikasz na format zaznaczone jest „Koduj w UTF-8 bez BOM”)
tak, plik odm.txt ma „Koduj w UTF-8 bez BOM”. Plik slo.tab to skopiowane txt z działania stardicta. :(
To jeszcze tylko pytanko: czy masz zainstalowaną podaną w instrukcji wersję Pythona?
Można jeszcze spróbować zamienić linijkę 264 w tab2opf.py z
dtstrip = normalizeUnicode( dt )
na
dtstrip = dt
i zobaczyć, czy słownik będzie działał prawidłowo (w opisie http://www.mobipocket.com/dev/article.asp?basefolder=prcgen&file=indexing.htm nie jest podane czy w idx:key mogą wstępować znaki z UTF-8).
kk, już wszystko działa, problemem była zła generacja pliku slo.tab, a ponadto jest zły link pod KindleGen, poprawny to http://www.amazon.com/gp/feature.html?ie=UTF8&docId=1000765211
Poprawione, dzięki za zwrócenie uwagi.
Dodam jeszcze, że na innych systemach też bez większych problemów powinniśmy móc przekonwertować słownik
# umieszczamy w folderze bazy słownikowe
touch nazwa\ słownika.ifo
[nazwa edytora tekstu] nazwa\ słownika.ifo
# wklejamy przykładowe dane
# stardict-editor jest np. w repo ubuntu; na maca jest też jakaś wersja:
# http://www.downloadplex.com/Mac/Education/Other/stardict-for-mac_135476.html
# otwieramy stardict-editor i konwertujemy słownik jak 4. kroku
cat słownik1.txt słownik2.txt > slo.tab
wget http://sjp.pl/slownik/odmiany/sjp-odm-20130126.zip
unzip sjp-odm-20130126.zip
iconv -f WINDOWS-1250 odm.txt > temp
rm odm.txt
mv temp odm.txt
wget https://raw.github.com/palkakrzysiek/scripts/master/tab2opf.py
chmod +x tab2opf.py
./tab2opf.py
[nazwa edytora tekstu] slo.opf
# poprawiamy dane słownika
# pobieramy odpowiednią wersję kindlegen
# http://www.amazon.com/gp/feature.html?ie=UTF8&docId=1000765211
# rozpakowujemy
./kindlegen slo.opf
$ ./tab2opf.py
Traceback (most recent call last):
File „./tab2opf.py”, line 255, in
dt, dd = r.split(’\t’,1)
ValueError: need more than 1 value to unpack
Nieprawidłowy slo.tab.
Przygotowałem ponownie i przeszło.
Gdzieś (na pewno w pierwszej linii, może też w innych) w pliku slo.tab jest błąd – nie do hasła nie ma przypinanej definicji oddzielonej tabulatorem. Sprawdź, czy w programie StarDict-Editor jako format wyjściowy wybrałeś „Tab file”, nie „Textual StarDict dictionary”. Przy okazji w ogóle sprawdź, co masz w pierwszej linijce pliku slo.tab. :)
U mnie w pierwszej linijce pliku slo tab jest całą masa tekstu, który wydaje się być później niewykorzystywany przez słownik. Tekst ten można zobaczyć np wchodząc w słownik i „go to” pierwsza strona. Sam słownik pomimo to działa bardzo dobrze.
oczywiście „wchodząc w słownik” – wejść (otworzyć) słownik na kindle tak jak w każdą normalną książkę :)
U mnie w PW mam tylko opcję „Go to Index” więc nie zobaczę o co chodzi, ale jak wyszukam „a”, to pokazuje „Loc 1” i nie mam nic wcześniej.
Treść tą można zobaczyć np w pierwszej linii Notepad++ dokumentu dotyczącego PWN z rozszerzeniem.txt powstałego po StarDict (punkt 4 poradnika) lub na pierwszej linii slo.tab (powstały w 4pkt poradnika) jeśli w/w txt skopiujemy jako pierwsze.
Linia ta zaczyna się od: (( , kolejna linia to: ?, późniejsze linie to już normalne definicje zaczynające się od: a
Wspomniana linia z dużą ilością tekstu zawiera np opisy geograficzne, procesy chem itp. Nie widać jej normalnym używaniu słownika gdyż ten rzeczywiście zaczyna się od „a”.
Mały update. Z mich obserwacji wynika, że w w/w treściach znajdują się elementy rozszerzonych definicji.
Przykład: AFRYKA – na krótka definicja, na końcu jej znajduje się: ,))
Wszystkie słowa z definicjami kończącymi się ciągiem znaków ,)) mają swoje szersze definicje w w/w pierwszej linijce pliku txt.
Może tak jest tylko u mnie, może zrobiłem jakiś błąd. Nie wiem. Sam słownik oczywiście działa.
Tak, czyli traci się ponad 1 MB danych z encyklopedii. Chodzi o to, że pierwszą wersję encyklopedii znajdziemy tutaj:
http://moja.akcja.pl/1xlator.htm#bazy
Jak ktoś ma jeszcze telefon z MIDP2 może zobaczyć jak to działa (wrzucił bym screeny, ale nie mogę obecnie połączyć się z telefonem). W każdym razie wygląda to tak, że na końcu niektórych definicji są strzałki „>>” i oznacza to, że na następnej stronie jest dalsza część danej definicji (w formacie xv2 można „na sztywno” podać kolejność definicji”):
https://github.com/palkakrzysiek/tab2xv1/blob/master/format-xlatora-xv2.txt
Tutaj wszystko wylądowało w jednej linijce. Trzeba by to jakość złączyć, ale najpierw wydobyć definicje bezpośrednio z pliku xv2 za pomocą konwertera http://www.farbiszowie.is.net.pl/Xlator/#download
Pierwotnie plik slo.tab przygotowałem otwierając go w vim-ie i wczytując (:r plik) wskazane 2 pliki. Po wczytaniu pierwszego dałem pustą linię.
Metoda z „cat plik1 plik2 > slo.tab” zadziałała.
Po 3 godzinach, wciągu których kilka razy miałem ochotę poszukać „gotowca” udało się.
Sporo czasu straciłem na zrozumieniu zdania: „We „wszystkich progamach” Szukamy folderu StarDict, a w nim linku do programu StarDict-editor, …”. Uważam ze o wiele prościej byłoby:
„otwieramy program StarDict-editor”.
Drugi problem ze zrozumieniem to:
„StarDict’s dict ifo file
version=3.0.0
idxoffsetbits=32
wordcount=100000
idxfilesize=100000
bookname=SJP
sametypesequence=m
… Analogicznie robimy z pozostałymi bazami.”
Czy” wordcount=100000 i idxfilesize=100000″ to wartosci dotyczace SJP? W końcu zmieniłem tylko „bookname=SJP” na „bookname=PWN”. Z reszta nie bylo problemu. Wielkie dzięki proszę o więcej
Właściwie poprawny opis potrzeby jest jeśli chcesz dodać słownik do programu Stardict/Goldendict czy podobnych (polecam :D). Na potrzeby konwersji do formatu Kindla poprawny opis nie jest potrzeby, musimy mieć tylko plik ifo. bookname=[nazwa] to oczywiście nazwa wyświetlana na liście słowników, wedle uznania. idxfilesize to wielkość pliku idx podana w bajtach, wordcount ilość słów. Żeby poznać te wartości możesz zamiast „decompile” kliknąć verify. Pojawi się coś w stylu:
[warning] Incorrect size of the index file: in .ifo file, idxfilesize=100000, real file size is 2142501.
poprawiasz idxfilesize, zapisujesz i jeszcze raz verify:
[warning] Incorrect number of words: in .ifo file, wordcount=100000, while the real word count is 100886.
poprawiasz wordcount i możesz taki słownik dodać do folderu ze słownikami stardicta.
http://img16.imageshack.us/img16/4462/zrzutekranuz20130223125.png
Wygasły linki…
The file you attempted to download is an archive that is damaged or possibly encrypted. MediaFire does not support unlimited downloads of broken or encrypted archives and the limit for this file has been reached. This file may only be distributed from a premium account.
Dałoby radę gdzieś to umieścić?
http://uploaded.net/file/er8z0wyh
link pochodzi z http://androidpolska.pl/view/colordict_najwiekszy_slownik_offline/2664
Udało się :)
Dziękuję za ten artykuł oraz tip w komentarzu odnośnie innych systemów. Teraz niektóre niezrozumiałe słowa staną się zrozumiałe bez odrywania się od lektury. :) SUPER! :)
Ciesze się, że się przydało :). Warto wspomnieć, że jakiegoś słówka zabraknie w bazie odmian. Wtedy, żeby było szybciej otworzyć słownik wybieramy inne słówko, „pokaż pełną definicję” i wpisujemy słówko w podstawowej formie. Co do sprawy z komentarza: http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-141567
aby mieć na Kindlu pełną encyklopedię jeszcze jedna instrukcja :), tu już Windows się przyda :(
Z http://www.farbiszowie.is.net.pl/Xlator/#download pobieram http://www.farbiszowie.is.net.pl/PrTVm/stat.php?s=konwerter_0.2&u=konwerter_0.2.zip
Z http://moja.akcja.pl/1xlator.htm#bazy pobieram epedia.zip, rozpakowuje. Za pomocą skrótu [klawisz windows] + r otwieram okienko do uruchamiania, wpisuję cmd, w konsoli wpisuję
cd [ścieżka do folderu z konwerter.exe i 9.XV2 otoczona znakami cudzysłowu]
konwerter 9.XV2 ency /d
następnie otwieram plik ency.mdx.txt w notepad++, wybieram format → konwertuj na format ANSI; format → zestaw znaków → środkowoeuropejskie windows-1250; tworze nowy dokument (chodzi o unixowy znak przejścia do nowej linii) i kopiuję zawartość poprzedniego pliku;
zapisuję jako ency.txt; wybieram szukaj → zamień Szukany tekst:
(.*)\n(.*)\n
zamień na:
\1\t\2
zaznaczam opcję „wyrażenie regularne”; zamień zamień wszystkie
później jeszcze raz z
^[^\t]*\t([^,\n]*),
na
\1\t\2
to powinno poprawić wygląd haseł; kolejna zamiana z:
na:
\\n
i zapisuje plik. Dalej standardowa konwersja. W razie gdyby nie wszystkie kody poprawnie się wyświetlały, ten komentarz też jest tutaj: http://pastebin.com/ZGNt2HXY
Verifying dictionary files…
[message] Verifying dictionary 'C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo’…
[critical] Load C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo failed: Incorrect magic data.
[message] File 'C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo’ is not a StarDict dictionary or it’s broken.
[message] Dictionary 'C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo’. Verification result: The dictionary is broken. Do not use it.
Failed!
Cóż począć?
Zrobić poprawny plik ifo :P
kindlegen wyswietla:
Error:E21016: Source file is not valid UTF8.
in file: C:\…\slownik\slo0.html
przekonwertowałem w notepad++ wszystkie pliki html na UTF8 bez BOM, jednak to samo…komuikat ten sam, nie generuje się żaden plik.
jakies pomysły?
Przyłączam się do pytania.
Stanąłem dokładnie w tym samym miejscu i nie wiem co dalej :-(.
Wielkie uznanie dla autora tekstu, funkcja bardzo przydatna podczas lektury. Nie mogę się doczekać, aby ją przetestować.
To samo tutaj, bardzo prosze o pomoc!:)
Niestety wszystkie mirrory podane na forum android, słownika jp są nieczynne, encyklopedia można jeszcze z jednego pobrać, chyba za dużo ludzi chciało i sie limit wyczerpał…
Wielki szacunek dla autora za artykuł, słownik języka polskiego – tego właśnie mi brakowało na Kindle PW.
Dziękuję bardzo :)
Swoja drogą czy są dostępne również takie polskie słowniki techniczne :)?
pięknie wszystko działa. Wyrazy uznania :-)
Wbrew pozorom nie jest to takie trudne z tym opisem, szkoda że wyrażnia wielowyrazowe (łącznie z nazwiskami) z encyklopedii są połączone ze sobą typu NOWAKPiotr i Kindle ich nie widzi gdy się chce sprawdzić…
Chyba Robert włączył automatyczną akceptację moich komentarzy, więc nie wiem kiedy to zobaczysz (o ile w ogóle). Wielowyrazowych definicji i tak nie wyświetlisz (przy zaznaczeniu pojawia się co najwyżej opcja zaznaczenia lub dodania notatki, ale nie szuka w słowniku). Kilka komentarzy wcześniej opisałem jak skonwertować encyklopedię bezpośrednio z pliku xv2 (tak, żeby wyrazy w haśle nie były złączone i żeby słownik zawierał pełne dłuższe definicje), ale komentarz również utknął w oczekiwaniu na moderację.
OK, poprzedni ten komentarz się wyświetlił. Nie wiem dlaczego wcześniejszy nie przeszedł. Sprawdź, co napisałem w http://pastebin.com/ZGNt2HXY żeby mieć lepszą wersję pliku tab z encyklopedią.
I co robimy dalej z tym plikiem ency.txt? Zmieniamy rozszerzenie na dict?
Sorki za głupie pytanie bo nie przeczytałem opisu. Stworzyłem słownik bez problemu. Jeden mankament: często brakuje TAB przed definicją w encyklopedii, którą konwertowałem z 9.XV2.
Przykład:
IDAHO FALLSmiasto w USA (Idaho)
Da się coś z tym zrobić?
Jak zaczniesz wpisywać IDAHO FALL to wyszuka; zaznaczając ten tekst w książce i tak nie będzie wyszukiwać w słowniku (działa to tylko dla pojedynczych słów). Zauważyłem, że zdecydowana większość definicji miała postać
[nazwa definicji], dalsza część
dlatego żeby trochę całość ulepszyć (żeby słowa kluczowe nie były złączone i w ogóle ładniej wyglądało) posłużyłem się tym wyrażeniem regularnym. Jak dla mnie i tak wygląda to lepiej niż „sklejone” słowa kluczowe (tu tabulator jest w miejscu pierwszego przecinka definicji) , ale można wybrać jak się chce :)
Masz rację. Słownik i tak wygląda rewelacyjnie a działa nawet lepiej niż wygląda dzięki odmianie. Wielki dzięki za świetną instrukcję. Miałem lekkie obawy czy sobie poradzę ale poszło zadziwiająco łatwo. :)
Mógłbyś to powiedzieć osobą, które znalazły formularz kontaktowy na mojej stronce, i co chwilę dostaje pytanie o udostępnienie mobi, bo same „nie dadzą sobie rady z konwersją i prawie nic nie rozumieją z instrukcji”. Aż mnie zastanawia, czy nie ma wśród nich jakiegoś pracownika z działu odpowiedzialnego za licencjonowanie PWNu, który z chęcią zgłosił by gdzie trzeba udostępnianie treści objętych prawem autorskim :)
Czyli jak rozumiem gdy w książce będzie IDAHO FALL i ja ustawie kursor przed IDAHO, to i tak mi nie wyszuka IDAHO FALL w encyklopedii? Jeśli tak, to w sumie rozdzielone wyrazy to sztuka dla sztuki.
Niestety nie poda ci definicji haseł wielowyrazowych. W przypadku IDAHO FALLS zobaczysz tylko definicję dla hasła „IDAHO”. Jednak lepiej wygląda encyklopedia z rozdzielonymi wyrazami i ma pełne definicje dla wielu haseł, np. AFRYKA. W wersji z połączonymi wyrazami brakuje nawet definicji dla tego kontynentu.
Dużo lepiej, i łatwiej szuka się definicji w encyklopedii po tej modyfikacji. Zresztą to też kwestia gustu i tego czy będzie się z niej korzystać na Kindlu. Oczywiście moim zdaniem zawsze warto mieć takie coś pod ręką, bardzo często zdarzało mi się korzystać ze słownika i encyklopedii na telefonie, a teraz gdy mam Kindla pod ręką to korzystam z niego.
Pochwali się ktoś wynikiem końcowym z tymi co są trochę na bakier komputerami… ?
naless@gmail.com
dysponując 'odmianą polską’ (plikiem odm.txt) – to na bazie tego opisu bardzo prosto przygotować również kompilację słownika polsko-angielskiego-niemieckiego razem SJP ;-) Działa, ale znacząco powiększa rozmiar pliku wyjściowego ;).
A ja mam inne pytanie. Jako że używałem kiedyś linuksa mam dwa zestawy plików stardicta (dict, idf, ifo) dla pewnego bilingwalnego słownika języka angielskiego. Czy wystarczy jak te pliki wrzucę w podlinkowany program? Chciałbym mieć możliwość zarówno sprawdzania ekwiwalentów polskich jak i angielskich.
Mój czytnik to kclassic
Tutaj może być problem z wyborem jaki język ma mieć słownik. Można ustawić go jako angielski w pozmieniać metadane książek (również zmienić ich język na angielski: http://swiatczytnikow.pl/dlaczego-slownik-w-kindle-czasami-nie-dziala-czyli-o-ustawieniach-jezyka/). Nie wiem też skąd wziąć angielską bazę odmian (nie szukałem). Dla polskiego wiedziałem, że takie coś istnieje, bo pracując kiedyś na Emacsie sprawdzając poprawność pojedynczych słów dostawałem informację w stylu: 'word „zrobiłem” is correct because of root „robić”. Kwestią było znalezienie tej bazy i modyfikacja skryptu tab2opf, żeby ją obsługiwał.
Dobra, moje poprzednie pytanie było niemądre. Poradziłem sobie z konwersją, ALE
W menu dictionaries mam tylko English. Czy to wina firmware’u classica czy coś źle skonwertowałem?
Prawdopodobnie nie edytowałeś (lub nie odpowiednio) pliku slo.opf, chodzi o ustawienia języka.
Po wykonaniu kilku testów, moje spostrzeżenia i uwagi:
Nie wiem jak innym użytkownikom, ale u mnie, to nie działa poprawnie. Wg mnie, kompilacja dwóch i więcej słowników się nie sprawdza, gdyż definicje nie łączą się wspólny wątek. W efekcie otrzymujemy duży słownik, który tak naprawdę nie spełnia swojej roli, czyli nie podaje pełnego komentarza (dwóch słowników) do poszukiwanego słowa, ale wyświetla pierwszą napotkaną definicję, wg kolejności wgranego wcześniej słownika.
Dlatego myślę, że lepiej jest wykonać dwa osobne słowniki (np. Encykl.mobi i SJP.mobi) niż jeden wspólny (Encykl-SJP.mobi).
Oczywiście mogę się mylić. Dlatego bardzo proszę o weryfikację
Dopisał bym to w artykule, ale tego nie zrobiłem, bo była to instrukcja dla Windowsa, który do niektórych zastosowań jest delikatnie mówiąc słaby :). Dokładniej chodzi o narzędzie „sort” (z wiersza poleceń). Na Linuksie jak się chce można mając już plik slo.tab wykonać np. takie polecenia:
sort slo.tab > temp
rm slo.tab
mv temp slo.tab
Windowsowy sort uznał, że plik jest zbyt duży, żeby go sortować. Próbowałem w Calcu (z LibreOffice) ale tu z kolei niektóre definicje były za długie. Można jeszcze spróbować Excela ale nie popieram kupowania zbyt dużej ilości produktów Microsoftu. Pirata nie chciałem ściągać, żeby przypadkiem nie zainfekować systemu, a czuję, że rejestracja triala była by drogą przez mękę w Microsoftowym piekle :)
Jakby ktoś nie wiedział jaki będzie efekt posortowania różnych baz: oczywiście wszystko będzie ustawione alfabetycznie (fajnie wygląda gdy korzysta się z tej (http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-141986) wersji encyklopedii. I jeśli w różnych bazach wstępują te same hasła, to wybierając „show full definition” będą one wyświetlane obok siebie. Jeśli bardzo by się chciało można korzystając z wyrażeń regularnych połączyć definicje, które są posortowane. W Vimie: :%s/^\(.*\)\t\(.*\)\n\1\t/\1\t\2\\/ . Po lekkiej modyfikacji zadziała i w Notepad++, ale nie wydaje mi się żeby było to aż tak potrzebne, więc już nie będę odpalał „Windy”, żeby to przetestować.
OK – posortowałem alfabetycznie plik slo.tab zawierający słowniki: 'ang’, 'encyk99′, 'sjp’ i muszę przyznać, że jest to jakiś sposób. Obawiałem się, że duplikaty będzie się źle czytało, ale po kilku testach nie odczuwam żadnego dyskomfortu, więc zdecydowanie polecam tę metodę.
Plik wyjściowy waży około 90 mb i został zbudowany z 28 plików .html
OK, pytania:
1. Jak widzę, nowe Kindle mają możliwość wyboru głównego słownika dla kilku języków osobno? W K3 mam tylko jeden główny słownik.
2. Jeżeli w K3 mam wybrany główny słownik, to jest on sprawdzany pod względem danego wyrazu. Co, jeżeli wyraz nie zostanie znaleziony w danym słowniku? Czy inne, wgrane i dotyczące tego samego języka są również przeszukiwane? Nie zauważyłem aby to działało w ten sposób? (mam kilka słowników języka angielskiego, i chciałbym aby szukał w każdym, jeżeli nie znajdzie w tym głównym).
W nowych Kindle słowniki działają podobnie jak w wcześniejszych wersjach czytników i nic specjalnego się nie zmieniło – czyli do danego języka jest przyporządkowany jeden słownik i tylko jeden może być aktywny. Ale oczywiście w kolekcji (swojej biblioteczce) możesz mieć więcej wersji różnych słowników.
„Myk” – opisany w tym artykule polega, na tym, że tworząc jeden 'aktywny słownik’ możesz zaopatrzyć go w rozszerzoną bazę innych słowników i skompilować tak, że będziesz miał wyświetlane różne definicję w tym jednym czasie, (np. definicje słów języka niemieckiego, angielskiego… francuskiego (itp.) naraz ;-)).
Moim zdaniem to bardzo ciekawa opcja, z której warto skorzystać .
Jeśli doinstalujesz dodatkowy system Duokan, wtedy każdy wyraz będzie sprawdzany w KAŻDYM słowniku i definicje będą kolejno wyświetlane, razem z informacją o źródle (mam dwa angielskie + enc. + SJP i wszystko pięknie i szybko chodzi).
Im więcej sie tym bawie, tym bardziej sobie uświadamiam jakie to rewolucyjne rozwiązanie. Bardzo dziękuje Panie Krzysztofie za ten poradnik. Jeśli nie ma Pan jeszcze dość odpowiedzi na pytania to czy mógłbym prosić o podpowiedź. Chciałbym zrobić tą „lepszą” wersję encyklopedii z opisu http://pastebin.com/ZGNt2HXY, mam już sciągnięty konwerter i plik encyklopedii – kompletnie jednak nie rozumiem jaką dokłądnie komendę mam wpisać w konsoli:
„cd [ścieżka do folderu z konwerter.exe i 9.XV2 otoczona znakami cudzysłowu]
konwerter 9.XV2 ency /d”
Założmy, że mam te dwa pliki luzem na dysku d, co muszę dokładnie wpisać…
Można to zrobić prościej.
Kliknij przycisk windows + R – otworzy się okienko Uruchom (uruchamianie).
Wpisz cmd – otworzy się konsola.
Przeciągnij na nią konwerter.exe – pojawi się jakaś tam ścieżka do tego pliku.
Kliknij spację.
Analogicznie przeciągnij plik 9.XV2 – do tego co było dopisze się druga ścieżka.
Potem kliknij spację i dopisz „ency /d”, oczywiście bez cudzysłowów.
Ważne żeby wszystko było oddzielone spacją.
Jeśli problemem jest brak formy grzecznościowej to przeprasza, ale tak było wygodniej i wydaje mi się przejrzyściej, a o to przecież chodzi.
Dzięki, dla ścisłości powiem, że docelowy plik tworzy się nie tam gdzie mamy zapisane dwa pliki wyjściowe tylko na dysku C w folderze Użytkownicy/nazwa uzytkownika, bo się trochę naszukałem.
Dalej jednak pojawiają się kolejne problemy. Robię wszystko tak jak jest opisane tutaj: http://pastebin.com/ZGNt2HXY, ale przy operacji:
(.*)\n(.*)\n
zamień na:
\1\t\2
(zazanczone wyrażenia regularne)
Nic się nie dzieje, komputer mieli dłuższą chwilę, ale ostatecznie daje komunikat, że nie zamieniono niczego, podobnie przy zamianie
^[^\t]*\t([^,\n]*),
na
\1\t\2
Rozumiem, że docelowo te zamiany mają sprawić, że każda definicja będzie w jednej linii.
Mi po tych „zamianach” hasło nadal wygląda tak:
„abeautifulviewmagni
A BEAUTIFUL VIEW… MAGNIFICENT DESOLATION, angielskie „piękny widok… wspaniałe pustkowie”; słowa kosmonauty amerykańskiego E.E. Aldrina po wylądowaniu na Księżycu 1969.
”
Ostaecznie, gdy dodam treść tego pliku do slo.tab, konwerter tab2opf, tworzy tylko jeden htmlowy plik bez treści i na tym kończy się jego praca. Nie wiem może te wyrażenia regularne są jakieś nie takie jak powinny?
W tamtym poradniku wszystko jest poprawnie. Sam zrobiłem według niego i mi działa jak należy.
Dodałem od siebie taką poprawkę:
([A-ZĘÓŁŚŻŹĆŃĄ][A-ZĘÓŁŚŻŹĆŃĄ]+)([a-zęółśążźćń])
na
\1 \2
Ważne żeby włączyć „Uwzględniaj wielkość liter”.
Większość haseł jest napisana wielkimi literami i czasem nie ma spacji między hasłem a definicją pisaną małymi i właśnie mój kod tę spację robi, ale jeśli następują min. 2 wielkie litery po sobie.
Np.
ABAZJAutrata zdolności chodzenia – tu spacje zrobi po haśle.
ABBAGNANO Nicola – Tu słowa Nicola nie rozdzieli.
Mimo wszystko może gdzieś zrobić odstęp niepożądany także to wszystko na własną odpowiedzialność.
A wracając z tej dygresji wytnij kilka linijek tekstu i wrzuć do nowego pliku i zobacz czy działa.
Jak nie to upewnij się że masz na pewno plik w formacie unix zgodnie z instrukcją. Informacja jest w prawym dolnym rogu – musi być tam „UNIX”. Bo te wyrażenia odnoszą się właśnie do unixowego formatu i na windowsowym faktycznie nie zadziałają.
Oczywiście zakładam, że pracujesz na notepad++ i tylko na tym.
No faktycznie nie było UNIX tylko Windows, ale po zmianie tego w ustawieniach Notepad++, przejściu ponownie całej ścieżki z poradnika nadal mi nie wyszukuje i zamienia tych wyrażeń regularnych. Mam zapisany ency.txt, w prawym rogu jest UNIX i ANSI, ale gdy wrzucam do wyszukania (.*)\n(.*)\n to mówi, że nie może znaleźć takiego wyrażnia i tyle. Dzięki za próbę pomocy, ale chyba pozostane z tą „gorszą” encyklopedią.
Jeżeli nadal chcesz się bawić to zobacz czy działa Ci tylko coś takiego:
(.*)
Oczywiście zaznaczone wyrażenia regularne, polecam też zaznaczyć trochę wyżej „wracaj na początek pliku”, szczególnie ważne to jest przy opcji zamień wszystkie.
Ta ww. komenda powinna odnajdować po prostu całe linie. Jeśli działa to jest dobrze.
Potem zobacz czy zadziała to:
(.*)\n
Jak nie zadziała to problemem jest \n czyli znak końca linii.
Kliknij na górze „Pokaż wszystkie znaki” na końcu linii powinien być taki jeden kwadracik z białym „LF”, jeśli jest coś innego to to jest problem, a jeśli wszystko jest jak napisałem i nie działa, to by trzeba było się temu dokładniej przyjrzeć.
(.*) działa, wyszukuje, (.*)\n – nie działa, nie wyszukuje, pokaż wszystkie znaki pokazjue „LF” w kwadracie na końcu linii. Zanaczy, że coś dziwnego u mnie się dzieje, i nie wiadomo co? Fuck…
Żeby było ciekawiej \n wyszukuje mi w trybie rozszerzonym wyszukiwania, natomiast (.*) tylko przy zaznaczeniu „wyrażenia regularne”, nie wiem czy tą zamianę da się rozbić na dwie?
Jednak nie dałem za wygraną, przeinstalowałem Notepada++ i wszystko zaczęło działać :)Swoją drogą przydało by się ten poradnik powyżej uzupełnić o te informacje, po zrobieniu encyklopedi z ego lepszego pliku i posortowaniu, działa to znacznie lepiej. Dzięki za poświęcony czas!
Jakim posortowaniu? W czym lepiej działa?
O jakim „lepszym pliku” mowa? Rzeczywiście by się przydało to dopisać do poradnika, bo w komentarzach trochę chaosu i ciężko z nich coś wnioskować…
To dobrze, że działa. Widocznie jakiś głupi błąd.
Co do wyszukiwania rozszerzonego i wyrażeń regularnych – ja różnicę rozumiem tak, że wyszukiwanie rozszerzone pozwala na wyszukiwanie dodatkowo znaków niedrukowalnych np. koniec linii, tabulatory itd.
A wyrażenia regularne polegają na wyszukiwaniu różnych kombinacji tekstu – np. (.*) wyszukuje wszelkie dowolne znaki do końca linii.
Ogólnie w komentarzach doszło tyle informacji zarówno od samego autora jak i innych, że spokojnie można by było napisać wersję 2. tego artykułu ;p
Porzez lepszy plik rozumiem plik encyklopedii pobrany i przerobiony według opisu zawartego w tym komentarzu:
http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-141986
Sortowanie to poukładanie definicji tak, żeby definicje tych samych wyrażeń, z różnych plików (np. encyklopedii i słownika) znajdowały się obok siebie, dzięki temu po przejściu do widoku pełnej definicji w Kindlu mamy je jedna pod drugą. Jak to zrobić Andrzej opisał tutaj: http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-142348
Aha. I jak by komuś pokazało że wszystko się zrobiło a plik wynikowy się nie pojawił to niech zobaczy jaka ścieżka jest w konsoli – zwykle to C:\Users\Nazwa użytkownika i właśnie w tym folderze pojawi się ten plik wynikowy.
CD /D D:/
z http://www.computerhope.com/cdhlp.htm
Dla chcących posortować sobie bazę:
1) Otwieramy notepad++
2) Klikamy: Pluginy->Plugin Manager->Show Plugin Manager
3) Wybieramy TextFX Characters i instalujemy. Program powinien wymusić na nas ponowne uruchomienie programu
4) Otwieramy bazę, zaznaczamy całą zawartość (dla nieobeznanych ze skrótami klawiszowymi Ctrl+A – zaznacz wszystko)
5) Na górze w menu wybieramy TextFX->TextFX Tools
6) Upewniamy się że opcja „+Sort ascending” jest zaznaczona i klikamy „Sort line case INsensitive (at column)”
7) Chwilę czekamy i gotowe.
Na którym pliku to sortowanie się robi?
Na slo.tab
Nie ma nic więcej do wyboru, bo plik odmian jest już posortowany.
Coś mi nie działa te sortowanie na pliku slo.tab przerobionym z 9.XV2
Dostaję ucięte wyrazy, np.:
ójnie \npotrójnie\n potrójnie…
órstwo \nprzetwórstwo\n przetwórstwo…
Pomijając to że polskie znaki są brane przed inne litery alfabetu, co akurat nie ma wielkiego znaczenia, wszystko jak najbardziej sortuje się sortuje. Te niepoprawne wpisy są już w słowniku języka polskiego. Możesz sprawdzić, że w nieposortowanym też takie wpisy się pojawiają.
Sorki, nie zauważyłem :) Dzięki za dobre porady z sortowaniem i rozdzieleniem wyrazów.
Pozwolę sobie zostawić jeszcze jeden komentarz, bo sam mam dość dziwny problem i jestem ciekaw czy mają go też inni i czy da się coś z tym zrobić.
Mianowicie, kiedy ustawiam sobie mój nowy słownik jako domyślny to wszystko fajnie, pięknie działa. Ale zdarza się sytuacja – pojawia się postać historyczna np. Aleksander Wielki. W tym przypadku zadziałać może jedynie encyklopedia, ale Aleksander jest napisany w innym przypadku niż ten ze słownika np. Aleksandra Wielkiego, wiadomo że słownik tego nie znajdzie, więc wpisuję go sobie ręcznie czy kopiuję i zmieniam końcówkę, bez różnicy i wybieram szukaj w słowniku (dictionary).
I tu jest problem, bo zamiast w aktualnie domyślnym utworzonym przeze mnie szuka w słowniku, który był poprzednio domyślny. Co jest dość wkurzające, a nie chcę usuwać teraz wszystkich innych słowników, co prawda tego nie sprawdziłem, ale strzelam że zadziała.
Ma ktoś taki problem i pomysł jak z tym można sobie poradzić ?
W ramach formalności mam Kindle 3.
Paperwhite niestety też się tak zachowuje. I strzelam, że to nie zadziała – wydaje mi się, że szuka w języku w jakim ustawiony jest Kindle.
Ktoś wie skąd ściągnąć jakąś bazę odmian angielską i niemiecką?
Świetna sprawa, działa i co najważniejsze, rzeczywiście się przydaje. Wielkie dzięki!
Ech, gdybym ja rozumiala choc jedno slowo z tego co napisaliscie poza poslki slownik…
Podaj mi swego maila to Ci „wytłumaczę” i dam rękę uciąć, że zaczniesz niebawem korzystać ze słownika :)
Czy mi też mógłbyś „wytłumaczyć”? Dziś odebrałem swojego Kindla. Z góry dziękuję.
remont.ogrodu@gmail.com
„Wytłumaczyć” mogę tylko kobiecie ;)
Chetnie i po kobiecemu ;P przyjme korepetycje indywidualne na adres agra77@poczta.fm, dziekuje ;)
Poproszę o indywidualne tłumaczenie. Wprawdzie nie wszystkie języki obce są mi obce, ale ten, którym rozmawiacie ze swoimi komputerami – tak… (musar@wp.pl)
Witam,
Miałbym prośbę o przesłanie szczegółowej instrukcji, dosłownie krok po kroku, jak mógłbym zainstalować/założyć/wprowadzić polski słownik do mojego Kindle’a (Touch).
Z góry serdecznie dziękuję i pozdrawiam,
Bartek
Instrukcja krok po kroku jest w artykule.
Po przygotowaniu słownika należy go wgrać na Kindle za pomocą kabla. Można posłużyć się Calibrem.
I się zaczęło…
No a instrukcja naprawdę tak prosto napisana, że ciężko tego nie zrobić.
@ichi, dla kogos kto sie troszke na tym zna moze tak, ale ja Ci tez moge napisac instrukcje do czegos w prostym szwedzkim, co z tego, jak Ty nie bedziesz rozumial…
Instrukcja jest nie w szwedzkim, chińskim… ale polskim języku. Jest tak napisana, że nie nie trzeba być informatykiem aby ją zrozumieć. Przyznaje, że za pierwszym razem musiałem poświęcić ok. 2h, ale było to zanim ją poprawiono i uzupełniono. Ktoś daje wędkę (komplet potrzebnych narzędzi), ale oczywiście łatwiej domagać się ryby.
Sorry, ale ten dzial polskiego jest dla mnie jak chinski a dla Ciebie szwedzki. Jesli bedziesz potrzebowal tlumaczenia na szwedzki odezwij sie to albo Ci dam rybe – przetlumacze albo wedke, podesle tipsy na dobre ksiazki, strony www do nauki jezyka. Uwazam,ze jesli ktos cos umie robic lepiej niz ja i moze mi pomoc, to zaden wstyd sie przyznac,ze ja nie wiem o co common. A nie jestem glupia zdaje mi sie, zwyczajnie w pewnych obszarach zycia jestem nieco zdolniejsza a w innych mniej. I jesli chcesz twierdzic,ze tak latwiej, masz prawo, ja uwazam,ze madrzej i bardziej zyciowo…
„pomoże” vs „zrobi za mnie” :P
Pomocą właśnie jest ta instrukcja.
No, ale ok, spróbujemy ;). Który punkt instrukcji jest niezrozumiały? Postaram się wyjaśnić najlepiej jak umiem.
Problemem nie jest pomoc, ale podsyłanie gotowego pliku. Legalność takiego działania jest dyskusyjna. Podobnie byłoby, gdyby ktoś „pomógł” osobie nieradzącej sobie z programami w zdobyciu konkretnej MP3, przesyłając (po wcześniejszym przerobieniu) taki plik np. z posiadanego przez siebie oryginalnego nagrania. Dlatego też autor bloga prosił o niezamieszczanie linków, a autor poradnika delikatnie sugerował aby nie nagabywać go mailowo o gotowca.
Ale ja nikogo o gotowca nie nagabuje, ja tylko napisalam,ze szkoda,ze nic nie rozumiem a poza poczatkiem o sciagnieciu pliku nie rozumiem zadnego punktu, okresl mnie komputerowym glupkiem, albo leniwcem, ja po prostu nie mam ani sily, ani czasu, ani ochoty poglebiac znajomosci z tej dziedzinie. Na pewno za jakis czas powstanie polski oficjalny slownik i wtedy z przyjemnoscia go sciagne lub zakupie, ja 99% swoich kindlowych ksiazek mam kupionych calkowicie oficjalnie i samodzielnie. Over, zeby nie zasmiecac komentarzy bezsensownymi dywagacjami, milego wieczoru zycze.
Dla kompletncyh głupków i leniwców :) pojawiła się już w sieci kompilacja encyklopedii, słownika i sł. wyr. obcych. Trzeba trochę poszukać przez wyszukiwarkę.
Świetna sprawa ten słownik ang-pol Bumato. Really helpful.
Owszem, pojawiła się w sieci wersja słownika-encyklopedii.
Po wrzuceniu w Google hasła – Słownik języka polskiego dla Kindle – pojawi się lista stron, czwarta pozycja ( choć to się możne zmienić) poprowadzi nas do strony, na forum której ludzie o tym rozmawiają i są tam dokładne informacje, jak samemu „rozwiązać problem”, bez narażania się na stygmatyzowanie mianem kompletnego głupka czy leniwca.
Ja rozumiem, że rozpowszechnianie tego pliku może być dyskusyjne i ci, którzy go sami sobie „zrobili” nie chcą tego robić.
Doskonale rozumiem też te osoby, dla których jest to czarna magia.
Ale nie rozumiem tych, którzy obnoszą się tu ze swoim poczuciem wyższości, „lepszości” tylko dlatego, że coś im udało się zrobić, a innym nie.
Ta ten portal powinien służyć czemu innemu, powinien być pomocny tym osobom, które szukają pomocy, wiedzy, informacji.
Niestety, tę rolę spełnia coraz słabiej :O
A da sie przekonwertowa Wielki słownik PWN Oxford angielsko-polski jesli mam go juz w mobi formacie. Tak by byl jako slowanik?
Witam. Słownik i encyklopedia działa jak chcę wyszukać jakieś hasło ręcznie natomiast jak wchodzę w Settings -> Device Options -> Language and Dictionaries -> Dictionaries to tam SJP pokazuje że to słownik angielski i dlatego nie działa w książkach w języku polskim. Co zrobić w takim przypadku ? Jak ustawić żeby Kindle wykrywał że to słownik języka polskiego ? Pozdrawiam i dzięki z atak obszerny materiał :)
Strzelam, że może sam słownik ustawiłeś jako książkę angielską? :)
W tym przypadku trzebaby zmienić metadane, np. korzystając z mobi2mobi –
http://swiatczytnikow.pl/dlaczego-slownik-w-kindle-czasami-nie-dziala-czyli-o-ustawieniach-jezyka/
Prawdopodobnie nie wykonałeś poprawnie siódmego kroku – nie ustawiłeś poprawnie metadanych :)
Sprawdzałem wszystkie możliwości i słownik ma ustawioną wersję języka na polski oraz w metadanych jest tak jak u pana na 100%. Jest coś jeszcze co może być tego przyczyną ?
Hej,
Czy udało Ci się rozwiązać Twój problem.
Wygląda na to, że mam taką samą przypadłość.
Z góry dzięki
Hej,
Czy udało Ci się rozwiązać Twój problem?
Wygląda na to, że mam taką samą przypadłość.
Z góry dzięki
Doprawdy nie daję rady. Jakby ktoś chciał podzielić się swoim końcowym wynikiem: avilon2k@gmail.com
Z góry dziękuję.
Końcowy wynik jest dostępny już w sieci, poggogluj trochę…
Hej,
mam pytanko do autora instrukcji.
Wszystko zostało przeprowadzone zgodnie z instrukcją i „teoretycznie” super działa na Kindlu Paperwhite.
Problem w tym, że nie działa na wszystkich książkach.
Wszystkie książki mam w formacie mobi (język polski).
W niektórych przypadkach otrzymuję informacjię „no dictionary has been found”.
Z góry dzięki za info
A upewniłeś się, że te książki mają ustawiony w metadanych język polski?
Hej,
Dzięki za szybką reakcję.
Właśnie sprawdziłem i co dziwne słownik działa na książce z przypisanym językiem angielskim. Na polskim nie działa.
Po powrocie z pracy zweryfikuję wszystko jeszcze raz.
No przyznaje bardzo dobrze napisany poradnik. Nawet mnie laikowi udało się przejść przez niego i dodać słownik do swojego Kindla. Pozdrawiam autora.
Kurczę, wszystko działa, ale niestety bez polskich znakiem, źle koduje te pliki html chyba :/
Dobrze, już działa, nie zmieniłem kodowania pliku slo.txt
Dzięki za poradnik!
Pozbyłem się przynajmniej jednego powtórzenia definowanego słowa. W edytorze Vim jest to polecenie z otwartym plikiem slo.tab.
:%s/^(.*)t(s+n1)/1t/
Od początku linii do tab-a:
^/(.*/)/t/(s+n/1/)
(druga grupa nie jest zasadniczo potrzebna – tego się pozbywamy)
zastąp tym co zostało znalezione do taba
1t
Pozbyć się jeszcze jednego powtórzenia definowanego słowa nie jest już tak prosto.
Można też posortawać slo.tab
:sort i
Fana Douglasa wyczuwam :D Właśnie czytam Restaurację na końcu świata na swoim kundelku ;)
Witam. Przymierzam się właśnie do kupna Kindle Paperwhite, ale zastanawia mnie jedna rzecz. Czy te wszystkie podkreślenia, notatki i szczególnie słownik będą działały także w przypadku pirackich ebooków np. z chomika?
O ile ebooki mają ustawiony w metadanych język, to nieważne skąd zostały pobrane.
Ok. Dziękuję serdecznie za odpowiedź.
Oczywiście ręczne dodanie do meta danych języka to w Calibre kilka kliknięć ;)
Uznania dla autora.
Wszystko śmiga jak należy – jedyne z czym był malutki problem to pliki ifo ale po ściągnięciu pliku, które autor umieścił w komentarzach reszta była już tylko formalnością.
Instrukcja mimo iż na początku wygląda na dość skomplikowaną jest w rzeczywistości prosta i wykonanie wszystkich kroków po kolei przychodzi z łatwością.
Jedyne co musiałem zrobić to poszukać w innym miejscu słowników, ponieważ nie byłem ich w stanie ściągnąć z podanej przez autora strony (można je znaleźć na chomiku wyszukując „bazy słownikowe StarDict”)
Aby trochę powiększyć bazę dostępnych słów dorzuciłem jeszcze to tego wszystkiego Słownik Wyrazów Obcych. Moim zdaniem dobrze uzupełnia zakres słów z 2 pozostałych.
Jeszcze raz dzięki i pozdrawiam.
Od roku jak ex ortodoks papieru jestem fanem czytników. Mam Booxa ale wyrywamy go sobie z moim synem dlatego postanowiłem kupić drugi. Pewnie Kindle choć mam kilka wątpliwości a główna dotyczy słownika. Jestem posiadaczem orginalnego słownika na CD pol-ang i ang-pol PWN który dzięki skryptowi PWN2stardict udało się zminić na stardicta (na Boox’ie działa doskonale). Moje pytnie brzmi następująco. Czy mając stardicta mogę dalej konwerotwać aby działał w tle na Kindlu, czy też muszę konwersję przechodzić od samego początku tak jak tutaj napisano. Dzięki za informacje.
Coś zrobiłem nie tak. Jak wchodzę bezpośrednio do słownika, wyszukuje mi hasła i z encyklopedii i ze słownika, jednak gdy zaznaczam jakiś wyraz w tekście czytanej książki, wyświetla mi hasła tylko ze słownika języka polskiego, z encyklopedii już nie, mimo że się one w niej znajdują, np. zaznaczę nazwisko Beethoven i nie wyświetla mi się nic. Jak ktoś wie o co chodzi, proszę o informację.
Witam, mógłby mi ktoś wysłać przerobiony już słownik lub link do niego na meila ?
Z góry dziękuję. flacktub@gmail.com
Jeśli ktoś potrzebuje gotowy słownik polsko angielski na Kindle a Bumato mu nie wystarcza, niech poszuka w google Wielki Słownik angielsko-polski 2014 for Kindle wersja 2014.1
To jesli nie ma dostepnej darmowej wersji slownika jezyka polskiego na Kindle to czy jest mozliwosc sciagniecie wersji odplatnie? Mysle ze fanow znalazlo by sie dosc sporo. Nie wiecie czy jest moze sposob na wyslanie sugestii do Amazon zeby taki slownik stworzyli i udostepnili go nawet odplatnie? Nie ma nic za darmo a ja zdecydowanie moge za takowy zaplacic.
Podłączam się do tego pytania. Dodam jeszcze, że dzisiaj wysłałem maila z zapytaniem do PWN, o stworzenie takiego słownika. Może jakby więcej osób wysłało, to PWN by takowy słownik stworzył. Szczerze powiem, że doceniam powyższy artykuł, jednakowoż wolałbym zapłacić, aniżeli przechodzić przez powyżej opisane instrukcje, zwłaszcza że takie rzeczy to dla mnie czarna magia.
Skrypt wygenerował mi tylko jeden plik html o wielkości 1KB. Ktoś pomoze?
Czy moglibyście pomóc mi jak dodać 'etykietę’, że plik slo.mobi to słownik? Kindle rozpoznaje go tylko jako zwykły ebook, nie wiem jak dodać mu tą informację w metadanych.
nie działa link do programu konwerter.exe (http://www.farbiszowie.is.net.pl/PrTVm/stat.php?s=konwerter_0.2&u=konwerter_0.2.zip)
wyśle mi ktoś na maila ten program… vip_it@o2.pl
genialne! Najpierw się przeraziłem tą instrukcją. A tak naprawdę jak się zabrałem do roboty to zajęło mi to ok. 80 minut. Najdłużej zeszło mi na wyszukanie rzeczy, do których były nieaktualne linki w artykule, natomiast sama instrukcja jest napisana bardzo przejrzyście – gratulacje dla autora, bo wytłumaczenie laikom komputerowym (takim jak ja) jak to zrobić krok po kroku nie należy do łatwych zadań :)
Jeszcze raz wielkie dzięki!!
Witam!
Czy w opisany sposób również przerobie słownik zapisany w PDF na Kindla?
Instrukcja dotyczy słowników, które już są w formacie bazodanowym. Ze słownika w PDF można w najlepszym przypadku zrobić ksiażkę MOBI do czytania, ale nic więcej.
Bardzo interesujacy artykul. Bede tu zagladac czesciej :)
Witam, mógłby mi ktoś wysłać już przerobiony słownik lub link do niego na maila, w celach edukacyjo-instruktażowych ?
Z góry dziękuję krecikopulos@onet.eu
Cześć!
Zainspirowany tym artykułem popełniłem swoją stronkę na której opisałem jak przerobić słownik SJP.pl na mobi. Strona i i plik mobi znajdują się pod tym adresem:
http://rolegames.pl/kindle-3/slownik-jezyka-polskiego/
Szukam obecnie słownika śląsko-polskiego z odmianami, może komuś rzuciło się w oczy?
Pozdrawiam!
Dzień Dobry, czy ktoś może wie, czy kindle poradzi sobie z odczytywaniem znaków koreańskich?
Pliki:
1) konwerter_0.2.zip
2) ency.zip
których już nie znajdziecie w miejscach, o których w komentarzach mowa można pobrać z „gryzonia”.
Instalator Stardict 3.0.3 też nie ma w tym samym miejscu, o którym tu mowa. Można go pobrać z jednego z mirrorów: http://priede.bf.lu.lv/ftp/pub/Uzzinjai/vaardniicas/StarDict/
Plik odmian odm.txt jest już chyba w formacie UTF-8 do pobrania.
Oj, wypadałoby gruntownie przeredagować artykuł, bo jest ciekawy, ale po tych trzech latach, mało rozgarnięci polegną w trzecim kroku.
Jest w UTF-8, ale ze złymi (Windows’owymi) końcówkami wiersza.
Przy robieniu swojego słownika języka polskiego (opisane na blogu i wzmianka na forum eksiazki) korzystałem jeszcze ze zmodyfikowanego skryptu tab2opf.py, bo przy domyślnym występowały różne problemy (ostrzeżenia zgłaszane przez kindlegen, bezużyteczne śmieci w kodzie i brak możliwości automatycznego, skryptowego wywołania, przy zachowaniu poprawnych metadanych i okładki).
Ogólnie artykuł jest przestarzały, ale jedni poradzą sobie z przeróbką, a inni nie zgłaszają zapotrzebowania.
A ma być z uniksowymi końcówkami? Nic na ten temat nie ma w instrukcji? Mowa jest o zmianie kodowania na UTF-8. O znakach nowej linii nic nie ma.
Niestety ma być, bo inaczej ignoruje ostatnią odmianę w każdym haśle.
Najnowsza wersja skryptu pwn2dict.py: http://mzblog.grajpopolsku.pl/files/pwn2dict.py Repozytorium: https://gitlab.com/pwn2dict/pwn2dict
Strona domowa: http://mzblog.grajpopolsku.pl
No i jeszcze taka ważna istotna zmiana. Kindle potrafi już szukać w słowniku wielowyrazowych słów kluczowych. Niestety, ale w takiej sytuacji PWN-owska wersja pliku stardict z posklejanymi słowami kluczowymi zupełnie się nie nadaje. Z tą encyklopedią są jeszcze inne problemy. Cudzysłowa w słowach kluczowych powodują problemy podczas konwersji kindlegenem. Ech…
Mechanizm Kindle nie jest doskonały. O ile w wersji podstawowej wyszuka dla wyrazu „żona”, zarówno definicję dla hasła „żona”, jak i „zona”, to już dla odmiany „żony” (kogo, czego) pokaże tylko „zonę” (czyli kompletnie nietrafione wskazanie).
Problemów nie ma tylko dla podstawowej formy. W tej sytuacji widzę tylko jedno rozwiązanie – każda odmiana musi mieć swoją kopię definicji i być traktowana jako oddzielne hasło (nie odmiana) – wtedy Kindle wyszuka wszystko, ale dla przykładu mój Słownik Języka Polskiego, po takiej modyfikacji rośnie z 9 MB to 50 MB. Ten stan potrwa dopóty, dopóki nie będzie oficjalnego wsparcia dla języka polskiego w Kindle.
Cudzysłowy trzeba zamienić na DTP-owskie (nie z maszyny do pisania), ale to nie jedyne problemy z tą bazą.
Witaj, w punkcie dostyczącym Stardicta, przy Decompile otrzymuję coś takiego:
Building…
[critical] Error, file version is not 2.4.2.
Done!
a kiedy sprawdzam klikając Verify pojawia się
Verifying dictionary files…
[message] Verifying dictionary 'D:\Downloads\dictdata\Hiszpansko-Polski.ifo’…
[critical] Load D:\Downloads\dictdata\Hiszpansko-Polski.ifo failed: Incorrect magic data.
[message] File 'D:\Downloads\dictdata\Hiszpansko-Polski.ifo’ is not a StarDict dictionary or it’s broken.
[message] Dictionary 'D:\Downloads\dictdata\Hiszpansko-Polski.ifo’. Verification result: The dictionary is broken. Do not use it.
Failed!
Znalazłem problem, plik ifo powinien być taki:
StarDict’s dict ifo file
version=2.4.2
wordcount=100000
idxfilesize=1000000
bookname=Hiszpansko – Polski
author=Dario
description=Dario
date=2006.5.19
sametypesequence=m
przekopiowałem te wartości z pliku thesaurus.ifo i poszło gładko
Super poradnik, kawał dobrej roboty, dziękóweczka!