Za drogo? Ustaw alerty cenowe na e-booki i kupuj taniej!

Jak przygotować słownik języka polskiego dla Kindle?

W poniższym artykule gościnnym Krzysztof Palka wyjaśnia, jak skonwertować słownik języka polskiego PWN do formatu używanego przez Kindle.

Na górze widzimy żywy przykład z Kindle Paperwhite.


Obecnie nie ma żadnego oficjalnego słownika języka polskiego na czytnik Kindle, ale przy odrobinie wysiłku możemy sobie taki zrobić. Jako bazy definicji użyjemy słowników na CD dodawanych do wersji drukowanych wydawanych przez PWN.

Aby ułatwić sobie konwersję, zakładając, że kupiliśmy już słownik, możemy pobrać bazę słownikową np. wątku na forum Android. Na zachętę przed przystąpieniem do konwersji warto pokazać jak może wyglądać efekt końcowy:

Tu słownik połączony jest z encyklopedią, opiszę jak to zrobić, ale po kolei.

Będziemy potrzebować pliku z definicjami w formacie (nazwijmy go „tab”):

hasło 1[tabulator]definicja 1
hasło 2[tabulator]definicja 2

oraz pliku z bazą odmian oraz narzędzi do konwersji.

Zaczynamy. :)

  1. Pobieramy interpreter skryptów w języku Python: http://www.python.org/ftp/python/2.7.3/python-2.7.3.msi, gdyż skrypt do konwersji jest w nim napisany.
  2. Włączamy wyświetlanie rozszerzeń znanych typów plików (w różnych Windowsach różnie to wygląda, jak nie wiesz jak to zrobić, to wyszukaj w Google)
  3. Potrzebne nam są pliki z bazą słownikową.
  4. Teraz krok dotyczących słowników w formacie Stardicta. Jedna baza zazwyczaj składa się z plików dict, idx oraz ifo – odpowiednio definicji, indeksu z definicjami oraz opisu słownika. Niestety pobrane bazy nie mają pliku ifo, więc musimy go stworzyć. Dodam, że wszystkie półprodukty staramy się przechowywać w jednym folderze. Instalujemy program Stardict: http://stardict-3.googlecode.com/files/stardict-3.0.3.exe. W edytorze Notepad++ wybieramy ustawienia → preferencje → Nowy dokument i jako format wybieramy Unix. Zamykamy okienko ustawień, tworzymy nowy dokument, wklejamy przykładowe dane:StarDict’s dict ifo file
    version=3.0.0
    idxoffsetbits=32
    wordcount=100000
    idxfilesize=100000
    bookname=SJP
    sametypesequence=m
    Na końcu pliku musi znajdować się jedna pusta linijka.Jeśli mamy plik „Slownik Jezyka Polskiego.idx” to zapisujemy z nazwą „Slownik Jezyka Polskiego.ifo”. We „wszystkich progamach” Szukamy folderu StarDict, a w nim linku do programu StarDict-editor, otwieram go i w zakładce „DeCompile/Verify” Otwieramy stworzony plik ifo, klikamy Decompile i folderze ze słownikami pojawia się nowy plik, tu „Slownik Jezyka Polskiego.txt”.
    Analogicznie robimy z pozostałymi bazami. Ja mam teraz w folderze mam 2 pliki: „Slownik Jezyka Polskiego.txt” oraz „Encyklopedia PWN 99.txt”. W Notepad++ tworzymy jeszcze jeden dokument, otwieramy otrzymane pliki txt i kopiujemy ich zawartość do stworzonego dokumentu, który następnie zapisujemy jako slo.tab
  5. Aby możliwe było wyszukiwanie wyrazów, które nie są w podstawowej formie potrzeba będzie baza odmian. Możemy ją pobrać stąd: http://www.sjp.pl/slownik/odmiany/.
    Następnie trzeba ją rozpakować i zmienić jej kodowanie z WINDOWS-1250 na UTF-8. W tym celu otwieramy plik „odm.txt” w Notepad++, wskazujemy, że obecne kodowanie to WINDOWS-1250 (Format → Zestaw znaków → Środkowoeuropejskie → Windows-1250). Następnie wybieramy Format → Konwertuj na format UTF-8 bez BOM) i zapisujemy plik.
  6. Zapisujemy w folderze, gdzie mamy pliki „slo.tab” oraz „odm.txt” ten skrypt: https://raw.github.com/palkakrzysiek/scripts/master/tab2opf.py
    Jeśli mamy zainstalowany interpreter Pythona klikamy dwukrotnie na pobrany skrypt, a jeśli do rozszerzenia „*.py” May przypisany inny program klikamy na pobrany skrypt PPM i wybieramy otwórz za pomocą → python. W zależności od tego jak duży mamy słownik pojawi nam się od kilku do kilkudziesięciu plików html (u mnie było 20) oraz plik „slo.opf”
  7. Otwieramy plik „slo.opf” za pomocą programu Notepad++ i edytujemy opis:<dc:Identifier id=”uid”>[identyfikator, kilka symboli opisujących słownik]</dc:Identifier>
    <dc:Title><h2>[Tytuł]</h2></dc:Title>
    <dc:Language>[język]</dc:Language>
    <DictionaryInLanguage>[język haseł]</DictionaryInLanguage>
    <DictionaryOutLanguage>[język definicji]</DictionaryOutLanguage>

    U mnie element metadata wygląda tak:

    <metadata>
    <dc-metadata>
    <dc:Identifier id=”uid”>pwn</dc:Identifier>

    <!– Title of the document –>
    <dc:Title><h2>PWN: SJP oraz Encyklopedia ’99 </h2></dc:Title><dc:Language>PL</dc:Language>
    </dc-metadata>
    <x-metadata>
    <DictionaryInLanguage>pl</DictionaryInLanguage><DictionaryOutLanguage>pl</DictionaryOutLanguage>
    </x-metadata>
    </metadata>

    Po dokonaniu edycji zapisujemy plik.

  8. Pobieramy program KindleGen i wypakowujemy plik „kindlegen.exe” tam gdzie mamy plik „slo.opf”. Następnie przeciągamy plik „slo.opf” na „kindlegen.exe”. Rozpocznie się konwersja. W konsoli mogą pojawiać się ostrzeżenia, jednak nie przejmujemy się nimi. ;) Całość może potrwać nawet kilka minut.
    Uwaga: konwertery mogą potrzebować chwilami kilkaset MB RAMu, więc jeśli nie mamy go w nadmiarze, to lepiej zamknąć na chwilę nieużywane programy, sama konwersja trwa długo, a jeszcze gdyby zamiast RAMu trzeba było korzystać dysku oczekiwanie jeszcze się wydłuży.
  9. Trzeba jeszcze skopiować otrzymany plik „slo.mobi” do folderu „documents” na Kindlu. Prawdopodobnie będzie to jedyny słownik polskiego, więc zostanie automatycznie wybrany jako domyślny dla tego języka. U mnie na Paperwhite wylądował w kolekcji „Dictionaries”. Można go też otworzyć i posprawdzać jak wygląda wyszukiwanie definicji.

To już wszystko. Mam nadzieję, że instrukcja się przyda, komentarze mile widziane. :)


Uwagi od Roberta:

  • Jeśli nie mamy słowników PWN na CD i nie chcemy korzystać z plików z sieci, format stardict jest dość popularny (korzysta z niego np. czytnik Onyx) i znajdziemy w tym formacie także inne, darmowe słowniki.
  • W podobny sposób na podstawie plików PWN można zrobić słownik angielsko-polski. Tutaj odpowiednie mobi już krąży po różnych serwisach…
  • Aby zobaczyć definicję słownikową w książce polskojęzycznej, musi mieć ona ustawiony w metadanych język polski. Książki z polskich księgarni, a także konwertowane przy pomocy Calibre zwykle nie wymagają już poprawek, ale w razie kłopotów odsyłam do artykułu na temat ustawień języka.
  • Jeżeli mamy kilka słowników języka polskiego, musimy w ustawieniach wybrać domyślny – co ciekawe, niby Kindle nie obsługuje języka polskiego, ale odpowiednią etykietę „Polish” wyświetla.
  • Tak, wiem że byłoby najprościej podać link do takiego gotowego słownika, ale nie możemy tego zrobić i proszę tego nie robić w komentarzach. Pamiętajmy też, że modyfikacja plików słownika kupionego na CD może naruszać licencję, więc robimy to na własną odpowiedzialność.

Czytaj dalej:

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Korzystanie z Kindle i oznaczony tagami , , , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

179 odpowiedzi na „Jak przygotować słownik języka polskiego dla Kindle?

  1. Tom pisze:

    Wyrazy uznania dla autora tekstu. Nie wiem, czy dam radę sobie z taką przeróbką, ale jest to wielka rzecz. Mam nadzieje, że zaroi się od nowych, świetnych słowników w pl.
    Pozdrawiam

    0
  2. tejot pisze:

    Ja dotąd korzystam na moim PW z BuMato i jestem b. zadowolony:) Jak piszą na stronie – „pierwszy darmowy słownik do kindle’a”. Zgodnie z prośbą Roberta powyżej – nie podaję linku.

    0
  3. TLo pisze:

    A może delikatnie podpowiedzieć PWN, że pojawiła się kindlowa nisza i można cokolwiek zarobić dodatkowo, zamiast samemu dziergać jakieś cuda?

    0
  4. Anusz pisze:

    „Tutaj odpowiednie mobi już krąży po różnych serwisach…”-ciekawe ile osób robi szuka googli… :)

    0
  5. Grubel pisze:

    A ja mam pytanie z troszkę innej beczki – czy da się w Paperwhite ustawić na fest, żeby bez względu na język książki przeszukiwał angielską Wikipedię?

    0
  6. lxr pisze:

    Zawartość ifo wyświetla mi się tutaj powyżej w jednej linijce, bez spacji nawet między słowami. Tak chyba nie powinno być? Używam Firefoxa.

    Ale po poprawieniu i tak stardict nie chce mi tego pliku zdekompilować, wyświetla, że nie jest to właściwy format pliku ifo.

    0
    • Tom pisze:

      U mnie podobnie, a próba zdekompilowania takiego pliku kończy się komunikatem:
      Building…
      [critical] Error, file version is not 2.4.2.
      Done!

      0
      • brut_all pisze:

        Miałem to samo, poradziłem sobie ściągając inny plik .ifo z tej samej stronki ze słownikami – słowniki en-pl albo pl-en mają ten plik i wystarczy zmienić mu nazwę.

        0
      • brut_all pisze:

        nvm – niżej już odpowiedź autora ;)

        0
      • kpalka pisze:

        I jak, działa po zastosowaniu poniższych instrukcji?

        0
      • Tomkyf pisze:

        Wystarczy poprawić numer wersji w linii pliku ifo:
        version=3.0.0
        na
        version=2.4.2
        U mnie zadziałało :)

        0
        • prawdziwki pisze:

          A u mnie niestety nie. Mam ten sam komunikat i zmiana wiersza wersji na 2.4.2 nie pomaga. Próbowałem odnaleć gotowy plik .ifo, ale bez skutku. Jestem w kropce. Ktoś coś?

          0
          • Athame pisze:

            Dlaczego nie użyjesz legalnego i nowszego słownika na bazie SJP.PL? Linki masz pod artykułem. Jeśli koniecznie chcesz wersję PWN, to poszukaj „gotowca” (dość łatwo znaleźć) – i tak nie podejrzewam, byś miał legalną wersję, więc wszystko jedno skąd weźmiesz.

            0
            • prawdziwki pisze:

              Dzięki za odpowiedź. Akurat mam oryginalny słownik USJP PWN z 2008 roku. Staram się korzystać z takich rzeczy na legalu. Plan był taki, żeby na próbę przygotować to, co jest dostępne w sieci, a potem wykorzystać słownik na płycie CD. Słownik SJP.pl oczywiście znam, ale nie wiedziałem, że jest dostępny na urządzenia Kindle. Fajnie, że został połączony z Wikisłownikiem. Sprawdzę go. Dziękuję za namiary. :)

              0
  7. kpalka pisze:

    Ponieważ mogły by być problemy ze stworzeniem pliku ifo (tutaj nie ma przejścia do nowej linii), oraz edycja pliku opf, to podam jeszcze linki do przykładowych konfiguracji:
    cała przykładowa konfiguracja (po wygenerowaniu pliku opf zmieniamy tylko część … )
    https://raw.github.com/palkakrzysiek/scripts/master/slo.opf
    a plik ifo zapisujemy z odpowiednią nazwą
    https://raw.github.com/palkakrzysiek/scripts/master/example_of_stardict_description.ifo
    Tak nawiasem mówiąc na nazwisko mam Palka, nie Pałka :). Jakoś dużo osób dorabia kreskę do „L” przy moim nazwisku :D

    0
  8. adanadhel pisze:

    Sorry za off-topic ale tak się od dłuższego czasu zastanawiam czy ktoś nie stworzył może jakiegoś zautomatyzowanego sposobu podmianki obrazków wygaszacza ?
    Oczywiście widziałem opisy jak to zrobić „ręcznie” ale trochę mnie to przerasta i nie chciałbym przekombinować. Zaznaczam, że nie jestem fanem tuningowania Kindla, ale jak trafiam na obrazek z Emily Dickinson to przechodzą mnie dreszcze :)
    Będę zobowiązany za podpowiedź.
    z góry dziękuję

    0
  9. Marcin pisze:

    Nie wiem jak u Was, ale u mnie w Operze umieszczone tu skrypty są nieczytelne.
    Nieprawidłowe formatowanie, sklejone wyrazy.

    0
  10. MoNo pisze:

    Dostaje takie info: co robię źle?

    ABAKANOWICZPiotr
    Traceback (most recent call last):
    File „C:\Python27\tab2opf.py”, line 259, in
    dtstrip = normalizeUnicode( dt )
    File „C:\Python27\tab2opf.py”, line 98, in normalizeUnicode
    text = unicode(text, 'utf-8′)
    UnicodeDecodeError: 'utf8′ codec can’t decode byte 0xd1 in position 5: invalid c
    ontinuation byte

    0
  11. kpalka pisze:

    Dodam jeszcze, że na innych systemach też bez większych problemów powinniśmy móc przekonwertować słownik
    # umieszczamy w folderze bazy słownikowe
    touch nazwa\ słownika.ifo
    [nazwa edytora tekstu] nazwa\ słownika.ifo
    # wklejamy przykładowe dane
    # stardict-editor jest np. w repo ubuntu; na maca jest też jakaś wersja:
    # http://www.downloadplex.com/Mac/Education/Other/stardict-for-mac_135476.html
    # otwieramy stardict-editor i konwertujemy słownik jak 4. kroku
    cat słownik1.txt słownik2.txt > slo.tab
    wget http://sjp.pl/slownik/odmiany/sjp-odm-20130126.zip
    unzip sjp-odm-20130126.zip
    iconv -f WINDOWS-1250 odm.txt > temp
    rm odm.txt
    mv temp odm.txt
    wget https://raw.github.com/palkakrzysiek/scripts/master/tab2opf.py
    chmod +x tab2opf.py
    ./tab2opf.py
    [nazwa edytora tekstu] slo.opf
    # poprawiamy dane słownika
    # pobieramy odpowiednią wersję kindlegen
    # http://www.amazon.com/gp/feature.html?ie=UTF8&docId=1000765211
    # rozpakowujemy
    ./kindlegen slo.opf

    0
    • Marcin pisze:

      $ ./tab2opf.py
      Traceback (most recent call last):
      File „./tab2opf.py”, line 255, in
      dt, dd = r.split(’\t’,1)
      ValueError: need more than 1 value to unpack

      0
      • Marcin pisze:

        Nieprawidłowy slo.tab.
        Przygotowałem ponownie i przeszło.

        0
      • kpalka pisze:

        Gdzieś (na pewno w pierwszej linii, może też w innych) w pliku slo.tab jest błąd – nie do hasła nie ma przypinanej definicji oddzielonej tabulatorem. Sprawdź, czy w programie StarDict-Editor jako format wyjściowy wybrałeś „Tab file”, nie „Textual StarDict dictionary”. Przy okazji w ogóle sprawdź, co masz w pierwszej linijce pliku slo.tab. :)

        0
        • Tom pisze:

          U mnie w pierwszej linijce pliku slo tab jest całą masa tekstu, który wydaje się być później niewykorzystywany przez słownik. Tekst ten można zobaczyć np wchodząc w słownik i „go to” pierwsza strona. Sam słownik pomimo to działa bardzo dobrze.

          0
          • Tom pisze:

            oczywiście „wchodząc w słownik” – wejść (otworzyć) słownik na kindle tak jak w każdą normalną książkę :)

            0
          • kpalka pisze:

            U mnie w PW mam tylko opcję „Go to Index” więc nie zobaczę o co chodzi, ale jak wyszukam „a”, to pokazuje „Loc 1” i nie mam nic wcześniej.

            0
            • Tom pisze:

              Treść tą można zobaczyć np w pierwszej linii Notepad++ dokumentu dotyczącego PWN z rozszerzeniem.txt powstałego po StarDict (punkt 4 poradnika) lub na pierwszej linii slo.tab (powstały w 4pkt poradnika) jeśli w/w txt skopiujemy jako pierwsze.
              Linia ta zaczyna się od: (( , kolejna linia to: ?, późniejsze linie to już normalne definicje zaczynające się od: a

              Wspomniana linia z dużą ilością tekstu zawiera np opisy geograficzne, procesy chem itp. Nie widać jej normalnym używaniu słownika gdyż ten rzeczywiście zaczyna się od „a”.

              0
              • Tom pisze:

                Mały update. Z mich obserwacji wynika, że w w/w treściach znajdują się elementy rozszerzonych definicji.
                Przykład: AFRYKA – na krótka definicja, na końcu jej znajduje się: ,))
                Wszystkie słowa z definicjami kończącymi się ciągiem znaków ,)) mają swoje szersze definicje w w/w pierwszej linijce pliku txt.

                Może tak jest tylko u mnie, może zrobiłem jakiś błąd. Nie wiem. Sam słownik oczywiście działa.

                0
              • kpalka pisze:

                Tak, czyli traci się ponad 1 MB danych z encyklopedii. Chodzi o to, że pierwszą wersję encyklopedii znajdziemy tutaj:
                http://moja.akcja.pl/1xlator.htm#bazy
                Jak ktoś ma jeszcze telefon z MIDP2 może zobaczyć jak to działa (wrzucił bym screeny, ale nie mogę obecnie połączyć się z telefonem). W każdym razie wygląda to tak, że na końcu niektórych definicji są strzałki „>>” i oznacza to, że na następnej stronie jest dalsza część danej definicji (w formacie xv2 można „na sztywno” podać kolejność definicji”):
                https://github.com/palkakrzysiek/tab2xv1/blob/master/format-xlatora-xv2.txt
                Tutaj wszystko wylądowało w jednej linijce. Trzeba by to jakość złączyć, ale najpierw wydobyć definicje bezpośrednio z pliku xv2 za pomocą konwertera http://www.farbiszowie.is.net.pl/Xlator/#download

                0
        • Marcin pisze:

          Pierwotnie plik slo.tab przygotowałem otwierając go w vim-ie i wczytując (:r plik) wskazane 2 pliki. Po wczytaniu pierwszego dałem pustą linię.
          Metoda z „cat plik1 plik2 > slo.tab” zadziałała.

          0
  12. cisek pisze:

    Po 3 godzinach, wciągu których kilka razy miałem ochotę poszukać „gotowca” udało się.
    Sporo czasu straciłem na zrozumieniu zdania: „We „wszystkich progamach” Szukamy folderu StarDict, a w nim linku do programu StarDict-editor, …”. Uważam ze o wiele prościej byłoby:
    „otwieramy program StarDict-editor”.
    Drugi problem ze zrozumieniem to:
    „StarDict’s dict ifo file
    version=3.0.0
    idxoffsetbits=32
    wordcount=100000
    idxfilesize=100000
    bookname=SJP
    sametypesequence=m
    … Analogicznie robimy z pozostałymi bazami.”

    Czy” wordcount=100000 i idxfilesize=100000″ to wartosci dotyczace SJP? W końcu zmieniłem tylko „bookname=SJP” na „bookname=PWN”. Z reszta nie bylo problemu. Wielkie dzięki proszę o więcej

    0
    • kpalka pisze:

      Właściwie poprawny opis potrzeby jest jeśli chcesz dodać słownik do programu Stardict/Goldendict czy podobnych (polecam :D). Na potrzeby konwersji do formatu Kindla poprawny opis nie jest potrzeby, musimy mieć tylko plik ifo. bookname=[nazwa] to oczywiście nazwa wyświetlana na liście słowników, wedle uznania. idxfilesize to wielkość pliku idx podana w bajtach, wordcount ilość słów. Żeby poznać te wartości możesz zamiast „decompile” kliknąć verify. Pojawi się coś w stylu:
      [warning] Incorrect size of the index file: in .ifo file, idxfilesize=100000, real file size is 2142501.
      poprawiasz idxfilesize, zapisujesz i jeszcze raz verify:
      [warning] Incorrect number of words: in .ifo file, wordcount=100000, while the real word count is 100886.
      poprawiasz wordcount i możesz taki słownik dodać do folderu ze słownikami stardicta.
      http://img16.imageshack.us/img16/4462/zrzutekranuz20130223125.png

      0
  13. Yann pisze:

    Wygasły linki…

    The file you attempted to download is an archive that is damaged or possibly encrypted. MediaFire does not support unlimited downloads of broken or encrypted archives and the limit for this file has been reached. This file may only be distributed from a premium account.

    Dałoby radę gdzieś to umieścić?

    0
  14. Marcin pisze:

    Udało się :)
    Dziękuję za ten artykuł oraz tip w komentarzu odnośnie innych systemów. Teraz niektóre niezrozumiałe słowa staną się zrozumiałe bez odrywania się od lektury. :) SUPER! :)

    0
    • kpalka pisze:

      Ciesze się, że się przydało :). Warto wspomnieć, że jakiegoś słówka zabraknie w bazie odmian. Wtedy, żeby było szybciej otworzyć słownik wybieramy inne słówko, „pokaż pełną definicję” i wpisujemy słówko w podstawowej formie. Co do sprawy z komentarza: http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-141567

      aby mieć na Kindlu pełną encyklopedię jeszcze jedna instrukcja :), tu już Windows się przyda :(

      http://www.farbiszowie.is.net.pl/Xlator/#download pobieram http://www.farbiszowie.is.net.pl/PrTVm/stat.php?s=konwerter_0.2&u=konwerter_0.2.zip
      Z http://moja.akcja.pl/1xlator.htm#bazy pobieram epedia.zip, rozpakowuje. Za pomocą skrótu [klawisz windows] + r otwieram okienko do uruchamiania, wpisuję cmd, w konsoli wpisuję
      cd [ścieżka do folderu z konwerter.exe i 9.XV2 otoczona znakami cudzysłowu]
      konwerter 9.XV2 ency /d
      następnie otwieram plik ency.mdx.txt w notepad++, wybieram format → konwertuj na format ANSI; format → zestaw znaków → środkowoeuropejskie windows-1250; tworze nowy dokument (chodzi o unixowy znak przejścia do nowej linii) i kopiuję zawartość poprzedniego pliku;
      zapisuję jako ency.txt; wybieram szukaj → zamień Szukany tekst:
      (.*)\n(.*)\n
      zamień na:
      \1\t\2
      zaznaczam opcję „wyrażenie regularne”; zamień zamień wszystkie
      później jeszcze raz z
      ^[^\t]*\t([^,\n]*),
      na
      \1\t\2
      to powinno poprawić wygląd haseł; kolejna zamiana z:

      na:
      \\n
      i zapisuje plik. Dalej standardowa konwersja. W razie gdyby nie wszystkie kody poprawnie się wyświetlały, ten komentarz też jest tutaj: http://pastebin.com/ZGNt2HXY

      0
  15. ichi pisze:

    Verifying dictionary files…
    [message] Verifying dictionary 'C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo’…
    [critical] Load C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo failed: Incorrect magic data.
    [message] File 'C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo’ is not a StarDict dictionary or it’s broken.
    [message] Dictionary 'C:\Users\Pawel\Desktop\slownik\Encyklopedia PWN 99.ifo’. Verification result: The dictionary is broken. Do not use it.
    Failed!

    Cóż począć?

    0
  16. Pasha pisze:

    kindlegen wyswietla:
    Error:E21016: Source file is not valid UTF8.
    in file: C:\…\slownik\slo0.html

    przekonwertowałem w notepad++ wszystkie pliki html na UTF8 bez BOM, jednak to samo…komuikat ten sam, nie generuje się żaden plik.
    jakies pomysły?

    0
    • Rikiti pisze:

      Przyłączam się do pytania.
      Stanąłem dokładnie w tym samym miejscu i nie wiem co dalej :-(.
      Wielkie uznanie dla autora tekstu, funkcja bardzo przydatna podczas lektury. Nie mogę się doczekać, aby ją przetestować.

      0
    • Ratz pisze:

      To samo tutaj, bardzo prosze o pomoc!:)

      0
  17. Dam pisze:

    Niestety wszystkie mirrory podane na forum android, słownika jp są nieczynne, encyklopedia można jeszcze z jednego pobrać, chyba za dużo ludzi chciało i sie limit wyczerpał…

    0
  18. Krzysiek pisze:

    Wielki szacunek dla autora za artykuł, słownik języka polskiego – tego właśnie mi brakowało na Kindle PW.
    Dziękuję bardzo :)

    Swoja drogą czy są dostępne również takie polskie słowniki techniczne :)?

    0
  19. ricky pisze:

    pięknie wszystko działa. Wyrazy uznania :-)

    0
  20. Dam pisze:

    Wbrew pozorom nie jest to takie trudne z tym opisem, szkoda że wyrażnia wielowyrazowe (łącznie z nazwiskami) z encyklopedii są połączone ze sobą typu NOWAKPiotr i Kindle ich nie widzi gdy się chce sprawdzić…

    0
    • kpalka pisze:

      Chyba Robert włączył automatyczną akceptację moich komentarzy, więc nie wiem kiedy to zobaczysz (o ile w ogóle). Wielowyrazowych definicji i tak nie wyświetlisz (przy zaznaczeniu pojawia się co najwyżej opcja zaznaczenia lub dodania notatki, ale nie szuka w słowniku). Kilka komentarzy wcześniej opisałem jak skonwertować encyklopedię bezpośrednio z pliku xv2 (tak, żeby wyrazy w haśle nie były złączone i żeby słownik zawierał pełne dłuższe definicje), ale komentarz również utknął w oczekiwaniu na moderację.

      0
      • kpalka pisze:

        OK, poprzedni ten komentarz się wyświetlił. Nie wiem dlaczego wcześniejszy nie przeszedł. Sprawdź, co napisałem w http://pastebin.com/ZGNt2HXY żeby mieć lepszą wersję pliku tab z encyklopedią.

        0
        • mario pisze:

          I co robimy dalej z tym plikiem ency.txt? Zmieniamy rozszerzenie na dict?

          0
        • mario pisze:

          Sorki za głupie pytanie bo nie przeczytałem opisu. Stworzyłem słownik bez problemu. Jeden mankament: często brakuje TAB przed definicją w encyklopedii, którą konwertowałem z 9.XV2.
          Przykład:
          IDAHO FALLSmiasto w USA (Idaho)
          Da się coś z tym zrobić?

          0
          • kpalka pisze:

            Jak zaczniesz wpisywać IDAHO FALL to wyszuka; zaznaczając ten tekst w książce i tak nie będzie wyszukiwać w słowniku (działa to tylko dla pojedynczych słów). Zauważyłem, że zdecydowana większość definicji miała postać
            [nazwa definicji], dalsza część
            dlatego żeby trochę całość ulepszyć (żeby słowa kluczowe nie były złączone i w ogóle ładniej wyglądało) posłużyłem się tym wyrażeniem regularnym. Jak dla mnie i tak wygląda to lepiej niż „sklejone” słowa kluczowe (tu tabulator jest w miejscu pierwszego przecinka definicji) , ale można wybrać jak się chce :)

            0
            • mario pisze:

              Masz rację. Słownik i tak wygląda rewelacyjnie a działa nawet lepiej niż wygląda dzięki odmianie. Wielki dzięki za świetną instrukcję. Miałem lekkie obawy czy sobie poradzę ale poszło zadziwiająco łatwo. :)

              0
              • kpalka pisze:

                Mógłbyś to powiedzieć osobą, które znalazły formularz kontaktowy na mojej stronce, i co chwilę dostaje pytanie o udostępnienie mobi, bo same „nie dadzą sobie rady z konwersją i prawie nic nie rozumieją z instrukcji”. Aż mnie zastanawia, czy nie ma wśród nich jakiegoś pracownika z działu odpowiedzialnego za licencjonowanie PWNu, który z chęcią zgłosił by gdzie trzeba udostępnianie treści objętych prawem autorskim :)

                0
            • Dam pisze:

              Czyli jak rozumiem gdy w książce będzie IDAHO FALL i ja ustawie kursor przed IDAHO, to i tak mi nie wyszuka IDAHO FALL w encyklopedii? Jeśli tak, to w sumie rozdzielone wyrazy to sztuka dla sztuki.

              0
              • mario pisze:

                Niestety nie poda ci definicji haseł wielowyrazowych. W przypadku IDAHO FALLS zobaczysz tylko definicję dla hasła „IDAHO”. Jednak lepiej wygląda encyklopedia z rozdzielonymi wyrazami i ma pełne definicje dla wielu haseł, np. AFRYKA. W wersji z połączonymi wyrazami brakuje nawet definicji dla tego kontynentu.

                0
              • kpalka pisze:

                Dużo lepiej, i łatwiej szuka się definicji w encyklopedii po tej modyfikacji. Zresztą to też kwestia gustu i tego czy będzie się z niej korzystać na Kindlu. Oczywiście moim zdaniem zawsze warto mieć takie coś pod ręką, bardzo często zdarzało mi się korzystać ze słownika i encyklopedii na telefonie, a teraz gdy mam Kindla pod ręką to korzystam z niego.

                0
  21. naless pisze:

    Pochwali się ktoś wynikiem końcowym z tymi co są trochę na bakier komputerami… ?

    naless@gmail.com

    0
  22. ricky pisze:

    dysponując 'odmianą polską’ (plikiem odm.txt) – to na bazie tego opisu bardzo prosto przygotować również kompilację słownika polsko-angielskiego-niemieckiego razem SJP ;-) Działa, ale znacząco powiększa rozmiar pliku wyjściowego ;).

    0
  23. Ickam pisze:

    A ja mam inne pytanie. Jako że używałem kiedyś linuksa mam dwa zestawy plików stardicta (dict, idf, ifo) dla pewnego bilingwalnego słownika języka angielskiego. Czy wystarczy jak te pliki wrzucę w podlinkowany program? Chciałbym mieć możliwość zarówno sprawdzania ekwiwalentów polskich jak i angielskich.
    Mój czytnik to kclassic

    0
    • kpalka pisze:

      Tutaj może być problem z wyborem jaki język ma mieć słownik. Można ustawić go jako angielski w pozmieniać metadane książek (również zmienić ich język na angielski: http://swiatczytnikow.pl/dlaczego-slownik-w-kindle-czasami-nie-dziala-czyli-o-ustawieniach-jezyka/). Nie wiem też skąd wziąć angielską bazę odmian (nie szukałem). Dla polskiego wiedziałem, że takie coś istnieje, bo pracując kiedyś na Emacsie sprawdzając poprawność pojedynczych słów dostawałem informację w stylu: 'word „zrobiłem” is correct because of root „robić”. Kwestią było znalezienie tej bazy i modyfikacja skryptu tab2opf, żeby ją obsługiwał.

      0
  24. Ickam pisze:

    Dobra, moje poprzednie pytanie było niemądre. Poradziłem sobie z konwersją, ALE
    W menu dictionaries mam tylko English. Czy to wina firmware’u classica czy coś źle skonwertowałem?

    0
  25. ricky pisze:

    Po wykonaniu kilku testów, moje spostrzeżenia i uwagi:

    Nie wiem jak innym użytkownikom, ale u mnie, to nie działa poprawnie. Wg mnie, kompilacja dwóch i więcej słowników się nie sprawdza, gdyż definicje nie łączą się wspólny wątek. W efekcie otrzymujemy duży słownik, który tak naprawdę nie spełnia swojej roli, czyli nie podaje pełnego komentarza (dwóch słowników) do poszukiwanego słowa, ale wyświetla pierwszą napotkaną definicję, wg kolejności wgranego wcześniej słownika.

    Dlatego myślę, że lepiej jest wykonać dwa osobne słowniki (np. Encykl.mobi i SJP.mobi) niż jeden wspólny (Encykl-SJP.mobi).
    Oczywiście mogę się mylić. Dlatego bardzo proszę o weryfikację

    0
    • kpalka pisze:

      Dopisał bym to w artykule, ale tego nie zrobiłem, bo była to instrukcja dla Windowsa, który do niektórych zastosowań jest delikatnie mówiąc słaby :). Dokładniej chodzi o narzędzie „sort” (z wiersza poleceń). Na Linuksie jak się chce można mając już plik slo.tab wykonać np. takie polecenia:
      sort slo.tab > temp
      rm slo.tab
      mv temp slo.tab
      Windowsowy sort uznał, że plik jest zbyt duży, żeby go sortować. Próbowałem w Calcu (z LibreOffice) ale tu z kolei niektóre definicje były za długie. Można jeszcze spróbować Excela ale nie popieram kupowania zbyt dużej ilości produktów Microsoftu. Pirata nie chciałem ściągać, żeby przypadkiem nie zainfekować systemu, a czuję, że rejestracja triala była by drogą przez mękę w Microsoftowym piekle :)

      0
      • kpalka pisze:

        Jakby ktoś nie wiedział jaki będzie efekt posortowania różnych baz: oczywiście wszystko będzie ustawione alfabetycznie (fajnie wygląda gdy korzysta się z tej (http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-141986) wersji encyklopedii. I jeśli w różnych bazach wstępują te same hasła, to wybierając „show full definition” będą one wyświetlane obok siebie. Jeśli bardzo by się chciało można korzystając z wyrażeń regularnych połączyć definicje, które są posortowane. W Vimie: :%s/^\(.*\)\t\(.*\)\n\1\t/\1\t\2\\/ . Po lekkiej modyfikacji zadziała i w Notepad++, ale nie wydaje mi się żeby było to aż tak potrzebne, więc już nie będę odpalał „Windy”, żeby to przetestować.

        0
  26. ricky pisze:

    OK – posortowałem alfabetycznie plik slo.tab zawierający słowniki: 'ang’, 'encyk99′, 'sjp’ i muszę przyznać, że jest to jakiś sposób. Obawiałem się, że duplikaty będzie się źle czytało, ale po kilku testach nie odczuwam żadnego dyskomfortu, więc zdecydowanie polecam tę metodę.
    Plik wyjściowy waży około 90 mb i został zbudowany z 28 plików .html

    0
  27. Marek pisze:

    OK, pytania:
    1. Jak widzę, nowe Kindle mają możliwość wyboru głównego słownika dla kilku języków osobno? W K3 mam tylko jeden główny słownik.
    2. Jeżeli w K3 mam wybrany główny słownik, to jest on sprawdzany pod względem danego wyrazu. Co, jeżeli wyraz nie zostanie znaleziony w danym słowniku? Czy inne, wgrane i dotyczące tego samego języka są również przeszukiwane? Nie zauważyłem aby to działało w ten sposób? (mam kilka słowników języka angielskiego, i chciałbym aby szukał w każdym, jeżeli nie znajdzie w tym głównym).

    0
    • ricky pisze:

      W nowych Kindle słowniki działają podobnie jak w wcześniejszych wersjach czytników i nic specjalnego się nie zmieniło – czyli do danego języka jest przyporządkowany jeden słownik i tylko jeden może być aktywny. Ale oczywiście w kolekcji (swojej biblioteczce) możesz mieć więcej wersji różnych słowników.

      „Myk” – opisany w tym artykule polega, na tym, że tworząc jeden 'aktywny słownik’ możesz zaopatrzyć go w rozszerzoną bazę innych słowników i skompilować tak, że będziesz miał wyświetlane różne definicję w tym jednym czasie, (np. definicje słów języka niemieckiego, angielskiego… francuskiego (itp.) naraz ;-)).
      Moim zdaniem to bardzo ciekawa opcja, z której warto skorzystać .

      0
    • PLumo pisze:

      Jeśli doinstalujesz dodatkowy system Duokan, wtedy każdy wyraz będzie sprawdzany w KAŻDYM słowniku i definicje będą kolejno wyświetlane, razem z informacją o źródle (mam dwa angielskie + enc. + SJP i wszystko pięknie i szybko chodzi).

      0
  28. Dam pisze:

    Im więcej sie tym bawie, tym bardziej sobie uświadamiam jakie to rewolucyjne rozwiązanie. Bardzo dziękuje Panie Krzysztofie za ten poradnik. Jeśli nie ma Pan jeszcze dość odpowiedzi na pytania to czy mógłbym prosić o podpowiedź. Chciałbym zrobić tą „lepszą” wersję encyklopedii z opisu http://pastebin.com/ZGNt2HXY, mam już sciągnięty konwerter i plik encyklopedii – kompletnie jednak nie rozumiem jaką dokłądnie komendę mam wpisać w konsoli:

    „cd [ścieżka do folderu z konwerter.exe i 9.XV2 otoczona znakami cudzysłowu]
    konwerter 9.XV2 ency /d”

    Założmy, że mam te dwa pliki luzem na dysku d, co muszę dokładnie wpisać…

    0
    • Andrzej pisze:

      Można to zrobić prościej.
      Kliknij przycisk windows + R – otworzy się okienko Uruchom (uruchamianie).
      Wpisz cmd – otworzy się konsola.
      Przeciągnij na nią konwerter.exe – pojawi się jakaś tam ścieżka do tego pliku.
      Kliknij spację.
      Analogicznie przeciągnij plik 9.XV2 – do tego co było dopisze się druga ścieżka.
      Potem kliknij spację i dopisz „ency /d”, oczywiście bez cudzysłowów.
      Ważne żeby wszystko było oddzielone spacją.

      Jeśli problemem jest brak formy grzecznościowej to przeprasza, ale tak było wygodniej i wydaje mi się przejrzyściej, a o to przecież chodzi.

      0
      • Dam pisze:

        Dzięki, dla ścisłości powiem, że docelowy plik tworzy się nie tam gdzie mamy zapisane dwa pliki wyjściowe tylko na dysku C w folderze Użytkownicy/nazwa uzytkownika, bo się trochę naszukałem.

        Dalej jednak pojawiają się kolejne problemy. Robię wszystko tak jak jest opisane tutaj: http://pastebin.com/ZGNt2HXY, ale przy operacji:
        (.*)\n(.*)\n
        zamień na:
        \1\t\2
        (zazanczone wyrażenia regularne)
        Nic się nie dzieje, komputer mieli dłuższą chwilę, ale ostatecznie daje komunikat, że nie zamieniono niczego, podobnie przy zamianie
        ^[^\t]*\t([^,\n]*),
        na
        \1\t\2

        Rozumiem, że docelowo te zamiany mają sprawić, że każda definicja będzie w jednej linii.
        Mi po tych „zamianach” hasło nadal wygląda tak:

        „abeautifulviewmagni
        A BEAUTIFUL VIEW… MAGNIFICENT DESOLATION, angielskie „piękny widok… wspaniałe pustkowie”; słowa kosmonauty amerykańskiego E.E. Aldrina po wylądowaniu na Księżycu 1969.

        Ostaecznie, gdy dodam treść tego pliku do slo.tab, konwerter tab2opf, tworzy tylko jeden htmlowy plik bez treści i na tym kończy się jego praca. Nie wiem może te wyrażenia regularne są jakieś nie takie jak powinny?

        0
        • Andrzej pisze:

          W tamtym poradniku wszystko jest poprawnie. Sam zrobiłem według niego i mi działa jak należy.
          Dodałem od siebie taką poprawkę:
          ([A-ZĘÓŁŚŻŹĆŃĄ][A-ZĘÓŁŚŻŹĆŃĄ]+)([a-zęółśążźćń])
          na
          \1 \2
          Ważne żeby włączyć „Uwzględniaj wielkość liter”.
          Większość haseł jest napisana wielkimi literami i czasem nie ma spacji między hasłem a definicją pisaną małymi i właśnie mój kod tę spację robi, ale jeśli następują min. 2 wielkie litery po sobie.
          Np.
          ABAZJAutrata zdolności chodzenia – tu spacje zrobi po haśle.
          ABBAGNANO Nicola – Tu słowa Nicola nie rozdzieli.
          Mimo wszystko może gdzieś zrobić odstęp niepożądany także to wszystko na własną odpowiedzialność.

          A wracając z tej dygresji wytnij kilka linijek tekstu i wrzuć do nowego pliku i zobacz czy działa.
          Jak nie to upewnij się że masz na pewno plik w formacie unix zgodnie z instrukcją. Informacja jest w prawym dolnym rogu – musi być tam „UNIX”. Bo te wyrażenia odnoszą się właśnie do unixowego formatu i na windowsowym faktycznie nie zadziałają.
          Oczywiście zakładam, że pracujesz na notepad++ i tylko na tym.

          0
          • Dam pisze:

            No faktycznie nie było UNIX tylko Windows, ale po zmianie tego w ustawieniach Notepad++, przejściu ponownie całej ścieżki z poradnika nadal mi nie wyszukuje i zamienia tych wyrażeń regularnych. Mam zapisany ency.txt, w prawym rogu jest UNIX i ANSI, ale gdy wrzucam do wyszukania (.*)\n(.*)\n to mówi, że nie może znaleźć takiego wyrażnia i tyle. Dzięki za próbę pomocy, ale chyba pozostane z tą „gorszą” encyklopedią.

            0
            • Andrzej pisze:

              Jeżeli nadal chcesz się bawić to zobacz czy działa Ci tylko coś takiego:
              (.*)
              Oczywiście zaznaczone wyrażenia regularne, polecam też zaznaczyć trochę wyżej „wracaj na początek pliku”, szczególnie ważne to jest przy opcji zamień wszystkie.
              Ta ww. komenda powinna odnajdować po prostu całe linie. Jeśli działa to jest dobrze.
              Potem zobacz czy zadziała to:
              (.*)\n
              Jak nie zadziała to problemem jest \n czyli znak końca linii.
              Kliknij na górze „Pokaż wszystkie znaki” na końcu linii powinien być taki jeden kwadracik z białym „LF”, jeśli jest coś innego to to jest problem, a jeśli wszystko jest jak napisałem i nie działa, to by trzeba było się temu dokładniej przyjrzeć.

              0
              • Dam pisze:

                (.*) działa, wyszukuje, (.*)\n – nie działa, nie wyszukuje, pokaż wszystkie znaki pokazjue „LF” w kwadracie na końcu linii. Zanaczy, że coś dziwnego u mnie się dzieje, i nie wiadomo co? Fuck…

                0
              • Dam pisze:

                Żeby było ciekawiej \n wyszukuje mi w trybie rozszerzonym wyszukiwania, natomiast (.*) tylko przy zaznaczeniu „wyrażenia regularne”, nie wiem czy tą zamianę da się rozbić na dwie?

                0
              • Dam pisze:

                Jednak nie dałem za wygraną, przeinstalowałem Notepada++ i wszystko zaczęło działać :)Swoją drogą przydało by się ten poradnik powyżej uzupełnić o te informacje, po zrobieniu encyklopedi z ego lepszego pliku i posortowaniu, działa to znacznie lepiej. Dzięki za poświęcony czas!

                0
              • assa pisze:

                Jakim posortowaniu? W czym lepiej działa?

                0
              • assa pisze:

                O jakim „lepszym pliku” mowa? Rzeczywiście by się przydało to dopisać do poradnika, bo w komentarzach trochę chaosu i ciężko z nich coś wnioskować…

                0
              • Andrzej pisze:

                To dobrze, że działa. Widocznie jakiś głupi błąd.
                Co do wyszukiwania rozszerzonego i wyrażeń regularnych – ja różnicę rozumiem tak, że wyszukiwanie rozszerzone pozwala na wyszukiwanie dodatkowo znaków niedrukowalnych np. koniec linii, tabulatory itd.
                A wyrażenia regularne polegają na wyszukiwaniu różnych kombinacji tekstu – np. (.*) wyszukuje wszelkie dowolne znaki do końca linii.

                Ogólnie w komentarzach doszło tyle informacji zarówno od samego autora jak i innych, że spokojnie można by było napisać wersję 2. tego artykułu ;p

                0
              • Dam pisze:

                Porzez lepszy plik rozumiem plik encyklopedii pobrany i przerobiony według opisu zawartego w tym komentarzu:
                http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-141986

                Sortowanie to poukładanie definicji tak, żeby definicje tych samych wyrażeń, z różnych plików (np. encyklopedii i słownika) znajdowały się obok siebie, dzięki temu po przejściu do widoku pełnej definicji w Kindlu mamy je jedna pod drugą. Jak to zrobić Andrzej opisał tutaj: http://swiatczytnikow.pl/jak-przygotowac-slownik-jezyka-polskiego-dla-kindle/#comment-142348

                0
      • Andrzej pisze:

        Aha. I jak by komuś pokazało że wszystko się zrobiło a plik wynikowy się nie pojawił to niech zobaczy jaka ścieżka jest w konsoli – zwykle to C:\Users\Nazwa użytkownika i właśnie w tym folderze pojawi się ten plik wynikowy.

        0
  29. Andrzej pisze:

    Dla chcących posortować sobie bazę:
    1) Otwieramy notepad++
    2) Klikamy: Pluginy->Plugin Manager->Show Plugin Manager
    3) Wybieramy TextFX Characters i instalujemy. Program powinien wymusić na nas ponowne uruchomienie programu
    4) Otwieramy bazę, zaznaczamy całą zawartość (dla nieobeznanych ze skrótami klawiszowymi Ctrl+A – zaznacz wszystko)
    5) Na górze w menu wybieramy TextFX->TextFX Tools
    6) Upewniamy się że opcja „+Sort ascending” jest zaznaczona i klikamy „Sort line case INsensitive (at column)”
    7) Chwilę czekamy i gotowe.

    0
    • ichi pisze:

      Na którym pliku to sortowanie się robi?

      0
    • mario pisze:

      Coś mi nie działa te sortowanie na pliku slo.tab przerobionym z 9.XV2
      Dostaję ucięte wyrazy, np.:
      ójnie \npotrójnie\n potrójnie…
      órstwo \nprzetwórstwo\n przetwórstwo…

      0
      • Andrzej pisze:

        Pomijając to że polskie znaki są brane przed inne litery alfabetu, co akurat nie ma wielkiego znaczenia, wszystko jak najbardziej sortuje się sortuje. Te niepoprawne wpisy są już w słowniku języka polskiego. Możesz sprawdzić, że w nieposortowanym też takie wpisy się pojawiają.

        0
  30. Andrzej pisze:

    Pozwolę sobie zostawić jeszcze jeden komentarz, bo sam mam dość dziwny problem i jestem ciekaw czy mają go też inni i czy da się coś z tym zrobić.

    Mianowicie, kiedy ustawiam sobie mój nowy słownik jako domyślny to wszystko fajnie, pięknie działa. Ale zdarza się sytuacja – pojawia się postać historyczna np. Aleksander Wielki. W tym przypadku zadziałać może jedynie encyklopedia, ale Aleksander jest napisany w innym przypadku niż ten ze słownika np. Aleksandra Wielkiego, wiadomo że słownik tego nie znajdzie, więc wpisuję go sobie ręcznie czy kopiuję i zmieniam końcówkę, bez różnicy i wybieram szukaj w słowniku (dictionary).
    I tu jest problem, bo zamiast w aktualnie domyślnym utworzonym przeze mnie szuka w słowniku, który był poprzednio domyślny. Co jest dość wkurzające, a nie chcę usuwać teraz wszystkich innych słowników, co prawda tego nie sprawdziłem, ale strzelam że zadziała.

    Ma ktoś taki problem i pomysł jak z tym można sobie poradzić ?

    W ramach formalności mam Kindle 3.

    0
    • kpalka pisze:

      Paperwhite niestety też się tak zachowuje. I strzelam, że to nie zadziała – wydaje mi się, że szuka w języku w jakim ustawiony jest Kindle.

      0
  31. ichi pisze:

    Ktoś wie skąd ściągnąć jakąś bazę odmian angielską i niemiecką?

    0
  32. WoKo pisze:

    Świetna sprawa, działa i co najważniejsze, rzeczywiście się przydaje. Wielkie dzięki!

    0
  33. agra77pl pisze:

    Ech, gdybym ja rozumiala choc jedno slowo z tego co napisaliscie poza poslki slownik…

    0
    • mario pisze:

      Podaj mi swego maila to Ci „wytłumaczę” i dam rękę uciąć, że zaczniesz niebawem korzystać ze słownika :)

      0
      • mac pisze:

        Czy mi też mógłbyś „wytłumaczyć”? Dziś odebrałem swojego Kindla. Z góry dziękuję.
        remont.ogrodu@gmail.com

        0
      • tygryska pisze:

        Poproszę o indywidualne tłumaczenie. Wprawdzie nie wszystkie języki obce są mi obce, ale ten, którym rozmawiacie ze swoimi komputerami – tak… (musar@wp.pl)

        0
      • Bartek pisze:

        Witam,
        Miałbym prośbę o przesłanie szczegółowej instrukcji, dosłownie krok po kroku, jak mógłbym zainstalować/założyć/wprowadzić polski słownik do mojego Kindle’a (Touch).
        Z góry serdecznie dziękuję i pozdrawiam,
        Bartek

        0
        • ichiban pisze:

          Instrukcja krok po kroku jest w artykule.
          Po przygotowaniu słownika należy go wgrać na Kindle za pomocą kabla. Można posłużyć się Calibrem.

          0
  34. Tom pisze:

    I się zaczęło…

    0
    • ichi pisze:

      No a instrukcja naprawdę tak prosto napisana, że ciężko tego nie zrobić.

      1
      • agra77pl pisze:

        @ichi, dla kogos kto sie troszke na tym zna moze tak, ale ja Ci tez moge napisac instrukcje do czegos w prostym szwedzkim, co z tego, jak Ty nie bedziesz rozumial…

        0
        • Tom pisze:

          Instrukcja jest nie w szwedzkim, chińskim… ale polskim języku. Jest tak napisana, że nie nie trzeba być informatykiem aby ją zrozumieć. Przyznaje, że za pierwszym razem musiałem poświęcić ok. 2h, ale było to zanim ją poprawiono i uzupełniono. Ktoś daje wędkę (komplet potrzebnych narzędzi), ale oczywiście łatwiej domagać się ryby.

          0
          • agra77pl pisze:

            Sorry, ale ten dzial polskiego jest dla mnie jak chinski a dla Ciebie szwedzki. Jesli bedziesz potrzebowal tlumaczenia na szwedzki odezwij sie to albo Ci dam rybe – przetlumacze albo wedke, podesle tipsy na dobre ksiazki, strony www do nauki jezyka. Uwazam,ze jesli ktos cos umie robic lepiej niz ja i moze mi pomoc, to zaden wstyd sie przyznac,ze ja nie wiem o co common. A nie jestem glupia zdaje mi sie, zwyczajnie w pewnych obszarach zycia jestem nieco zdolniejsza a w innych mniej. I jesli chcesz twierdzic,ze tak latwiej, masz prawo, ja uwazam,ze madrzej i bardziej zyciowo…

            0
            • ichi pisze:

              „pomoże” vs „zrobi za mnie” :P
              Pomocą właśnie jest ta instrukcja.
              No, ale ok, spróbujemy ;). Który punkt instrukcji jest niezrozumiały? Postaram się wyjaśnić najlepiej jak umiem.

              0
              • Tom pisze:

                Problemem nie jest pomoc, ale podsyłanie gotowego pliku. Legalność takiego działania jest dyskusyjna. Podobnie byłoby, gdyby ktoś „pomógł” osobie nieradzącej sobie z programami w zdobyciu konkretnej MP3, przesyłając (po wcześniejszym przerobieniu) taki plik np. z posiadanego przez siebie oryginalnego nagrania. Dlatego też autor bloga prosił o niezamieszczanie linków, a autor poradnika delikatnie sugerował aby nie nagabywać go mailowo o gotowca.

                0
              • agra77pl pisze:

                Ale ja nikogo o gotowca nie nagabuje, ja tylko napisalam,ze szkoda,ze nic nie rozumiem a poza poczatkiem o sciagnieciu pliku nie rozumiem zadnego punktu, okresl mnie komputerowym glupkiem, albo leniwcem, ja po prostu nie mam ani sily, ani czasu, ani ochoty poglebiac znajomosci z tej dziedzinie. Na pewno za jakis czas powstanie polski oficjalny slownik i wtedy z przyjemnoscia go sciagne lub zakupie, ja 99% swoich kindlowych ksiazek mam kupionych calkowicie oficjalnie i samodzielnie. Over, zeby nie zasmiecac komentarzy bezsensownymi dywagacjami, milego wieczoru zycze.

                0
              • Dam pisze:

                Dla kompletncyh głupków i leniwców :) pojawiła się już w sieci kompilacja encyklopedii, słownika i sł. wyr. obcych. Trzeba trochę poszukać przez wyszukiwarkę.

                0
  35. Lizergamid pisze:

    Świetna sprawa ten słownik ang-pol Bumato. Really helpful.

    0
  36. Skrzat kuchenny pisze:

    Owszem, pojawiła się w sieci wersja słownika-encyklopedii.
    Po wrzuceniu w Google hasła – Słownik języka polskiego dla Kindle – pojawi się lista stron, czwarta pozycja ( choć to się możne zmienić) poprowadzi nas do strony, na forum której ludzie o tym rozmawiają i są tam dokładne informacje, jak samemu „rozwiązać problem”, bez narażania się na stygmatyzowanie mianem kompletnego głupka czy leniwca.

    Ja rozumiem, że rozpowszechnianie tego pliku może być dyskusyjne i ci, którzy go sami sobie „zrobili” nie chcą tego robić.

    Doskonale rozumiem też te osoby, dla których jest to czarna magia.
    Ale nie rozumiem tych, którzy obnoszą się tu ze swoim poczuciem wyższości, „lepszości” tylko dlatego, że coś im udało się zrobić, a innym nie.

    Ta ten portal powinien służyć czemu innemu, powinien być pomocny tym osobom, które szukają pomocy, wiedzy, informacji.
    Niestety, tę rolę spełnia coraz słabiej :O

    0
  37. Wiki pisze:

    A da sie przekonwertowa Wielki słownik PWN Oxford angielsko-polski jesli mam go juz w mobi formacie. Tak by byl jako slowanik?

    0
  38. Tomek pisze:

    Witam. Słownik i encyklopedia działa jak chcę wyszukać jakieś hasło ręcznie natomiast jak wchodzę w Settings -> Device Options -> Language and Dictionaries -> Dictionaries to tam SJP pokazuje że to słownik angielski i dlatego nie działa w książkach w języku polskim. Co zrobić w takim przypadku ? Jak ustawić żeby Kindle wykrywał że to słownik języka polskiego ? Pozdrawiam i dzięki z atak obszerny materiał :)

    0
  39. Tomek pisze:

    Sprawdzałem wszystkie możliwości i słownik ma ustawioną wersję języka na polski oraz w metadanych jest tak jak u pana na 100%. Jest coś jeszcze co może być tego przyczyną ?

    0
    • macsa pisze:

      Hej,

      Czy udało Ci się rozwiązać Twój problem.
      Wygląda na to, że mam taką samą przypadłość.

      Z góry dzięki

      0
    • macsa pisze:

      Hej,

      Czy udało Ci się rozwiązać Twój problem?
      Wygląda na to, że mam taką samą przypadłość.

      Z góry dzięki

      0
  40. ProjektAvilon pisze:

    Doprawdy nie daję rady. Jakby ktoś chciał podzielić się swoim końcowym wynikiem: avilon2k@gmail.com
    Z góry dziękuję.

    0
  41. macsa pisze:

    Hej,
    mam pytanko do autora instrukcji.
    Wszystko zostało przeprowadzone zgodnie z instrukcją i „teoretycznie” super działa na Kindlu Paperwhite.
    Problem w tym, że nie działa na wszystkich książkach.
    Wszystkie książki mam w formacie mobi (język polski).
    W niektórych przypadkach otrzymuję informacjię „no dictionary has been found”.

    Z góry dzięki za info

    0
    • Robert Drózd pisze:

      A upewniłeś się, że te książki mają ustawiony w metadanych język polski?

      0
      • macsa pisze:

        Hej,
        Dzięki za szybką reakcję.
        Właśnie sprawdziłem i co dziwne słownik działa na książce z przypisanym językiem angielskim. Na polskim nie działa.
        Po powrocie z pracy zweryfikuję wszystko jeszcze raz.

        0
  42. Kamil pisze:

    No przyznaje bardzo dobrze napisany poradnik. Nawet mnie laikowi udało się przejść przez niego i dodać słownik do swojego Kindla. Pozdrawiam autora.

    0
  43. Jarek pisze:

    Kurczę, wszystko działa, ale niestety bez polskich znakiem, źle koduje te pliki html chyba :/

    0
  44. Jarek pisze:

    Dobrze, już działa, nie zmieniłem kodowania pliku slo.txt

    0
  45. beeblebrox pisze:

    Dzięki za poradnik!

    Pozbyłem się przynajmniej jednego powtórzenia definowanego słowa. W edytorze Vim jest to polecenie z otwartym plikiem slo.tab.

    :%s/^(.*)t(s+n1)/1t/

    Od początku linii do tab-a:

    ^/(.*/)/t/(s+n/1/)

    (druga grupa nie jest zasadniczo potrzebna – tego się pozbywamy)
    zastąp tym co zostało znalezione do taba

    1t

    Pozbyć się jeszcze jednego powtórzenia definowanego słowa nie jest już tak prosto.

    Można też posortawać slo.tab

    :sort i

    0
  46. Ola pisze:

    Witam. Przymierzam się właśnie do kupna Kindle Paperwhite, ale zastanawia mnie jedna rzecz. Czy te wszystkie podkreślenia, notatki i szczególnie słownik będą działały także w przypadku pirackich ebooków np. z chomika?

    0
  47. Sebastian pisze:

    Uznania dla autora.
    Wszystko śmiga jak należy – jedyne z czym był malutki problem to pliki ifo ale po ściągnięciu pliku, które autor umieścił w komentarzach reszta była już tylko formalnością.

    Instrukcja mimo iż na początku wygląda na dość skomplikowaną jest w rzeczywistości prosta i wykonanie wszystkich kroków po kolei przychodzi z łatwością.

    Jedyne co musiałem zrobić to poszukać w innym miejscu słowników, ponieważ nie byłem ich w stanie ściągnąć z podanej przez autora strony (można je znaleźć na chomiku wyszukując „bazy słownikowe StarDict”)

    Aby trochę powiększyć bazę dostępnych słów dorzuciłem jeszcze to tego wszystkiego Słownik Wyrazów Obcych. Moim zdaniem dobrze uzupełnia zakres słów z 2 pozostałych.

    Jeszcze raz dzięki i pozdrawiam.

    0
  48. Rafał pisze:

    Od roku jak ex ortodoks papieru jestem fanem czytników. Mam Booxa ale wyrywamy go sobie z moim synem dlatego postanowiłem kupić drugi. Pewnie Kindle choć mam kilka wątpliwości a główna dotyczy słownika. Jestem posiadaczem orginalnego słownika na CD pol-ang i ang-pol PWN który dzięki skryptowi PWN2stardict udało się zminić na stardicta (na Boox’ie działa doskonale). Moje pytnie brzmi następująco. Czy mając stardicta mogę dalej konwerotwać aby działał w tle na Kindlu, czy też muszę konwersję przechodzić od samego początku tak jak tutaj napisano. Dzięki za informacje.

    0
  49. Tadeusz pisze:

    Coś zrobiłem nie tak. Jak wchodzę bezpośrednio do słownika, wyszukuje mi hasła i z encyklopedii i ze słownika, jednak gdy zaznaczam jakiś wyraz w tekście czytanej książki, wyświetla mi hasła tylko ze słownika języka polskiego, z encyklopedii już nie, mimo że się one w niej znajdują, np. zaznaczę nazwisko Beethoven i nie wyświetla mi się nic. Jak ktoś wie o co chodzi, proszę o informację.

    0
  50. Flacktub pisze:

    Witam, mógłby mi ktoś wysłać przerobiony już słownik lub link do niego na meila ?
    Z góry dziękuję. flacktub@gmail.com

    0
  51. Daniel pisze:

    Jeśli ktoś potrzebuje gotowy słownik polsko angielski na Kindle a Bumato mu nie wystarcza, niech poszuka w google Wielki Słownik angielsko-polski 2014 for Kindle wersja 2014.1

    0
  52. Piotrek pisze:

    To jesli nie ma dostepnej darmowej wersji slownika jezyka polskiego na Kindle to czy jest mozliwosc sciagniecie wersji odplatnie? Mysle ze fanow znalazlo by sie dosc sporo. Nie wiecie czy jest moze sposob na wyslanie sugestii do Amazon zeby taki slownik stworzyli i udostepnili go nawet odplatnie? Nie ma nic za darmo a ja zdecydowanie moge za takowy zaplacic.

    0
    • Michał pisze:

      Podłączam się do tego pytania. Dodam jeszcze, że dzisiaj wysłałem maila z zapytaniem do PWN, o stworzenie takiego słownika. Może jakby więcej osób wysłało, to PWN by takowy słownik stworzył. Szczerze powiem, że doceniam powyższy artykuł, jednakowoż wolałbym zapłacić, aniżeli przechodzić przez powyżej opisane instrukcje, zwłaszcza że takie rzeczy to dla mnie czarna magia.

      0
  53. Fal pisze:

    Skrypt wygenerował mi tylko jeden plik html o wielkości 1KB. Ktoś pomoze?

    0
  54. Marek pisze:

    Czy moglibyście pomóc mi jak dodać 'etykietę’, że plik slo.mobi to słownik? Kindle rozpoznaje go tylko jako zwykły ebook, nie wiem jak dodać mu tą informację w metadanych.

    0
  55. Piotr Kruszewski pisze:

    nie działa link do programu konwerter.exe (http://www.farbiszowie.is.net.pl/PrTVm/stat.php?s=konwerter_0.2&u=konwerter_0.2.zip)

    wyśle mi ktoś na maila ten program… vip_it@o2.pl

    0
  56. mgm pisze:

    genialne! Najpierw się przeraziłem tą instrukcją. A tak naprawdę jak się zabrałem do roboty to zajęło mi to ok. 80 minut. Najdłużej zeszło mi na wyszukanie rzeczy, do których były nieaktualne linki w artykule, natomiast sama instrukcja jest napisana bardzo przejrzyście – gratulacje dla autora, bo wytłumaczenie laikom komputerowym (takim jak ja) jak to zrobić krok po kroku nie należy do łatwych zadań :)
    Jeszcze raz wielkie dzięki!!

    0
  57. Szymon pisze:

    Witam!
    Czy w opisany sposób również przerobie słownik zapisany w PDF na Kindla?

    0
    • Robert Drózd pisze:

      Instrukcja dotyczy słowników, które już są w formacie bazodanowym. Ze słownika w PDF można w najlepszym przypadku zrobić ksiażkę MOBI do czytania, ale nic więcej.

      0
  58. Bardzo interesujacy artykul. Bede tu zagladac czesciej :)

    0
  59. Michael pisze:

    Witam, mógłby mi ktoś wysłać już przerobiony słownik lub link do niego na maila, w celach edukacyjo-instruktażowych ?
    Z góry dziękuję krecikopulos@onet.eu

    0
  60. San Zamoyski pisze:

    Cześć!

    Zainspirowany tym artykułem popełniłem swoją stronkę na której opisałem jak przerobić słownik SJP.pl na mobi. Strona i i plik mobi znajdują się pod tym adresem:
    http://rolegames.pl/kindle-3/slownik-jezyka-polskiego/

    Szukam obecnie słownika śląsko-polskiego z odmianami, może komuś rzuciło się w oczy?

    Pozdrawiam!

    0
  61. falafel pisze:

    Dzień Dobry, czy ktoś może wie, czy kindle poradzi sobie z odczytywaniem znaków koreańskich?

    0
  62. quiris pisze:

    Pliki:
    1) konwerter_0.2.zip
    2) ency.zip
    których już nie znajdziecie w miejscach, o których w komentarzach mowa można pobrać z „gryzonia”.

    Instalator Stardict 3.0.3 też nie ma w tym samym miejscu, o którym tu mowa. Można go pobrać z jednego z mirrorów: http://priede.bf.lu.lv/ftp/pub/Uzzinjai/vaardniicas/StarDict/

    0
  63. quiris pisze:

    Plik odmian odm.txt jest już chyba w formacie UTF-8 do pobrania.

    Oj, wypadałoby gruntownie przeredagować artykuł, bo jest ciekawy, ale po tych trzech latach, mało rozgarnięci polegną w trzecim kroku.

    1
    • Athame pisze:

      Jest w UTF-8, ale ze złymi (Windows’owymi) końcówkami wiersza.

      Przy robieniu swojego słownika języka polskiego (opisane na blogu i wzmianka na forum eksiazki) korzystałem jeszcze ze zmodyfikowanego skryptu tab2opf.py, bo przy domyślnym występowały różne problemy (ostrzeżenia zgłaszane przez kindlegen, bezużyteczne śmieci w kodzie i brak możliwości automatycznego, skryptowego wywołania, przy zachowaniu poprawnych metadanych i okładki).

      Ogólnie artykuł jest przestarzały, ale jedni poradzą sobie z przeróbką, a inni nie zgłaszają zapotrzebowania.

      0
      • quiris pisze:

        A ma być z uniksowymi końcówkami? Nic na ten temat nie ma w instrukcji? Mowa jest o zmianie kodowania na UTF-8. O znakach nowej linii nic nie ma.

        0
  64. quiris pisze:

    No i jeszcze taka ważna istotna zmiana. Kindle potrafi już szukać w słowniku wielowyrazowych słów kluczowych. Niestety, ale w takiej sytuacji PWN-owska wersja pliku stardict z posklejanymi słowami kluczowymi zupełnie się nie nadaje. Z tą encyklopedią są jeszcze inne problemy. Cudzysłowa w słowach kluczowych powodują problemy podczas konwersji kindlegenem. Ech…

    0
    • Athame pisze:

      Mechanizm Kindle nie jest doskonały. O ile w wersji podstawowej wyszuka dla wyrazu „żona”, zarówno definicję dla hasła „żona”, jak i „zona”, to już dla odmiany „żony” (kogo, czego) pokaże tylko „zonę” (czyli kompletnie nietrafione wskazanie).

      Problemów nie ma tylko dla podstawowej formy. W tej sytuacji widzę tylko jedno rozwiązanie – każda odmiana musi mieć swoją kopię definicji i być traktowana jako oddzielne hasło (nie odmiana) – wtedy Kindle wyszuka wszystko, ale dla przykładu mój Słownik Języka Polskiego, po takiej modyfikacji rośnie z 9 MB to 50 MB. Ten stan potrwa dopóty, dopóki nie będzie oficjalnego wsparcia dla języka polskiego w Kindle.

      0
    • Athame pisze:

      Cudzysłowy trzeba zamienić na DTP-owskie (nie z maszyny do pisania), ale to nie jedyne problemy z tą bazą.

      0
  65. Dario pisze:

    Witaj, w punkcie dostyczącym Stardicta, przy Decompile otrzymuję coś takiego:

    Building…
    [critical] Error, file version is not 2.4.2.
    Done!

    a kiedy sprawdzam klikając Verify pojawia się
    Verifying dictionary files…
    [message] Verifying dictionary 'D:\Downloads\dictdata\Hiszpansko-Polski.ifo’…
    [critical] Load D:\Downloads\dictdata\Hiszpansko-Polski.ifo failed: Incorrect magic data.
    [message] File 'D:\Downloads\dictdata\Hiszpansko-Polski.ifo’ is not a StarDict dictionary or it’s broken.
    [message] Dictionary 'D:\Downloads\dictdata\Hiszpansko-Polski.ifo’. Verification result: The dictionary is broken. Do not use it.
    Failed!

    0
    • Dario pisze:

      Znalazłem problem, plik ifo powinien być taki:
      StarDict’s dict ifo file
      version=2.4.2
      wordcount=100000
      idxfilesize=1000000
      bookname=Hiszpansko – Polski
      author=Dario
      description=Dario
      date=2006.5.19
      sametypesequence=m

      przekopiowałem te wartości z pliku thesaurus.ifo i poszło gładko

      0
  66. Mateusz pisze:

    Super poradnik, kawał dobrej roboty, dziękóweczka!

    1

Skomentuj kpalka Anuluj pisanie odpowiedzi

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania i polityką prywatności

Komentarze do tego artykułu można śledzić także w formacie RSS.