Za drogo? Ustaw alerty cenowe na e-booki i kupuj taniej!

Kolejny słownik języka polskiego dla Kindle: SJP.pl spotyka Wikisłownik!

 sjp-kikimora

Tydzień temu pisałem o dwóch nowych wersjach Słownika języka polskiego dla Kindle. Teraz doszła kolejna – i tym razem z nowymi treściami.

San Zamoyski, który był autorem pierwszej wersji – teraz zaprezentował kolejny słownik, w którym część definicji z serwisu SJP.pl została zastąpiona przez znacznie bogatsze – z Wikisłownika, czyli serwisu rozwijanego, podobnie jak Wikipedia, przez wolontariuszy i zawierającego ponad 60 tysięcy polskich definicji.

Tak przedstawia się opis słownika:

Dostępna jest już nowa wersja słownika, oparta na dwóch źródłach: serwisie SJP.pl oraz bazie słów pl.Wiktionary.org. W przypadku pojawienia się hasła w bazie Wiki, zastępuje ona hasło z SJP.pl. W definicji zawarte są dodatkowo synonimy, przykłady oraz wymowa.

Słownik jest jeszcze niedopracowany (pojawiają się pewne błędy edytorskie), i, jako podstawa do debugowania, wyświetlane są również odmiany (co owocuje znacznie zwiększonym rozmiarem – 32MB).

Docelowo słownik nie będzie wyświetlał elementu odmiany oraz będzie wykorzystywana bardziej efektywna opcja kompresji słownika (Kindle huffdic compression).

Udostępniam tę wersję już teraz, bo działa już zdecydowanie lepiej niż wersja oparta na samym SJP.pl, a przy okazji liczę na pewien feedback od Was, użytkownicy, co (a może nawet jak!) poprawić.

Słownik wgrywamy jak każdą inną książkę i powinien od razu działać z polskimi tytułami (patrz też FAQ nt. słowników).

A jak to działa?

Wysłałem słownik mailowo i podobnie jak w tamtym artykule, otworzyłem zbiór „Ostatnie życzenie” Andrzeja Sapkowskiego i sprawdziłem te same słowa.

sjp-pularda sjp-tarnina sjp-akredytywa sjp-turzyca

Wynik krótkiego testu jest niejednoznaczny. Dwa pierwsze słowa (pularda i tarnina) mają definicję z Wikisłownika – i jest ona rzeczywiście dłuższa. Dwa pozostałe słowa zachowały definicję z SJP.pl. Przydatna w ocenie przydatności będzie informacja o źródle słowa na końcu każdego artykułu.

Moim zdaniem to wystarczy, aby nowy słownik wgrać na nasze czytniki. Przypomnę, że pobierzemy go ze strony autora, gdzie jest też dokładne jego omówienie. To jest edycja testowa i pewnie będą kolejne, zaglądajcie więc tam w przyszłości. Z tego co dowiedziałem się od Sana, szykowana jest też wersja dla Kobo.

Jako wikipedysta wspomnę tylko o konieczności zachowania zgodności z licencją CC BY-SA, na której wydawany jest Wikisłownik – trzeba ten nowy słownik opublikować na tej samej licencji.

Słownik dla Kobo i PocketBooka

A jeśli już o innych czytnikach mówimy – znów Athame – przygotował wersję SJP dla czytników Kobo i PocketBook.

Użytkownicy Kobo muszą chyba jeszcze przeczytać artykuł Cyfranka na temat instalacji własnych słowników, bo nie jest to oczywiste. Dzisiaj też Cyfranek przetestował wersję dla PocketBooka. Nie wszystko działa jeszcze dobrze (Adobe Reader nie zaznacza poprawnie słów z polskimi znakami, FB Reader sobie radzi), ale na bezrybiu…

Dodam, że bardzo mnie cieszy ta korespondencyjna rywalizacja i coraz to nowe wersje. :-)

Czytaj dalej:

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Korzystanie z Kindle i oznaczony tagami , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

23 odpowiedzi na „Kolejny słownik języka polskiego dla Kindle: SJP.pl spotyka Wikisłownik!

  1. Dan pisze:

    Nie na temat

    Potrzebuję porady w wyborze tabletu

    Chodzi mi o coś w miarę taniego. Do czytanie magazynów w formacie PDF
    Za granica nie będę miał dostępu do papierowych wydań. Sprawdziłem cobie i to co mnie interesuje (to co czytam, a nie jest tego dużo) jest dostępne do kupienia w wersji pfd.
    Na telefonie da się czytać, lecz nie chcę się aż tak męczyć. Na Kindle tragedia.

    Myślę a jakimś 10 calowym. Nie wiem, jakie parametry są ważne. W sumie ten tablet będzie mi służył praktycznie tylko i wyłącznie do czytania. Żadne gry i inne tego typu rzeczy. No do i do sieci zajrzeć, email. Więc nie potrzebuję jakiegoś wypasionego. Firma też nie ma znaczenia. Na co zwrócić uwagę? Możecie coś polecić?

    0
    • opliko95 pisze:

      Do czytania ważna będzie rozdzielczość ekranu. I ogólnie jakość ekranu. Z 10 calowych dość ciekawy wydaje się Lenovo TAB2 A10-70F, który oferuje rozdzielczość full-hd (co w tej półce cenowej trudno znaleźć u 10″ tabletów). Kosztuje ok. 700 zł. Taniej można znaleźć dużo tabletów o rozdzielczości 1280×800 – więc jeśli lekko widoczne piksele Ci nie przeszkadzają, możesz poszukać czegoś typu acer iconia tab 10 (podaje ten jako przykład, ponieważ używałem go przez jakiś czas)

      0
  2. Simplex pisze:

    Miałem poprzednio słownik athame. Testowałem go na książce „Chłopcy 4. Największa z przygód”. Działał dobrze. Wgrałem ten nowy słownik, został rozpoznany, trafił do sekcji słowniki, mogłem go otworzyć i przeglądać. Niestety przy próbie sprawdzenia słowa w wyżej wymienionej książce słownik nie zadziałał, nie został wykryty jako pasujący. Zrobiłem coś źle?

    0
    • Katemeika pisze:

      Spróbuj ten nowy słownik ustawić jako domyślny.
      U mnie na PW III trzeba przejść:
      Menu – Settings – Device Options – Language and Dictionaries – Dictionaries
      i ustawić żądany słownik w sekcji Polish

      0
  3. Franek pisze:

    Mam jedno techniczne pytanie.
    Dlaczego nie mogę zaznaczyć w tekście pojedynczego słowa jeżeli przed nim jest „samodzielna” litera, przykładowo „z Niemcami”. Jak bym nie próbował, to nie mogę zaznaczyć słowa „Niemcami”, tylko zawsze zaznacza się łącznie z literką „z”.

    0
    • Athame pisze:

      Prawdopodobnie pomiędzy „z” i „Niemcami” jest „twarda spacja”, czyli te dwa wyrazy traktowane są jako jeden.

      0
  4. San Zamoyski pisze:

    Cześć!

    Dziękuję Panie Robercie za zwrócenie uwagi na mój nowy słownik.
    Jak pisałem na stronie przymierzam się do stworzenia skryptów generujących słowniki dla innych czytników. Pierwsze testy dla Kobo wróżą, że niedługo będę mógł z czystym sercem opublikować w pełni sprawny słownik (choć są wyraźne różnice pomiędzy strukturą słownika dla Kindle i dla Kobo). Potrzebuję jednak większej ilości testerów.

    Czego nie napisałem na swojej stronie, to informacja o tym, że (skrypty już pracują ;)) kolejnym krokiem do uzupełnienia słownika będzie wykorzystanie definicji w Wikipedii (nie znam jeszcze statystyk, ale mowa prawdopodobnie o kilku tysiącach definicji).

    Wciąż brakuje mi jednej bardzo ważnej rzeczy – generatora odmian i szerszej listy słów. Obecnie w bazie znajduje się 213 tys. słów + odmiany. Wg. Wielkiego słownika ortograficznego PWN, w języku polskim znajduje się ok. 140 tys. słów, wg. Jana Grzeni (http://sjp.pwn.pl/poradnia/haslo/Ile-slow-liczy-jezyk-polski;5606.html) ~200 tys., zaś wg. Słownika Gramatycznego Języka Polskiego (Wiedza Powszechna) 245 tys. Gdzie jest prawda – nie wiem ;).

    Zastrzegam od razu – nie wykorzystuję i nie mam zamiaru wykorzystywać źródeł, które nie pozwalają sobie na wykorzystywanie materiałów.

    Ale wciąż szukam kolejnych źródeł informacji…

    Każda pomoc będzie mile widziana!

    0
    • San Zamoyski pisze:

      Ach!

      Jak widać wciąż pojawiają się niuansiki zasługujące na poprawę. Na screenie z ‚tarnina’ widać (w definicji 2) odwołanie do definicji pierwszej w postaci z Wikisłownika – (1.1).

      I dla tego potrzebuję testerów ;)

      Zauważyłem, również, że pojawiają się pytanie o słowniki czesko-, esperanto-, niemiecko-, itd. polskie. Tak jak Athame już wspominał – potrzebne do tego niebagatelne źródło – baza słów język_obcy (z odmianami) -> polski.
      Wprowadzenie takiego źródła do mojej bazy nie stanowi problemu a wygenerowanie podobnego słownika to kwestia puszczenia skryptów w ruch.

      0
    • Athame pisze:

      Te 213 tys. słów to chyba więcej niż występuje w języku polskim. Skąd taka liczba? Dodałeś cały słownik wyrazów obcych + gwary (także te o małym zasięgu)? Czy może słownik ortograficzny? Wg mnie Wielki Słownik Ortograficzny PWN podaje najbardziej wiarygodną liczbę słów w języku polskim. W tym zawiera się ok. 50 tysięcy archaizmów, zapożyczeń lub słów używanych w zamkniętych kręgach.

      Sam przygotowuję słownik wszechpolski, który już na starcie ma 200 tys. niezależnych haseł, a docelowo będzie znacznie więcej. Też bazuję na materiałach wydanych na wolnych licencjach. Nie zamierzam nawet sugerować, że to słowa wyłącznie polskie, bo takowe będą ostatecznie stanowić ok. 35%.

      0
  5. San Zamoyski pisze:

    Zaktualizowane słowniki (najstarsze definicje sprzed dwóch dni) dla Kindle i dla Kobo już dostępne na stronie http://xn—zabaaganionemiejsce-8fd.pl/slownik-sjp-pl/

    Muszę wykombinować jakąś nową nazwę dla tego kombosa.

    W słowniku znajduje się ~93 tys. definicji.

    0
  6. San Zamoyski pisze:

    Bardziej bezpośredni link do najnowszych wersji:
    zabałaganionemiejsce.pl/cc-sjp/

    0
  7. Amdy pisze:

    Jak ustawić ten słownik na kindle 4gen classic

    0
  8. Matejko pisze:

    Można o jakiś aktualny adres do pobrania słownika prosić?

    0
  9. Weronika pisze:

    Mam problem z tym słownikiem i każdym innym dodanym od siebie. Słownik widnieje na dysku, w opcji ‚Language & Dictionaries’ również jest widoczny, ale nie mogę go zaznaczyć jako domyślny. Próbowałam wrzucać po kablu i wysyłając mailem. Gdzieś tutaj wyczytałam by próbować ręcznie przerzucać pliki do folderu ‚dictionaries’. Zawsze jest tak samo. Robię coś nie tak? Czy ma ktoś jakiś pomysł na rozwiązanie tego problemu?

    0
    • Athame pisze:

      Konkretnych informacji zbyt mało:
      1) Który model Kindle posiadasz?
      2) Czy nie możesz oznaczyć jako domyślny, czy też wcale nie funkcjonuje jako słownik?
      3) Skąd pobierałaś (dokładny link) i czy jest on poprawnie złożony (głównie chodzi o metadane)?

      0
      • Weronika pisze:

        Proszę mi wybaczyć moje roztrzepanie ;)

        1. Model, który posiadam to PW3

        2. Widnieje jako słownik, ale nie mogę go wybrać jako domyślny. Po przejściu do ‚Language i Dictionaries’ mam dwa słowniki: angielski (wbudowany) i polski, przy czym o ile w tym pierwszym jest możliwość przejścia do kolejnego podfolderu, to w przypadku słownika polskiego tej opcji już nie ma. Na screenie Roberta po prawej stronie jest – nazwijmy to umownie – strzałeczka, której ja nie mam. W poniższym linku przedstawiam wizualizację https://zapodaj.net/ffd1f54155d2f.png.html

        3. Pojęcie metadane obiło mi się o uszy, niemniej jednak stanowi dla mnie abstrakcję ;). Oto link, z którego pobrałam np. ten słownik http://zabałaganionemiejsce.pl/cc-sjp/SJP-201611080036.mobi
        lub Twój https://drive.google.com/file/d/0B9DUYhTR5YmQYWlUODJ6OWhqbmM/view
        Z kolei podpinając mojego Kindla do kompa w folderze ‚dictionaries’ mam jedynie pusty folder z tym słownikiem (inne słowniki mają w takich folderach dwa pliki z rozszerzeniem MBP1 i MBS) + plik z rozszerzeniem AZW. Plik AZWvmam i ten zamieszczony jest w folderze ‚documents’. Jak go przerzucam ręcznie na jego docelowe miejsce to niczego to nie zmienia.

        0
        • Athame pisze:

          Podeślij mi wszystkie słowniki dotyczące języka polskiego skopiowane z pamięci Kindle (nie takie jak pobierasz). Wcześniej spakuj to np. do jednego archiwum ZIP.

          Wstępnie mogę napisać, że jeśli brakuje strzałki, to oznacza tylko tyle, że czytnik wykrywa wyłącznie jeden słownik pasujący dla danego języka (tu: polskiego).

          Obecność plików MBP1 i MBS nie jest wymagana, a nawet niekoniecznie pożądana przy tych słownikach. Z czasem powstaną, ale ich rola jest żadna – jedynie zaśmiecają pamięć.

          0

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania. Jeśli chcesz mieć swój obrazek przy podpisie, zarejestruj swój adres mailowy na stronie gravatar.com.

Zapisz się także do newslettera Świata Czytników


Komentarze do tego artykułu można śledzić także w formacie RSS.