Za drogo? Ustaw alerty cenowe na e-booki i kupuj taniej!

Sztuczna inteligencja czyta e-booki, czyli aplikacja BookScout.ai z firmy Literacka Technologie

Jedną z korzyści książek elektronicznych jest to, że możemy je komputerowo przetwarzać. A co, jeśli będą również komputerowo czytane?

Olsztyńska firma Literacka Technologie pracuje właśnie nad Asystentem Wydawniczym – aplikacją BookScout.ai, która ma pomagać wydawcom w znalezieniu potencjalnych hitów.

Aplikacja wykorzystuje sztuczną inteligencję do analizy treści i stylu książek. Poniżej opiszę, jak to działa i w czym może się przydać.

Artykuł powstał we współpracy z producentem aplikacji. Wszystkie opinie, chyba że podałem inaczej, są wyłącznie moje.

Jak działa BookScout.ai (i po co?)

Zacznijmy od tego, w jaki sposób wydawcy poszukują przyszłych bestsellerów.

Wydawcy dostają od autorów lub agentów literackich setki rękopisów (tak się je wciąż określa, choć dziś to głównie pliki), które muszą ocenić, czy warto się nimi zająć. Zwykle jest tak, że ktoś po stronie wydawcy siada i czyta pierwsze strony lub rozdział, jeśli się wciągnie i zauważy potencjał – idzie dalej. Jeśli nie, trudno.

Dobrze znana jest historia J.K. Rowling, która z rękopisem pierwszej części powieści o Harrym Potterze kołatała do kilkunastu wydawców. Pomógł ponoć przypadek, czyli to, że powieść spodobała się córce jednego z nich. Wydawcy opowiadają sobie nieraz, jako coś normalnego, że zdarzyło im się zignorować autora, którego książki okazały się hitem.

Z drugiej strony – wydawcy się nieraz mylą – nawet najwięksi wypuszczają czasami tytuły, które nie zdobywają ani popularności, ani przychylności czytelników. Ot, zapełniają półki, z których potem znikają.

I tutaj wchodzi na scenę BookScout.ai. Jest to aplikacja, która pozwala wydawcom lub agentom literackim zidentyfikować, które rękopisy mają szanse zostać bestsellerami.

Wydawnictwo może korzystać z aplikacji na dwa sposoby:

  1. albo wrzuca do niej otrzymane od autorów rękopisy i otrzymuje ich ocenę
  2. albo wyszukuje spośród rękopisów nadesłanych bezpośrednio przez autorów

Co właściwie ocenia BookScout.ai? Na przykład:

  • Które rękopisy pasują do profilu wydawcy, albo wręcz pasują do wydawanych serii (wyobraźmy sobie wydawnictwo specjalizujące się w książkach o starożytnej Grecji, albo w powieściach o Skandynawii, albo w reportażach)
  • Jaką tematykę porusza rękopis – o czym właściwie autor pisze? Automatycznie generowane są też słowa kluczowe i tagi.
  • Jakie są cechy stylu i języka, w którym książka została napisana.
  • Jakie są „cechy miękkie” książki – np. na ile jest romantyczna, uczuciowa, zabawna itd. A zatem jakie emocje (!) książka wzbudza w czytelniku.

W jaki sposób technologia może rozpoznać emocje? Zapytałem o to Małgorzatę Sieniewicz (CEO Literacka):

Sztuczna inteligencja jest trochę jak człowiek, tylko szybciej się uczy. Nasze algorytmy uczyły się od czytelników i od wydawców. To ludzie określali, jak odbierają przeczytane przez siebie książki, jakie tytuły wprawiają ich zadumę, jakie bawią, a jakie smucą. Zebraliśmy ogromną ilość danych i przeprowadziliśmy wiele różnych eksperymentów z dziedziny uczenia maszynowego. Teraz większość z emocji zawartych w treści książek oprogramowanie rozpoznaje z dokładnością sięgającą 90 %.

Ciekawą rzeczą jest też klasyfikacja tematyczna – z pierwszych testów wyszło, że system potrafi nieraz klasyfikować gatunki takie jak kryminał czy fantastyka lepiej niż sami ludzie. To myślę, że jest całkiem zrozumiałe – zresztą sami autorzy często to zaciemniają. Kupujemy kryminał, a dostajemy powieść obyczajową. Oczekujemy fantasy, a to bardziej romans z elfami. Inną sprawą jest to, jak wydawca chce książkę sprzedawać. Są np. autorzy z „głównego nurtu” piszący fantastykę, którzy nie chcą być z nią kojarzeni.

System oferuje też wsparcie redaktorskie, również samym autorom. Jest np. w stanie zauważyć, że bohater obecny we wcześniejszych rozdziałach później niespodziewanie zniknął.

Jak jeszcze można korzystać z BookScout.ai? Narzędzie może odkryć podobieństwo niewydanych jeszcze książek do tych, które już są na rynku. Taki troszkę Tinder dla książek – jeśli wydawca szuka np. drugiego Dana Browna lub drugiej Olgi Tokarczuk to BookScout.ai pomoże mu go znaleźć. Można też znaleźć teksty podobne do tych, które w wydawnictwie się dobrze sprzedawały.

Jak to działa w praktyce? Mówi Krzysztof Sopyła z Literackiej.

Sam system jest obecnie w fazie testów i niedługo zostanie przedstawiony funkcjonalny prototyp.

Prezentacja BookScout.ai odbyła się podczas festiwalu BookTarg, czyli wirtualnych targów książki, organizowanych m.in. przez Allegro.

A oto nagranie z webinaru.

 

Co o tym sądzę?

Przyznaję, że zastosowanie sztucznej inteligencji do analizy książek może trochę przerażać. Ale czy postępowanie algorytmu jest tak kompletnie inne niż to, jak sami poszukujemy książek?

Sami stosujemy przecież różne strategie, szukając lektury dla siebie. Jeśli spodobał się nam dany autor, szukamy podobnego. Nie będzie już nigdy drugiego Pratchetta, Tolkiena czy Kinga, ale wydawcy nieraz nawiązują do znanych nazwisk, aby wypromować nowe.

Pamiętajmy też, że to ma być narzędzie do znalezienia bestsellera, a nie nominacji do nagród literackich. Większość książek wydawanych w Polsce – szczególnie tzw. literatury gatunkowej ma w założeniu być popularna, celem i autora i wydawcy jest dobra sprzedaż.

Czy nie skończy się to jednak „formatowaniem”, jakie znamy ze współczesnej muzyki pop, gdzie wiele utworów jest do siebie podobnych, zaś algorytmy analizujące muzykę pod kątem wielu zmiennych, znane są od dawna? Nie sądzę, tym bardziej że każdy wydawca będzie wyszukiwał tekstów pasujących do swojego profilu i wrażliwości swoich czytelników.

Myślę zatem, że może być to ciekawe narzędzie, które wprawdzie nie zastąpi „nosa” wydawcy, ale będzie mogło go wspomóc.

O firmie Literacka Technologie

Firma, jak już wspomniałem pochodzi z Olsztyna, a siedzibę ma w Olsztyńskim Parku Naukowo-Technologicznym. Jej twórcy łączą technologię i pasję książkową. Zatrudniają zarówno literaturoznawców, jak i specjalistów data science.

Pierwszym dużym projektem Literackiej w 2019 było autorskie oprogramowanie FIONA do analizy długich tekstów. Dane z Fiony zasilają System Zaawansowanych Rekomendacji Książek (w skrócie SZREK). A na podstawie Szreka działają już w różnych miejscach moduły Wirtualnego Księgarza.

Niektórzy z Was mogli się już spotkać z takim modułem, bo jesienią 2019 wdrożyła go księgarnia Publio, o czym zresztą kiedyś pisałem.

Jak to działa?

Wdrożenie podstawowe w Publio opiera się na możliwości wyboru cech miękkich książek, na jakie ma się w danej chwili ochotę i danie użytkownikowi możliwości eksploracji tytułów, które posiadają te cechy. Za pomocą suwaków użytkownik może ustawiać natężenia wybranych cech. Dzięki dodatkowym filtrom użytkownik może na wyszukiwanie po cechach nałożyć na przykład zawężenie do kategorii.

Jeszcze w maju w Publio pojawią się rekomendacje na poziomie konkretnych książek (czyli book2book). System zaproponuje inne książki o podobnej treści – i to jest nowością, bo dotąd większość systemów rekomendacyjnych bazuje na różnych ogólnych cechach, np. tagach.

Mamy też jeszcze jeden film z listopada 2020, w którym różni klienci Literackiej (m.in. Publio, Nexto i Legimi) opowiadają o szansach sztucznej inteligencji.

I na końcu jeszcze jedna ciekawostka. Pamiętacie serwis openbooks.com, założony m.in. przez Michała Kicińskiego (twórcę CD Projektu), a który miał oferować nowy model sprzedaży e-booków? Opisywałem go dokładnie w 2015.

Otóż w roku 2020 Kiciński objął w spółce część udziałów, a spółka kupiła OpenBooks.com. Pod koniec 2021 ma go przekształcić w „giełdę literacką” dla wydawców i agentów.

Podsumowanie

Bardzo mnie cieszy, że takie technologie i firmy powstają w Polsce. Zastosowań sztucznej inteligencji w analizie tekstów może być sporo, dlatego niewykluczone, że BookScout.ai to dopiero początek rewolucji. Tutaj skupiamy się na wersji polskiej – ale wydaje mi się, że serwis ma potencjał zdobycia zainteresowania w każdym języku.

A ja – jako czytelnik z ograniczonym czasem – też chętnie sięgnę po książki, które nie tylko wydawcy uznali za dobre, ale algorytmy ich w tym utwierdziły. :-)

I jeszcze raz podkreślę, że artykuł powstał w ramach współpracy z firmą Literacka Technologie. Na przygotowanie Asystenta Wydawniczego (czyli BookScout.ai) firma dostała dofinansowanie z Narodowego Centrum Badań i Rozwoju.

 

Czytaj dalej:

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Książki na czytniki i oznaczony tagami , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

12 odpowiedzi na „Sztuczna inteligencja czyta e-booki, czyli aplikacja BookScout.ai z firmy Literacka Technologie

  1. Marian pisze:

    Warto może zajrzeć do https://andrewmayneblog.wordpress.com/. Andrew Mayne jest znanym także w Polsce autorem nietypowych kryminałów („Naturalista” i kontynuacje). Z jego blogu wynika, że intensywnie posługuje się sztuczną inteligencją z zestawu OpenAI GPT-3. Zadaje wiele ciekawych pytań i zaskakuje odpowiedziami (Czy AI może napisać książkę? Co do tego potrzeba jej dać? Odp. skrypt!)

    Demonstruje także, że można napisać powieść w 24 godziny. Może to jest odpowiedź na niesłychaną wydajność naszych niektórych autorów?

    3
  2. Majka pisze:

    Zastanawia mnie reakcja takiego programu na takie „50 twarzy” czy panią Lipińską, czy program przewidziałby sukces gniotów. W zasadzie powinien, skoro sukcesy święciła też taka Barbara Cartland czy Jackie Collins.
    W zasadzie obawiam się, że algorytm nastawiony na maksymalizację zysków będzie premiował szmiry, a nie odkrycia bazujące na jakości, i z niej idącą popularność.

    2
    • kandelbery pisze:

      Patrząc na historię wydawania 50… to raczej nie była to kwestia samej książki, co okoliczności
      https://en.wikipedia.org/wiki/Fifty_Shades_of_Grey#Background_and_publication

      Tego raczej AI nie jest w stanie przewidzieć zapoznając się tylko z książką.

      0
    • asymon pisze:

      Ależ ten program ma (tzn. może) wyłapywać „klony” „369 dni”. Żebyśmy mieli jasność: to jest narzędzie dla wydawców, mające pomóc wyłapać bestsellery z ton/terabajtów chłamu nadsyłanych do wydawnictw. Bestsellery, nie arcydzieła. A teraz na topie są właśnie książki z motywem „porwana przez gangstera”.

      0
  3. Marek pisze:

    Sztuczną inteligencję da się całkiem łatwo oszukać. Czekam aż ktoś wpadnie na użycie fraz które zmylą Book Scouta :)

    2
    • asymon pisze:

      Ale SI nie tak działa. Najpierw musisz ją nauczyć, podsuwając do czytania książki, jakich poszukujesz (wzmocnienie pozytywne) i jakich nie chcesz (negatywne). Nie jest tak, że wrzucasz losowy tekst i zapala się lampka „wydawco, bier to!”.

      Przynajmniej mam takie podejrzenie, że będą to opcje „znajdź książkę podobna do innych książek” i nikt nie będzie uczył na książkach Manna czy Prousta, bo to się nie sprzeda. Raczej poszukiwania drugiego Mroza czy Lipińskiej wśród morza grafomanii, nie oszukujemy się.

      Ludzie, nie róbmy z maszyny Skynetu jakiegoś :-)

      7
      • Halinka z Warzywniaka pisze:

        Wszystko opiera sie na wewnetrznych korelacjach, ktorych niestesty nie widac. Juz byly eksperymenty obrazkowe, gdzie wytrenowanej sieci podano zdjecia z JEDNYM zmenionym pikselem i siec zwariowala dajac zupelnie inne wyniki klasyfikacji. Wiec jak najbardziej bedzie mozliwe zapodanie nauczonej sieci tekstu, ktory sie w te ukryte korelacje dobrze wpasuje i siec zmyli.

        1
      • tokariew pisze:

        https://openai.com/blog/multimodal-neurons/
        https://medium.com/swlh/how-to-fool-artificial-intelligence-fcf230bf37e

        Masz czarne pudełko i na dobrą sprawę nie wiesz jak ona klasyfikuje przedmioty… Zbyt często bagatelizuje się, jak AI klasyfikuje przedmioty…

        Przykład z psem i dolarami masz przejaskrawiony do bólu, jak można oszukać sieć, podkładając jej specjalnie przygotowany przykład… Nie jest trudno sobie wyobrazić, że dla tekstu będą jakieś zdania, zwroty kluczowe, które niemal z automatu, zakwalifikują dzieło jako sukces…
        Przygotowanie odpowiednich zbiorów do nauki sieci, to jest najtrudniejsze zadanie, w procesie wyuczania sieci.
        Masz potencjalnie mniejszą różnorodność tekstów niż zdjęć. Może się okazać że sieć będzie faworyzowała archaizmy, lub nietypowe konstrukcje zdaniowe. Bo okaże się że dominowały one w jednym ze zbiorów.

        I będziesz miał przykładowo archaizmy w książce i wydawco bierz to…

        1
    • kandelbery pisze:

      Pytanie tylko, po co oszukiwać?

      Jeśli zastosowaniem jest filtrowanie książek, zanim przeczyta je redaktor z wydawnictwa, to efekt będzie mierny.

      Jeśli chodzi o to, by ktoś, skuszony charakterystyką wystawioną przez algorytm kupił książkę, która udaje romans a jest kryminałem, to szybko czytelnicy wystawią ocenę recenzji, jako słabą (np. na lubimyczytac jest taki guzik przy każdej recenzji). Przecież taka klasyfikacja może być automatycznie wygenerowana dla setek tysięcy książek w czytelni/księgarni. I może być pomocna przy wyborze.

      0
  4. Tomek B. pisze:

    „Sztuczna inteligencja czyta e-booki”. I bardzo dobrze – będzie bardziej inteligentna, już Młynarski pisał jak ważne jest czytanie.
    Przepraszam, nie mogłem się powstrzymać :-)

    6
  5. mrownik pisze:

    Prawdopodobnie parę głębokich sieci neuronowych, modelowanie tematów, analiza wydźwięku (sentiment analysis). Jeśli tak, to nie ma w tym nic zadziwiającego, jeśli ktoś liznął, czym się zajmuje NLP i co obecnie jest już nieźle opracowane. Chociaż wymaga wiele pracy przy utworzeniu i wytrenowaniu modeli, szczególnie ze względu na cechy polszczyzny.

    > Jakie są „cechy miękkie” książki – np. na ile jest romantyczna, uczuciowa, zabawna itd.

    Ciekaw jestem bardzo, czy ta aplikacja potrafi zauważyć, że np. „Dzienniki gwiazdowe” Lema są zabawne. Po czym? Musiałaby rozumieć opisywane _sytuacje_. Tego obecnie oprogramowanie, nawet najbardziej zaawansowane AI, nie potrafi. Analiza wydźwięku, owszem, wychwyci sporą częstość przymiotników, rzeczowników, czasowników typowych dla masowej prozy romantycznej, albo powiedzmy, dla horroru, ale nie ma jak uchwycić „zabawności” tekstu.

    5
  6. Al pisze:

    Ciekawe, czy powstanie wersja AI, która snobistycznie będzie utrzymywać, że czyta tylko papierowe książki, bo „nic nie zastąpi aromatu druku” ;)

    3

Skomentuj Al Anuluj pisanie odpowiedzi

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania i polityką prywatności

Komentarze do tego artykułu można śledzić także w formacie RSS.