Za drogo? Ustaw alerty cenowe na e-booki i kupuj taniej!

Czy Amazon śledzi każdy nasz ruch na Kindle? Dostałem swoje dane i oto, co w nich znalazłem

Czy urządzenia Kindle rzeczywiście śledzą każdy nasz krok i wysyłają do Amazonu? Sprawdziłem to na swoich danych.

Pod koniec stycznia 2020 świat obiegł tweet od amerykańskiej dziennikarki, która odkryła, że Amazon zbiera dane na temat każdej zmiany strony na czytniku. Alarmistyczne w tonie komentarze opublikowało wiele serwisów technologicznych.

Nie zdziwiło mnie to jakoś mocno, bo przecież o tym że czytniki nas śledzą pisałem już w roku 2012. Powstrzymałem się od komentarza do czasu, aż Amazon udostępni mi dane dla mojego konta i będę mógł im się przyjrzeć.

Od razu uprzedzę, to jest długi artykuł. Zbieram w nim to, czego się dowiedziałem, lub czego się domyślam. I piszę o tym dokładniej jako pierwszy w Polsce i jeden z pierwszych na świecie.

Streszczenie: tak, Amazon zbiera informacje o tym, co i w jaki sposób czytamy na czytnikach Kindle nowszych niż 6. generacja. Zbieranie danych możemy wyłączyć w ustawieniach czytnika, albo na koncie Kindle.

Jak poprosić o swoje dane?

Amazon ma stronę Privacy Central, na której znajdziemy formularz „Request My Data”.  Z listy rozwijanej wybieramy kategorię, którą chcemy ściągnąć.

Formularz "Request My Data" - wybieramy jedną z opcji, co ma być pobrane

Ja wybrałem oczywiście „Kindle”, choć jeśli chcemy, można kliknąć „Request All Your Data” i pobrać wszystko.

Po wyborze trzeba jeszcze kliknąć w link, który dostaniemy na maila. Widzimy wtedy potwierdzenie.

Jak wynika z  komunikatu, oczekiwanie na dane „nie powinno zabrać więcej niż miesiąc”. Nie brzmi to zachęcająco.

W moim przypadku było jednak lepiej: prośbę o dane złożyłem 29 stycznia 2020, a 8 lutego 2020 dostałem maila z informacją, że już są do pobrania.

Aby ściągnąć dane musiałem się najpierw zalogować do Amazonu, następnie potwierdzić swoją tożsamość przez wpisanie kodu, wysłanego na mój telefon.

Do pobrania jest kilka kategorii danych.

Strona "Download your Amazon data" - lista plików do pobrania na stronie Amazonu

Wszystkie pliki nie są duże, łącznie zajmują 8 MB, choć w środku są wszędzie pliki tekstowe, które korzystają z dobrej kompresji – np. wewnątrz „Devices.Kindle.ReadingActions.zip” (4 MB) mamy plik CSV o wielkości 132 MB.

Pliki oraz ich zawartość

Ważna uwaga na wstępie. Dostajemy dane, ale nie dostajemy do nich „instrukcji obsługi”, tak więc przy analizie należy zgadywać, co znajduje się w poszczególnych plikach, albo co oznaczają różne kolumny. Z drugiej strony Amazon nie próbuje tutaj raczej „zaciemniać” tych danych i większość nazw jest w miarę zrozumiała.

Plik Charakterystyka Zawartość (prawdopodobna)
3P App Usage Data Setting.zip Jeden plik CSV Informacje o użyciu  jakiejś aplikacji, dotyczą tylko tabletu Fire.
App Engagement.zip Jeden plik CSV Lista: kiedy używaliśmy danej aplikacji na urządzeniach Kindle i Fire
Device Engagement.zip Jeden plik CSV Lista: kiedy używaliśmy jakiego urządzenia
Device Usage Data Setting.zip Jeden plik CSV Informacje o naszej zgodzie na przetwarzanie danych dla dotykowych czytników Kindle i aplikacji Kindle (kolumna customer_opt_out_flag) z datą kiedy jej udzieliliśmy
Devices.Kindle.ReadingActions.zip Jeden duży plik CSV (113 MB) Lista działań wykonywanych na urządzeniach Kindle
Devices.Kindle.ReadingSessions.zip Jeden plik CSV Lista sesji czytelniczych na urządzeniach Kindle
Devices.Registration.zip Jeden plik CSV Lista rejestracji naszych urządzeń Kindle
Digital.Content.Ownership.zip Wiele plików JSON Informacje o wszystkich treściach (w tym samplach, czasopismach i aplikacjach) używanych na urządzeniach Kindle
Digital.SeriesContent.Relation_1.zip  + Digital.SeriesContent.Relation_2.zip Dwa pliki CSV Lista naszych książek z Kindle Store należących do serii tematycznych
KindlePeriodicals.zip Jeden plik CSV Lista subskrypcji magazynów/czasopism w Kindle Store

Dodam, że pierwsze omówienia tych plików pojawiały się w grudniu 2019 – patrz blog Danieli Poehn.

Pliki CSV można zaimportować do Excela, co też zrobiłem. Przykładowo mamy Devices.Registration.zip – lista moich urządzeń Amazonu. [link otwiera pełne zdjęcie]

Fragment pliku Excela z listą urządzeń zarejestrowanych na moim koncie

Mamy tu nie tylko czytniki, są np. aplikacje Kindle, które swego czasu rejestrowałem na czytnikach Nook i Onyx, jest nawet mój telewizor, na którym aktywowałem kiedyś usługę Amazon Video. :-) Lista liczy sobie 87 pozycji, co pokazuje, jak wielką siecią Amazon oplótł moje życie. Wiele z nich jest oczywiście nieaktywnych.

Pliki JSON to format wymiany danych obsługiwany przez większość języków programistycznych. Amazon w plikach JSON przekazuje dane w Digital.Content.Ownership.zip – dotyczące treści z konta Kindle. Tak wyglądają przykładowe dane dla  jednej z książek zakupionych przeze mnie jeszcze w roku 2010.

Zawartość pliku JSON: surowe, ciężkie do odczytania dane w jednym ciągłym wierszu

W sieci są też konwertery, które pozwalają podejrzeć obiekty zawarte w konkretnym pliku.

Szczegóły pliku JSON - różne właściwości obiektu odpowiadającego książce na koncie Amazonu

Widzimy np. pole „rightStatus: active” – to potwierdzenie że mam prawo korzystać z tego pliku. Pamiętajmy: książki kupowane w Amazonie mają zabezpieczenia DRM i firma będzie sprawdzała, czy licencja, na której możemy z nich korzystać jest ważna.

Część plików ma też „rightStatus”:”Revoked”, znalazłem np. książkę „The Oxford Guide to People & Places of the Bible”, którą zwróciłem niedługo po zakupie – czyli informacja o niej jest na moim koncie, ale nie mam do niej prawa.

Na koncie jest też informacja o plikach, które nie mają DRM, ale które skasowałem. Np. przy starych wydaniach „Gazety Wyborczej” też mam tam „rightStatus”:”Revoked”. Nie uprawnia to do przypuszczeń, że skasowane e-booki są nadal przechowywane przez Amazon. Po prostu informacja, że kiedyś taki był na koncie.

Warto wspomnieć, że w plikach udostępnionych przez Amazon nie ma żadnych metadanych – np. tytułu czy autora, jest tylko identyfikator:

  • krótki dla książki z Kindle Store np. „B01HS3YB4M” (to tzw. numer ASIN – więcej na Wikipedii)
  • długi dla dokumentów osobistych np. „06E42A5364CE4A39B4DEE60E3EF4B96B”.

Ten sam identyfikator widzimy w nazwie pliku, gdy podejrzymy zawartość folderu „documents” po podłączeniu czytnika Kindle do komputera.

Z jakich czytników i urządzeń Amazon zbiera dane?

Warto uświadomić sobie z których czytników Amazon zbiera szczegółowe dane o użyciu:

  • Kindle 7, 8, 10 (choć dla K7 brak jakichkolwiek)
  • Kindle Paperwhite 2-4
  • Kindle Voyage
  • Kindle Oasis 1-3

Są to zatem czytniki nowsze niż „6 generacja” (patrz artykuł), a zatem wszystkie, które do niedawna dostawały aktualizacje oprogramowania. Nie mam informacji o zbieraniu danych dla pierwszego Paperwhite, albo czytników klawiszowych.

Jeśli chcemy wiedzieć, z których naszych czytników u nas zbierane są dane – listę znajdziemy na naszym koncie, patrz dalej w punkcie „Jak zrezygnować z przetwarzania danych?”.

Co o moim czytaniu wie Amazon?

Większość plików zawiera informacje dostępne tak czy inaczej na naszym koncie, jednak w dwóch znajdziemy informacje zebrane od nas podczas czytania.

Pierwszy to Devices.Kindle.ReadingSessions.zip. Plik zawiera informacje na temat kolejnych sesji czytelniczych od lutego 2018 do lutego 2020, czyli dla dwóch lat.

Takich sesji miałem w tym czasie sporo, bo 13 tysięcy!

W pliku znajdziemy następujące kolumny:

  • Numer seryjny czytnika (lub aplikacji)
  • Wersja oprogramowania
  • Typ książki (PDOC – nasz plik wysłany mailem, EBOK – książka z Kindle Store, MAGZ – magazyn)
  • Pole „contentID” – czyli jak podaję wyżej: numer ASIN dla zakupionych i wygenerowany przez Amazon identyfikator dla wysłanych mailem.
  • Informacja, czy dany plik jest pozycją zakupioną w Amazonie (isAmazonBook)
  • Czas początku i końca (jest taki sam, zapewne jakiś błąd)
  • Pole „totalReadingMillis”, które interpretuję jako długość danej sesji w milisekundach.

Dołożyłem sobie dodatkowe pole przeliczające te milisekundy na minuty i oto mogę sprawdzić, przy jakich książkach spędzałem najwięcej czasu.

Fragment pliku Excela: informacje o sesjach czytelniczych - co i kiedy czytałem na jakim czytniku

Np. 3 listopada 2019 spędziłem prawie trzy godziny nad książką o identyfikatorze „PXG55MTW6AJN4D4MENXC3UGCTCUIFTSN”, czyli Nie zdążę Olgi Gitkiewicz. No dobrze, nie ja, bo w domu wszystkie czytniki mamy zarejestrowane na jedno konto.

Widzimy, że Amazon ma tutaj doskonałe dane do tego, aby ocenić, jak długo czytana jest dna książka, niestety nie pokazują tego publicznie. Przypomnę, że statystyki czytelnicze od dawna zbiera Kobo – i w przeciwieństwie do Amazonu pokazują je na czytniku. No, ale jeśli mamy takie dane – wystarczy prosta tabela przestawna – i hop, widzę, że ponowne przeczytanie „Potopu” w ubiegłym roku zajęło mi 30 i pół godziny.

Czas czytania? To, że Amazon takie informacje zbiera nie powoduje chyba zaskoczenia. Podobne zbiera np. Legimi – i pokazuje nam je na ekranie startowym aplikacji.

Drugi plik to Devices.Kindle.ReadingActions.zip – i to właśnie jego zawartość wzbudziła takie zainteresowanie na świecie dwa tygodnie temu.

Plik, który otrzymałem zawiera informacje od stycznia 2018 do czerwca 2019. Nie wiem czy przestali je wtedy zbierać, czy po prostu nie byli w stanie wygenerować mi późniejszych informacji.

Tutaj podobnie jak przy sesjach mamy numer seryjny czytnika, wersję oprogramowania, datę, a następnie co najciekawsze:

  • pole „actionID” to jedna z ponad 300 możliwych akcji, które wykonuję na czytniku;
  • pole „context” to jeden z 300 kontekstów, czyli jak rozumiem sytuacji, w której ma miejsce dane działanie – można to rozumieć jako opis tego, co akurat jest wyświetlane na ekranie;
  • pola „spanType”, „pointType” i „setttingID” z dodatkowymi informacjami, rzadko używane.

Jakie informacje są zbierane? Zmiany stron, ale również korzystanie z wszelkich funkcji czytnika, wchodzenie do ustawień, sprawdzanie słów w słowniku, czy Wikipedii.

Oto fragment dla jednej tylko książki. [Kliknięcie otwiera pełny obrazek]

Fragment pliku Excela: wszystkie działania wykonywane na książce Kindle w ciągu dwóch minut. Kilkadziesiąt wierszy Excela.

Otóż 4 maja 2019 o godzinie 0:29 otworzyłem sobie książkę o identyfikatorze „LGQIJB32QLJKUQ5BI26SFMSSM4PAW736”, skądinąd wiem że były to Rozmowy z katem Moczarskiego. Zmieniłem ustawienia czcionki (nie wiadomo na jakie), po czym zacząłem od kolejnego rozdziału. Zmieniłem parę stron i dwukrotnie sprawdziłem przypis.

To wszystko na przestrzeni dwóch minut.

Co tutaj najbardziej zaskakuje to niesamowita szczegółowość danych.

Większość aplikacji ma opcje developerskie, po których włączeniu zapisywany jest dziennik ze wszelkimi działaniami użytkownika. Pozwala to odtworzyć sytuację, która doprowadziła np. do jakiegoś błędu. Rzadko jednak rejestrowany jest dosłownie każdy ruch – i wysyłany do producenta.

W moim pliku znalazło się 752 tysiące wierszy – czyli wszystkie działania na czytnikach Kindle z mojego konta na przestrzeni kilkunastu miesięcy. Teraz przemnóżmy to przez miliony użytkowników Kindle i setki miesięcy. Ilość danych, które Amazon gdzieś trzyma na swoich serwerach jest porażająca.

Dowiem się na przykład, że czytnik restartowałem 12 razy, z czego 3 razy z menu, 9 razy w kontekście „Global” – czyli zapewne przez dłuższe przyciśnięcie przycisku zasilania – w praktyce pewnie tyle razy Kindle mi się zawiesił.

Fragment pliku Excela: 12 wierszy z informacjami o datach restartu Kindle

Przez ponad rok ponad 2000 razy dodawałem podkreślenia (no, z niczego się te moje 12 tysięcy nie wzięło), przy czym Amazon rozróżnia, czy robiłem to po raz pierwszy, czy edytowałem istniejące podkreślenie. Co jest dla nich informacją, jak często ludzie się mylą i muszą zakres podkreślenia poprawiać.

Fragment pliku Excela: daty dodawania podkreśleń do plików Kindle

Przyjrzyjmy się jeszcze słownikowi.

Fragment pliku Excela: informacje o czasie i sposobach korzystania ze słownika na Kindle

W rejestrze znajdziemy takie informacje jak zmiana słownika dla języka (bez szczegółów na jaki), następnie sprawdzanie słów – również bez szczegółów, których słów dotyczy – jest jednak informacja, czy definicja została znaleziona (FoundLookup) czy nie (MissedLookup). Firma rejestruje nawet sprawdzanie homonimów, czyli alternatywnych znaczeń dla danego słowa.

Amazon ewidentnie tutaj zbiera informacje, że korzystamy ze słownika, a nie co w nim sprawdzamy. Można więc założyć, że stoi za tym chęć zebrania statystyk, a nie permanentnej inwigilacji.

Choć akurat w przypadku słownika dobrze wiemy, że sprawdzone słowa i tak trafiają do aplikacji Vocabulary Builder, tak więc nie ma potrzeby ich rejestrowania w ten sposób. Swoją drogą w danych, które otrzymałem nie ma bazy tej aplikacji, która niewątpliwie jest synchronizowana między czytnikami podłączonymi do jednego konta. Czy to oznacza, że Amazon nie uznaje tych danych, ewidentnie powiązanych ze mną, za osobowe? 

Z pliku również nie wynika wprost, że Amazon śledzi działania dla konkretnej książki. Oto mamy otwartego e-booka o danym identyfikatorze, potem kolejne działania, które jednak w kolumnie „contentId” nie mają wartości. Czyli teoretycznie Amazon przechowuje informacje np. o zmianie strony bez powiązania z konkretną książką. W praktyce – widzimy na powyższym fragmencie sami, jaka była kolejność czynności. Najpierw otworzyliśmy konkretną książkę, potem zmienialiśmy strony – czyli robiliśmy to w tej książce, a nie innej.

Co z książkami wgranymi po kablu?!

No dobrze, ale jeśli nie korzystamy z chmury Kindle i nasze pliki przegrywamy po kablu do pamięci czytnika, czy Amazon śledzi również ich czytanie?

Tak, Amazon śledzi że takie książki czytamy, ale prawdopodobnie nie wie, o jakie chodzi.

We wspomnianym pliku „Devices.Kindle.ReadingSessions.zip” znalazłem typ książki „SIDE”, co może być skrótem od „sideloaded”, a tak Amazon określa pliki wgrane po kablu.

Fragment pliku Excela: 7 wierszy z sesjami czytelniczymi dla plików o typie SIDE

Przefiltrowałem plik przez ten typ i za dużo nie ma. Wynikałoby z tego, że w ciągu dwóch lat jedynie 7 razy czytałem książki wgrane po kablu. Owszem – wszystkie bez wyjątku zakupione tytuły wysyłam do chmury.

Ale tak się składa, że w październiku 2019 byłem na konferencji twórców serwisu Wikiźródła i pokazywałem jak działają różne pliki MOBI wgrane na czytnik właśnie po kablu. Mam konkretną datę, wiem co wtedy robiłem i co dla tej daty ma Amazon?

Fragment pliku Excela: sesje czytelnicze z października 2019 dla książek o typie EBOK i nietypowym identyfikatorze

Otóż niektóre książki wgrane po kablu określane są również jako „EBOK” – czyli tytuły z Kindle Store, jednak w logach mają też oznaczenie, że nie są książką amazonową (isAmazonBook=FAŁSZ).

Dotyczy to zapewne wielu plików skonwertowanych przez program Calibre, albo poprawianych przez takie narzędzia jak ExtractCoverThumbs. Zewnętrzne narzędzia dodają często „fałszywy” numer ASIN, przez co oszukujemy czytnik, że jest to książka Amazonowa, a nie „personal document”. Nie korzystam z Legimi dla Kindle, ale podejrzewam, że książki zaciągane przez ich aplikację będą podobnie oznaczane.

[Jeśli chcemy poznać temat bliżej, był o tym w 2014 roku gościnny artykuł Pawła Jastrzębskiego].

I tak – być może czytnik uda się oszukać, ale Amazon sprawdza że takiej książki nie kupiliśmy, więc w logach nie traktuje jej jako zakupionej.

Skąd biorą się w tym przypadku identyfikatory książek? To prawdopodobnie funkcja skrótu (coś jak MD5), ciąg znaków odpowiadający unikalnej treści pliku.

Z danych tych nie wynika, aby Amazon wiedział cokolwiek o książkach wgranych na dysk, poza tym, że istnieją, no i że być może wiele osób ma taki sam plik – z takim samym identyfikatorem.

Dodam, że informacji o książkach wgranych po kablu nie znalazłem również w pliku Digital.Content.Ownership.zip, który zbiera wszystkie dokumenty, które mamy na koncie. Tym bardziej nie mamy tutaj powodu przypuszczać, że Amazon np. wgrywa treść naszych książek na swoje serwery. Po prostu – jeśli rejestrują działania dotyczące książek – muszą wspomnieć, że jakąś książkę otwarto. Jeśli nie kombinowaliśmy z typem „EBOK” – to dla książek wgrywanych po kablu (typ „SIDE”) Amazon nie rejestruje żadnych identyfikatorów.

Co Amazon robi z naszymi danymi?

No dobrze, wiemy już mniej więcej, jak Amazon śledzi nasze aktywności, ale co z nimi robią? Na ich stronie znajdziemy dokument Privacy Settings FAQs dla wszystkich urządzeń Amazonu.

Punkt 1:

The operating system of your Amazon Device collects data about your use of the device and its features, such as your navigation of the home screen, selection of device settings (such as device language, display size, WiFi and Bluetooth options), or open and close of apps and services.

System operacyjny urządzenia Kindle zbiera informacje o korzystaniu z niego i jego funkcji, np. nawigacji po ekranie startowym, wyboru ustawień i uruchamiania i zamykania aplikacji.

Co robią z tymi informacjami – o  tym mówi punkt 2:

We use this data to provide you with the features of your device, for example, to fulfill the actions you take on the device (such as opening an app), to allow you to restore the settings on your device, and to help you troubleshoot when you experience technical issues. We also use it to develop and improve products and features for all our customers and to gain insights into how our products are being used, assess customer engagement, identify potential quality issues, analyze our business, and customize marketing offers.

No, generalnie robią wszystko. Mogą nam pomóc rozwiązać problem z urządzeniem, używają ich do rozwoju produktów i zdobywania wiedzy na temat sposobów korzystania z produktów. Wreszcie na ich podstawie (cóż za zaskoczenie) dostosowują oferty marketingowe.

Jak zrezygnować z przetwarzania danych?

Czy można Amazonowi zabronić pobierania tak szczegółowych danych? Tego dotyczy punkt 5 w powyższym FAQ. Mamy dwa sposoby na zmianę ustawień prywatności.

Pierwszy sposób: na czytnikach Kindle odpowiednią opcję znajdziemy w:
Menu – Settings – Device Options – Advanced Options

Po kliknięciu „Privacy” widzimy dłuższe wyjaśnienie i możliwość wyłączenia przetwarzania danych (Disable).

Pod linkiem „Learn more” wyświetli nam się wspomniane wyżej FAQ.

Drugim sposobem jest skorzystanie ze strony naszego konta w Amazoniewww.amazon.com/mycd. Znajdziemy tam zakładkę „Privacy Settings – Amazon Devices Privacy”.

Wybieramy jedno z urządzeń, których dotyczą ustawienia i przełączamy opcję.

Strona Amazonu i zakładka Amazon Devices Privacy. Wybrane jedno z urządzeń i widoczna opcja Device Usage Data

Po wyłączeniu dostajemy informację:

Turning this setting off will not affect „Your ability to use the features of this device, as we will continue to collect and process your data to deliver those features to you”

Czyli nadal część będą przetwarzać. Ha. Ale po chwili pomyśleć trzeba, że pewne informacje jak np. to że synchronizujemy czytnik będą musiały być przesyłane. Brakuje jednak podania, co konkretnie my tym przyciskiem wyłączamy.

Zastosowałem te ustawienia na jednym ze swoich czytników (Kindle 10) i nie zauważyłem żadnych zmian w korzystaniu z czytnika.

W szczególności nadal:

  • Mamy podawane informacje „Time left in chapter/book” – czyli czas do końca rozdziału lub książki. Czytnik nadal zatem zbiera informacje o czasie czytania, być może nie wysyła ich po prostu na serwer. Za jakiś czas pobiorę ponownie moje dane i to sprawdzę.
  • Działa synchronizacja między urządzeniami, po dodaniu podkreśleń na Kindle 10 i zamknięciu książki, chwilę później zobaczyłem je na Oasis.

Inna sprawa, że samą synchronizację dla danego urządzenia możemy włączyć lub wyłączyć w opcjach „Whispersync for Books” – widzimy je na zrzucie ekranowym wyżej zaraz nad prywatnością.

Podsumowanie

Wiemy już mniej więcej jakie informacje Amazon zbiera i jak to możemy wyłączyć.

Podstawowe pytanie jest jednak takie – co to znaczy dla nas? Czy fakt, że Amazon wie tak dużo o naszych zwyczajach czytelniczych jest dla nas niebezpieczny?

Wrócę do tytułu swojego artykułu z roku 2012: Twój czytnik cię śledzi – zagrożenie czy szansa?

Dziś po licznych aferach dotyczących prywatności mamy już coraz mniej złudzeń, że wielkie korporacje uczą się naszych zachowań po to, aby dostarczyć nam najlepsze produkty. No nie. Albo przynajmniej nie tylko. Nawet w komunikacie ustawień prywatności na pierwszym miejscu Amazon podaje „customized marketing offers” – chcą wiedzieć o nas jak najwięcej, aby jeszcze skuteczniej sprzedawać nam różne rzeczy.

No cóż, ja się na to godzę – i płacę za to cenę – bo rekomendacje bywają naprawdę trafne i w Kindle Store dokonuję zakupów regularnie.

Większości czytelników z Polski temat jednak w zasadzie nie dotyczy – bo jeśli kupujemy e-booki w polskich księgarniach i wysyłamy je bezprzewodowo na czytnik, to Amazon wielu rekomendacji z tego nie wyciągnie.

Warto jednak te obawy umieścić w pewnym kontekście. Jak ktoś podsumował na Facebooku, gdy pojawiły się pierwsze alarmistyczne artykuły.

„urządzenie bada z jaką szybkością czytasz książki i może sprzedawać te dane firmom trzecim”. Uff, jak dobrze że nie noszę w kieszeni czegoś co śledzi moje położenie i ma wbudowany mikrofon.

No właśnie. Żyjemy w świecie, w którym dane na temat naszego życia oddajemy firmom za cenę większej wygody.

Wygodę w przypadku Kindle zapewnia nam trzymanie naszych książek w chmurze. A dopiero niedawno dowiedzieliśmy się, że niejako mimochodem Amazon chce dokładnie wiedzieć, co z tymi książkami robimy.

Oczywiście, taki Google czy Facebook zbierają znacznie więcej informacji o naszym życiu. Amazon niby wie tylko o czytelniczych zwyczajach, które oczywiście da się też przełożyć na inne sfery. Czy po lekturze anglojęzycznej książki o rybach, nie zobaczymy w Amazonie oferty na wędki?

Jeśli to zbieranie danych nam przeszkadza – możemy je wyłączyć, a nasza codzienność w korzystaniu z czytnika się nie zmieni. Oczywiście Amazon nadal będzie wiedział co czytamy, jeśli te książki sami wysłaliśmy na maila.

Czy to załatwia sprawę? Ano niekoniecznie. Bo są jeszcze dwie kwestie:

  1. Dlaczego Amazon zaczął te dane zbierać bez naszej zgody? Zastosowano tu klasyczną formułę „opt-out” – możemy zrezygnować, ale domyślnie wszystko jest zbierane. Pewnie zgodę wyraziliśmy kiedyś zatwierdzają dłuuugi regulamin, czyli coś, czego nikt nie czyta. Ustawodawstwo unijne dąży ku rozszerzeniu formuły „opt-in”, co jednak zmusza nas do klikania coraz większej liczby zgód, których i tak nie czytamy.
  2. Odrębną kwestią jest to, czy Amazon (i wszelkie inne wielkie firmy), po tym gdy wyłączymy zgodę na zbieranie danych, rzeczywiście przestaje je zbierać i wysyłać na swoje serwery. Jako klienci musimy de facto wierzyć na słowo. Tu oczekiwałbym monitorowania tego przez organizacje konsumenckie czy specjalistów (hackerów w pozytywnym znaczeniu tego słowa), którzy umieją sprawdzić co Kindle rzeczywiście zapisuje w logach i co próbuje wysłać. Jak widać było z informacji, które dostałem, dane zbierane są od roku 2018, ale dopiero teraz robi się o tym głośniej.

Czy to wszystko oznacza, że nagle zacznę krzyczeć „sprzedajcie Kindle, kupcie czytniki innej firmy”? Nie. Tym bardziej, że nie wiem, co zbierają inne czytniki.

Większość tego, czego dowiedziałem się z udostępnionych danych nie jest dla mnie zaskoczeniem. Osobiście też nie widzę zagrożenia w tym, że Amazon wie, co czytam i jak często korzystam z jakiejś funkcji. Jestem świadomy kosztów tego (jak pisałem wyżej), ale nie uważam, aby tu przekroczono jakąś granicę.

Moim zdaniem warto mieć jednak świadomość tego, co firmy od nas zbierają, aby wiedzieć, czy w danej sytuacji nie musimy postawić granicy. Tak jak użytkownicy Messengera, którzy przesiadają się np. na Telegrama, bo tak jest w pewnych sytuacjach bezpieczniej. W przypadku Kindle podobnej potrzeby nie widzę.

Ciekawi mnie, co o tym sądzicie. Czy zamierzacie zawnioskować o dane dla siebie i zobaczyć, co Amazon wie o Waszym czytaniu? Czy będziecie chcieli wyłączyć zbieranie danych? A może jest Wam wszystko jedno?

Co zrobisz z ustawieniami prywatności na Kindle?

Zobacz wyniki

Loading ... Loading ...

 

Czytaj dalej:

Artykuł był przydatny? Jeśli tak, zobacz 6 sposobów, na jakie możesz wspomóc Świat Czytników. Dziękuję!

Ten wpis został opublikowany w kategorii Korzystanie z Kindle i oznaczony tagami , , . Dodaj zakładkę do bezpośredniego odnośnika.
Hosting: Zenbox

56 odpowiedzi na „Czy Amazon śledzi każdy nasz ruch na Kindle? Dostałem swoje dane i oto, co w nich znalazłem

  1. Robert Drózd pisze:

    PS. Trochę się napracowałem nad tym wpisem, a dwa tygodnie temu w Wykopie na stronę główną trafiła wyłącznie plotka. Jeśli macie konto na Wykopie to poproszę o +1 :)

    https://www.wykop.pl/link/5330747/czy-amazon-sledzi-kazdy-ruch-na-kindle-dostalem-swoje-dane-i-oto-moja-analiza/

    EDIT: i jesteśmy na głównej. Dzięki wielkie!

    9
    • asymon pisze:

      Dej pan spokój, dla użytkowników wykopu istotne jest, czy Amazon zbiera informacje o plikach pobieranych np. z chomikuja. I czy jest szansa, że „nocą do drzwi załomocą” wiadome służby.

      15
      • Robert Drózd pisze:

        No, to ten artykuł odpowiada na to pytanie. Choć racja, powinienem był sformułować opis inaczej :D

        3
  2. Athame pisze:

    I tak – być może czytnik uda się oszukać, ale Amazon sprawdza że takiej książki nie kupiliśmy, więc w logach nie traktuje jej jako zakupionej.

    Półprawda. Moja modyfikacja na okładki dla własnych książek wysłanych przez chmurę skutecznie oszukuje ten mechanizm. Czyli w praktyce chodzi tu o jedną funkcję, która upośledza e-booki już po tym jak trafią na czytnik, a zanim zostaną oznakowane jako nowy rekord w bazie SQL Wszystko dzieje się lokalnie. Popsucie tej funkcji sprawia, że każdy e-book który wyślę przez chmurę, jest traktowany jak zakupiony w sklepie Amazona. Na każdym etapie – także w tych logach.

    2
    • Robert Drózd pisze:

      No, nie mam wątpliwości, że da się to również obejść. Masz opisaną gdzieś tę modyfikację?

      Bardzo jestem ciekaw, jak pokazywane są w tych logach książki z Legimi.

      0
      • Athame pisze:

        To u mnie część EKT. Szczegółów nigdzie nie opisywałem, a akurat ten fragment moda, to poprawka w edytorze szesnastkowym. Dość wrażliwa modyfikacja – pomyłka skutkuje całkowitym brickiem czytnika. Inne części nie powodują takich wypadków, nawet jak są błędne. Z trudniejszych było jeszcze przygotowanie pythona z niestandardowym modułem, przy drastycznym ograniczeniu rozmiaru (4 razy mniejszy niż wersja NiLuJe).

        Książki z Legimi są traktowane jako obce (spoza Amazona) w każdym przypadku.

        0
  3. ola pisze:

    Brakuje w ankiecie „Już mam wyłączone” ;)
    Jakoś się kiedyś do tej opcji dogrzebałam i wyłączyłam. Czy czuję się z tym bardziej tajniacko, no nie wiem :D

    Z tego całego śledzenia najbardziej „stresuje” mnie jakoś śledzenie głosowe przez komórkę. Bo tu niestety często wyłapuję, że o czymś rozmawiam z mężem i widzę potem reklamy, przy czym jestem absolutnie pewna, że nic na ten temat nie klikałam. I nawet nie chodzi o same reklamy, tylko co robią z całą resztą wysłuchanych/nagranych pogadanek. Bo to, że widzę „dopasowanie marketingowe” z internetowania to jakoś się z tym pogodziłam i co zrobisz, nic nie zrobisz;)
    Jak jestem w domu raczej trzymam komórkę w innym pokoju niż przebywamy i z tego są podwójne korzyści, bo sie oduczyłam sięgać ot tak z nudów. W sypialni też już od dawna analogiczny budzik, a komórki out;)

    16
    • Wojciech pisze:

      +1, w dzisiejszych czasach przegląd ustawień prywatności danego programu/systemu/lodówki od razu po zakupie to podstawa. Choć nie mam złudzeń, że zapewne i tak nas śledzą, ale przynajmniej wbrew naszej wyraźnie wyrażonej woli.

      5
    • Bozi pisze:

      Ja tak samo – wyłączone po zakupie

      1
    • Bociek pisze:

      Właśnie sprawdziłem u siebie i wygląda na to, że wyłączyłem to zaraz po zakupie czytnika.

      0
  4. ola pisze:

    A ze zbieranych danych książkowych danych najbardziej by mnie ciekawiło przez jakie książki ludzie najbardziej nie mogą przebrnąć, jakie najczęściej porzucają niedokończone itp

    4
    • mjm pisze:

      Ja bym obstawiał Ulissesa Joyce’a, ale według deklaracji użytkowników serwisu Goodreads jest to Trafny wybór J. K. Rowling. A na drugim miejscu jedna z moich ulubionych lektur – Paragraf 22 :-(
      https://www.goodreads.com/shelf/show/abandoned

      4
    • Robert Drózd pisze:

      No właśnie to, czego w tych danych nie ma to pozycji w książce. Oczywiście Amazon przechowuje bieżącą lokację dla czytnika i dla całej książki pozycję, do której doszliśmy najdalej – „furthest read” (co można zresetować sobie na koncie Amazonu), ale w szczegółowych danych tego brak.

      1
  5. e-czytelnik pisze:

    4) brak takiej opcji na urządzeniu, a także na stronie Amazon („twoje urządzenie może nie posiadać najnowszej wersji oprogramowania”)

    0
  6. Pysiorek pisze:

    Czy jeżeli nie mam włączonego internetu i nie korzystam z chmury to tez jestem śledzona?

    1
    • Robert Drózd pisze:

      Jeśli nie masz włączonego internetu to nie, ale czytnik prawdopodobnie i tak zbiera te dane i wysyła je potem na serwer, jak już się połączysz.

      Nie wiadomo, co w przypadku gdy czytnik nie jest zarejestrowany.

      0
      • Athame pisze:

        Wiadomo.

        Gromadzenie danych jest niezależne od dostępu do internetu i od rejestracji. To wszystko gromadzone jest w bazach danych na niewidocznej z poziomu komputera partycji. Przy każdym podłączeniu do internetu od razu są one wysyłane na serwery Amazona. Jako identyfikator urządzenia występuje na pierwszym miejscu adres MAC, a później numer seryjny.

        Z dość wiarygodnych źródeł (ale nie na 100%) wiadomo, że Amazon może włączyć sieć bez pomocy użytkownika, tylko po to by zsynchronizować te dane. Dlatego najlepiej trzymać czytnika z dala od otwartych hot-spotów.

        Albo mieć do tego takie podejście jak moje – niech sobie zbierają ile chcą. To i tak malutko w porównaniu do tego ile zbiera MS od użytkowników Windowsa, czy Intel za pomocą IME, albo AMD za pomocą PSP. O amerykańskiej narodowej agencji bezpieczeństwa nie wspominając.

        5
        • NieKorzystamZWindowsa pisze:

          Bardzo jestem ciekaw jak to niby Amazon moze wlaczyc siec zdalnie. Jakies szczegoly?

          Moj 5-letni czytnik byl swiadomie online mniej niz 10 sekund. Czy historie logowan mozna gdzies potwierdzic?

          0
          • Doman pisze:

            Nie zdalnie, tylko np. czasowo. Np. zapisać w oprogramowaniu czytnika, żeby raz na rok niezależnie od ustawień poszukał jakiejś dostępnej sieci wifi z zapisanym hasłem, albo bez hasła i przesłał dane.

            Jedyny 100% pewny sposób to logi twojego własnego routera, ale pewnie nie trzymasz ich 5 lat ani nie zagwarantujesz, że przez te 5 lat czytnik nie był w zasięgu innej otwartej sieci wifi.

            2
          • Robert Drózd pisze:

            Akurat w przypadku czytników z 3G (np. Kindle DX) było potwierdzone, że Amazon czasami 3G włącza.

            3
  7. asymon pisze:

    Najbardziej boli mnie, że Amazon ma dane to tego, żeby udostępnić nam fajne statystyki a la Legimi, a tego nie robi :-( Zamiast tego mamy śmieszne Kindle Insights, które pokazuje tylko, czy otworzyliśmy książkę.

    9
    • midway pisze:

      Jakby je gdzieś wyświetlali, to ta „afera” wybuchałaby znacznie wcześniej.

      0
      • asymon pisze:

        Jaka afera? Serio nie wiedziałeś że Amazon rejestruje częstość zmian stron na czytniku? Jak inaczej wyliczyć czas pozostały do końca rozdzialu czy książki?

        Legimi wyświetla takie statystyki, zresztą amazonowe Audible także, ma nawet odznaki typu „słuchałeś dwóch audiobooków jednego dnia” czy „sluchałeś 24h w weekendy”. Nie ma problemu.

        3
        • midway pisze:

          Ten cudzysłów przy aferze nie pojawił się przypadkowo :-) Ale teraz jest moda na prywatność i teraz każde takie „sensacyjne” (kolejny nieprzypadkowy cudzysłów :-) odkrycie jest aferą.

          0
  8. Martens pisze:

    Może troszkę nie na temat ale mam pytanie – czy można w jakikolwiek sposób z chmury Amazonu usunąć niektóre (zdublowane w moim przypadku) ebooki?

    0
  9. Maria pisze:

    A niech zbierają.

    Nie sądzę by służby były skłonne mnie szantażować groźbą opublikowania tego co czytałam :-)

    Tym bardziej że Google chętnie dostarczy im znacznie bardziej intymne dane na mój temat.

    0
    • asia pisze:

      Zawsze mnie dziwi ze takie teksty wystepuja na stronach zrzeszajacych ludzi czytajacych, bo niby jakim cudem jeszcze? Przeczytaj na start chociazby Orlinskiego „Internet”, ktory jest wartka opowiescia wlasnie dla ludzi myslacych ze wszystko jest ok skoro nie maja nic do ukrycia. Fajnie temat podejmuje tez przemysl filmowy, szczegolnie Black mirror (jest tez uzupelniajaca ksiazka) i Person of interest.

      1
      • Wojciech pisze:

        Dorzucam do tej listy autobiografię Snowdena („Pamięć nieulotna”), warto otworzyć oczy.

        2
        • asymon pisze:

          To ja polecę program na YT, „Government Surveillance: Last Week Tonight with John Oliver (HBO)” – nie wrzucę bezpośrednio linka, bo chyba lecą do moderacji.

          Program niby satyryczny, ale… Niestety nie ma polskich napisów.

          2
          • mjm pisze:

            Jeśli ktoś ma dostęp do HBO GO to tam jest w wersji z napisami lub lektorem:
            Przegląd tygodnia: Wieczór z Johnem Oliverem Sezon 2 odc. 8

            3
  10. Marek Kasztel pisze:

    Z ja znowu poza tematem :-)

    Wiem, że są tu osoby z Wolnych Lektur czy ktoś może mi powiedzieć dlaczego w bazie nie ma książki Cudowna Podróż która jest lekturą w szkole podstawowej, a zarówno sama powieść jak i polski przekład należą już do domeny publicznej?

    Pytam bo jeśli to kwestia funduszy to niedawno w szkole na zebraniu połowa rodziców zadeklarowała, że chętnie zapłacą byleby dostać ebooka z WL. Myślę, że w skali kraju chętnych znalazłoby się wielu, bo dla wielu WL to PIERWSZE źródło książek, dopiero później jest biblioteka, księgarnie i na końcu chomik. Może warto wrócić (albo skierować się) w kierunku lektur właśnie. Z całym szacunkiem dla np. „Nostromo” Conrada które niedawno się pojawiło w serwisie, w ciemno mogę założyć że dowolną szkolną lekturę przeczyta 10-100 razy więcej osób.

    0
    • Robert Drózd pisze:

      Autorka „Cudownej podróży” faktycznie zmarła w 1940 i jej dzieła są już w domenie publicznej, ale tłumaczka czyli Janina Mortkowiczowa zmarła w 1960, więc do domeny przejdzie dopiero w 2031.

      Inna sprawa, że teraz jak oryginał jest w PD, to inne wydawnictwa to tłumaczą na własną rękę i wydają. Tu np. masz wydanie Siedmiorogu za 5 zł: https://ebooki.swiatczytnikow.pl/ebook/9788377919149,selma-lagerlof–cudowna-podroz.html

      0
      • Marek Kasztel pisze:

        A to przepraszam. Wydawało mi się, że liczymy 50 lat od śmierci.

        To co linkujesz i jest dostępne w księgarniach to nowa skrócona wersja, a nie stare dwutomowe wydanie.

        0
  11. Hania pisze:

    Prawdopodobnie teraz wybuchniecie śmiechem, ale ja naprawdę nie do końca zrozumiałam – to w końcu da się wykryć piraty czy nie? Nie korzystam, nie do końca wiem nawet czym się technicznie taki pirat różni od oryginału. Czy książka przerobiona w Calibre (wyjustowanie i inne kosmetyczne zabiegi) może pod to podpadać i być wykrywalna jako coś nielegalnego?

    Dobry artykuł! Widać, że fachowy, bo w komentarzach ujawnili się techniczni spryciarze :)

    0
    • Robert Drózd pisze:

      Chodzi o to, czy Amazon jest w stanie stwierdzić, czy na Kindle czytamy pirata? Nie. Nawet jeśli wysłałem im plik na konto, więc mają go na swoich serwerach, nie mogą wiedzieć, czy książkę zrobiłem sobie sam (lub znalazłem w sieci), czy kupiłem np. bezpośrednio od wydawcy czy w innej księgarni.

      Jest od tego jeden wyjątek – sądzę, że mogą rozpoznać swoje własne książki, z których zdjęto DRM i wysłano do chmury. Ale nie sądzę, aby cokolwiek mieli z tym robić. Odsetek klientów korzystających z takich e-booków jest zapewne nieistotny.

      0
  12. Hania pisze:

    Sposób na alibi: „Zmieniałam wtedy stronę!”

    1
    • Maria pisze:

      To jest druga strona medalu.

      Ciągła rejestracja wizerunku (kamery w miejscach publicznych) oraz aktywności w sieci pozwala nie tylko na udowodnienie że obywatel robił coś złego, ale także na obronę przed nieuzasadnionym podejrzeniem.

      Przypomniała mi się taka anegdota:

      Leniwy listonosz zamiast przesyłek nosił tylko awizo które wrzucał ludziom do skrzynek nawet jeśli akurat byli w domu. Któregoś dnia ktoś to zauważył i dał mu w mordę. Listonosz zaczął się wydzierać że zawiadomi policję, na co adresat, ale przecież mnie tu nie ma właśnie pan mi dał urzędowe alibi że nie było mnie w domu.

      5
  13. W. pisze:

    W danych, które mi udostępnił Amazon, nie mam w ogóle plików Devices.Kindle.ReadingActions.zip i Devices.Kindle.ReadingSessions.zip.
    Na pewno miałem od dawna wyłączone Whispersync for Books, bo czytam tylko na czytniku i tego nie potrzebuję. Natomiast co do ustawienia Privacy nie jestem pewny, jakie było przez ten miniony okres, bo sposób w jaki jest ono pokazane na czytniku to trochę „dark pattern” – aktualny stan nie jest widoczny na wierchu, inaczej niż w przypadku Whispersync.
    Ogólnie widać z tego, że mamy nad tym jakąś tam kontrolę, w najgorszym razie w kwestii tego, do jakiego zakresu zbieranych danych się potem przyznają. ;P

    0
  14. San Zamoyski pisze:

    Zazdroszczę, chciałbym mieć takie statystyki o swoim czytaniu, ale na keyboardzie pewnie jest tylko cisza. Niemniej chętnie zobaczę co Amazon o mnie wie ;)
    Jakoś mnie ten news nie zaskakuje i nie razi…

    2
  15. cranky pisze:

    Po czasie, ale trochę mnie nie było. Proponuje doświadczenie: Stwórzcie plik mobi, zawierający byle jaką treść (ale nie faktycznie istniejąca książkę, tylko np. 40X powtórzona treść jakiegoś wypracowania, artykułu z sieci itp.) Dorzućcie na co 2 stronie jakiś krótki motyw lub epitet typu „jak rozpoznać chorobę śledziony” czy „życie w średniowiecznym zakonie” albo „V kantata Achille-Claude Debussy”. Wgrajcie na czytnik po kablu i symulujcie przez tydzień, że to czytacie. A potem cieszcie się personalizowanymi reklamami google na urządzeniach w waszej sieci domowej WiFi. Tego wam oficjalne logi nie zdradzą.

    0
  16. nonpossumus pisze:

    A przydałoby się taka opcja w samym czytniku, która by pokazywała ile czasu poświęcam na czytanie w rozbiciu na poszczególne książki i okresy czasu (tygodnie/miesiące/lata). Gdzieś chyba czytałem że w aplikacji kindla można to zobaczyć się to chyba nie prawda?

    0
  17. Damian pisze:

    Ojej! Ale afera! A jak pójdę do „analogowej biblioteki” to wścibska Pani bibliotekarka analizując moją kartę czytelnika też może się wiele rzeczy o mnie dowiedzieć (np. jak często wypożyczam książki, czy czytam ambitne dzieła czy może coś w stylu 50 twarzy Greya, jak wypożyczę jakąś książkę medyczną to może wywnioskować na co choruję itp.).

    0
    • Robert Drózd pisze:

      Trochę nie wiem do czego się odnosisz, bo w artykule, podobnie jak i na tym blogu staram się nie rozdmuchiwać „afer” i nie krzyczeć o tym, jaka to krzywda się dzieje. Tak, wiem że by się lepiej klikało.

      1
  18. Hoek pisze:

    Ogólnie to jest mało ludzi którzy czytają polityki prywatności i jeszcze mniej co przechodzi przez wszystkie opcje po zakupie nowego sprzętu i konfiguruje opcje związane z prywatnością i najmniej takich którzy śledzą changelog nowych wydań i zmian. Z drugiej strony wszystko co nowe powinno być opcjonalnie wyłączone a użytkownik poinformowany, że jest taka opcja i możesz włączyć. Ale wtedy nikt by tego nie włączał. No i jest jeszcze sprawa, jak coś jest za darmo to nasze dane są ceną. Ale gdy płaci się za coś to oczekiwałoby się jednak innego podejścia. Tak czy siak to są wielkie korpo które mogą mieć swoje regulaminy jakie chcą bo siedzi za tym sztab prawników. Wiec np dzięki Twojemu artykułowi każdy (kto nie zapoznał sie z tym na własną rękę) w prosty sposób otrzymuje analizę i sam moze podjąć działania, włączam, wyłączam, rezygnuje z usługi itp. dobra robota. W ankiecie jednak brakuje jednego wpisu – Nic nie zrobię, mam już dawno wyłączone.

    2

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Przed dodaniem komentarza zapoznaj się proszę z zasadami komentowania i polityką prywatności

Komentarze do tego artykułu można śledzić także w formacie RSS.