čtvrtek 31. ledna 2013

Válka, jaká je doopravdy — na digitálním videu

Prý je to nejsledovanější video z války v Afghánistánu. Vojín první třídy Ted Daniels spustil kameru a vyrazil do útoku. Zpočátku to vypadá úplně stejně jako kterákoli střílečka hraná z pohledu první osoby, od Doomu po Call of Duty. Voják postupuje, bojiště sledujeme přes hlaveň jeho zbraně.



Pak se ale situace mění. Daniels se dostane do nepřátelské palby, je zasažen, na chvíli ztratí pušku, snaží se krýt a volá o pomoc. Hra se změnila v drsnou realitu, ovšem se šťastným koncem, Daniels se poměrně rychle vyléčil ze svých zranění, odeslán zpět do USA a demobilizován.

Celý jeho příběh je fascinující, zůstaňme ale u té nahrávky. Když si Ted Daniels na helmu připevnil kameru GoPro Hero3, neudělal nic zas tak nezvyklého. Videa na památku si prý vojáci dnes pořizují celkem běžně. Americké ozbrojené síly v Afghánistánu to nezakazují plošně, rozhodnutí je na tom kterém veliteli. Z hlediska utajení to vypadá dost šíleně, zřejmě se ale vychází z toho, že obě strany v boji pořizují tolik dat, že je to už jedno.

Vojáci ostatně mívali soukromé fotoaparáty už ve druhé světové válce a velitelé jim to často tolerovali.

Dnešní armáda natáčí minimálně v takovém množství, v jakém střílí. Oficiální videokamery jsou na vozidlech, ve vrtulnících i ve vybavení jednotlivých pěšáků. Záznamy se po akci vyhodnocují a rozebírají.

Kromě videa se v boji pořizuje mnoho dalších dat. Všechny zbraňové systémy mají čidla a zároveň monitorují svůj vlastní stav, poruchy a opotřebení. Všude jsou GPS přijímače a všechno se zobrazuje v reálném čase na mapách. Tahle data ovšem nejsou pro veřejnost.

Amatérské záznamy jsou tak zpravidla to jediné, co z toho všeho uvidíme. Ukazují válku v malém výřezu, bez kontextu, bez nadhledu. Tak, jak bychom ji viděli my sami, kdybychom se do ní připletli.

čtvrtek 24. ledna 2013

Kolik dat je příliš?

Převodu analogového signálu na digitální — třeba u zvukové nahrávky - se říká vzorkování. Čím častěji odeberu vzorek a vyčíslím jeho hodnotu, tím věrněji změřím původní signál. Nebo ne?

Ano, ale jen v ideálním světě, jaký neexistuje. V realitě je každý signál doplněn šumem. Čím častěji vzorkuji, tím více šumu odebírám spolu se signálem. Správně zvolená frekvence vzorkování je ta, kterou by vybrala Popelka: ani moc, ani málo, ale tak akorát.

Odborněji se tomu říká Nyquistův vzorkovací teorém: volbou frekvence vzorkování lze stanovit, které frekvence signálu ještě přečteme a které ne. Ta nejvyšší, která se z analogových dat do digitálních dostane, je poloviční oproti vzorkovací frekvenci. Vysokofrekvenční šum se automaticky odfiltruje.

Když sledujete zprávy třikrát denně, konzumujete vysokofrekvenční šum. Máte pocit, že se svět zbláznil. Když se na ně podíváte jednou za týden, získáte dojem daleko větší stability - nic se vlastně neděje. Prkotiny se totiž mezitím vyřešily samy a zapomnělo se na ně.

Tohle je jedno z velkých rizik spojených s celým fenoménem Big Data. Mít hodně dat neznamená nutně být na tom lépe. Při naivním přístupu k věci je daleko snazší uškodit si všemi těmi údaji, než z nich jakkoli profitovat.


pondělí 21. ledna 2013

Vaše SPZ byla prověřena

Odjížděl jsem dnes z garáže nákupního centra. Zastrčím lístek do čtečky, naskočil tam text: „Vaše SPZ byla nyní prověřena.“ Zvednu oči, skutečně na stropě visí nová kamera a míří směrem k přední masce.

Prověřena? Proti čemu?

Odjezdy vůči příjezdům? To nedává smysl, čas příjezdu je kódován v magnetickém pruhu papírové karty, což k výpočtu parkovného naprosto stačí a používá se to tak léta.

Proti policejní databázi kradených vozidel? Nepravděpodobné. Nebylo by to schůdné organizačně (z příběhu o registru vozidel víme, jak stát umí zacházet s distribuovanými databázemi) a asi ani právně — soukromému subjektu takové údaje do rukou nepatří.

Proti jejich vlastní databázi návštěvníků? Sotva by to sdělovali, vést takovou databázi bez souhlasu evidovaných je protizákonné. Jsem si samozřejmě jist, že ji teď už mají a že do ní každé auto zaznamenávají, ale jestli nejsou blázni, nikdy to nepřiznají, rozhodně ne takhle hloupě.

Tak co se tam vlastně prověřuje? (Pomiňme, že to, co nazývají SPZ, se už dávno správně jmenuje RZ.)

Pořizovat a ukládat lze téměř jakákoli data, technologie na to jsou. Stále častěji musí padat otázka, kdy to má smysl a kdy ne. Kdy je to vysloveně nepřípustné. A kde je šedá zóna, v níž se výhody (mám evidenci, které auto kdy bylo v nákupním centru a i když třeba teď nevím, k čemu je to dobré, časem se něco najde) vyvažují s nevýhodami (zákazníci, obávající se o soukromí, začnou jezdit jinam).

Všeho moc škodí, i dat.