From fcb7778f99ab68334a90f20dd2631ef34bfade34 Mon Sep 17 00:00:00 2001 From: Filip Znachor Date: Thu, 25 May 2023 10:44:03 +0200 Subject: [PATCH] =?UTF-8?q?Pozn=C3=A1mky=20ze=207.=20prezentace=20z=20UPG?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../07. Pokročilá vizualizace informace.md | 237 ++++++++++++++++++ 1 file changed, 237 insertions(+) create mode 100644 KIV UPG/07. Pokročilá vizualizace informace.md diff --git a/KIV UPG/07. Pokročilá vizualizace informace.md b/KIV UPG/07. Pokročilá vizualizace informace.md new file mode 100644 index 0000000..f99905a --- /dev/null +++ b/KIV UPG/07. Pokročilá vizualizace informace.md @@ -0,0 +1,237 @@ +# Pokročilá vizualizace informace + +## Vizualizace dokumentů + +- dokumenty jsou primárním zdrojem informací +- snadný přístup: digitální knihovny, webové stránky, ... +- vizualizace může pomoci usnadnit získávání informací z textů a kolekcí dokumentů +- požadavky + - jaké dokumenty obsahují XYZ? + - jaké dokumenty jsou pro mne zajímavé? + - existují dokumenty podobné tomuto? + - co je skryto v této kolekci dokumentů? + - jaké jsou spojitosti mezi dokumenty? + +**Vyhledávání dokumentů** +- neznáme + - jak velké je shoda + - jak často se výraz v dokumentu opakuje + - kde se nachází + - délku dokumentu + +**Hotmap** +- Hoeber & Yang, 2006 +- barevná sekvence podle četnosti výskytu slova výrazu v dokumentu + - žlutá až červená +- postranní náhled + +**Tilebar** +- Anderson et al., 2002 +- dokument rosekán na bloky +- pro každý stanovena četnost výskytu hledaného výrazu +- vizualizace kvantizovaných četností + +**Document cards** +- Strobelt et al., 2009 +- vizuální reprezentace dokumentu +- klíčové části textu a obrázky extrahovány +- extrahovaný obsah zobrazen v náhledu +- podpora interaktivního procházení + +**Tags cloud** +- někdy nevíme, jaká klíčová slova volit +- tags = klíčová slova přiřazená ručně dokumentům, obrázkům, zboží, ... +- seznam tagů souvisejících alespoň s jedním zadaným klíčovým slovem nabídnut uživateli +- nabídka může být seřazena + - podle četnosti - vyžaduje sekvenční hledání tagu + - abecedně - chybí četnost +- alternativní vizuální řešení + - položky seřazeny abecedně + - velikost písma, tloušťka a barva podle popularity +- může být použit k prozkoumání převažující náplně dokumentů + +## Vizualizace pracovních postupů + +- vizualizace grafu bez smyček +- uzel = dílčí činnost +- hrana = návaznosti činnosti +- vhodné pro řízení projektů + +**Ganttův graf** +- činnosti zobrazeny typicky pod sebou na ose y +- trvání činnosti zobrazeno sloupcem na ose x +- barva sloupce může vystihovat další dimenzi (typ činnosti, barevný kód osoby, ...) +- jednoduše pochopitelný +- nemusí obsahovat dostatek informací pro důležitá rozhodnutí + +**Pertův graf** +- graf činností s vyznačením kritické cesty +- kritická cesta = zpoždení činnosti na této cestě povede ke zpoždění celku + +**Montážní postupy** +- zvláštní případ pracovního postupu +- manuál obsahuje + - seznam všech částí + - vizualizaci tvaru každé části a popisek + - vztah částí vůči sobě +- vizualizace montážních postupů není jednoduchá +- možné řešení + - vymodelované 3D objekty + - exploze objektů tak, aby se nezakrývaly + - doplnit popisky + +## Vícerozměrná data + +- datová položka má často mnoho dimenzí +- např. + - množství cukrů, tuků, vitamínů B12, C, D, E, K + - počet zaměstnanců firem na pozicích: ... + - geografická poloha kina, datum, teplota veknu, počet návštěvníků, film, cena vstupenky +- možnosti vizualizace + - grafem v kartézských souřadnicích po dvojicích + - projekce dat do 2D prostoru (další 3 dimenze barvou, tvarem, velikostí značek) + - obvykle potřeba více grafů + - pro mnoho dimenzí nepřehledné + - grafem typu radar + - lze znázornit velké množství dimenzí naráz + - datová položka určena svým polygonem + - složitější porovnání nesousedících hodnot + - grafem v paralelních souřadnicích + - jednotlivé dimenze zobrazeny vedle sebe + - datová položka určena lomenou čárou + - problémy + - obvykle nezbytné mít různá měřítka + - anomálie v datech snadno viditelné + - čitelnost klesá s počtem dimenzí (možno zlepšit např. blendingem) + - vhodné pro + - hledání souvislostí ve vícerozměrných datech + - pochopení důsledků rozhodnutí + - nevhodné pro ty, kteří graf neumí číst + - interaktivní tabulkou s informačními čočkami + - vhodné pro velký počet datových položek + - maximální počet dimenzí: desítky + - data uspořádaná do tabulky (dimenze ve sloupcích) + - vyžaduje interaktivitu + - vizuální náhledy + - rozbalení detailů + - řazení dat podle sloupce + - číselné hodnoty jako u spoupcového grafu + - nečíselné hodnoty + - ignorovat, barevný kód, tilebar + - anomálie snadno viditelné + +## Vizualizace grafů + +- mnoho závislostí lze znázornit grafem +- příklady + - odkud kam tečou data na internetu + - moji přátelé a přátelé přátel na FB + - s kým kdo publikoval nějaký článek + - podrobnosti mezi odevzdanými SP + - jaké jsou návaznosti slov v textu + +**Uzly** +- tvar a velikost prvku +- výplň (barva) prvku +- popisek +- ohodnocení uzlu + - barva, velikost, popisek +**Hrany** +- barva +- tloušťka čáry +- styl čáry +- popisek +- ohodnocení hrany + - barva, tloušťka, popisek + +**Problémy** +- každý uzel musí být viditelný +- pro každý uzel lze spočítat jeho stupeň +- lze bezpečně sledovat spojnici (nekříží se moc) +- skupiny obdobných dat jsou u sebe ++ neexistuje univerzální řešení + +**Kruhové rozložení** +- uzly leží na kružnici +- spojnice uvnitř kružnice +- nejjednodušší možné +- plýtvání místem + +**Ortogonální rozložení** +- neprotínající se spojnice pouze ve směru x, y +- snaha minimalizovat počet ohybů spojnice +- vhodné pro zobrazení elektrických obvodů + +**Obecné rozložení** +- algoritmický problém + +Grafy mohou mít 100 a více uzlů +- obvykle nelze zobrazit vše +- řešení + - zobrazení po částech + - zobrazí se jen primární zájem a jeho okolí + - uživatel může primární zájem měnit + - lze interaktivně připravit a poté vytisknout + - nejsou vidět souvislosti + - shlukování hran + - hrany vedoucí podobným směrem nahrazeny v části společnou hranou + - seskupování uzlů + - příbuzné uzly nahrazeny jedním + - uživatel může skupinu interaktivně rozbalit + - souvislosti na vyšší úrovni patrné + - interaktivní čočka + - graf zobrazen se všemi uzly v malém měřítku + - uživatel si část grafu zvětší + - informace musí být k dispozici i ve zmenšené podobě + - uzel minimálně 1px + - méně významné hrany nemusí být viditelné + +**Detail vizualizace** +- různé možnosti zvětšení detailu + - nahrazení obsahu + - nejjednodušší + - zobrazím jen vybranou část + - ztrácí se kontext + - koordinovaná dvojice + - zobrazení náhledu celku s vyznačením oblasti zájmu + - čočka (lupa) + - náhled na pozadí + - detail v místě čočky + - návaznosti ztraceny + - rybí oko + - prostor okolo bozdu zájmu zdeformován + - návaznosti patrné, ale zdeformované + +### Hierarchie + +- orientovaný graf bez smyček +- do uzlu se lze dostat právě z jednoho jiného uzlu +- rodokmen, adresářová struktura, OOP třídy, ... + +**Umožňuje speciální rozložení** ++ vertikální rozložení po úrovních + - kořen stromu nahoře vlevo + - uzly stejné úrovně umístěny pod sebou + - velmi jednoduchá reprezentace, vhodné pro vyhledávání + - pochopení problematické +- horizontální rozložení po úrovních + - kořen stromu nahoře + - uzly stejně daleko od kořene na stejné hotizonální přímce + - lepší pro pochopení struktury, složitější rozložení + - **nejjednodušší umisťovací algoritmus** + 1. fáze = pro každý uzel zjisti šířku jeho podstromů + 2. fáze = zobraz uhel, spočitej pozice podstromů, zobraz spojnice, rekurzivně pokračuj + - problém: šířka roste rychle, není efektivní pro nevyvážené stromy + - **Reingold-Tilford** + - sofistikovanější dvoufázový algoritmus + 1. fáze + - postupuji zdola nahoru, posouvám uzel pravého podstromu doleva + - rodič vycentrován nad děti + 2. fáze + - postupuji shora dolů + - zobrazuji uzly dle vypočítaného posunu ++ **TreeMap** + - uzlům stromu přiřazena číselná hodnota + - uzly vyplní celý prostor + - velikost uzlu dána přirozenou číselnou hodnotou + - snadno rozšiřitelné (různé barvy, interaktivita, další dimenze) \ No newline at end of file