Poznámky ze 7. prezentace z UPG

This commit is contained in:
Filip Znachor 2023-05-25 10:44:03 +02:00
parent 79f4393874
commit fcb7778f99

View file

@ -0,0 +1,237 @@
# Pokročilá vizualizace informace
## Vizualizace dokumentů
- dokumenty jsou primárním zdrojem informací
- snadný přístup: digitální knihovny, webové stránky, ...
- vizualizace může pomoci usnadnit získávání informací z textů a kolekcí dokumentů
- požadavky
- jaké dokumenty obsahují XYZ?
- jaké dokumenty jsou pro mne zajímavé?
- existují dokumenty podobné tomuto?
- co je skryto v této kolekci dokumentů?
- jaké jsou spojitosti mezi dokumenty?
**Vyhledávání dokumentů**
- neznáme
- jak velké je shoda
- jak často se výraz v dokumentu opakuje
- kde se nachází
- délku dokumentu
**Hotmap**
- Hoeber & Yang, 2006
- barevná sekvence podle četnosti výskytu slova výrazu v dokumentu
- žlutá až červená
- postranní náhled
**Tilebar**
- Anderson et al., 2002
- dokument rosekán na bloky
- pro každý stanovena četnost výskytu hledaného výrazu
- vizualizace kvantizovaných četností
**Document cards**
- Strobelt et al., 2009
- vizuální reprezentace dokumentu
- klíčové části textu a obrázky extrahovány
- extrahovaný obsah zobrazen v náhledu
- podpora interaktivního procházení
**Tags cloud**
- někdy nevíme, jaká klíčová slova volit
- tags = klíčová slova přiřazená ručně dokumentům, obrázkům, zboží, ...
- seznam tagů souvisejících alespoň s jedním zadaným klíčovým slovem nabídnut uživateli
- nabídka může být seřazena
- podle četnosti - vyžaduje sekvenční hledání tagu
- abecedně - chybí četnost
- alternativní vizuální řešení
- položky seřazeny abecedně
- velikost písma, tloušťka a barva podle popularity
- může být použit k prozkoumání převažující náplně dokumentů
## Vizualizace pracovních postupů
- vizualizace grafu bez smyček
- uzel = dílčí činnost
- hrana = návaznosti činnosti
- vhodné pro řízení projektů
**Ganttův graf**
- činnosti zobrazeny typicky pod sebou na ose y
- trvání činnosti zobrazeno sloupcem na ose x
- barva sloupce může vystihovat další dimenzi (typ činnosti, barevný kód osoby, ...)
- jednoduše pochopitelný
- nemusí obsahovat dostatek informací pro důležitá rozhodnutí
**Pertův graf**
- graf činností s vyznačením kritické cesty
- kritická cesta = zpoždení činnosti na této cestě povede ke zpoždění celku
**Montážní postupy**
- zvláštní případ pracovního postupu
- manuál obsahuje
- seznam všech částí
- vizualizaci tvaru každé části a popisek
- vztah částí vůči sobě
- vizualizace montážních postupů není jednoduchá
- možné řešení
- vymodelované 3D objekty
- exploze objektů tak, aby se nezakrývaly
- doplnit popisky
## Vícerozměrná data
- datová položka má často mnoho dimenzí
- např.
- množství cukrů, tuků, vitamínů B12, C, D, E, K
- počet zaměstnanců firem na pozicích: ...
- geografická poloha kina, datum, teplota veknu, počet návštěvníků, film, cena vstupenky
- možnosti vizualizace
- grafem v kartézských souřadnicích po dvojicích
- projekce dat do 2D prostoru (další 3 dimenze barvou, tvarem, velikostí značek)
- obvykle potřeba více grafů
- pro mnoho dimenzí nepřehledné
- grafem typu radar
- lze znázornit velké množství dimenzí naráz
- datová položka určena svým polygonem
- složitější porovnání nesousedících hodnot
- grafem v paralelních souřadnicích
- jednotlivé dimenze zobrazeny vedle sebe
- datová položka určena lomenou čárou
- problémy
- obvykle nezbytné mít různá měřítka
- anomálie v datech snadno viditelné
- čitelnost klesá s počtem dimenzí (možno zlepšit např. blendingem)
- vhodné pro
- hledání souvislostí ve vícerozměrných datech
- pochopení důsledků rozhodnutí
- nevhodné pro ty, kteří graf neumí číst
- interaktivní tabulkou s informačními čočkami
- vhodné pro velký počet datových položek
- maximální počet dimenzí: desítky
- data uspořádaná do tabulky (dimenze ve sloupcích)
- vyžaduje interaktivitu
- vizuální náhledy
- rozbalení detailů
- řazení dat podle sloupce
- číselné hodnoty jako u spoupcového grafu
- nečíselné hodnoty
- ignorovat, barevný kód, tilebar
- anomálie snadno viditelné
## Vizualizace grafů
- mnoho závislostí lze znázornit grafem
- příklady
- odkud kam tečou data na internetu
- moji přátelé a přátelé přátel na FB
- s kým kdo publikoval nějaký článek
- podrobnosti mezi odevzdanými SP
- jaké jsou návaznosti slov v textu
**Uzly**
- tvar a velikost prvku
- výplň (barva) prvku
- popisek
- ohodnocení uzlu
- barva, velikost, popisek
**Hrany**
- barva
- tloušťka čáry
- styl čáry
- popisek
- ohodnocení hrany
- barva, tloušťka, popisek
**Problémy**
- každý uzel musí být viditelný
- pro každý uzel lze spočítat jeho stupeň
- lze bezpečně sledovat spojnici (nekříží se moc)
- skupiny obdobných dat jsou u sebe
+ neexistuje univerzální řešení
**Kruhové rozložení**
- uzly leží na kružnici
- spojnice uvnitř kružnice
- nejjednodušší možné
- plýtvání místem
**Ortogonální rozložení**
- neprotínající se spojnice pouze ve směru x, y
- snaha minimalizovat počet ohybů spojnice
- vhodné pro zobrazení elektrických obvodů
**Obecné rozložení**
- algoritmický problém
Grafy mohou mít 100 a více uzlů
- obvykle nelze zobrazit vše
- řešení
- zobrazení po částech
- zobrazí se jen primární zájem a jeho okolí
- uživatel může primární zájem měnit
- lze interaktivně připravit a poté vytisknout
- nejsou vidět souvislosti
- shlukování hran
- hrany vedoucí podobným směrem nahrazeny v části společnou hranou
- seskupování uzlů
- příbuzné uzly nahrazeny jedním
- uživatel může skupinu interaktivně rozbalit
- souvislosti na vyšší úrovni patrné
- interaktivní čočka
- graf zobrazen se všemi uzly v malém měřítku
- uživatel si část grafu zvětší
- informace musí být k dispozici i ve zmenšené podobě
- uzel minimálně 1px
- méně významné hrany nemusí být viditelné
**Detail vizualizace**
- různé možnosti zvětšení detailu
- nahrazení obsahu
- nejjednodušší
- zobrazím jen vybranou část
- ztrácí se kontext
- koordinovaná dvojice
- zobrazení náhledu celku s vyznačením oblasti zájmu
- čočka (lupa)
- náhled na pozadí
- detail v místě čočky
- návaznosti ztraceny
- rybí oko
- prostor okolo bozdu zájmu zdeformován
- návaznosti patrné, ale zdeformované
### Hierarchie
- orientovaný graf bez smyček
- do uzlu se lze dostat právě z jednoho jiného uzlu
- rodokmen, adresářová struktura, OOP třídy, ...
**Umožňuje speciální rozložení**
+ vertikální rozložení po úrovních
- kořen stromu nahoře vlevo
- uzly stejné úrovně umístěny pod sebou
- velmi jednoduchá reprezentace, vhodné pro vyhledávání
- pochopení problematické
- horizontální rozložení po úrovních
- kořen stromu nahoře
- uzly stejně daleko od kořene na stejné hotizonální přímce
- lepší pro pochopení struktury, složitější rozložení
- **nejjednodušší umisťovací algoritmus**
1. fáze = pro každý uzel zjisti šířku jeho podstromů
2. fáze = zobraz uhel, spočitej pozice podstromů, zobraz spojnice, rekurzivně pokračuj
- problém: šířka roste rychle, není efektivní pro nevyvážené stromy
- **Reingold-Tilford**
- sofistikovanější dvoufázový algoritmus
1. fáze
- postupuji zdola nahoru, posouvám uzel pravého podstromu doleva
- rodič vycentrován nad děti
2. fáze
- postupuji shora dolů
- zobrazuji uzly dle vypočítaného posunu
+ **TreeMap**
- uzlům stromu přiřazena číselná hodnota
- uzly vyplní celý prostor
- velikost uzlu dána přirozenou číselnou hodnotou
- snadno rozšiřitelné (různé barvy, interaktivita, další dimenze)