FAV-ZCU/KIV UPG/07. Pokročilá vizualizace informace.md

7.9 KiB

Pokročilá vizualizace informace

Vizualizace dokumentů

  • dokumenty jsou primárním zdrojem informací
  • snadný přístup: digitální knihovny, webové stránky, ...
  • vizualizace může pomoci usnadnit získávání informací z textů a kolekcí dokumentů
  • požadavky
    • jaké dokumenty obsahují XYZ?
    • jaké dokumenty jsou pro mne zajímavé?
    • existují dokumenty podobné tomuto?
    • co je skryto v této kolekci dokumentů?
    • jaké jsou spojitosti mezi dokumenty?

Vyhledávání dokumentů

  • neznáme
    • jak velké je shoda
    • jak často se výraz v dokumentu opakuje
    • kde se nachází
    • délku dokumentu

Hotmap

  • Hoeber & Yang, 2006
  • barevná sekvence podle četnosti výskytu slova výrazu v dokumentu
    • žlutá až červená
  • postranní náhled

Tilebar

  • Anderson et al., 2002
  • dokument rosekán na bloky
  • pro každý stanovena četnost výskytu hledaného výrazu
  • vizualizace kvantizovaných četností

Document cards

  • Strobelt et al., 2009
  • vizuální reprezentace dokumentu
  • klíčové části textu a obrázky extrahovány
  • extrahovaný obsah zobrazen v náhledu
  • podpora interaktivního procházení

Tags cloud

  • někdy nevíme, jaká klíčová slova volit
  • tags = klíčová slova přiřazená ručně dokumentům, obrázkům, zboží, ...
  • seznam tagů souvisejících alespoň s jedním zadaným klíčovým slovem nabídnut uživateli
  • nabídka může být seřazena
    • podle četnosti - vyžaduje sekvenční hledání tagu
    • abecedně - chybí četnost
  • alternativní vizuální řešení
    • položky seřazeny abecedně
    • velikost písma, tloušťka a barva podle popularity
  • může být použit k prozkoumání převažující náplně dokumentů

Vizualizace pracovních postupů

  • vizualizace grafu bez smyček
  • uzel = dílčí činnost
  • hrana = návaznosti činnosti
  • vhodné pro řízení projektů

Ganttův graf

  • činnosti zobrazeny typicky pod sebou na ose y
  • trvání činnosti zobrazeno sloupcem na ose x
  • barva sloupce může vystihovat další dimenzi (typ činnosti, barevný kód osoby, ...)
  • jednoduše pochopitelný
  • nemusí obsahovat dostatek informací pro důležitá rozhodnutí

Pertův graf

  • graf činností s vyznačením kritické cesty
  • kritická cesta = zpoždení činnosti na této cestě povede ke zpoždění celku

Montážní postupy

  • zvláštní případ pracovního postupu
  • manuál obsahuje
    • seznam všech částí
    • vizualizaci tvaru každé části a popisek
    • vztah částí vůči sobě
  • vizualizace montážních postupů není jednoduchá
  • možné řešení
    • vymodelované 3D objekty
    • exploze objektů tak, aby se nezakrývaly
    • doplnit popisky

Vícerozměrná data

  • datová položka má často mnoho dimenzí
  • např.
    • množství cukrů, tuků, vitamínů B12, C, D, E, K
    • počet zaměstnanců firem na pozicích: ...
    • geografická poloha kina, datum, teplota veknu, počet návštěvníků, film, cena vstupenky
  • možnosti vizualizace
    • grafem v kartézských souřadnicích po dvojicích
      • projekce dat do 2D prostoru (další 3 dimenze barvou, tvarem, velikostí značek)
      • obvykle potřeba více grafů
      • pro mnoho dimenzí nepřehledné
    • grafem typu radar
      • lze znázornit velké množství dimenzí naráz
      • datová položka určena svým polygonem
      • složitější porovnání nesousedících hodnot
    • grafem v paralelních souřadnicích
      • jednotlivé dimenze zobrazeny vedle sebe
      • datová položka určena lomenou čárou
      • problémy
        • obvykle nezbytné mít různá měřítka
        • anomálie v datech snadno viditelné
        • čitelnost klesá s počtem dimenzí (možno zlepšit např. blendingem)
      • vhodné pro
        • hledání souvislostí ve vícerozměrných datech
        • pochopení důsledků rozhodnutí
      • nevhodné pro ty, kteří graf neumí číst
    • interaktivní tabulkou s informačními čočkami
      • vhodné pro velký počet datových položek
      • maximální počet dimenzí: desítky
      • data uspořádaná do tabulky (dimenze ve sloupcích)
      • vyžaduje interaktivitu
        • vizuální náhledy
        • rozbalení detailů
        • řazení dat podle sloupce
      • číselné hodnoty jako u spoupcového grafu
      • nečíselné hodnoty
        • ignorovat, barevný kód, tilebar
      • anomálie snadno viditelné

Vizualizace grafů

  • mnoho závislostí lze znázornit grafem
  • příklady
    • odkud kam tečou data na internetu
    • moji přátelé a přátelé přátel na FB
    • s kým kdo publikoval nějaký článek
    • podrobnosti mezi odevzdanými SP
    • jaké jsou návaznosti slov v textu

Uzly

  • tvar a velikost prvku
  • výplň (barva) prvku
  • popisek
  • ohodnocení uzlu
    • barva, velikost, popisek Hrany
  • barva
  • tloušťka čáry
  • styl čáry
  • popisek
  • ohodnocení hrany
    • barva, tloušťka, popisek

Problémy

  • každý uzel musí být viditelný
  • pro každý uzel lze spočítat jeho stupeň
  • lze bezpečně sledovat spojnici (nekříží se moc)
  • skupiny obdobných dat jsou u sebe
  • neexistuje univerzální řešení

Kruhové rozložení

  • uzly leží na kružnici
  • spojnice uvnitř kružnice
  • nejjednodušší možné
  • plýtvání místem

Ortogonální rozložení

  • neprotínající se spojnice pouze ve směru x, y
  • snaha minimalizovat počet ohybů spojnice
  • vhodné pro zobrazení elektrických obvodů

Obecné rozložení

  • algoritmický problém

Grafy mohou mít 100 a více uzlů

  • obvykle nelze zobrazit vše
  • řešení
    • zobrazení po částech
      • zobrazí se jen primární zájem a jeho okolí
      • uživatel může primární zájem měnit
      • lze interaktivně připravit a poté vytisknout
      • nejsou vidět souvislosti
    • shlukování hran
      • hrany vedoucí podobným směrem nahrazeny v části společnou hranou
    • seskupování uzlů
      • příbuzné uzly nahrazeny jedním
      • uživatel může skupinu interaktivně rozbalit
      • souvislosti na vyšší úrovni patrné
    • interaktivní čočka
      • graf zobrazen se všemi uzly v malém měřítku
      • uživatel si část grafu zvětší
      • informace musí být k dispozici i ve zmenšené podobě
        • uzel minimálně 1px
        • méně významné hrany nemusí být viditelné

Detail vizualizace

  • různé možnosti zvětšení detailu
    • nahrazení obsahu
      • nejjednodušší
      • zobrazím jen vybranou část
      • ztrácí se kontext
    • koordinovaná dvojice
      • zobrazení náhledu celku s vyznačením oblasti zájmu
    • čočka (lupa)
      • náhled na pozadí
      • detail v místě čočky
      • návaznosti ztraceny
    • rybí oko
      • prostor okolo bozdu zájmu zdeformován
      • návaznosti patrné, ale zdeformované

Hierarchie

  • orientovaný graf bez smyček
  • do uzlu se lze dostat právě z jednoho jiného uzlu
  • rodokmen, adresářová struktura, OOP třídy, ...

Umožňuje speciální rozložení

  • vertikální rozložení po úrovních
    • kořen stromu nahoře vlevo
    • uzly stejné úrovně umístěny pod sebou
    • velmi jednoduchá reprezentace, vhodné pro vyhledávání
    • pochopení problematické
  • horizontální rozložení po úrovních
    • kořen stromu nahoře
    • uzly stejně daleko od kořene na stejné hotizonální přímce
    • lepší pro pochopení struktury, složitější rozložení
    • nejjednodušší umisťovací algoritmus
      1. fáze = pro každý uzel zjisti šířku jeho podstromů
      2. fáze = zobraz uhel, spočitej pozice podstromů, zobraz spojnice, rekurzivně pokračuj
      • problém: šířka roste rychle, není efektivní pro nevyvážené stromy
    • Reingold-Tilford
      • sofistikovanější dvoufázový algoritmus
      1. fáze
        • postupuji zdola nahoru, posouvám uzel pravého podstromu doleva
        • rodič vycentrován nad děti
      2. fáze
        • postupuji shora dolů
        • zobrazuji uzly dle vypočítaného posunu
  • TreeMap
    • uzlům stromu přiřazena číselná hodnota
    • uzly vyplní celý prostor
    • velikost uzlu dána přirozenou číselnou hodnotou
    • snadno rozšiřitelné (různé barvy, interaktivita, další dimenze)