Recently in Theorie Category

Een grafiek kan relaties tussen voorwerpen in beeld brengen. Het kan een verzameling knopen en lijnen die paren verbinden in beeld brengen. Een voorbeeld:
333px-6n-graf.svg.png

Deze manier wordt bijvoorbeeld gebruikt bij het in beeld brengen van sociale netwerken, bij het schetsen van elektrische schema's en in de cartografie. Je kunt hiermee ook database modellen in kaart brengen. We zetten bijvoorbeeld Django modellen met behulp van Python om naar Graphviz DOT files. GraphViz (= Graph Visualization Software) is [simpel gesteld] de software die gebruikt maakt van de DOT taal om wiskundige berekeningen te visualiseren.

Het brengt de onderliggende relaties prachtig in beeld:
DjangoGraphViz.png

Meer informatie:
~ Converting Django models into Graphviz DOT files
~ Graphviz - Graph Visualization Software
~ Django extensie: GraphModels

De kracht van een data visualisatie

Een bak cijfers vertalen naar een visuele weergave kan ervoor zorgen dat statistische data beter gecommuniceerd wordt. Grafieken zijn zoals Tufte (1997), een bekende auteur op het gebied van analytisch ontwerp, zegt 'instruments for reasoning'. Voordat het zover is zullen echter eerst een paar stappen genomen moeten worden. Ervan uitgaande dat de bak met data al verzameld is moet er gekeken worden welke cijfers met elkaar in verband kunnen worden gebracht. Is er een ontwikkeling in tijd, zijn er verschillen, is er een stijgende of dalende lijn in te ontdekken etcetra. Door deze data te rangschikken en te ordenen kunnen deze patronen zichtbaar gemaakt worden. Ontwikkelingen, schommelingen hierin, de frequentie hiervan, onderlinge relaties en een totaaloverzicht kunnen in beeld gebracht worden.

Data moet, volgens Tufte (1997), zo in beeld gebracht worden dat

  • vergelijkingen (het vergelijken van 2 of meer variabelen),
  • verspreidingen (hoe vaak verschillende waardes van één of meer variabelen voorkomen),
  • samenstellingen,
  • ontwikkelingen (variabelen door de tijd heen) en
  • onderliggende relaties zichtbaar gemaakt kunnen worden.

Dr. Andrew V. Abela (2006), een professor in marketing en marktonderzoek aan de Catholic University of America in Washington, gaat uit van 4 mogelijkheden: vergelijkingen, onderliggende relaties, verspreidingen en samenstellingen. Visueel is dit te zien in zijne 'Chart Suggestions--A Thought-Starter'.

ChartSuggestions.jpg

Dit artikel is een kort overzicht van een paar hoogtepunten uit de geschiedenis. Het is een samenvatting van alle artikelen die al eerder door mij gepubliceerd zijn op deze blog. En is bedoeld als een summier maar compleet overzicht met onderstaande conclusie als resultaat:

Conclusie

Wanneer je de ontwikkelingen in datavisualisatie vergelijkt met die van de maatschappij zie je dat er vooral grote ontwikkelingen op het gebied van data visualisatie plaats vonden vlak na grote overgangen in de maatschappij.

Vlak na het industriële tijdperk bijvoorbeeld, eind 18e - begin 19e eeuw, was er een enorme opbloei van data visualisatie.

En sinds het post-industriële tijdperk de opkomst van de personal computer (In 1983 introduceerde IBM zijn eerste Personal Computer in Nederland.) zie je een toename de verschillende visualisatie technieken (wordclouds, treemaps, spreadplots).

Vandaag de dag volgen zowel de technologische als maatschappelijk ontwikkelingen elkaar in hoog tempo op. Computers worden steeds sneller, hebben steeds meer rekenkracht om ingewikkelde berekeningen uit te voeren. Het delen van informatie, het participeren hierin, rijke internet applicaties is steeds meer een gemeengoed. Het valt buiten de scope van mijn artikel om in te gaan op de huidige enorme technologische ontwikkeling maar het zal zeker van grote invloed zijn op de datavisualisatie en het presenteren van gegevens. Het is een goed moment om nu te gaan kijken naar de nieuwe mogelijkheden.

Een 'design pattern' is een systematische beschrijving over een optimale toepassing van vaardigheden. Uitgangspunt is altijd de meest effectieve oplossing uit de praktijk waardoor er minder complicaties bij de uiteindelijke implementaties zullen zijn.

Deze manier van beschrijven is ontwikkeld door de architect Christopher Alexander. Hij ontwikkelde een ontwerpmethode voor architecten en stedenbouwkundigen en beschreef deze in 1977 in zijn boek 'A Pattern Language: Towns, Buildings, Construction'.
In 1994 hoorde ik voor het eerst over design patterns op de @Home conferentie van Doors of Perception.
En sinds ongeveer 2000 volg ik de groei Martijn van Welie's 'A Pattern Library for Interaction Design' nauwgezet. In de loop van de tijd zijn daar ook de Design Pattern Library van Yahoo en het Web Patterns Project van U.C. Berkeley School of Information bijgekomen.

Een pattern bestaat ruwweg uit:

  • naam
  • probleem dat het patroon oplost
  • synoniemen
  • probleemomschrijving (voorbeeld wanneer patroon de oplossing zou kunnen zijn)
  • context waarop het patroon van toepassing is
  • structuur van het patroon
  • implementatie van het patroon
  • voorbeeld
  • voorbeelden gerelateerde patronen

De InfoDesign site heeft een mooie verzameling links naar relevante informatie over patterns op het web!

Nu heeft Christian Behrens als bijlage bij zijn master thesis 'The Form of Facts and Figures' een website 'Information Design Patterns' ontwikkeld waarin hij design patronen voor het visualiseren van informatie omschrijft.

skitched-20080520-114250.png

vdqi_bookcover.gif Als het goed is wordt dit het laatste artikel dat zijn oorsprong heeft in Tufte's klassieke boek 'The visual display of quantitative information'. Niet zonder spijt want het is een prachtig gebonden boek van mooie lithografische kwaliteit vol zorgvuldig gerangschikte afbeeldingen. En de grondigheid waarmee hij zijn kennis met voorbeelden omschrijft en laat zien is zeer aangenaam.

... Theory and practice in the design of data graphics, 250 illustrations of the best (and a few of the worst) statistical graphics, with detailed analysis of how to display data for precise, effective, quick analysis. ...

Tufte verdeeld het onderdeel 'theorie van grafische data visualisatie' in 5 onderdelen.

  1. Data-inkt en grafische restyling.
  2. Chart-junk: vibraties, grids en eenden.
  3. Data-inkt maximalisatie en grafische vormgeving.
  4. Multifunctionele grafische elementen.
  5. Data dichtheid en kleine veelvouden.
  6. Esthetiek en techniek in grafische data visualisatie.

'Graphical integrity' kenmerkt zich, volgens Tufte, door een zestal principes:

  1. Zorg dat de weergave van nummers, zoals daadwerkelijk gemeten binnen een grafiek, moeten gelijk zijn aan de gevisualiseerde numerieke hoeveelheden.
  2. Gebruik heldere, grondige en gedetailleerde etikettering, om grafische vervorming en dubbelzinnigheid te voorkomen.
  3. Toon variatie in data, niet in het ontwerp.
  4. Geef geld in tijdslijnen gecorrigeerd voor inflatie en in standaardeenheden weer. Dat is veelal beter dan een nominale weergave van het geld.
  5. Gebruik geen twee of driedimensionele weergave om eendimensionele data te visualiseren. Het aantal getoonde informatie-dragende dimensies mag niet het aantal dimensies in gegevens overschrijden.
  6. Laat geen data zien die buiten de context vallen.

Bij het communiceren van complexe kwantitatieve ideeën zijn er vier basisvormen te onderscheiden:

  1. data kaarten,
  2. tijdsreeksen,
  3. plaats-tijd narrative ontwerpen en
  4. relationele grafieken.

Tabellen zijn taaie kost, een rauwe opsomming van getallen. De visualisatie van de gegevens moeten 'het oog aanmoedigen' om deze data te interpreteren'. Tufte zegt dat grafische weergaven meerder functies hebben. Ze moeten

  • de data tonen;
  • voorkomen dat data vervormd wordt weergegeven of geïnterpreteerd;
  • een grote hoeveelheid cijfers op een beperkt oppervlak weergeven;
  • een coherent geheel maken van de omvangrijke data sets;
  • het oog uitnodigen om de verschillende brokken data met elkaar te vergelijken;
  • de data op verschillende niveaus onthullen, van een breed overzicht tot in het kleinste detail;
  • een duidelijke doel dienen: beschrijving, exploratie, tabuleren of decoratie;
  • nauw verweven zijn met de statistische en verbale beschrijvingen van de data set.

Uit voorgaande twee artikelen 'Subjectieve bewijsvoering' en 'De 4 grondbeginselen van een grafiek' blijkt dat wanneer de weergave van gegevens waar en onthullend moet zijn de logica van het ontwerp de logica van de analyse moet reflecteren. De juiste en rationele opeenvolging van oorzaak en gevolg moet zowel in het ontwerp als in de analyse van de data gelijk zijn. Tufte zegt hierover

Visual representation of evidence should be governed by principles of reasoning about quantitative evidence. For information displays, design reasoning must correspond to scientific reasoning. Clear and precise seeing becomes as one with clear and precise thinking.

Het principe van gecontroleerde vergelijkingen dicteert tegelijkertijd de constructie van de weergave van gegevens en schrijft voor hoe de inkt of de pixels van een grafiek zo geordend moeten worden dat context en vergelijkingen direct weerspiegeld worden. De kwaliteit van de vormgeving komt voort uit de intellectuele kwaliteit. Bovengenoemde tweeledige principes, nodig voor zowel het beredeneren van statistische bewijsvoering als voor het ontwerpen van statistische grafieken, omvatten

  1. het documenteren van bronnen en van de karakteristieken van de data,
  2. het doorlopend afdwingen van de meest geschikte vergelijkingen,
  3. het demonstreren van mechanismen van oorzaak en gevolg,
  4. deze mechanismen kwantitatief in beeld brengen,
  5. het herkennen van de inherent zijnde multivariate natuur van analytische problemen en
  6. het inspecteren en evalueren van alternatieve verklaringen.

Weergaven van informatie moeten, mits een correcte weerspiegeling van inhoud en kern van de zaak,

  • documentair,
  • de oorzaak insluitend en verklarend,
  • vergelijkend,
  • in hoeveelheden uitgedrukt,
  • multivariate [1] en
  • verklarend zijn.

Bron
Visual Explanations: Images and Quantities, Evidence and Narrative, Edward Tufte, Graphic Press, 1997. Bladzijde 53, Conclusion: Thinking and design.

[1] Defintie multivariate analyse
Verzamelnaam voor een aantal analysetechnieken die ontworpen zijn om de aard en de mate van samenhang tussen een groot aantal waarnemingen te beschrijven.
Meer algemene term: analyse, analysetechnieken. Meer specifieke term: factoranalyse. Rubriek: S24.2 wetenschappelijk onderzoek. Gevonden op thesauruszorgenwelzijn.nl

visex_bookcover.gif Op 28 januari 1986 explodeerde de Challenger door een lekkende O-ring. Onderzoek na de ramp liet zien dat dit veroorzaakt werd door een lekkende O-ring. Ingenieurs hadden de dag voor de lancering data overlegd aan de beslissingnemers dat hun advies moest onderstrepen, de dag van de lanchering zou te koud zijn om de Challenger te lanceren. Terwijl het Snow juist door de visualisatie lukte om iedereen te overtuigen ging het hier mis. Daar zijn zeker meerdere redenen dan alleen de visualisaties voor aan te wijzen. Edward Tufte concentreert zich in zijn boek 'Visual Explanations: Images and Quantities, Evidence and Narrative' vooral op de visualisatie van de data tijdens het onderzoek wat volgde na de ramp.

Hieruit komen vier principes naar voren.

De keuze voor een visualisatie optie bepaald de uiteindelijke interpretatie van de data. Neem bijvoorbeeld de kaart visualisatie van John Snow. Door het weergeven van de sterfgevallen door cholera op een kaart van London kon hij inzichtelijk maken dat een waterbron in Broad Street de mogelijke bron van besmetting was. Op zich een knap stukje werk want men had toendertijd geen inzicht in de manier waarop de ziekte werd overgebracht.

  1. Gegevensdragers bijvoorbeeld de kolommen in een staafdiagram of de cirkels in een belgrafiek.
  2. Ordeningsonderdelen bijvoorbeeld de assen, rasterlijnen of stramien.
  3. Tekst zoals titel, bijschriften, bronvermelding en legenda.

Soms komen daar de ondersteunende onderdelen zoals bijvoorbeeld de achtergrond of het kader nog bij.

Om zinvolle informatie in geordende data zichtbaar te maken kunnen deze met elkaar in verband worden gebracht. Je kunt dit doen door bijvoorbeeld het gemiddelde uit te rekenen, door het in groepen in te delen, door vergelijkingen of door verbanden te leggen. Denk hierbij aan de categorieën geografisch weer te geven (de cholera visualisatie van Snow). De statistiek kan laten zien of deze combinaties ook tot een conclusie kunnen leiden. Hiervoor kan geput worden uit een enorm aantal visualisatie mogelijkheden.

Zijn naam duikt op op de meest onverwachte momenten. Als mede-initiatiefnemer van Ted [1], auteur [2], vormgever, bedenker van de term 'informatie architect'. en als architect.

Ik hoorde, als beginnend vormgever, voor het eerst over Richard Saul Wurman bij een opdracht tot het ontwerpen van formulieren voor een grote organisatie. Een senior collega gaf mij vijf mogelijkheden om te starten met orde te brengen in de berg van informatie die op mijn bureau lag. Als houvast vertelde hij over het LATCH principe.

  1. Location
  2. Alphabetical
  3. Time
  4. Category
  5. Hierarchy

Een bak cijfers vertalen naar een visuele weergave kan ervoor zorgen dat statistische data beter gecommuniceerd wordt. Grafieken zijn zoals Tufte, een bekende auteur op het gebied van analytisch ontwerp, zegt 'instruments for reasoning' [1]. Voordat het zover is zullen echter eerst een paar stappen genomen moeten worden. Ervan uitgaande dat de bak met data al verzameld is moet er gekeken worden welke cijfers met elkaar in verband kunnen worden gebracht. Is er een ontwikkeling in tijd, zijn er verschillen, is er een stijgende of dalende lijn in te ontdekken etcetra. Door deze data te rangschikken en te ordenen kunnen deze patronen zichtbaar gemaakt worden. Ontwikkelingen, schommelingen hierin, de frequentie hiervan, onderlinge relaties en een totaaloverzicht kunnen in beeld gebracht worden.

Archief

Over dit archief

Deze pagina is het archief met recente berichten uit de Theorie categorie.

Historie is de vorige categorie.

Lees recente content in de linker kolom of blader door het archief om alle content te vinden.

www.flickr.com
This is a Flickr badge showing public photos and videos from Amsterdam, statistisch bekeken. Make your own badge here.
Creative Commons License
This weblog is licensed under a Creative Commons License.
Powered by Movable Type 4.21-en