Category Archives: Theorie

De 8 principes van analitisch ontwerpen volgens Tufte

Voor de opening van de tentoonstelling ‘Pen and Parchment – The Beautiful Evidence of Medieval Drawings’ in het Metropolitan Museum in de zomer van 2009 heeft Edward Tufte een lezing gegeven. Ook hier passeerden, aan de hand van onder andere de kaart ‘Tocht van Napoleon naar Moskou’ van Minard weer de 8 principes voor een analitische weergave van data:

  1. Zorg voor visuele vergelijkingen, zoek antwoorden op de vraag ‘vergeleken met wat?’
  2. Toon causaliteit, toon de betrekking van oorzaak en gevolg. Napoleon is verslagen door de winter, niet door de vijand.
  3. Toon multivariate (=meerdere variabelen, meerdere dimensies) data. De kaart van Minard toont meerdere variabelen: omvang van het leger, locatie van het leger op de kaart, richting, temperatuur, datums.
  4. Integreer woorden, nummers en afbeeldingen met elkaar. Laat het ene element het andere versterken en plaats ze niet onafhankelijk van elkaar op verschillende pagina’s.
  5. Documenteer alles en vertel erover.
  6. Bijna alles wat vormgegeven wordt hangt af van de kwaliteit, de relevantie en de integriteit van de inhoud. De kaart van Minard is ontwikkelt als een aanklacht tegen de oorlog. Om goed gehoord te worden moest zijn data volledig aansluiten op de boodschap die hij wilde vertellen. En daar schuilt ook direct het addertje onder het gras.
  7. Toon gerelateerde informatie naast elkaar in ruimte. Koppel de data visueel. Kies voor een goede ordening van de data.
  8. Maak indien nodig gebruik van kleine veelvouden. Dit zijn een serie van grafieken die bij een gelijkblijvende variable een andere, wisselende variable in kaart brengen.

Andere prachtige voorbeelden over data visualisatie kun je bekijken op Pen and Parchment: Drawing in the Middle Ages

Visualisaties van grafieken

Een grafiek kan relaties tussen voorwerpen in beeld brengen. Het kan een verzameling knopen en lijnen die paren verbinden in beeld brengen. Een voorbeeld:
333px-6n-graf.svg.png
Deze manier wordt bijvoorbeeld gebruikt bij het in beeld brengen van sociale netwerken, bij het schetsen van elektrische schema’s en in de cartografie. Je kunt hiermee ook database modellen in kaart brengen. We zetten bijvoorbeeld Django modellen met behulp van Python om naar Graphviz DOT files. GraphViz (= Graph Visualization Software) is [simpel gesteld] de software die gebruikt maakt van de DOT taal om wiskundige berekeningen te visualiseren.
Het brengt de onderliggende relaties prachtig in beeld:
DjangoGraphViz.png
Meer informatie:
~ Converting Django models into Graphviz DOT files
~ Graphviz – Graph Visualization Software
~ Django extensie: GraphModels

Data kaart

[samenvatting] De Tuftiaanse theorieën

De kracht van een data visualisatie

Een bak cijfers vertalen naar een visuele weergave kan ervoor zorgen dat statistische data beter gecommuniceerd wordt. Grafieken zijn zoals Tufte (1997), een bekende auteur op het gebied van analytisch ontwerp, zegt ‘instruments for reasoning’. Voordat het zover is zullen echter eerst een paar stappen genomen moeten worden. Ervan uitgaande dat de bak met data al verzameld is moet er gekeken worden welke cijfers met elkaar in verband kunnen worden gebracht. Is er een ontwikkeling in tijd, zijn er verschillen, is er een stijgende of dalende lijn in te ontdekken etcetra. Door deze data te rangschikken en te ordenen kunnen deze patronen zichtbaar gemaakt worden. Ontwikkelingen, schommelingen hierin, de frequentie hiervan, onderlinge relaties en een totaaloverzicht kunnen in beeld gebracht worden.
Data moet, volgens Tufte (1997), zo in beeld gebracht worden dat

  • vergelijkingen (het vergelijken van 2 of meer variabelen),
  • verspreidingen (hoe vaak verschillende waardes van één of meer variabelen voorkomen),
  • samenstellingen,
  • ontwikkelingen (variabelen door de tijd heen) en
  • onderliggende relaties zichtbaar gemaakt kunnen worden.

Dr. Andrew V. Abela (2006), een professor in marketing en marktonderzoek aan de Catholic University of America in Washington, gaat uit van 4 mogelijkheden: vergelijkingen, onderliggende relaties, verspreidingen en samenstellingen. Visueel is dit te zien in zijne ‘Chart Suggestions–A Thought-Starter‘.
ChartSuggestions.jpg

Continue reading

defourcroy3

De geschiedenis van data visualisatie in vogelvlucht

Dit artikel is een kort overzicht van een paar hoogtepunten uit de geschiedenis. Het is een samenvatting van alle artikelen die al eerder door mij gepubliceerd zijn op deze blog. En is bedoeld als een summier maar compleet overzicht met onderstaande conclusie als resultaat:

Conclusie

Wanneer je de ontwikkelingen in datavisualisatie vergelijkt met die van de maatschappij zie je dat er vooral grote ontwikkelingen op het gebied van data visualisatie plaats vonden vlak na grote overgangen in de maatschappij.
Vlak na het industriële tijdperk bijvoorbeeld, eind 18e – begin 19e eeuw, was er een enorme opbloei van data visualisatie.

Patronen voor informatie ontwerp

Een ‘design pattern’ is een systematische beschrijving over een optimale toepassing van vaardigheden. Uitgangspunt is altijd de meest effectieve oplossing uit de praktijk waardoor er minder complicaties bij de uiteindelijke implementaties zullen zijn.
Deze manier van beschrijven is ontwikkeld door de architect Christopher Alexander. Hij ontwikkelde een ontwerpmethode voor architecten en stedenbouwkundigen en beschreef deze in 1977 in zijn boek ‘A Pattern Language: Towns, Buildings, Construction‘.
In 1994 hoorde ik voor het eerst over design patterns op de @Home conferentie van Doors of Perception.
En sinds ongeveer 2000 volg ik de groei Martijn van Welie’s ‘A Pattern Library for Interaction Design‘ nauwgezet. In de loop van de tijd zijn daar ook de Design Pattern Library van Yahoo en het Web Patterns Project van U.C. Berkeley School of Information bijgekomen.
Een pattern bestaat ruwweg uit:

  • naam
  • probleem dat het patroon oplost
  • synoniemen
  • probleemomschrijving (voorbeeld wanneer patroon de oplossing zou kunnen zijn)
  • context waarop het patroon van toepassing is
  • structuur van het patroon
  • implementatie van het patroon
  • voorbeeld
  • voorbeelden gerelateerde patronen

De InfoDesign site heeft een mooie verzameling links naar relevante informatie over patterns op het web!
Nu heeft Christian Behrens als bijlage bij zijn master thesis ‘The Form of Facts and Figures’ een website ‘Information Design Patterns‘ ontwikkeld waarin hij design patronen voor het visualiseren van informatie omschrijft.
skitched-20080520-114250.png

databasedgrid

De theorie van grafische data visualisatie

vdqi_bookcover.gif Als het goed is wordt dit het laatste artikel dat zijn oorsprong heeft in Tufte’s klassieke boek ‘The visual display of quantitative information‘. Niet zonder spijt want het is een prachtig gebonden boek van mooie lithografische kwaliteit vol zorgvuldig gerangschikte afbeeldingen. En de grondigheid waarmee hij zijn kennis met voorbeelden omschrijft en laat zien is zeer aangenaam.

… Theory and practice in the design of data graphics, 250 illustrations of the best (and a few of the worst) statistical graphics, with detailed analysis of how to display data for precise, effective, quick analysis. …

Tufte verdeeld het onderdeel ‘theorie van grafische data visualisatie’ in 5 onderdelen.

  1. Data-inkt en grafische restyling.
  2. Chart-junk: vibraties, grids en eenden.
  3. Data-inkt maximalisatie en grafische vormgeving.
  4. Multifunctionele grafische elementen.
  5. Data dichtheid en kleine veelvouden.
  6. Esthetiek en techniek in grafische data visualisatie.

Continue reading

De 6 principes van grafische integriteit

‘Graphical integrity’ kenmerkt zich, volgens Tufte, door een zestal principes:

  1. Zorg dat de weergave van nummers, zoals daadwerkelijk gemeten binnen een grafiek, moeten gelijk zijn aan de gevisualiseerde numerieke hoeveelheden.
  2. Gebruik heldere, grondige en gedetailleerde etikettering, om grafische vervorming en dubbelzinnigheid te voorkomen.
  3. Toon variatie in data, niet in het ontwerp.
  4. Geef geld in tijdslijnen gecorrigeerd voor inflatie en in standaardeenheden weer. Dat is veelal beter dan een nominale weergave van het geld.
  5. Gebruik geen twee of driedimensionele weergave om eendimensionele data te visualiseren. Het aantal getoonde informatie-dragende dimensies mag niet het aantal dimensies in gegevens overschrijden.
  6. Laat geen data zien die buiten de context vallen.

Continue reading

Encourage the eye

Tabellen zijn taaie kost, een rauwe opsomming van getallen. De visualisatie van de gegevens moeten ‘het oog aanmoedigen‘ om deze data te interpreteren’. Tufte zegt dat grafische weergaven meerder functies hebben. Ze moeten

  • de data tonen;
  • voorkomen dat data vervormd wordt weergegeven of geïnterpreteerd;
  • een grote hoeveelheid cijfers op een beperkt oppervlak weergeven;
  • een coherent geheel maken van de omvangrijke data sets;
  • het oog uitnodigen om de verschillende brokken data met elkaar te vergelijken;
  • de data op verschillende niveaus onthullen, van een breed overzicht tot in het kleinste detail;
  • een duidelijke doel dienen: beschrijving, exploratie, tabuleren of decoratie;
  • nauw verweven zijn met de statistische en verbale beschrijvingen van de data set.

Continue reading

Conclusie

Uit voorgaande twee artikelen ‘Subjectieve bewijsvoering‘ en ‘De 4 grondbeginselen van een grafiek‘ blijkt dat wanneer de weergave van gegevens waar en onthullend moet zijn de logica van het ontwerp de logica van de analyse moet reflecteren. De juiste en rationele opeenvolging van oorzaak en gevolg moet zowel in het ontwerp als in de analyse van de data gelijk zijn. Tufte zegt hierover

Visual representation of evidence should be governed by principles of reasoning about quantitative evidence. For information displays, design reasoning must correspond to scientific reasoning. Clear and precise seeing becomes as one with clear and precise thinking.

Het principe van gecontroleerde vergelijkingen dicteert tegelijkertijd de constructie van de weergave van gegevens en schrijft voor hoe de inkt of de pixels van een grafiek zo geordend moeten worden dat context en vergelijkingen direct weerspiegeld worden. De kwaliteit van de vormgeving komt voort uit de intellectuele kwaliteit. Bovengenoemde tweeledige principes, nodig voor zowel het beredeneren van statistische bewijsvoering als voor het ontwerpen van statistische grafieken, omvatten

  1. het documenteren van bronnen en van de karakteristieken van de data,
  2. het doorlopend afdwingen van de meest geschikte vergelijkingen,
  3. het demonstreren van mechanismen van oorzaak en gevolg,
  4. deze mechanismen kwantitatief in beeld brengen,
  5. het herkennen van de inherent zijnde multivariate natuur van analytische problemen en
  6. het inspecteren en evalueren van alternatieve verklaringen.

Weergaven van informatie moeten, mits een correcte weerspiegeling van inhoud en kern van de zaak,

  • documentair,
  • de oorzaak insluitend en verklarend,
  • vergelijkend,
  • in hoeveelheden uitgedrukt,
  • multivariate [1] en
  • verklarend zijn.

Bron
Visual Explanations: Images and Quantities, Evidence and Narrative, Edward Tufte, Graphic Press, 1997. Bladzijde 53, Conclusion: Thinking and design.
[1] Defintie multivariate analyse
Verzamelnaam voor een aantal analysetechnieken die ontworpen zijn om de aard en de mate van samenhang tussen een groot aantal waarnemingen te beschrijven.
Meer algemene term: analyse, analysetechnieken. Meer specifieke term: factoranalyse. Rubriek: S24.2 wetenschappelijk onderzoek. Gevonden op thesauruszorgenwelzijn.nl

De 4 grondbeginselen van een grafiek

visex_bookcover.gif Op 28 januari 1986 explodeerde de Challenger door een lekkende O-ring. Onderzoek na de ramp liet zien dat dit veroorzaakt werd door een lekkende O-ring. Ingenieurs hadden de dag voor de lancering data overlegd aan de beslissingnemers dat hun advies moest onderstrepen, de dag van de lanchering zou te koud zijn om de Challenger te lanceren. Terwijl het Snow juist door de visualisatie lukte om iedereen te overtuigen ging het hier mis. Daar zijn zeker meerdere redenen dan alleen de visualisaties voor aan te wijzen. Edward Tufte concentreert zich in zijn boek ‘Visual Explanations: Images and Quantities, Evidence and Narrative‘ vooral op de visualisatie van de data tijdens het onderzoek wat volgde na de ramp.
Hieruit komen vier principes naar voren.

Continue reading

snowmap_1854

Subjectieve bewijsvoering

De keuze voor een visualisatie optie bepaald de uiteindelijke interpretatie van de data. Neem bijvoorbeeld de kaart visualisatie van John Snow. Door het weergeven van de sterfgevallen door cholera op een kaart van London kon hij inzichtelijk maken dat een waterbron in Broad Street de mogelijke bron van besmetting was. Op zich een knap stukje werk want men had toendertijd geen inzicht in de manier waarop de ziekte werd overgebracht.

Continue reading

Visualisatie opties

Om zinvolle informatie in geordende data zichtbaar te maken kunnen deze met elkaar in verband worden gebracht. Je kunt dit doen door bijvoorbeeld het gemiddelde uit te rekenen, door het in groepen in te delen, door vergelijkingen of door verbanden te leggen. Denk hierbij aan de categorieën geografisch weer te geven (de cholera visualisatie van Snow). De statistiek kan laten zien of deze combinaties ook tot een conclusie kunnen leiden. Hiervoor kan geput worden uit een enorm aantal visualisatie mogelijkheden.

Continue reading

Vijf mogelijkheden tot het ordenen van informatie

Zijn naam duikt op op de meest onverwachte momenten. Als mede-initiatiefnemer van Ted [1], auteur [2], vormgever, bedenker van de term ‘informatie architect’. en als architect.
Ik hoorde, als beginnend vormgever, voor het eerst over Richard Saul Wurman bij een opdracht tot het ontwerpen van formulieren voor een grote organisatie. Een senior collega gaf mij vijf mogelijkheden om te starten met orde te brengen in de berg van informatie die op mijn bureau lag. Als houvast vertelde hij over het LATCH principe.

  1. Location
  2. Alphabetical
  3. Time
  4. Category
  5. Hierarchy

Continue reading

samenstellingen

De kracht van een data visualisatie

Een bak cijfers vertalen naar een visuele weergave kan ervoor zorgen dat statistische data beter gecommuniceerd wordt. Grafieken zijn zoals Tufte, een bekende auteur op het gebied van analytisch ontwerp, zegt ‘instruments for reasoning’ [1]. Voordat het zover is zullen echter eerst een paar stappen genomen moeten worden. Ervan uitgaande dat de bak met data al verzameld is moet er gekeken worden welke cijfers met elkaar in verband kunnen worden gebracht. Is er een ontwikkeling in tijd, zijn er verschillen, is er een stijgende of dalende lijn in te ontdekken etcetra. Door deze data te rangschikken en te ordenen kunnen deze patronen zichtbaar gemaakt worden. Ontwikkelingen, schommelingen hierin, de frequentie hiervan, onderlinge relaties en een totaaloverzicht kunnen in beeld gebracht worden.

Continue reading