De kracht van een data visualisatie

Een overzichtelijke visualisatie van statistische gegevens kan het verschil maken in hoe informatie wordt begrepen en geïnterpreteerd. Edward Tufte, een prominente figuur op het gebied van analytisch ontwerp, beschreef grafieken als ‘instruments for reasoning’ (1997). Voordat we tot zo’n visuele vertaling kunnen komen, zijn er enkele cruciale stappen vereist.

Uitgaande van het feit dat de gegevens al zijn verzameld, is het essentieel om te identificeren welke cijfers met elkaar kunnen worden geassocieerd. Dit kan betekenen het waarnemen van trends over tijd, het herkennen van variaties, of het ontdekken van opwaartse of neerwaartse trends, om enkele voorbeelden te noemen. Het zorgvuldig sorteren en organiseren van deze gegevens kan helpen om dergelijke patronen aan het licht te brengen. Hierbij kunnen we ontwikkelingen, variaties, frequenties, relaties en een algemeen overzicht visualiseren.

Tufte (1997) benadrukte het belang van het presenteren van gegevens op een manier die diverse aspecten van de data verheldert, waaronder:

  • Vergelijkingen (het afzetten van twee of meer variabelen tegen elkaar),
  • Verspreidingen (het tonen van de frequentie van verschillende waardes binnen één of meerdere variabelen),
  • Samenstellingen,
  • Ontwikkelingen (het volgen van variabelen over een bepaalde periode), en
  • Onderliggende relaties.

Dr. Andrew V. Abela (2006), een expert in marketing en marktonderzoek, belicht vier kernpunten voor datavisualisatie: vergelijkingen, onderliggende relaties, verspreidingen en samenstellingen. Het begrijpen en toepassen van deze principes kan een grote bijdrage leveren aan hoe effectief data wordt gecommuniceerd naar het publiek.

Visueel is dit te zien in zijne ‘Chart Suggestions–A Thought-Starter‘.

ChartSuggestions.jpg

Visualisatie opties

Om zinvolle informatie in geordende data zichtbaar te maken moeten deze dus met elkaar in verband worden gebracht. Je kunt dit doen door bijvoorbeeld het gemiddelde uit te rekenen, door het in groepen in te delen, door vergelijkingen of door verbanden te leggen. De statistiek kan laten zien of deze combinaties ook tot een conclusie kunnen leiden. Hiervoor kan geput worden uit een enorm aantal visualisatie mogelijkheden. Het Visual Communication Lab van IBM bijvoorbeeld biedt in hun ‘levende laboratorium’ onderstaande mogelijkheden aan.

  • Locaties in kaart brengen (geografisch): Plattegrond, Kaart
  • Ontwikkelingen door de tijd heen zichtbaar maken: Tijdslijn, Lijngrafiek of -diagram (Line graph), Stapeldiagram (Stack graph)
  • Delen van een geheel zichtbaar maken: Treemap, Taartdiagram of cirkeldiagram of schijfdiagram
  • Relaties zien tussen verschillende punten: Netwerk diagram, Scatterplot
  • Vergelijken van een set variabelen : Matrixkaart (Matrix chart), Belgrafiek (Bubble chart), Histogram of kolommendiagram, Staafdiagram

Dit is nog maar een kleine selectie van de verschillende mogelijkheden. Robert L. Harris (1996) heeft in zijn boek ‘A Comprehensive Illustrated Reference’ een overzicht gemaakt waarin ongeveer 4000 grafieken, tabellen en kaarten staan weergeven.

De drie ingrediënten van een diagram

Een diagram of grafiek is opgebouwd uit 3 verschillende onderdelen.

  1. Gegevensdragers bijvoorbeeld de kolommen in een staafdiagram of de cirkels in een belgrafiek.
  2. Ordeningsonderdelen bijvoorbeeld de assen, rasterlijnen of stramien.
  3. Tekst zoals titel, bijschriften, bronvermelding en legenda.

Soms komen daar de ondersteunende onderdelen zoals bijvoorbeeld de achtergrond of het kader nog bij.

Subjectieve bewijsvoering: keuze van visualisatie en interpretatie van data

De manier waarop data wordt gevisualiseerd, beïnvloedt sterk de uiteindelijke interpretatie ervan. Een illustratief voorbeeld hiervan is de kaartvisualisatie van John Snow. Hij bracht sterfgevallen door cholera in kaart in Londen, waardoor hij kon aantonen dat een waterput in Broad Street een waarschijnlijke besmettingsbron was. Dit was een baanbrekend inzicht, vooral omdat men destijds niet begreep hoe de ziekte zich verspreidde.

Snow-cholera-map.jpg

Ik heb cijfers uit Snow’s document ‘On the mode of communication of cholera’ (uit ‘Table I’) ingevoerd in Many Eyes. Uit deze data bleek dat het aantal fatale besmettingen en sterfgevallen al afnam voordat de waterput werd afgesloten.

cholera_chart.png

Tufte merkte in “Visual Explanations” op dat Snow, door zijn eerdere onderzoeken, al het vermoeden had dat een waterput een besmettingsbron kon zijn. Hierdoor zocht hij gericht naar data om dit aan te tonen. Zijn grondige verzameling en analyse van gegevens over sterflocaties toonden aan dat velen daadwerkelijk water uit de Broad Street-bron hadden gedronken. Hij onderzocht ook tegenvoorbeelden, zoals een nabijgelegen brouwerij waar werknemers, door het drinken van hun eigen brouwsel, nauwelijks werden besmet, of een naburig ‘Work house’ met een eigen waterbron. Ook keek hij buiten de directe omgeving van de bron, ontdekkend dat sommige verder gelegen slachtoffers dichtbij de bron naar school gingen.

Volgens Tufte was Snow’s succes te danken aan zijn methodische aanpak, gekenmerkt door:

  • Het effectief inzetten van data in een relevante context (zoals een plattegrond) om de impact van de gegevens te versterken.
  • Het maken van kwantitatieve vergelijkingen en het stellen van de cruciale vraag: “Vergeleken met wat?”.
  • Het overwegen van alternatieve verklaringen en tegenstrijdigheden.
  • Het beoordelen van mogelijke onnauwkeurigheden in zijn data en visualisaties.

Concluderend, zowel de wijze van visualisatie als de onderliggende data spelen een cruciale rol in de uiteindelijke interpretatie en conclusies die uit visualisaties worden getrokken.

De vier grondbeginselen van een grafiek

Tufte (1996) heeft de vier grondbeginselen waaraan een grafiek volgens hem moet voldoen op een rij gezet.

  1. De legenda moet ten alle tijden zichtbaar en helder zijn.
  2. De data moet de aandacht trekken, niet de vormgeving.
  3. Oorzaak en gevolg moeten helder gecommuniceerd worden.
  4. De data moet een goede ordening hebben.

Aan de hand van visualisaties gemaakt bij de nabeschouwingen van de ramp met de Challenger (1986) laat hij zien hoe hij tot bovenstaande opsomming is gekomen. Zie artikel ‘De 4 grondbeginselen van een grafiek‘ op Latebytes.

Visualisatie is meer dan alleen een jasje

Uit voorgaande twee hoofdstukken ‘Subjectieve bewijsvoering’ en ‘De 4 grondbeginselen van een grafiek’ blijkt dat wanneer de weergave van gegevens waar en onthullend moet zijn de logica van het ontwerp de logica van de analyse moet reflecteren. De juiste en rationele opeenvolging van oorzaak en gevolg moet zowel in het ontwerp als in de analyse van de data gelijk zijn. Tufte (1997) zegt hierover

“Visual representation of evidence should be governed by principles of reasoning about quantitative evidence. For information displays, design reasoning must correspond to scientific reasoning. Clear and precise seeing becomes as one with clear and precise thinking. p. 53)”

De kwaliteit van de vormgeving komt voort uit de intellectuele kwaliteit. De principes, nodig voor zowel het beredeneren van statistische bewijsvoering als voor het ontwerpen van statistische grafieken, omvatten

  • het documenteren van bronnen en van de karakteristieken van de data,
  • het doorlopend afdwingen van de meest geschikte vergelijkingen,
  • het demonstreren van mechanismen van oorzaak en gevolg,
  • deze mechanismen kwantitatief in beeld brengen,
  • het herkennen van de inherent zijnde multivariate (de samenhang tussen een groot aantal waarnemingen) natuur van analytische problemen en
  • het inspecteren en evalueren van alternatieve verklaringen.

Visualisaties van informatie moeten, mits een correcte weerspiegeling van inhoud en kern van de zaak,

  • documentair,
  • de oorzaak insluitend en verklarend,
  • vergelijkend,
  • in hoeveelheden uitgedrukt,
  • multivariate (de samenhang tussen een groot aantal waarnemingen) en
  • verklarend zijn.

Encourage the eye

Tabellen zijn taaie kost, een rauwe opsomming van getallen. De visualisatie van de gegevens moeten ‘het oog aanmoedigen’ om deze data te interpreteren’. Tufte (1991) zegt dat grafische weergaven meerder functies hebben. Ze moeten: de data tonen;

  • voorkomen dat data vervormd wordt weergegeven of geïnterpreteerd;
  • een grote hoeveelheid cijfers op een beperkt oppervlak weergeven;
  • een coherent geheel maken van de omvangrijke data sets;
  • het oog uitnodigen om de verschillende brokken data met elkaar te vergelijken;
  • de data op verschillende niveaus onthullen, van een breed overzicht tot in het kleinste detail;
  • een duidelijke doel dienen: beschrijving, exploratie, tabuleren of decoratie;
  • nauw verweven zijn met de statistische en verbale beschrijvingen van de data set.

Grafieken onthullen data. Tufte haalt om dit te onderstrepen Anscombe’s quartet aan waarbij 4 data sets er bijna gelijk uitzien. Pas nadat deze grafisch worden weergegeven zijn de trends direct zichtbaar.

I II III IV
x y x y x y x y
10 8.04 10 9.14 10 7.46 8 6.58
8 6.95 8 8.14 8 6.77 8 5.76
13 7.58 13 8.74 13 12.74 8 7.71
9 8.81 9 8.77 9 7.11 8 8.84
11 8.33 11 9.26 11 7.81 8 8.47
14 9.96 14 8.10 14 8.84 8 7.04
6 7.24 6 6.13 6 6.08 8 5.25
4 4.26 4 3.10 4 5.39 19 12.50
12 10.84 12 9.13 12 8.15 8 5.56
7 4.82 7 7.26 7 6.42 8 7.91
5 5.68 5 4.74 5 5.73 8 6.89

De vier basis vormen van een data visualisatie

Bij het communiceren van complexe kwantitatieve ideeën zijn er vier basisvormen te onderscheiden data kaarten, tijdsreeksen, plaats-tijd verhalende ontwerpen en relationele grafieken. 1. Data kaarten Een afbeelding kan zeer veel data op een klein oppervlak overzichtelijk presenteren. Het is ook een zeer herkenbare vorm voor het menselijke oog. De aandacht wordt direct op de inhoud gericht. Nadeel van deze methode is dat niet het aantal mensen maar een geografische grens de inhoud bepaald. De verhouding oppervlakte – aantal mensen wisselt per regio. Zoals bijvoorbeeld

dupin2.gif

822.gif

2. Tijdreeksen

Bij deze grafieken is één as altijd gereserveerd voor een tijdseenheid zoals seconden, minuten, uren, weken, maanden, eeuwen of millennia. De natuurlijke ordening naar tijd zorgt voor een krachtig, efficiënt ontwerp. Deze vorm is uitermate geschikt voor de meer complexere data. Het nadeel met tijdsreeksen is dat het verstrijken van tijd geen goede verklarende variabele is. Beschrijvende chronologie is veelal geen oorzakelijke verklaring. Uitzonderingen hierop bevestigen deze regel. Voorbeelden zijn de New York weather in 1980. Deze grafiek uit de New York Times en de vliegtuigbewegingen, passagiersbewegingen en vrachtvervoer op Amsterdam Airport Schiphol, 1940-2005. NYweather.jpg

New York weather in 1980. Deze grafiek uit de New York Times (Jan. 11, 1981, p. 32)

2571.gif

Vliegtuigbewegingen, passagiersbewegingen en vrachtvervoer op Amsterdam Airport Schiphol, 1940-2005.

3. Plaats-tijd verhalende ontwerpen

Het verschil met de tijdreeks is de ruimtelijke dimensie dat toegevoegd is aan het ontwerp. De data wordt zowel in tijd als in ruimte (2 of 3 dimensionaal) weergegeven. Een voorbeeld hiervan is de kaart van Minard. Tufte noemt dit zelfs ‘probably the best statistical graphic ever drawn…’ (Tufte, 1991). Deze kaart, die berucht is om de hoeveelheid informatie (geografische locatie inclusief namen van steden en rivieren, tijd (alleen op de terugtocht), temperatuur (het onderste deel van de grafiek), route, richting van de troepen en het aantal (nog resterende) manschappen) die aangeboden wordt, uit 1869 laat de verliezen onder de manschappen (breedte van de banen), hun bewegingen (heen bovenste baan, terugtrekking onderste zwarte baan) en de buiten temperatuur tijdens de franse invasie naar Moskou (1812) zien. Minard gebruikt hier een voor die tijd innovatief idee. De breedte van elementen is proportioneel en is daardoor direct te interpreteren.

Minard.png

4. Relationele grafieken

Zodra er sprake is van meer abstracte data en er geen link meer is met de fysieke wereld van tijd of locatie is de relationele grafiek een uitermate geschikte vorm. Een voorbeeld is de grafiek van Playfair. Het (afbeelding 10) laat in de linkeras en -lijn per cirkel de bevolking en in de rechteras en -lijn per cirkel de belasting zien.

first-pie-chart.jpg

De uitvergroting laat dit beter zien. De bedoeling is dat de helling die deze linker- en rechterlijn met elkaar verbindt de hoogte van belasting direct zichtbaar maakt. Alleen wordt de helling in deze afbeelding ook bepaald door de diameter van de cirkel. Het is in ieder geval wel zichtbaar dat de helling behorende bij ‘Britain and Ireland’ de andere kant op gaat. In de huidige statistische visualisaties is het een regel om nooit twee verticale assen voor verschillende waardes (bevolking en belasting) te gebruiken.

small6.jpg

De zes principes van grafische integriteit

In het vertalen van data naar vorm kan veel. bewust of onbewust verkeerd gaan. Tufte (1991) heeft het daarom over ‘Graphical integrity’. Volgens hem kenmerkt dit zich door een zestal principes:

  1. Zorg dat de weergave van nummers, zoals daadwerkelijk gemeten binnen een grafiek, moeten gelijk zijn aan de gevisualiseerde numerieke hoeveelheden.
  2. Gebruik heldere, grondige en gedetailleerde etikettering, om grafische vervorming en dubbelzinnigheid te voorkomen.
  3. Toon variatie in data, niet in het ontwerp.
  4. Geef geld in tijdslijnen gecorrigeerd voor inflatie en in standaardeenheden weer. Dat is veelal beter dan een nominale weergave van het geld.
  5. Gebruik geen twee of driedimensionale weergave om eendimensionale data te visualiseren. Het aantal getoonde informatie-dragende dimensies mag niet het aantal dimensies in gegevens overschrijden.
  6. Laat geen data zien die buiten de context vallen.

Zie artikel ‘De 6 principes van grafische integriteit‘ op Latebytes voor voorbeelden.

De theorie van grafische data visualisatie

Het is me opgevallen dat bijna alle boeken en artikelen die ik heb gelezen verwijzen naar de ideeën van Tufte. Met het risico van blikvernauwing verwijs ik voor een theoretische achtergrond dus nogmaals naar Tufte. Tufte (1991) verdeeld het onderdeel ’theorie van grafische data visualisatie’ in vijf onderdelen.

1. Data-inkt en grafische restyling

De inkt gebruikt voor de gehele grafiek mag nooit meer zijn dan de inkt gebruikt voor de gegevens.

fig11-5.jpg

Cholera deaths per day in London, August-September 1854. The peak reflects a doubling of deaths during the ten-day outbreak in Golden Square. Bron: The John Snow archive and research company. De data moet de aandacht van de gebruiker trekken, niet de overige onderdelen. Hij laat voorbeelden zien waarin het grid een verspilling is van inkt, waarin een staafgrafiek terug gebracht wordt tot een paar lijnen (een staaf heeft een vulling, een linker-, een rechter- en een bovenlijn, hij brengt dit terug tot 1 simpele lijn). In een ander voorbeeld laat hij zien dat indien sprake van symmetrie je eigenlijk de helft van een afbeelding kunt weglaten (kijkers zien vaak maar de helft). De 5 principes hierin zijn:

De data moet de aandacht van de gebruiker trekken, niet de overige onderdelen. Hij laat voorbeelden zien waarin het grid een verspilling is van inkt, waarin een staafgrafiek terug gebracht wordt tot een paar lijnen (een staaf heeft een vulling, een linker-, een rechter- en een bovenlijn, hij brengt dit terug tot 1 simpele lijn). In een ander voorbeeld laat hij zien dat indien sprake van symmetrie je eigenlijk de helft van een afbeelding kunt weglaten (kijkers zien vaak maar de helft). De 5 principes hierin zijn:

  1. Toon boven alles de data.
  2. Maximaliseer de data-inkt ratio ( = data-inkt – totale hoeveelheid inkt gebruikt bij het ontwikkelen van de grafiek).
  3. Wis alle data-inkt welke niet gebruikt wordt voor de gegevens.
  4. Wis alle overbodige data-inkt.
  5. Verbeter en publiceer.

2. Chart-junk: vibraties, grids en overdesign

duck2.jpg

Waarschijnlijk “the worst graphic ever to find its way into print” (Tufte, p. 118). Chart junk bestaat uit decoratieve elementen die geen informatie bevatten en vooral voor verwarring zorgen.

  • Arceringen zorgen voor moiré effecten en visuele rommel.
  • Een opvallend grid bijvoorbeeld door een donkere lijnvoering zorgt voor visuele onrust en is dus chart junk.
  • Decoratieve vormen, elementen van Grafische Stijl die de kwantitatieve informatie verbergen.

Allen dragen ze bij aan de zogenoemde ‘chart junk’. Technieken om chart junk te voorkomen zijn bijvoorbeeld het vervangen van arceringen en rasters door volvlakken of grijstonen, het gebruik van een directe etikettering in plaats van een legenda en het vermijden van overheersende gegevensdragers. 3. Data-inkt maximalisatie en grafische vormgeving Aan de hand van voorbeelden toont Tufte (1991) hoe je de bestaande basis grafieken zou kunnen verbeteren. Het komt er vooral neer op een vermindering van het aantal gebruikte lijnen. Zijn conclusies zijn

  • Sommige van deze aangepaste grafieken ogen op het eerste gezicht vreemd maar dat is dan vooral doordat we er nog niet aan gewend zijn.
  • Het optimaliseren van de data-inkt is maar een beperkt onderdeel van een complexe en multivariate ontwerp taak.
  • Grafieken zullen bijna altijd verbeteren dankzij het bewerken, reviseren en testen van verschillende ontwerpen.
  • Hou rekening met de kijker. Zal deze de nieuwe ontwerpen begrijpen of deze juist verwarrend vinden.

Een voorbeeld: Een grafiek voor data-inkt maximalisatie:

di1.png

Dezelfde grafiek na data-inkt maximalisatie:

di6.png

4. Multifunctionele grafische elementen Hierin laat hij onder andere zien:

  • dat de gegevensdragers (Zie ‘De drie ingrediënten van een diagram’) opgebouwd kunnen worden met de data zelf,
  • dat het grid zelf de gegevens zichtbaar kan maken,
  • of dat de etikettering een dubbele functie kan hebben.

databasedgrid.png

5. Data dichtheid en kleine veelvouden

Onze ogen kunnen op een klein oppervlak heel veel verschillen in structuur onderscheiden. Tufte (1991) vraagt zich in het hoofdstuk ‘Data density and small multiples’ dan ook af hoe je hiervan voordeel kunt behalen in een statistische grafiek en hoeveel informatie een grafiek minimaal moet bevatten om nog duidelijk te zijn. Hij heeft hiervoor een formule ontwikkeld: datadensity.png Een voorbeeld: Stel dat een staafdiagram een oppervlakte heeft van 50 vierkante centimeter en 8 ingangen heeft dan zou de data dichtheid 8 : 50 = 0,16 (waardes per vierkante centimeter) zijn. Dat is een zeer lage dichtheid. Dit zou zeker hoger kunnen. Een wetenschappelijk tijdschrift heeft grafieken die variëren van 50 – 200 nummers per vierkante inch (1 inch = 16,387 centimeter).

figure11.gif

Data grafieken kunnen in het algemeen beter gebaseerd zijn op een grote data matrix waardoor ze veel informatie kunnen bevatten. Data rijke ontwerpen zorgen voor context en geloofwaardigheid van statistische bewijzen. De manier om de data density bij eenvoudige grafieken (weinig informatie) te verhogen is de matrix te verkleinen. Small multiples of kleine veelvouden zijn een serie van grafieken die bij een gelijkblijvende variable een andere, wisselende variable in kaart brengen.

small_multiples.gif

Bron Many Eyes Blog, IBM.

huygens-2.gif

Bron: Un demi siècle pour découvrir l’anneau de Saturne

Het grote voordeel van goed ontworpen kleine veelvouden is dat je makkelijk kunt vergelijken. Het zijn kleine grafieken met een hoge data dichtheid die daarnaast ook nog eens heel verhalend kunnen zijn.

6. Esthetiek en techniek in grafische data visualisatie

“Graphical elegance is often found in simplicity of design and complexity of data'” Tufte, The visual display of quantitative information, blz. 177

Een paar richtlijnen voor een goede esthetiek die hij geeft zijn

  • kies voor een geschikt formaat en ontwerp
  • gebruik woorden, nummers en lijnen als één geheel
  • zorg voor evenwichtige en relevante schaalverdeling
  • toon een toegankelijk detailleringsniveau
  • laat de data het verhaal vertellen
  • teken met aandacht en professioneel
  • vermijd chart junk en informatieloze decoratie
  • gebruik verschillende lijndiktes als een aantrekkelijke en compacte manier om data te tonen
  • een liggende grafiek verdient de voorkeur boven een staande grafiek (mits de content dit toelaat)

Conclusie

De vormgeving van een grafiek is meer dan alleen een mooi jasje, het gaat ook om de integriteit en om de doelstelling van de visualisatie. Je moet zelf voortdurend de vraag stellen wat je met de visualisatie wilt bereiken. Is het een bewijs voor een bepaald idee zoals Snow het bijvoorbeeld deed met zijn cholera map. Of wil je trends ontdekken. We weten dat er verschillende visualisatie mogelijkheden zoals data kaarten, tijdsreeksen, plaats-tijd narrative ontwerpen en relationele grafieken zijn. We hebben geleerd welke het meest geschikt is om datastructuren binnen statistische data te presenteren. Er zijn een paar standaard richtlijnen zoals legenda kloppend en zichtbaar, data die niet onderdoet voor de vormgeving, etcetera behandeld. Maar niet alleen de manier van visualiseren is essentieel. Ook de verzamelde gegevens zijn van invloed op de uiteindelijk conclusies die aan visualisaties ontleend kunnen worden. Het meest waardevol is die visualisatie waaruit conclusies getrokken kunnen worden.

Bronnenlijst

  • Michael Friendly (May 1, 2007). Milestones in the history of thematic cartography, statistical graphics, and data visualization.
  • Michael Friendly. Gallery of Data Visualization The Best and Worst of Statistical Graphics. Geraadpleegd tussen februari en juni 2008.
  • Edward Tufte. Charles Joseph Minard, “Graphic Tables and Figurative Maps“. Geraadpleegd op 14 april 2008.
  • Edward Tufte. The Visual Display of Quantitative Information, Second Edition, Graphics Press, USA, 1991.
  • Edward Tufte. Computing Lie Factor by Dividing Percentages. Geraadpleegd op 15 mei 2008.
  • Mark Zachry and Charlotte Thralls. Cross-Disciplinary Exchanges . An Interview with Edward R. Tufte. Technical communication quarterly, 13(4), p. 447-462, 2004.
  • Edward Tufte. Visual Explanations: Images and Quantities, Evidence and Narrative. Graphics Press, USA, 1997.
  • Chaomei Chen. Information Visualization: Beyond the Horizon. Springer; 2nd ed. 2004. 2nd printing edition. 2006.
  • Edward Tufte. Beautiful Evidence. Graphics Press, USA, 2006.
  • Robert L. Harris. Information Graphics: A Comprehensive Illustrated Reference. Oxford University Press, USA; 1 edition. 2000.
  • Dr. Andrew V. Abela. Chart Suggestions–A Thought-Starter. 2006. Geraadpleegd op 21 april 2008
  • Van Taarten En Balken. Grafisch Nederland – Kerstnummer Grafisch Nederland 1996.
  • IBM. Many Eyes. Geraadpleegd tussen februari en juni 2008.
  • Wade Robinson et al. Representation and Misrepresentation: Tufte and the Morton Thiokol Engineers on the Challenger. Science and Engineering Ethics (2002) 8, 59-81.
  • Ron Graham, Wolfgang Hees, Lisa Henn. Viewgraphs. Geraadpleegd tussen februari en juni 2008.
  • The John Snow arhive and research companion. Geraadpleegd op 5 mei 2008.
  • IBM. Visual Communication Lab. Geraadpleegd tussen februari en juni 2008.
  • Moritz Stefaner. Visual tools for the socio-semantic web. Master’s Thesis Interface Design Programme. University of Applied Sciences Potsdam. June 2007.
  • Latebytes. Nieuwe manieren om globale statistische data te presenteren. 2008.
  • Latebytes. Intelligente legenda’s. 2008.
  • Fernanda B. Viégas, Martin Wattenberg, Frank van Ham, Jesse Kriss, Matt McKeon. Many Eyes: A Site for Visualization at Internet Scale. Infovis, 2007.
  • Frank van Ham. Interactive Visualization of Large Graphs PhD thesis, Technische Universiteit Eindhoven, 2005.
  • Frank van Ham. Collaborative Visualization: IBM’s Many Eyes project.. See #3 conference, Wiesbaden, Germany. April 19 2008.
  • Jan Kraak. Waarom werkt informatie- visualisatie zo goed? Pictogram 1. Februari, maart 2005
  • Chris Houwing. Visualisatie Statistische gegevens. Afstudeerscriptie Master Software Engineering. Universiteit van Amsterdam. 21 juni 2004.
  • The Economist (print edition). Charts. Worth a thousand words. Dec 19th 2007.