Een wiskunde zonder getallen
Gerichte analytische grafen worden in dit concept gebruikt als een wiskunde zonder getallen. Dit wil niet zeggen dat het niet met getallen kan gebruikt worden. In verschillende onderzoek domeinen worden gewogen gerichte grafen (weighted directed graphs) gebruikt als analyse methode van datasets, op zoek naar causale verbanden, 'causal discovery'. De causale verbanden die in dit concept weergegeven worden vertrekken echter van bewezen wetenschappelijke kennis. De grafen op zich zijn echter geen bewijs maar een tool om bewijzen voor te stellen.
De onderdelen van een gerichte graaf zijn minimaal twee nodes (knopen), verbonden met een gerichte pijl (gepunte lijn). De eenvoudigste toepassing is het verbinden van twee feiten, toestanden (de nodes) met een causaal proces (de pijl). Dit noemen we een causaal triplet.
Elke node bestaat uit minimaal twee delen: (1) in de hoofding de definitie van een feit, toestand of van een proces en (2) De formulering van de voorwaard(en) die aan de basis liggen voor het voorkomen van dit feit, deze toestand of dat proces. Deze voorwaarden moeten altijd het resultaat zijn van metingen of van observatie of van beide.
Voor de weergave van alle onderdelen van de graaf kunnen zowel prolog termen of datalogtermen als platte tekst gebruikt worden. De prolog of datalogtermen hebben als voordeel dat ze kunnen gebruikt worden voor queries, maar het is uiteindelijk de logische structuur van de declaraties die het mogelijk maakt ze om te zetten in een gerichte graaf. Punten en komma’s zijn wel essentieel. Hier onder van een simpel voorbeeld, een excerpt in platte tekst van zo'n declaratie die door een parser is omgezet in een gerichte analytische graaf. Punten en komma’s in het rood. Het volstaat om de positieve litteralen toe te voegen om het ook te bewijzen met Horn clausules. Als de declaratie solide is maakt de parser ook een datalog bestand aan. De volledige en solide declaratie vind je in dit tekst bestand. Er is momenteel een parser geschreven in java beschikbaar in beta test.
prove :-
Water koken in een pan op zeeniveau.
Water koken in een pan op zeeniveau :-
Koud water in de pan
Kokend water in de pan.
Koud water in de pan :-
Temperatuur tussen 0 graden en 100 graden Celsius,
Luchtdruk is 1013,25 hectopascal (hPa).
Kokend water in de pan :-
Temperatuur is 100 graden Celsius,
Luchtdruk is 1013,25 hectopascal (hPa).
Bij het formuleren van de voorwaarden worden wel weer getallen binnengehaald in het causaal logisch concept, maar ingekapseld als "text", niet om mee te rekenen. Ze zijn onmisbaar natuurlijk om de condities te formuleren. Het is wel een aanbevolen praktijk om bij de korte formele definities in de grafen uitgebreide definities in natuurlijke taal te geven, zoals bij deze twee voorbeelden. Klik op het label onderaan de graaf en dan komt u terecht op de pagina met definities. Die pagina kan ook gebruikt worden voor certificatie.
Bewijs. Zie hier voor de uitgebreide definities .
Bewijs. Zie hier voor de uitgebreide definities.
Men kan de vraag stellen wat de grafiek komt doen bij het vorige voorbeeld. Strikt logisch is die inderdaad overbodig, maar hij laat zien dat de inkrimping van de poolkap niet lineair verloopt maar met hoogtes in de zomer en laagtes in de winter. Toch is een duidelijke daling merkbaar. Dit is het verschil tussen logische relevantie en didactische relevantie. Aangezien dit voorstel een onderwijs tool beoogd kan bijkomende beeldinformatie verhelderend zijn. In een precair stadium, bijvoorbeeld voor mensen die de taal niet kennen of niet kunnen lezen zijn foto's en tekeningen een must.
In de nodes van de grafen vind je de definities van begintoestand en eindtoestand, bij de pijlen de definitie van het proces. Onder de definities van de begintoestand en eindtoestand zijn de voorwaarden opgelijst om tot die toestand te komen. Hier wordt het principe van de “conditio sine qua non” gebruikt zoals voorgesteld door Alexander Stepanov (Stepanov, 1985) . Daar moet bij opgemerkt worden dat een statistishe correlatie geen noodzakelijke en voldoende voorwaarde is (Jacques Tacq, 1982; Ines Lee, 2021).
De aangegeven voorwaarden bij een gegeven feit of toestand moeten altijd tezelfdertijd waar zijn. Ze zijn dus verbonden door de logische “EN”. In de node van de graaf staan ze onder elkaar in een tabel.
Bij de processen ingesloten tussen twee toestanden worden geen condities aangegeven. In principe worden die gedefinieerd door de condities geformuleerd in de parameters van begin_toestand en eindtoestand. Indien vereist kunnen er wel condities geformuleerd worden, in het geval dat het proces enkel kan bestaan onder die bepaalde condities, onafhankelijk van begin_toestand en eind_toestand.
Een complexer voorbeeld vind je hieronder met met bodeminfiltratie.
Bewijs. Zie hier voor de uitgebreide definities. Zie ook de volledige wartercyclus in 8 hoofdprocessen en 24 subprocessen hier bijeen onder elkaar.
[terug naar begin pagina]Ingebedde Hyperlinks
De visualisatie van Analytische Gerichte Grafen wordt geïmplementeerd met SVG dat gedefinieerd is in het Document Object Model (DOM) van XML . XML is een onderdeel van het goed gedefinieerde Semantische Web. Daar vind je ook de definitie van Xlink:href.
Xlink is gedefinieerd in XML door het W3C. Aangezien de grafen in afzonderlijke bestanden met extensie .svg opgeslagen worden, worden ze in de .html bestanden gecodeerd als object: <object data="uri" type="image/svg+xml" typemustmatch></object>. Daarom moet in de .svg bestanden bij de uri's het attribuut target gespecificeerd worden als: target="_blank" of target:="_parent", anders wordt het doel van de hyperlink geopend in de ruimte voorzien voor het object in de .html pagina, ook al is dat niet de bedoeling.
De xlink:href moet bewijs ondersteunende informatie aanbrengen. Die kan extern aangereikt worden in tekstueel formaat of een combinatie van textueel en grafisch formaat. Dit kan aangeduid worden in een HTML link met het attribuut "rel": rel="external" of rel="search".
Het tekstueel materiaal heeft een externe bron, bij voorkeur HTML of XML, een externe bestemming, dus wordt het buiten de grafische voorstelling weergegeven. Het mag vanuit alle elementen van de graaf geactiveerd worden, de visualisatie van de toestanden: status(type) en de visualisatie van de processen, process(type). De bron van dit tekstueel en/of grafisch materiaal moet gecertificeerd zijn komende van een encyclopedie (bvb de Englestalige Wikipedia), komende van een wetenschappelijk instituut (bvb het ESA klimaatbureau) of aangemaakt zijn door een docent/leraar. Een “measurement system analysis” is de meest strikte vorm van certificering.
[terug naar begin pagina]Exclusieve disjunctie van processen
Een begintoestand kan afhankelijk van een bepaalde voorwaarde tot verschillende eindtoestanden leiden. In dat geval zullen er verschillende pijlen vertrekken van die begintoestand naar die eindtoestanden waarvan minstens een voorwaarde in beide eindtoestanden moet verschillen. Dit is een EXCLUSIEVE disjunctie van processen.In dit analytisch concept van causaliteit wordt de “INCLUSIEVE disjunctie” (of het een of het ander of allebei) NIET GEBRUIKT. Dit is een causale contradictie. Bijvoorbeeld kan men stellen dat het soms regent, of soms sneeuwt, maar nooit tezelfdertijd.
Zie hier dezelfde processen zonder hagel maar mat sneeuwregen.
[terug naar begin pagina]Conjunctie van processen
Een eenvoudig voorbeeld van CONJUNCTIE van processen kan je zien bij verdamping hier onder.
Een complex proces kan geanaliseerd worden als zijnde het resultaat van verschillende processen die samen tegelijkertijd noodzakelijk zijn voor een ander proces. Hier kan je spreken van een conjunctie van afzonderlijke processen die een nieuw proces aansturen. Hier zullen dus verschillende pijlen toekomen bij dat nieuwe proces. Dit kan je duidelijk zien bij dit voorbeeld van het fotosynthese proces.
 
[terug naar begin pagina]Toepassing op feiten en toestanden
Feiten en toestanden worden structureel gelijk benaderd in dit concept, maar zijn inhoudelijk verschillend. Toestand wordt in dit concept gebruikt als een meetbare en/of observeerbare categorie van feiten die onderdeel zijn van dezelfde verzameling van gebeurtenissen. Een voorbeeld: regenbui, sneeuw, motregen, hagel zijn onderdeel van de zelfde verzameling neerslag. Aangezien neerslag observeerbaar en meetbaar is, kan het als overkoepelende categorie conditioneel benaderd worden. De dagenlange hoosbui waaruit tot 100 liter per vierkante meter viel in juli 2021 in het stroomgebied van de Vesder in België is een gebeurtenis. Dat was geen motregen. Strikt genomen behoort die ook tot de categorie neerslag, maar toch zal anders naar de oorzaken gekeken worden van dit afzonderlijke feit dan naar de algemene categorie neerslag. Intensiteit en duur zijn hier wel degelijk relevant.
Samengevat. Toestanden hebben gemeenschappelijke eigenschappen waarvan de drempels meetbaar en/of observeerbaar zijn. Bij de overgang van de ene naar de andere toestand is een proces de oorzaak van een overschrijding van minstens een van die drempels. De duur van dat proces kan een miliseconde zijn, maar bijvoorbeeld bij de vorming van regenwolken ook negen dagen. Het duurt gemiddeld negen dagen voor er regen uitvalt. In een histroische context kunnen die processen jaren en eeuwen in beslag nemen. De klimaatverandering is er niet op een dag, week of jaar gekomen. Het is een proces dat al 200 jaar bezig is.
Het gewenste niveau hangt af van het soort kennis men beoogt, algemene kennis over neerslag, of specifieke kennis over een specifieke neerslag op een bepaalde dag, een bepaald uur, op een wel bepaalde plaats. Het eerste is stof voor het secundair onderwijs, het tweede is kennis die meterologen en hydrologen moeten hebben. De algemene regels die van toepassing zijn op een categoriale status kunnen niet op afzonderlijke gebeurtenissen worden toegepast, maar kunnen structureel wel op dezelfde manier worden geanalyseerd. Deze algemene regels zijn wel van toepassing op die gebeurtenis, maar zijn onvoldoende om de specificiteit ervan te verklaren.
De modale logica heeft ondertussen aangetoond dat causaliteit perfect kan voorgesteld worden met gerichte acyclische grafen (van Benthem,IEP). Er wordt alleen nog gediscusieerd of die causaliteit nu invariant is of contextueel is. David Lewis koos voor invariantie. Ik kan daar mee leven op twee voorwaarden (1) dat men bij de analyse ook altijd de context analyseert, en nagaat of een regel algemeen blijft in alle contexten, indien niet moet men opsplitsen en (2) dat men moet aanvaarden dat de contexten in die mate kunnen veranderen dat men ook de regels moet veranderen. Dat laatste is tijdens de analyse van de klimaatverandering voldoende duidelijk geworden. In feite worden daar alle metereologische, hydrologische en ecologische systemen door elkaar gehaald dat opstellen van regels telkens opnieuw moet bekeken worden. Bij volstrekt nieuwe fenomenen komt dat regelmatig voor. In de periode van covid19 moest men uiteindelijk ook de regel verwerpen dat het virus enkel verspreid werd met druppeltjes, het zat wel degelijk ook in de aerosols.
[terug naar begin pagina]Visie en Concept
Deze implementatie is gebaserd op de moderne modale logica en dan zijn ‘Scalable Vector Graphics’ (SVG) het ideale middel om causalitiet te visualiseren als gerichte acyclische grafen. Je zou je kunnen afvragen waarom je deze visualisatie zou gebruiken, terwijl je vandaag generatieve kunstmatige intelligentieprogramma's hebt zoals ChatGPT om antwoorden op alle vragen te krijgen. Allereerst moet de visualisatie die wordt voorgesteld direct gekoppeld worden aan bewezen wetenschappelijke onderzoeksresultaten en dat is niet het geval bij generatieve AI.
Generatieve AI is het resultaat van ‘deep learning’. En ‘deep learning’ is gebaseerd op probabilistische verbanden gefilterd uit massa’s data online. Het is dus geen resultaat van observatie en wetenschappelijk onderzoek. Het loopt dan ook regelmatig uit de hand met die antwoorden die generatieve AI produceert. Het kan heel gemakkelijk worden misbruikt om er desinformatie uit de halen en deze te verspreiden en dat gebeurt dan ook. YouTube-kanalen die AI gebruiken om video's te maken met valse "wetenschappelijke" informatie worden aan kinderen aanbevolen als "educatieve inhoud". Een team van onderzoeksjournalisten van de BBC, dat desinformatie op het Web analyseerde vond meer dan 50 kanalen in meer dan 20 talen waar desinformatie verspreid werd, vermomd als STEM [Science Technology Engineering Maths] content.
Ten tweede, deze visualisatie met gerichte anlytische grafen zijn bedoeld als een didactische tool voor leraars en docenten voor het onderwijs, naast verbale informatie en andere didactische tools. Hun eenvoud laat toe om ze te gebruiken zonder digitaal plarform maar ook op een digitaal platform. Het is een illusie dat iedereen overal altijd internet toegang heeft. De dual-coding theory van cognitie stelt dat de menselijke geest informatie verwerkt langs twee verschillende kanalen: verbaal en visueel. Er wordt aangenomen dat visuele informatie het onthouden verbetert (Reed, 2012). Generatieve AI biedt die nog niet tezelfdertijd aan. Leraren en docenten doen dat vloeiend. Dit concept visualiseert causaliteit. Het schema verwijst zelf naar de bronnen en het bewijs van die causaliteit.
Generatieve AI verbruikt massa's energie voor het bij elkaar schrapen van data, het ontwikkelen van de database, het trainen en onderhoud van de data. Daarmee wordt geen enkel probleem van klimaatverandering opgelost, maar wordt er een extra probleem geschapen. Onderzoekers berekenden dat het trainen van een middelgroot generatief AI-model met de techniek ‘neural architecture search’ een elektriciteits- en energieverbruik heeft gelijk aan 626.000 ton CO2-uitstoot. De datacenterindustrie is verantwoordelijk voor de uitstoot van 2–3% van de mondiale broeikasgassen.
Het visualisatie systeem dat hier voorgesteld wordt, heeft geen digitaal platform nodig om toegepast te worden. Het vereist ook geen bijzondere grafische vaardigheid enkele een vaste hand, pen en papier. Op een digitaal platform werkt het natuurlijk efficienter, maar het vraagt slechts een beperkte bandbreedte en opslag cappaciteit. Energieveslindende deep learning is compleet overbodig. Een gedecentraliseeerde databank is een mogelijke toevoeging.
Digitaal ‘savy’ zullen opmerken dat SVG een veiligheids-risico inhoudt voor uw website want ze kunnen code injecteren in uw webpagina en uiteindelijk je systeem besmetten om dingen te doen die aan uw controle ontsnappen. Dat klopt. SVG heeft alle faciliteiten van HTML. Als je op het web op een link klikt van een webpagina die kwaadaardige scripts bevat, kan hetzelfde gebeuren. Er is een simpele manier om dat te voorkomen, maak uw SVG beelden zelf. Als je toch SVG wil downloaden, gebruikt dan enkel SVG uit betrouwbare bronnen. Je kan ook controleren of er geen <script> of <foreignObject> tags inzitten. Dat zijn de secties die code kunnen injecteren. SVG code is gewoon tekst, dus moeilijk is dat niet. Meer in detail daarover op de Howto pagina.
[terug naar begin pagina]Referenties
Dahlström, Erik et al, (2011) Scalable Vector Graphics (SVG) 1.1 (Second Edition), W3C Recommendation 16 August 2011, <https://www.w3.org/TR/2011/REC-SVG11-20110816/>
Lee, Ines (2021). 4 Reasons why Correlation does NOT imply Causation, Published in Towards Data Science"
Menzies, Peter, (2019), Counterfactual Theories of Causation, 29 October 2019, Stanford Encyclopedia of Pholosophy, <https://plato.stanford.edu/entries/causation-counterfactual/>
Reed, Stephen K. (2012). Cognition : theories and applications. Wadsworth, Cengage Learning, 12 April 2012, ISBN 978-1-133-49228-3. OCLC 1040947645, <https://www.worldcat.org/nl/title/1040947645>
Runge, Jakob, et al. , (2019), Detecting and quantifying causal associations in large non-linear time series datasets. Sci. Adv.5,eaau4996 (2019). DOI: <https://www.science.org/doi/10.1126/sciadv.aau4996>
Stepanov,
Alexander (1985), Towards a Theory of Causal Implication, Department of Electrical Engineering and Computer Science, Polytechnic University of New York,
1985,
<http://stepanovpapers.com/TOWARDS%20A%20THEORY%20OF%20CAUSAL%20IMPLICATION.pdf> Tacq,Jacques (1982), Causaliteit in sociologisch onderzoek, Sociologische Gids, RUG, Groningen van Benthem, Johan, (IEP), Modal Logic: A Contemporary
View, University of Amsterdam, Stanford University, and Tsinghua
University, The Netherlands, U. S. A., and China,
<https://iep.utm.edu/modal-lo/>
Deze voorbeelden van analytische gerichte grafen dienen enkel ter illustratie van de mogelijkheden van het concept. De verklarende teksten zijn ontleend aan de Wikipedia. Het concept is in feite maar echt werkbaar als er een interdisciplinair team is, dat werkt aan en waakt over de consistentie, volledigheid en precisie van de causale verbanden en de achterliggende verklaringen. De causale verbanden die ermee weergegeven worden moeten vertrekken van empirisch bewezen wetenschappelijke feiten. De grafen op zich zijn geen bewijs maar een tool om wetenschappelijk aangenomen bewijzen voor te stellen.