1.
Inleiding. Oorzaak-gevolg problemen.
1.1.
Het gaat om het resultaat.
Een terugkerende situatie in ons leven is dat we een bepaald doel willen bereiken. In het algemeen heeft dat doel
twee kanten:
• Toename van gewenste omstandigheden.
• Afname van ongewenste omstandigheden.
Nemen we zelf ons lot ter hand dan is het zaak om ons in te zetten voor voor de volgende twee doelen,
afzonderlijk of gecombineerd:
• Het veroorzaken, althans bevorderen, van gewenste effecten.
• Het verhinderen, althans tegengaan, van ongewenste effecten.
Voor elk van deze twee doelen zijn voorafgaande acties nodig:
• Het bevorderen (vermeerderen, versterken) van de oorzaken voor de gewenste effect
en.
• Het tegengaan (verminderen, verzwakken) van de oorzaken voor de ongewenste effecten.
In beide gevallen is dus eerst kennis nodig van de oorzaken van de betreffende effecten.
1.2.
Op zoek naar de cruciale schakel.
Als we een bepaald resultaat willen realiseren dan willen we in feite een
oorzaak aandragen die het gewenste
effect teweegbrengt.
M.a.w., bij een gegeven combinatie van omstandigheden willen we een
factor toevoegen die - naar verwachting -
vrijwel zeker tot het beoogde effect zal leiden.
(of vermeerderen, bevorderen, versterken, enz.) - dus met een hoge kans - Algemener gezegd, we willen een bepaalde
factor zodanig vermeerderen, bevorderen of versterken, dat dit een aanzienlijke
kans oplevert dat het beoogde
effect al optreden.
De kunst is dus om die doorslaggevende factor, de
cruciale schakel, te achterhalen.
Causale inferentie.
Omstandigheden in het verleden kunnen niet meer worden beïnvloed. Het gewenste effect ligt in de regel ergens
in de toekomst, ver of nabij.
Het bepalen van de cruciale schakel vraagt daarom allereerst om goede
voorspellingen.
Hiervoor is het toepassen van oorzaak-gevolg verbanden nodig.
Via
causale inferentie kennen we een
causale relatie toe aan een aantal verschijnselen: 'oorzaak' en '
effect', zeg
A1 en
E1.
1.3.
Het opsporen van oorzaak-gevolg verbanden.
Hiervoor is kennis van oorzaak-gevolg principes nodig.
Causale analyse dient om deze kennis te verwerven.
Inductie
Stel het voorschrift op van de
causale relatie tussen
A1 en
E1: de
causale regel.
Dit vraagt met name om twee elementaire competenties:
(a)
Uit waarnemingen afleiden van patronen.
Herkennen van regelmatigheden in gegevens en processen.
(b) Uit patronen afleiden van cruciale schakels.
Opsporen van cruciale schakels en benodigde bouwstenen voor de doeluitkomst.
1.4.
Basisaannamen in oorzaak-gevolg onderzoek.
Het eerste uitgangspunt van elk onderzoek naar kennis is het vermijden van een 'gekleurde' blik, vooringenomenheid.
Stel dat we uitgaan van zo min mogelijk vooronderstellingen. D.w.z. een 'schone lei', of '
tabula rasa'.
Wat kunnen we dan
tenminste aannemen, voordat we beginnen met onderzoek naar causale relaties?
Er is in ieder geval een onderzoeksgebied, een
domein. Wanneer we naar oorzaken en gevolgen zoeken
is dit gebied meestal
fysisch van aard: de wereld van materie en energie, tijd en ruimte.
Maar binnen die werkelijkheid kan ze ook
intra-psychisch zijn: de wereld van bewuste subjectieve beleving.
Deze beide kunnen ook gedeeld worden via taal en communicatie: de wereld van intersubjectieve beleving.
De laatste twee domeinen zijn eigenlijk niet geschikt voor causale analyse omdat de eerste
- en daarmee indirect ook de tweede - problematische, of althans complicerende aspecten bevatten: (a) 'interne'
subjectieve beleving, die niet direct empirisch toegankelijk is; en (b) de ervaring van keuzevrijheid of 'vrije wil',
die niet logisch verenigbaar is met causale determinatie.
Het domein van
abstracte patronen sluiten we meestal uit omdat dit geen causale mechanismen kent, enkel logische
implicaties. Het is ook niet vatbaar voor causale analyse omdat logica juist nodig is voor causale analyse -
en niet omgekeerd.
Binnen het domein zijn er altijd wel bepaalde verschijnselen (fenomenen) te onderscheiden.
Het aantal verschijnselen die in een domein, of deelgebied daarvan, met redelijke objectiviteit te onderscheiden is,
is in principe niet-aftelbaar oneindig. (Dat staat nog los van wat louter subjectief,
met fantasie, projectie en dergelijke, valt te ontwaren).
Welke verschijnselen we onderscheiden is immers afhankelijk van de indeling, de schaalgrootte, en de selectie
die we onvermijdelijk toepassen. En dat levert een combinatorische explosie van mogelijke onderscheidingen.
Toch kunnen we een aantal algemene principes over de verschijselen binnen het domein formuleren.
Allereerst zijn er
objecten, of
observatie-eenheden, zogezegd 'individuele gevallen'.
Deze
objecten hebben bepaalde eigenschappen:
traits.
Daarbij zijn er ruimtelijke en tijdgerelateerde eigenschappen.
We bekijken de verschijnselen in het domein altijd binnen een bepaald, begrensd kader, een
context,
van tijd (periode) en ruimte (plaats). Vervolgens is een onderscheid te maken tussen:
(1)
Constantie.
Datgene wat (relatief) onveranderlijk, statisch c.q. stabiel blijft.
(2) Variatie.
Datgene wat (relatief) veranderlijk, fluctuerend c.q. dynamisch blijkt.
De
constantie omvat vaste eigenschappen (
constanten), en duurzame relaties: met name
oorzaak-gevolg relaties:
causale relaties.
De
variatie omvat veranderlijke eigenschappen (
variabelen), en (tijdgebonden) relaties: met name
ordeningsrelaties (die bepaald worden door specifieke causale relaties en daardoor in principe veranderlijk zijn).
We hebben dus enerzijds eigenschappen, en anderzijds relaties.
De eigenschappen - constanten en variabelen - hebben bepaalde
waarden.
De aanname is dat bepaalde
causale relaties bepalend zijn voor zowel de
waarden van bepaalde
eigenschappen, als de ordeningsrelaties. Omdat 'echte' constanten niet (traceerbaar) beïnvloed worden door
causale relaties, gaat het uitsluitend om variabelen die beïnvloed worden.
We willen dus uit de kennelijke
variatie in bepaalde eigenschappen c.q.
variabelen, nog onbekende,
of nader te bevestigen,
causale relaties afleiden.
We kunnen het domein echter niet rechtstreeks, '
An Sich' benaderen, maar alleen via waarnemingen (observaties)
metingen).
We maken daarom een onderscheid tussen:
(1) De volledige verzameling van reëel bestaande verschijnselen in het domein: de populatie
.
(2) De verzameling verschijnselen uit het domein: die door ons worden waargenomen of gemeten: de steekproef of
selectie.
De steekproef kan in principe de volledige populatie omvatten, maar vaak vormt ze daar maar een deel van.
De mate van
variatie van
variabelen kunnen we vanuit onze waarnemingen van de
steekproef op een
statistisch-kwantitatieve manier in kaart brengen: meten en berekenen. Het resultaat noemen we dan
variantie.
Alle
variantie in een
steekproef uit een
populatie in een niet-abstract
(sub)domein
omvat in principe twee hoofdcategorieën:
(1)
Chaos.
'Toevalsruis', random 'error', noise.
Te verwaarlozen.
(2) Dynamiek.
Gevolg van ordening: samenhang, structuur, systematiek. De laatste bestaande uit causale relatie(s),
oftewel mechanismen.
Daarnaast kunnen we spreken van:
(3) 'Proxi-chaos', 'micro-dynamiek'.
Subtiele, extreem complexe structuur die bijna niet te traceren, bewijzen is.
Ze behoort dus in principe, theoretisch tot (2), maar zolang we dit (vooralsnog) niet empirisch kunnen aantonen,
rekenen we haar uit pragmatische overwegingen (voorlopig) tot (1) - tenzij en voor zover niet het tegendeel blijkt.
In de structuur zijn te onderscheiden:
(a)
Systematische 'error', bias.
Onbedoelde afwijkingen c.q. fouten, a.g.v. onvoldoende correctheid, door tekortkomingen en gebreken (bias),
in experiment, resp. steekproef.
(b) Reële en direct relevante systematiek.
Maximum niveau van validiteit direct relevant want conform de hypothese.
Geldigheid binnen de steekproef resp. de populatie.
Interessant is te bedenken dat alle samenhang die we in de werkelijkheid met enige objectiviteit kunnen vaststellen,
uitsluitend uit causale relaties bestaat. Met andere woorden, onze werkelijkheid is doortrokken van causaliteit.
Kennis van causale relaties is ook onmisbaar voor elk inzicht en elke uitspraak met enige verklarende kracht (in
retrospectie) of voorspellende kracht (in prospectie).
Causaliteit is hierdoor ook de basis van alle betrouwbare, valide kennis, dus in principe
zeker van wetenschappelijke kennis. Het correct herkennen van causale relaties
zou dan ook de eerste deskundigheid moeten zijn van academici. Helaas zijn er maar weinig academici te vinden
die hierover een samenhangend verhaal kunnen houden dat van voldoende inzicht in causaliteit getuigt.
Schema
Causale analyse
Globale schets van de procedure.
2.
Probleemstelling.
2.1.
Hoofddoelen.
Heel globaal bezien worden organismen in hun algehele functioneren geleid door twee soorten motieven:
(I)
'Negatieve' motieven.
Het tegengaan of verminderen van ongunstige c.q. ongewenste omstandigheden en gebeurtenissen.
(II) 'Positieve' motieven.
Het bevorderen of vermeerderen van ongunstige c.q. ongewenste omstandigheden en gebeurtenissen.
De vraag is dus hoe sitiuaties in gewenste richting te kunnen beïvloeden.
2.2.
Vraagstukken.
Tijdrichting:
(a)
Terugzien (Retrospectief).
Kunnen achterhalen van de 'herkomst' van gebeurtenissen.
D.i. informatie over gebeurtenissen in het
verleden.
Deze informatie is nodig om twee dingen te weten te komen:
(1) Welke acties of gebeurtenissen hebben eerder tot ongewenste effecten geleid?
(2) Welke acties of gebeurtenissen hebben eerder tot gewenste effecten geleid?
Dus de vraag is, wat, welke factor, heeft een gegeven toestand veroorzaakt?
(b)
Vooruitzien
(
Prospectief).
Kunnen voorzien van de gevolgen van acties of gebeurtenissen.
D.i. informatie over gebeurtenissen in de
toekomst.
Deze informatie is nodig om twee dingen te weten te komen:
(1) Welke acties of gebeurtenissen zullen later tot ongewenste effecten leiden?
(2) Welke acties of gebeurtenissen zullen later tot gewenste effecten leiden?
Dus de vraag is, wat, welk effect, zal een bepaalde toestand veroorzaken?
2.3.
Verklaren en voorspellen.
Vervolgens hebben we inzicht nodig in twee volgende vraagstukken c.q. afgeleide doelstellingen:
(a)
Verklaren.
Onderzoek in hoeverre een gegeven verschijnsel, E1, kan worden verklaard als effect van een (eerdere
) oorzaak A1.
Dus het doel is: achteraf kunnen opsporen van oorzaken.
Dit vereist:
'Terugvoorspellen', retrodictie, causale attributie, backward mapping.
O.a. t.b.v. evaluatie, etiologie, determinatie, diagnose. D.m.v. abductie.
(b) Voorspellen.
Onderzoek in hoeverre een gegeven verschijnsel, A1, een oorzaak vormt voor een (later) effect E1
.
Dus het doel is: tevoren kunnen inschatten van effecten.
Dit vereist:
Voorspellen, predictie, forward mapping.
O.a. t.b.v. anticipatie, prognose. D.m.v. deductie.
Doel is dus het bepalen van dominante trends of tendenties, in een bepaald gebied in de werkelijkheid: een populatie
in het referentiële domein in de empirie.
2.4.
De 'standaard' Causale hypothese.
Het opstellen/ constructie van een nieuwe causale regel.
Formulering van een (toetsbare)
hypothese, veronderstelling over een trend c.q. tendentie in
het referentiële domein.
Deze geeft een
regel weer met betrekking tot een algemeen geldige wet, mechanisme of regelmatigheid.
Keuze van specifieke hypothese: op basis van beschikbare gegevens en bestaande inzichten.
(1)
Te onderzoeken:
Stelling: er geldt een
causale relatie tussen twee dingen c.q. verschijnselen: 'oorzaak' en 'effect', zeg
A1
en
E1.
D.w.z., "
A1 bewerkstelligt, versterkt, bevordert, verandert of beïnvloedt E1".
Notatie:
Bijv.: 'Causale relatie (A1, E1)'; of: 'CE(A1,E1)'; of: '(
A1 -> E1)'; of: '(A1 ==> E1)'; e.d..
Oftewel, gestandaardiseerd:
A1 E1.
(2)
Te toetsen hypothese:
Het verband kan direct of indirect, geheel of gedeeltelijk van toepassing zijn.
(a)
Er is een volledige causale determinatie.
Hypothese met de algemene vorm:
"A1 'VEROORZAAKT' E1".
Causale relatie vereist altijd:
symmetrische variatie van
A1 en
E1.
(
symmetrische variatie is de empirische basis voor rekenkundige
symmetrische variantie, beter bekend als
statistische
covariantie).
Oftewel:
A1 E1.
M.a.w.:
A1 vormt
volledig en
uitsluitend oorzaak van
E1.
Dat vereist: de
symmetrische variantie van
A1 en
E1 is totaal (± 1).
(b)
Of, er is een zekere mate van van causale determinatie:
"A1 'BEPAALT' E1".
D.w.z., de
symmetrische variantie van
A1 en
E1 wijkt af van nul.
(c)
Of, er is (tenminste) een gedeeltelijke causale determinatie:
"A1 'beïnvloedt' E1".
D.w.z., de
symmetrische variantie van
A1 en
E1 wijkt af van nul maar is niet volledig (± 1).
2.5.
Bewijzen of weerleggen.
Het onderzoeken en toetsen van een hypothese kan dienen voor twee doelen, die tegengesteld (
complementair)
zijn aan elkaar maar tegelijk weer twee kanten van dezelfde medaille, vanwege hun gemeenschappelijke onderwerp:
de geldigheid van een causale relatie.
(I)
Bewijsvoering.
Aanleveren van bewijzen, onderbouwing, argumentatie, premissen, bevestigingen of
positieve indicaties
(ondersteunende waarnemingen),
ter ondersteuning van een stelling c.q. hypothese.
(a) M.n. in discussiefase 1: bewijsvoering (a); stelling, betoog, pleidooi, onderbouwing
.
(b) M.n. in discussiefase 3: bewijsvoering (b); verweer, verdediging (rebuttal).
(c) M.n. in discussiefase 5: bewijsvoering (c); dupliek.
(II)
Weerlegging.
Aanvoeren van tegenwerpingen, met tegenbewijs, uitzonderingen, contra-indicaties, anomalieën
(onverenigbare waarnemingen),
ter bestrijding van een stelling c.q. hypothese.
(a) M.n. in discussiefase 2: weerlegging (a); commentaar, twijfel, tegenspraak, kritiek.
(b) M.n. in discussiefase 4: weerlegging (b); repliek.
2.6.
Te onderzoeken variabelen.
De - veronderstelde - betrokken factoren: ('
causale factoren').
Te meten
variabelen zijn:
(a)
Onafhankelijke variabele.
A1: Veronderstelde causale 'oorzaak'.
Verklarende c.q. voorspellende factor, explanatory variable (explanans).
De predictor variabele(n), determinant.
Initiële conditie, incentive, treatment, program.
(causa efficiens, impetus, stimulant, influence, agent, catalyst, trigger
; stimulus, ..).
(b) Afhankelijke variabele.
E1: Verondersteld, verwacht causaal 'gevolg', 'effect'.
Te verklaren c.q. te voorspellen factor (explanandum).
De criterium variabele(n), response variable.
'Effect', resultaat, uitkomst (outcome; symptom, performance).
Validiteit.
Beweringen over oorzaak-gevolg verbanden (verklaringen, voorspellingen) worden heel vaak gedaan zonder
een redelijke vorm van betrouwbaar onderzoek, adequate proefopzet en valide theorievorming.
In die gevallen is het nodig om de veronderstelde verbanden te kunnen toetsen met behulp van criteria
die betrekking hebben op de verschillende vereisten (noodzakelijke criteria) voor causale inferenties,
die anders via een 'echte' experimentele setting worden gewaarborgd.
3.
Conceptvaliditeit.
3.1.
Conceptvaliditeit van de causale factoren.
Vereisten aan de te meten
variabelen.
(1)
Eenduidig herkenbaar.
Elk is gedefinieerd via minstens één uniek kenmerk (of unieke combinatie van kenmerken).
(2) Traceerbaar in tijd en ruimte.
Elk is te 'verankeren' in tijd en ruimte, daardoor af te bakenen ten opzichte van andere gegevens.
(3) Meetbaar. D.i. observeerbaar.
Zintuiglijke verifieerbaarheid (empirische grond). Dus tenminste rechtstreeks empirisch toegankelijk en/of
(indirect) eenduidig afleidbaar.
3.2.
Conceptvaliditeit van het causale model.
Vereisten aan de
relaties tussen de factoren volgens het hypothetische model.
Algemene kenmerken van een
causaal mechanisme.
(1)
Evident verschil.
Er is minstens één evident verschil tussen causale factor en effect.
D.w.z. een eenduidig onderscheid.
Dit vereist: er is minstens één verschillend structuurkenmerk, dus in minstens één inherente eigenschap van beide
(het verschil volgt dus niet louter uit definitie, verwoording of interpretatie).
(2) Overbrugbaarheid.
Overbrugbaarheid van causale factor en effect.
Dit via domein-overlapping, van minstens één inherente eigenschap. (Anders is er geen transformatie
mogelijk).
Vereist: er is voldoende structuurovereenkomst, of symmetrie, in inherente eigenschappen, tussen
A1 en E1 (dus geen essentieel verschil).
(3) Toetsbaarheid.
Toetsbare vorm van de causale relatie.
Via eenduidige formulering en representatie.
Weergave van een duidelijke en vervulbare logisch-causale structuur: de causale relatie
kan direct of indirect zijn, met conjuncte of disjuncte, distale of proximale oorzaken en/of effecten, gemedieerd c.q.
geschakeld in keten of serie enz..
(4) Plausibel causaal werkingsmechanisme.
Het causale model dient een beschrijving te bieden van een aannemelijk causaal mechanisme dat verondersteld wordt
werkzaam te zijn in het referentiële domein. Deze biedt een eenduidige specificatie van een transformatieproces.
Deze specificatie dient te voldoen aan de algemene randvoorwaarden voor causale inferentie (zie aldaar).
4.
Betrouwbaarheid.
4.1.
Eisen aan de meetwaarden van de variabelen.
Betrouwbaarheid van gebruikte waarnemingsgegevens, benamingen en beschrijvingen, en cijfers (kwantitatieve data)
over incidentele feitelijke toestanden in het domein.
(1) Exactheid, 'scherpte'.
De meetwaarden zijn eenduidig 'leesbaar'. D.w.z. syntactische, met name lexicale betrouwbaarheid.
Dit wordt onder meer bevorderd door conceptvaliditeit, zie aldaar.
(2) Precisie, accuratesse.
De meetwaarden weerspiegelen de reële verhoudingen in het referentiële domein.
D.w.z. nauwkeurigheid, inhoudelijke correctheid, 'waarheidsgetrouwheid', correspondentie.
Dit vereist objectiviteit: de meetwaarden zijn in hoge mate 'object-bepaald', dat wil zeggen weerspiegelen
de beoogde, corresponderende (empirische) feiten.
De meetwaarden bevatten zo min mogelijk afwijkingen c.q. 'error' ten opzichte van de reële (empirische) feiten.
(3) Niet vertekend (non-biased).
Implicatie van (2). Er waren zo min mogelijk storende invloeden die kunnen hebben geleid tot niet-toevallige, zgn.
systematische error oftewel bias in de meetwaarden.
Zoals subjectiviteit: de meetwaarden zijn zo min mogelijk 'subject-bepaald', bepaald of 'gekleurd' door
niet-algemene persoonlijke of collectieve eigenschappen en processen, zoals percepties, interpretaties,
waarden, belangen, enz..
Betrouwbaarheid wordt onder meer bevorderd door
aselecte trekking. Die vermindert de kans op niet-toevallige
afwijkingen (ad 3). Daardoor kunnen eventuele afwijkingen later statistisch worden 'uitgemiddeld'
en met recht worden geduid als toevallig, 'ruis' oftwel
random error; zodat de objectieve feiten met meer
precisie (ad 2) (bij benadering) kunnen worden beschreven.
Aselecte trekking is bovendien van belang voor zowel interne als externe validiteit, zie aldaar.
Betrouwbaarheid wordt verder bevorderd, althans arbitraire afwijkingen in de meetwaarden worden tegengegaan, door
uniformiteit,
standaardisatie, van procedures door welomschreven protocollen - met als risico rigiditeit,
en daardoor weer selectiviteit.
5.
Controle op symmetrie.
Wat we eerst moeten zien aan te tonen is een samenhang tussen de onderzochte kenmerken in de waarnemingsgegevens.
5.1.
Afzonderlijke variantie.
Er blijkt voldoende
variantie van alle betrokken variabelen (
stochasten).
(Anders wordt
correlatie onmogelijk).
5.2.
Symmetrische variatie.
Om een causale relatie aan te tonen, moeten we op zijn minst een
symmetrische variantie aantonen.
Bij een evenredige relatie geldt:
(a) Hoe meer A1 afneemt - des te meer E1
afneemt.
(b) Hoe meer A1 toeneemt - des te meer E1 toeneemt.
Nb. Voor een 'omgekeerd evenredige' relatie geldt uiteraard het omgekeerde.
5.3.
Relaties tussen toestandsverschillen.
Als sprake is van een causale relatie, leidt verschil in het éne verschijnsel tot verschil in het andere verschijnsel.
(a) Een verschil of verandering in E1 - is gevolg van
enig verschil of verandering in A1.
(b) Een verschil of verandering in A1 - veroorzaakt enig verschil of verandering in E1.
Dus: De 'effect'-variabele
E1 vertoont in de regel een 'beduidende' patroonafwijking - in of na contact met
de 'oorzakelijke' variabele
A1.
5.4.
De logische structuur van causaliteit.
Voor gegronde toepassing van causale inferentie moet voldaan worden aan de algemene kenmerken van de
logische structuur van causale relaties.
(a)
Verklaren: aantonen van Noodzakelijke
voorwaarde
(
cruciale factor).
Causale attributie, met schema: 'Als
E1 dan (eerder)
A1'.
D.w.z.,
E1 is
voldoende indicatie voor (eerdere)
A1.
M.a.w., '
E1 impliceert
A1'.
{
E1 A1 };
{(
A1 ¬
E1 ) };
{¬(¬
A1
E1 ) }.
Het verband,
disjunctie, is niet direct empirisch waarneembaar.
Is houdbaar bij bevestigingen (
positieve indicaties,
hits):
'Zonder
A1, volgt geen
E1';
oftewel: 'Niet-
A1 en (kort daarna, eveneens) Niet-
E1', d.w.z.
{¬
A1 ¬
E1 }.
(b)
Voorspellen: aantonen van Voldoende voorwaarde
(
afdoende factor).
Causale deductie, Met schema: 'Als
A1 dan (later)
E1'.
D.w.z.,
A1 is
voldoende indicatie voor (latere)
E1.
M.a.w., '
A1 impliceert
E1'.
{
A1 E1 };
{(¬
A1 E1 ) };
{¬(
A1
¬
E1 ) }.
Het verband,
conjunctie, is niet direct empirisch waarneembaar.
Is houdbaar bij bevestigingen (
positieve indicaties,
hits):
'Zodra
A1, dan volgt
E1';
oftewel: '
A1 en (kort daarna, eveneens)
E1', d.w.z.
{
A1 E1 }.
(c)
Verklaren èn voorspellen: aantonen van Bepalende voorwaarde
(
relevante factor).
Causale inferentie, Met schema: 'Als
E1 dan (eerder)
A1', en/of 'Als
A1 dan (later)
E1
'.
D.w.z.:
A1 biedt
voldoende èn
noodzakelijke voorwaarde voor
E1.
D.w.z. er geldt een (logische)
equivalentie van
A1 en
E1.
(Nb. niet te verwarren met
identiteit, '=').
{(
E1 A1)
(
A1 E1) };
{(¬
E1 A1)
(¬
A1 E1) };
{¬(
E1 ¬
A1)
¬(
A1 ¬
E1) };
{
A1 E1 }.
Het verband,
equivalentie, is niet direct empirisch waarneembaar.
Is houdbaar bij bevestigingen (
positieve indicaties,
hits):
'Niet-
A1 en (kort daarna, eveneens) Niet-
E1', en/of '
A1 en (kort daarna, eveneens)
E1'.
5.5.
Componenten van causale werking.
Aantonen van
systematische bijdrage
Van veronderstelde causale factor
A1 aan verondersteld effect
E1.
Dit vereist minstens
éénzijdige afhankelijkheid van effect-variabele
E1 van oorzakelijke variabele
A1
.
Oftewel: een
monocausale relatie.
{N.b. Hier werken we onder de
default aanname: eventuele causale inwerking vindt plaats op
fysisch macro-niveau, dus in lineaire,
non-time-symmetric, irreversibele fysische tijd.
Geldig is de 'klassieke' c.q.
relativistische fysica (Newton-Einstein).
We gaan hier voorbij aan de
quantum-fysica, met 'anomalieën' zoals
non-localiteit e.d.. Dat is redelijk
omdat we in het dagelijks leven zelden direct merkbaar bemoeienis hebben met
sub-atomaire processen.
Zie voor algemene opmerkingen over quantum-theorie:
Quantum-verklaringen van bewustzijn. }.
Met name speuren we dus naar een specifiek soort
cruciale en
afdoende bijdrage
van de veronderstelde causale factor
A1 aan het verondersteld effect
E1.
(a)
Verklaren: aantonen van unieke /exclusieve bijdrage.
E1 kan dienen als indicator van A1.
(b) Voorspellen: aantonen van autonome /zelfstandige bijdrage.
(Impliceert onbelemmerde gelegenheid; afwezigheid van beletsel).
E1 is inherent aan A1.
De causale hypothese impliceert dus:
A1 levert
zelfstandige èn
unieke bijdrage aan
E1.
5.6.
Controle op contra-indicaties van causaliteit.
De betreffende causale hypothese is onhoudbaar in geval van uitzonderingen d.i. tegenvoorbeelden.
Deze hebben een specifieke
logische vorm.
(a)
Tegenbewijs van Noodzakelijke
voorwaarde.
'Niet-
A1 en (niettemin)
E1', d.w.z.
{¬
A1 E1 }.
(b)
Tegenbewijs van Voldoende voorwaarde.
'
A1 en (niettemin) Niet-
E1', d.w.z.
{
A1 ¬
E1 }.
(c)
Tegenbewijs van Bepalende voorwaarde
.
'Niet-
A1 en (niettemin)
E1', en/of '
A1 en (niettemin) Niet-
E1', d.w.z.
5.7.
Uitsluiten van onverwachte invloeden.
Controle op invloed van secundaire, onafhankelijke variabelen:
covariaten,
moderator variabelen.
(a)
Uitsluiten van disjuncte bijdragen.
Vereist uitsluiten van alternatieve verklaringen;
d.w.z. overbodigheid van de bijdrage van (oorzaak)
A1;
wegens
multi-causaliteit.
Impliceert uitsluiten van invloed van
disjuncte oorzaak
Dj in causale relatie.
Dj1: alternatieve, 'vervangende' voorwaarde, '
disjuncte' oorzaak,
additieve
/
parallelle oorzaak.
Met schema: 'Als (
A1 en/of
Dj1) dan
E1'.
{(
A1 Dj1 )
E1 }.
Variantie/ activiteit hiervan leidt
parallel tot
additionele component (proportie)
verklaarde variantie
.
Geeft kans op '
verstrengeling', onvoldoende onderscheid, van (parallelle) effecten.
Uitsluiten door aantonen van afwezigheid, isolatie, minimale waarde of constantie van mogelijke
Dj.
M.n. onder lage waarden van
A1.
D.w.z.: 'Niet-
A1 èn Niet-
Dj1'.
{¬
A1 ¬
Dj1 }.
(b)
Uitsluiten van conjuncte bijdragen.
Vereist uitsluiten van ontoereikende bijdrage van (oorzaak)
A1;
wegens
complexe oorzaak.
Impliceert uitsluiten van invloed van
conjuncte oorzaak
Cj in causale relatie.
Cj1: noodzakelijke, (rand)voorwaarde, '
conjuncte' oorzaak.
Bijv.
katalysator e.d..
Met schema: 'Als (
A1 èn
Cj1) dan
E1'.
{(
A1 Cj1 )
E1 }.
Variantie/ activiteit hiervan leidt
parallel tot
interactie-effect.
Geeft kans op ongegrond onderscheid van (samenhangende) oorzaken.
Constantie /passiviteit hiervan leidt tot
reductie /
degressie van component (proportie)
verklaarde variantie.
Uitsluiten door aantonen van afwezigheid, isolatie, minimale waarde of constantie van mogelijke
Cj.
M.n. onder hoge waarden van
A1.
D.w.z.: '
A1 en Niet-
Cj1'.
{
A1 ¬
Cj1 }.
(c)
Uitsluiten van gemeenschappelijke bijdragen.
Vereist uitsluiten van irrelevante c.q.
illusoire,
fictieve bijdrage van ('oorzaak')
A1;
wegens
gemeenschappelijke oorzaak.
Impliceert uitsluiten van invloed van gemeenschappelijke oorzaak (
common cause) oorzaak
Cm1
in causale relatie.
Cm1: gemeenschappelijke oorzaak, '
common cause'.
Met schema: 'Als
Cm1 dan (
A1 èn
E1)'.
{
Cm1 (
A1
E1 ) }.
Uitsluiten door aantonen van afwezigheid, isolatie, minimale waarde of constantie van mogelijke
Cm1.
D.w.z.: '
A1 en Niet-
Cm1'.
{
A1 ¬
Cm1 }.
Door aantonen van een exclusieve beïnvloeding van de (proximale) oorzaak
A1 door een specifieke
voorliggende oorzaak
P1.
P1: voorliggende, '
precedente' oorzaak.
Initiële, meer
distale oorzaak.
Met schema:
'Als
P1 dan
A1; Als
A1 dan
E1);
Als Niet-
P1 dan Niet-
A1; Als Niet-
A1 dan Niet-
E1)'.
{((
P1 A1 )
(
A1 E1 ) );
(¬
P1 ¬
A1 )
(¬
A1 ¬
E1 ) ) }.
Bijvoorbeeld door actief de
precedente oorzaak te reguleren.
Door middel van
gecontroleerde, c.q.
arbitraire eliminatie van
A1 in controle conditie; resp.
introductie van
A1 in experimente conditie.
(d)
Uitsluiten van omgekeerde causaliteit.
D.w.z. uitsluiten van omgekeerde (
inverse) causaliteit;
en wederzijdse (
reciproke) causaliteit.
Dus waarborgen van voldoende
onafhankelijkheid van causale factor
A1 t.o.v. effect-variabele
E1.
Dit kan door de meetwaarden te controleren op coördinaten in
tijd (
chronologie) en
ruimte (
gepaarde waarnemingen).
Zie verderop, aanvullende vereisten.
6.
Interne validiteit.
Interne validiteit: de mate waarin bevindingen, gevonden regelmatigheden in de waarnemingsgegevens
correct
zijn afgeleid uit, en
generaliseerbaar zijn, dus
geldig zijn binnen de (gehele) steekproef.
Waarborgen voor
interne validiteit.
Proefopzet (experimenteel ontwerp, design).
Minimale vereiste aan de waarnemings-situatie.
Globale opzet van het onderzoeksontwerp (
proefopzet,
design).
Dit dient bij voorkeur een 'echt experimenteel ontwerp' te zijn:
een gerandomiseerd, gebalanceerd, dubbel blind, pretest-posttest, placebo-gecontroleerd
onderzoek.
6.1.
Opsporen
van het verwachte verschil.
Nagaan of de veronderstelde 'oorzaak'
A1 inderdaad een noemenswaardig
verschil maakt
voor het veronderstelde 'effect'
E1.
D.w.z., vergelijken van de waarden van de 'effect-variabele'
E1 onder verschillende condities:
(a)
Condition 0. Controle- of baseline conditie.
Het bepalen van een ijkpunt (calibratie, benchmarking).
Met causale factor A1 afwezig constant, lager dan gemiddeld of op baseline niveau.
Door bijv. eliminatie, isolatie of fixatie /inhibitie - van de causale factor A1.
T.b.v. controle op disjuncte oorzaak Dj.
D.m.v. vóórmeting c.q. 'nulmeting' (pre-test).
M.b.t. de begintoestand van het systeem (initiële toestand).
(b) Condition 1. Experimentele of treatment conditie.
Testen van de causale relatie (trial).
Met causale factor A1 aanwezig, variabel, hoger dan gemiddeld of boven baseline niveau.
Door bijv. introductie, exposure, intrusion /activatie - van de causale factor A1.
T.b.v. controle op conjuncte oorzaak Cj.
D.m.v. nameting (post-test).
M.b.t. de eindtoestand van het systeem (finale toestand).
(c) Condition 2. Pseudo-experimentele of placebo conditie.
Alles overeenkomstig de experimentele conditie, maar nu met een gefingeerde causale factor, A2
aanwezig, variabel, hoger dan gemiddeld of boven baseline niveau.
T.b.v. controle op oneigenlijke, psychologische e.a. oorzaken.
6.2.
Verdeling van de (eerste) steekproef.
Eerste vereiste is aanwezigheid van voldoende, juiste conditiegroepen: met name een experimentele groep,
een controle-groep en eventueel een
placebo groep).
Steekproefgroepen (c.q.
cells).
(a)
Vergelijkingsgroep (comparison group).
Tbv. controle- of baseline conditie.
(b) 'Experimentele' groep.
Tbv. Experimentele of treatment conditie.
(c) 'Placebo' groep.
Tbv. Pseudo-experimentele conditie.
7.
Testen op symmetrie.
Het toetsen van de hypothese.
7.1.
Te bewijzen systematiek.
Aantonen van voldoende
systematiek van samenhang.
M.n. van voldoende
systematische coïncidentie resp.
symmetrische variatie van de gemeten variabelen.
7.2.
Herkennen van patronen.
Het vinden van causale werkingsprincipes komt nu neer op: het herkennen van
indicaties voor
- niet direct waarneembare -
patronen.
Observaties van bevestigingen en uitzonderingen, per steekproef-conditie.
(a)
Bevestigingen.
(
positieve indicaties,
hits).
(a1)
Onder controle conditie.
('nulmeting').
Het effect
E1 blijft afwezig, constant, lager dan gemiddeld of op
baseline niveau.
{
t1 t2
t3 ((¬
A1[t1] ..
¬
E1[t1] )
..
(¬
A1[t2] ..
E1[t3
] ) );
(1)
(
A1[t2]
..
E1[t3] );
(2)
((((
A1[t2] [
Cj1
[t2]] ) [
Dj1[t2]] )
..
((¬
A1[t2] [
±
Cj1
[t2]] ) [
¬
Dj1[t2]] ) )
..
¬
E1[t3] ). ) )
t3,
t2, t1 }.
(a2)
Onder experimentele conditie.
Het effect
E1 blijkt aanwezig, variabel, hoger dan gemiddeld of boven
baseline niveau.
{
t1 t2
t3 ((¬
A1[t1] ..
¬
E1[t1] )
..
(
A1[t2] ..
E1[t3
] ) );
(1)
(
A1[t2]
..
E1[t3] );
(2)
((((
A1[t2] [
Cj1
[t2]] ) [
Dj1[t2]] )
..
((
A1[t2] [
Cj1[
t2]] ) [
±
Dj1[t2]] ) )
..
E1[t3] ) ) )
t3,
t2, t1 }.
(b)
Uitzonderingen.
(
negatieve indicaties,
failures).
(b1)
Onder controle conditie.
{
t1 t2
t3 ((¬
A1[t1] ..
¬
E1[t1] )
..
(¬
A1[t2] ..
E1[t3
] ) );
(1)
¬
(
A1[
t2] ..
E1[t3] );
(2)
((((
A1[t2] [
Cj1
[t2]] )
Dj1[t2]
)
..
((¬
A1[t2] [
¬
Cj1[t2]] )
Dj1
[t2]
) )
..
E1[t3
] ). ) )
t3, t2, t1 }.
(b2)
Onder experimentele conditie.
{
t1 t2
t3 ((¬
A1[t1] ..
¬
E1[t1] )
..
(
A1[t2] ..
¬
E1[t3
] ) );
(1)
¬
(
A1[
t2] ..
E1[t3] );
(2)
((((
A1[t2]
Cj1[t2]
) [
Dj1[t2]] ) )
..
((¬
A1[t2]
¬Cj1[t2]
) [
¬
Dj1
[t2]] ) )
..
¬
E1[t3]
) ) )
t3, t2, t1 }.
Nb. Relatie met logische systemen.
De
empirische waarnemingen van
incidentele toestanden van de steekproef interpreteren we als logische (
grond)
instanties.
In die zin vormen ze
conjuncties van positieve en/of negatieve atomaire formules, zgn.
literalen.
{(±
A1[t2] [
±
Cj1
[t2]] ) [
±
Dj1[t2]] ) )
..
±
E1[t3] }.
Deze
instanties verwijzen - mits de meetgegevens betrouwbaar zijn - naar zgn.
domein toestanden.
Ze geven het domein weer op een louter beschrijvend niveau. Op semantisch niveau zijn dit waarheidsbeweringen
met betrekking tot de toestand van (delen van) het domein dat we in ogenschouw nemen.
8.
Aanvullende vereisten.
Als we bovendien een 'echte' causale relatie willen aantonen, moet nog aan een heel aantal aanvullende voorwaarden
worden voldaan.
8.1.
Kenmerken in fysische tijd.
(1)
Afzienbaarheid van transformatieproces.
Voldoende traceerbare en specifieke
tijdwaarden.
(a) Startmoment en eindtoestand van verandering in causale factor A1 - is
eenduidig traceerbaar.
(b) Startmoment en eindtoestand van verandering in effect-variabele E1 - is eenduidig traceerbaar.
(2)
Chronologie.
Adequate
tijdsvolgorde, (
chronologie,
temporele sequentie) van veranderingen in causale variabelen.
(a) Als A1 afneemt - zal daarna E1
afnemen.
(b) Als A1 toeneemt - zal daarna E1 toenemen.
T.b.v. uitsluiten van omgekeerde (
inverse) causaliteit;
en wederzijdse (
reciproke) causaliteit.
Dus waarborgen van voldoende
onafhankelijkheid van causale factor t.o.v. effect-variabele.
(3)
Faseverloop.
Herkenbare
stadia van
transformatie van de causale variabelen, m.n. de effect-variabele.
Minimaal vereiste opbouw en verloop van onderzoeks
procedure.
(a)
Beginfase.
Initiële toestand. Baseline conditie.
Start van de 'controle' conditie.
Eventueel voormeting, c.q. 'nulmeting' (pretest).
(b) Exposure fase.
Start van de 'experimentele' conditie.
Toevoeging, toename of verandering van veronderstelde 'oorzaak', causale factor A1 (exposure fase).
(c) Overgangsfase.
Contact-moment van 'sturende' causale factor A1 met 'ontvangende' effect variabele E1.
Start van het causale proces, 'drempeloverschrijding'.
Activatie van de cruciale causale schakel.
Omslagpunt; 'tussen-toestand'.
Ontstaan-moment (toename, verandering) van effect E1.
Start van de 'effect-fase'.
(d) Uitwerking van causale factor.
Verschijnen, toename of verandering van veronderstelde 'effect' E1.
Afloop van het causale proces.
(e) Eindfase.
Nameting (posttest).
Afronding van de procedure.
(4)
Relaties tussen tijdsverschillen.
Te verwachten toestanden in het domein op verschillende tijdstippen.
D.w.z. de te observeren waarden van variabelen (
A1,
E1} zijn op tijdstippen {
t1,
t2,
t3
, .. }:
(a)
Nominaal meetniveau (discreet, dichotoom):
'
A1 gaat in de tijd vooraf aan
E1'.
{
x t1
t2 t3 (((¬
A1[x,
t1] ..
A1[x,t2] )
(¬
E1[x,t1] ..
E1[x,t3] ) );
(
t1 <
t2 <
t3 ) )
t3, t2,
t1, x }.
(b)
Ordinaal en 'gradueel' meetniveau (scale: continu, interval, ratio):
Continuumhypothese: 'verandering in
A1 gaat in de tijd vooraf aan Verandering in
E1'.
(Waarbij '
X$
' staat voor waarde van een variabele
X).
{
x t1
t2 t3 (((
A1$
[x,t1] ..
A1$
[x,t2] )
(
E1$
[x,t1] ..
E1
$
[x,t3] ) );
(
A1$
[x,t1] <
A1$
[x,t2] );
(
E1$
[x,
t1] <
E1$
[x,t3] ) )
t3, t2,
t1, x }.
(5)
Temporele nabijheid.
Minimaal tijdverschil - tussen veranderingen in causale factoren {
A1,
E1}.
T.b.v. uitsluiten van (verkleinen van kans op) indirecte, 'geschakelde' (
sequentiële) causaliteit,
keten
causaliteit.
De oorzaken van
E1 kunnen geschakeld zijn, in keten of serie ('
domino-effect'), enz..
(6)
Voldoende constante latentietijd
Voldoende
constantie van tijdverschil - tussen veranderingen in causale factoren {
A1,
E1}.
T.b.v. uitsluiten van indirecte causaliteit,
intermediërende c.q.
instrumentele factoren; m.n.
variantie van
conjuncte oorzaken.
8.2.
Kenmerken in fysische ruimte.
(1)
Directe wederzijdse toegankelijkheid tussen causale factoren.
Een causaal effect E1 vereist de activatie van de cruciale causale schakel A1 tijdens het 'omslagpunt'
in het transformatieproces.
Dit vereist voldoende ruimtelijke nabijheid van de causale factoren. D.w.z., er is een contactgebied.
(2) Gebruik van gepaarde waarnemingen.
Vaak wordt een causale relatie niet in de interactie tussen groepen of individuen gezocht, maar binnen
- het functioneren van - individuen. In dat laatste geval ligt het vereiste contactgebied tussen de
veronderstelde een causale factoren in laatste instantie dus ook binnen elk individu. De waarnemingsgegevens
van de causale variabelen moeten dan ook per individu gekoppeld zijn: door 'gepaarde' waarnemingen.
8.3.
Kenmerken in materiaal.
(a)
Rechtstreekse inwerking
van de causale factor A1.
(b) Overdracht van kenmerken.
Bij contact (of meeste nabijheid), worden kenmerken van de causale factor A1 'verplaatst' of 'vertaald' naar
wijzigingen in kenmerken van de effect-variabele E1.
(c) Overgangsfase: graduele overgang.
Bij verandering van effect-variabele E1.
9.
Kwantitatieve kenmerken.
Berekeningen over de waarnemingsgegevens.
Dit betreft beschrijvende statistiek.
9.1.
In kaart brengen van frequenties.
We kunnen de waarnemingen overeenkomstig hun
logische structuur (zie boven) registreren, en hun
frequenties
opnemen in een zgn.
contingentie tabel (
cross tabulation, of '
crosstab').
Deze tabel bevat cellen voor alle categorieën van
variantie die in de waarnemingsgegevens naar voren komen:
d.w.z., voor alle mogelijke combinaties van gemeten variabelen - op zijn minst {
A1,
E1} - en hun waarden
- op zijn minst onder resp. boven hun gemiddelden: {0,1}. Ze bevat dus minimaal twee bij twee cellen: voor de
bevestigingen en uitzonderingen in zowel controle- als experimentele conditie.
9.2.
Vergelijken van proporties.
We kunnen met deze cijfers de hoeveelheden c.q.
proporties vergelijken tussen soorten observaties, c.q. metingen
in een steekproef met betrekking tot incidentele gevallen
x in de betreffende populatie, c.q. het referentieel
domein.
9.3.
Vergelijken van varianties.
Een contingentie tabel vormt bovendien de grondslag voor de berekening van talrijke statistische maten
voor de vergelijking van varianties, met name
Chi-kwadraat (Χ
2),
en varianten of afgeleiden daarvan, zoals (
Pearson product moment)
correlatie coëfficiënt,
regressie
coëfficiënt, proportie
verklaarde variantie,
Student's t,
F,
Fisher z, enz..
Deze maten worden gebruikt voor statistische toetsing van causale hypothesen (zie onder).
10.
Externe validiteit.
Externe validiteit: de mate waarin bevindingen, gevonden regelmatigheden in de waarnemingsgegevens voldoen aan
interne validiteit, en bovendien
generaliseerbaar zijn, dus
geldig zijn voor de (gehele) populatie.
De tweede stap in de statistische analyse is toetsen of de steekproefuitkomsten inderdaad de populatiewaarden
weerspiegelen op langere termijn - en dus mogen gelden voor de gehele populatie.
Dit betreft verklarende statistiek.
Waarborgen voor externe validiteit.
T.b.v.
generalisatie van (eerste) steekproef naar de populatie, c.q. een volgende steekproef (
inductie,
extrapolatie,
divergentie).
10.1.
Statistische analyse.
De eerste stap in de statistische analyse is toetsen of de steekproefuitkomsten op de onderzochte aspecten:
(a) voldoende betrouwbaar zijn, d.w.z. een behoorlijke afspiegeling bieden
van de populatie; en
(b) voldoende valide zijn, d.w.z. voldoende markant om zinvolle voorspellingen te doen vanuit
de steekproefgegevens naar toestanden in de populatie.
10.2.
Statistische maten.
Bij een statistische toets berekenen we een statistische grootheid uit een hoeveelheid beschikbare meetgegevens.
Die grootheid kan een maat zijn voor een statistisch verband: overeenstemming, of juist verschil.
Deze zijn uiteraard twee kanten van dezelfde medaille.
(a)
Correlatie.
r : gestandaardiseerde afgeleide van
gemeenschappelijke variantie (
covariantie) van
A1 en
E1.
(
Pearson product-moment correlatie coëfficiënt, van Karl Pearson (1857-1936).
De correlatie coëfficiënt heeft een gestandaardiseerd bereik, is dus onafhankelijk van schaal.
(-1 ≤ r ≤ 1 ).
T.b.v. test
symmetrische variatie van
A1 en
E1.
(
r = 0 ):
A1 en
E1 zijn onafhankelijk, niet gerelateerd.
(
r < 0 ): omgekeerd evenredig verband tussen
A1 en
E1.
(
r > 0.5 ): de hellingshoek (
gradient) van de correlatielijn ligt boven 45 graden.
Het is meestal de bedoeling dat de gevonden correlatie een
symmetrische variantie weerspiegelt
tussen reële processen in het referentiële domein c.q. de populatie. De veronderstelling is dat deze symmetrie
over langere termijn geldt en structureel is, dus
inherent aan de causale relatie tussen de betreffende factoren.
(b)
Regressie.
B1: regressiecoëfficiënt.
Bereik is afhankelijk van schaal c.q. van standaardisatie van {
X,
Y}.
y :=B0 +(B1 *x ) +e.
e:
error term (a.g.v. voorspellingsfout).
(
B1 > 1.0) : lijn boven 45 graden.
Ahw. Minder
x 'nodig', of 'aangevoerd', om dezelfde invloed op
y te krijgen.
Ahw. Relatief 'overmaat' van effect/winst
y.
(c)
Verklaarde variantie.
P: De
proportie verklaarde variantie (
pvv).
Het kwadraat van de correlatiewaarde levert de
proportie verklaarde variantie: de gestandaardiseerde
relatieve hoeveelheid symmetrische variantie (c.q.
covariantie) tussen de betreffende variabelen ten opzichte van
een volledige symmetrie.
(
P > 0.5 ): voorspelling
better than random.
(d)
Effect-verschil.
t :
t-waarde. (
Student's t).
T.b.v. test van verschil in effect
E1, met versus zonder oorzaak
A1.
10.3.
Statistische toetsing.
Waarborgen voor
Statistische conclusie validiteit.
10.3.1.
Zwakke, diffuse indicatie: Significantie van effect-verschil.
Als we een symmetrische variantie willen aantonen, moet op zijn minst blijken dat de gezochte symmetrie
in voldoende mate uit de waarnemingsgegevens naar voren treedt.
We onderzoeken allereerst de 'marginale' versie van de
causale hypothese:
A1 is
relevant voor
E1
.
Dat wil zeggen dat de 'oorzaak' inderdaad een noemenswaardig
verschil maakt voor het 'effect'.
M.a.w., het '
effect-verschil' tussen de onderzochte condities is in dat geval 'beduidend', voldoende markant,
dus in voldoende mate afwijkend van nul.
Dat betekent dat ze in statistische zin naar alle waarschijnlijkheid
afwijkt van toeval.
(I)
Bewijsvoering.
Hypothese H1 : de 'oorzaak' A1 maakt (wel) enig verschil voor het 'effect' E1.
('geen toeval', oftewel 'er-is-verschil').
(II) Weerlegging.
Hypothese H0 : de 'oorzaak' A1 maakt geen (enkel) verschil voor het 'effect' E1.
('louter toeval', oftewel 'geen-verschil').
Het begrip
significantie wil zoveel zeggen als dat het effect-verschil als 'beduidend' kan worden beschouwd.
Dus: er is tenminste een 'significant' verschil tussen de waarden van het 'effect' (
E1[t1],
E1[t3])
- onder een gegeven 'significant' verschil tussen de waarden van de 'oorzaak' (
A1[t1],
A2[t2]).
De vraag is nu hoe groot volgens de steekproefuitkomsten de kans is dat een voorspelde patroonafwijking
in de effect-variabele
E1 in de populatie niet louter toe te schrijven is aan toevalsvariantie
oftewel 'toevalsruis' (
random error).
We kunnen kijken of die afwijking afleidbaar is uit statistische gegevens.
We zoeken daarom een
rekenkundige relatie.
De statistische maat testen we in het algemeen op
consistentie - niet-strijdigheid - met de aanname dat
het gevonden verband louter aan toeval te wijten is, de zgn. 'nulhypothese'.
X : stochast, variabele Bijv. {A1,E1,.. }.
i : index van X-waarde.
x[i] : geobserveerde waarde van X in steekproef, score, X-waarde, schaal-gebonden.
z(x[i]) : z-waarde, gestandaardiseerde waarde van x[i].
Pdf : Probability density function.
Phi, Cdf : Cumulative probability density function.
(a)
Cumulatieve kans: p-waarde.
p : cumulatieve kansdichtheidswaarde, kanswaarde voor te meten waarde x
[i].
p = Phi(z(x[i])).
Gebaseerd op proportie bevestigingen (
pro-indicaties,
hits).
D.w.z., kans dat er enig verschil is (
t), resp. enig verband (
r).
(Deze twee, verschil en verband, zijn 'twee kanten van dezelfde medaille').
(b)
Toevalskans: q-waarde.
q : 'overschrijdingskans'.
Kanswaarde voor
veronderstelde toevalsvariantie, 'toevalsruis' (
random error), in het
voorspelde 'effect-verschil' voor de populatie.
q = 1.0 -p.
Gebaseerd op proportie uitzonderingen (
negatieve indicaties,
failures).
D.w.z., kans dat er geen verschil is (
t), resp. verband (
r).
(c)
Foutmarge: alpha (α).
Kanswaarde, voor maximaal toegestane toevalsvariantie, in het voorspelde 'effect-verschil' voor de populatie.
Anders gezegd de 'foutmarge', de kritische waarde, de criteriumwaarde is het maximaal niveau van de
random error
(de
q waarde) voor significantie.
Deze vertegenwoordigt de gehanteerde 'toevalstolerantie'.
Ze definieert het onzekerheidsgebied, de kritische zône, het verwerpingsgebied (voor H0), het
significantie
gebied.
De
alpha wordt arbitrair vastgesteld door de onderzoeker dan wel ingegeven door
de heersende academische conventies.
Gebruikelijk zijn tamelijk 'tolerante' c.q. 'liberale' waarden, meestal in de volgende
range:
(0.005 < α ≤ 0.05 ).
(Leveren enigszins hoge kans op 'fout Type I':
Overdeterminatie, overschatting van verband c.q. effect-verschil,
false positive conclusion; onderschatting van toeval).
Meer 'stringente' c.q. 'conservatieve' waarden liggen bijvoorbeeld in de
range:
(0.0005 < α ≤ 0.005 ).
(Leveren hogere kans op 'fout Type II':
Onderdeterminatie, onderschatting van verband c.q. effect-verschil,
false negative conclusion; onderschatting van toeval).
(d)
Betrouwbaarheidsinterval (confidence interval, CI).
CI = 1.0 -α
(e)
Significantie.
Wanneer blijkt dat de
q-waarde kleiner of gelijk is dan een bepaalde '
alpha' (α) waarde
kunnen we - voorlopig - concluderen tot
inconsistentie met de nulhypothese.
(q ≤ α ).
Bij een tweezijdige test:
(q ≤ (α /2 ) ).
Bij een gegeven steekproefgrootte
N en een bepaalde gekozen
alpha waarde geldt:
(·) Naarmate de symmetrische variatie tussen twee variabelen, (bijv. A1,
E1) toeneemt;
(·) neemt hun gemeenschappelijke variantie toe (c.q. covariantie, correlatie, proportie
verklaarde variantie, t-waarde, enz.);
(·) neemt de kansdichtheidswaarde (cumulatieve kans, p-waarde) van het statistische verband toe;
(·) neemt de toevalskans (verwachte random error, q-waarde) af;
(·) neemt de voorspellingsfout af (c.q. proportie onverklaarde variantie, enz.);
(·) neemt de 'overschrijdingskans', de kans op overschrijding van de gestelde foutmarge (alpha) af;
(·) neemt de kans op significantie toe.
10.3.2.
Sterke, scherpe indicatie: Voorspellende kracht van de correlatiewaarde.
Veelzeggender dan significantie is de kans dat de proportie verklaarde variantie in de populatie niet alleen
voldoende afwijkt van louter 'toevalsruis', maar bovendien behoorlijke
voorspellende kracht heeft.
Dat wil zeggen, dat de symmetrische variatie die ze weergeeft voldoende groot is voor
betrouwbare voorspellingen
van (nieuwe) meetwaarden.
Dit vereist dat ze niet te veel wordt overheerst door afwijkingen in het symmetrische patroon in de vorm van
'uitzonderingsruis' (
systematic error,
bias) onder invloed van andere causale factoren.
Dat wil zeggen, dat de kans op correcte voorspellingen ten minste die van louter 'toevaltreffers' overstijgt, dus
better than random is. Hiervoor dient niet zozeer de cumulatieve kanswaarde als criterium, maar eerder de
proportie verklaarde variantie. D.w.z.:
(P > 0.5).
11.
Aanvullende eisen aan de populatie.
(a) De populatie afzienbaar en inzichtelijk, dus is eindig.
(b) De gehele populatie blijft vanaf de eerste steekproef, tot en met de gehele periode waarover de onderzoeksresultaten
moeten gelden, in alle relevante opzichten constant.
12.
Aanvullende eisen aan de steekproef.
12.1.
Steekproef is vergelijkbaar met populatie.
Representativiteit van waarnemingen.
De steekproef is een evenredige afspiegeling van de populatie.
De steekproef is in elk onderdeel
representatief voor de populatie.
(a) Meerdere observaties. Om de kans op toeval te verkleinen helpt het om zoveel mogelijk
vergelijkbare situaties te observeren.
(b) De steekproefomvang is voldoende voor generalisatie.
(c) De steekproef heeft t.o.v. de populatie vergelijkbare, analoge samenstelling van elementen.
Er is dus geen sprake van een onevenwichtige, eenzijdige of 'partijdige' selectie van elementen.
Strategie: Controlling selection bias. Elk element uit de populatie heeft een gelijke kans
om in de steekproef terecht te komen.
Methode: De steekproef is aselect, dus 'blind', via volstrekt willekeurige selectie uit de populatie
tot stand gekomen.
Aselecte steekproef, randomisatie (random sampling, random selection).
(d) De steekproef heeft t.o.v. de populatie een vergelijkbare verdeling van eigenschappen over individuele eenheden.
Dit op grond van invloedrijke additieve kenmerken (covariaten).
Methode: trekking van elementen op basis van a priori ordening van de populatie: systematische steekproef,
gelede steekproef.
Afzonderlijke trekking per categorie; geleding (stratificatie, segmentatie) in quota, strata
, cohorts.
Verdeling van de steekproef in homogene subgroepen (blocks): matching/ pairing (vooraf),
blocking (achteraf).
12.2.
Steekproefgroepen zijn onderling vergelijkbaar.
(a) Steekproefgroepen zijn vergelijkbaar in omvang.
Gebalanceerde steekproef.
(b) Steekproefgroepen zijn vergelijkbaar in samenstelling.
Voldoende evenredige verdeling van eigenschappen over (sub)groepen.
Methode: random classificatie (random assignment). Aselecte toewijzing van steekproefeenheden aan
conditiegroepen en subgroepen.
12.3.
Steekproefeenheden zijn onderling vergelijkbaar.
Interne vergelijkbaarheid van steekproefeenheden (proefpersonen, respondenten,
subjects).
(a) Steekproefeenheden zijn volledig onderling 'inwisselbaar'. Zijn proxies van elkaar.
Alle steekproefeenheden zijn - over de gehele steekproef en binnen alle (sub)groepen - vanaf de aanvang onderling
identiek op niet-gemeten variabelen, en blijven dat ook tijdens de metingen.
(b) De waarnemingsgegevens zijn - binnen de experimentele condities - onderling onafhankelijk.
Strategie: De steekproefeenheden blijven geïsoleerd van elkaar, en worden per groep waarover gemiddeld wordt
uitsluitend in identieke situaties gebracht.
12.4.
Constantie.
Toestand tussen voormeting en nameting is
statisch (afgezien van de variatie van de 'oorzakelijke' variabele
A1).
Ceteris paribus conditie.
(a) De gehele steekproef blijft tijdens de metingen constant.
(a1) Steekproefomvang blijft gelijk.
(a2) Steekproefgroepen blijven gelijk (in omvang, samenstelling).
(a3) Steekproefeenheden blijven gelijk.
Ze blijven onder meer constant en geïsoleerd van externe invloeden.
(b) Er vindt geen beïnvloeding, interactie of communicatie plaats tussen steekproefgroepen.
(c) Er vindt geen beïnvloeding, interactie of communicatie plaats tussen steekproefeenheden.
Te voorkomen door o.m. 'blinde' opzet:
blind testing:
De steekproefeenheden weten niet bij welke groep c.q. conditie ze zijn ingedeeld
(weten het verschil in 'treatment' niet).
12.5.
Algemene vereisten voor de invloeden op de steekproefgroepen.
Er vindt geen beïnvloeding, interactie of communicatie plaats tussen onderzoekers en steekproefgroepen c.q. -eenheden.
Te voorkomen door o.m.:
(a) Uniforme omgeving en behandeling van steekproefeenheden.
Ceteris paribus conditie.
(Vaak onhaalbaar in sociaal-wetenschappelijk onderzoek).
(b) 'Dubbelblinde' opzet. De onderzoekers (proefleiders, observators e.a. uitvoerders) weten niet
met welke groep c.q. conditie ze te maken hebben (weten het verschil in 'treatment' niet).
(b) Onafhankelijkheid van uitvoerders.
Dit kan worden gecontroleerd door test-hertest vergelijking; d.m.v. herhaalonderzoeken door derden (
replicaties).
(c) Onafhankelijkheid van setting.
Dit kan worden bevorderd door de setting te variëren (ceteris liberis) via veldonderzoeken.
(d) Uitsluiten van onbedoelde covariaten (Zie elders).
13.
Aanvullende eisen aan de variabelen.
(a) De variabelen zijn op een interval-meetniveau (zeg een 'glijdende schaal') meetbaar,
- en zijn op die schaal ook gemeten.
(b) Bij correlatie-onderzoek: er blijkt een normale verdeling.
De gemeten variabelen (stochasten) vertonen in hun 'gedrag' (d.i. wisselende omvang) een spreiding c.q.
variantie die evenwichtig rond het gemiddelde schommelt. (Dit in overeenstemming met de zgn. Gauss functie
of bell curve).
(c) De meetwaarden van de onderzochte variabelen vertonen ook onderling een overeenkomstige variantie (
homoscedasticiteit).
In de praktijk blijken waarnemingsgegevens c.q. steekproefdata maar zelden aantoonbaar te voldoen aan al deze vereisten.
{Nb. In die gevallen worden vaak andere statistische analysemethoden aanbevolen, zoals
nonparametrische testtechnieken, maar deze hebben weer hun eigen zwaktes zoals beperkte bruikbaarheid
voor modelvorming met waarborging van voldoende betrouwbare voorspellende kracht). }
14.
Deductieve validiteit.
In veel gevallen waarin empirisch-statistisch onderzoek wordt toegepast ten behoeve van
causale analyse
is het doel om de uitkomsten toe te passen op grote groepen: bijvoorbeeld, het testen van nieuw ontwikkelde vaccins
om ze in geval van succes grootschalig te kunnen inzetten voor de bevolking.
Maar veel andere toepassingen hebben tot doel om beslissingen te ondersteunen in praktijksituaties, waarin het gaat om
een klein aantal behoorlijk unieke individuen: bijvoorbeeld, onderzoek naar therapeutische methoden om deze in geval van
behoorlijke effectiviteit te gebruiken in psychotherapie aan individuen of cliëntsystemen.
Dit betekent toepassing van de gevonden causale regel op specifiek geval: '
in vivo', c.q. '
in situ'.
De gemiddelde waarden zijn niet de individuele waarden.
Voor dit doel kan niet zonder meer gebruik worden gemaakt van de genoemde statistische maten, zoals
correlatie- en regressie-coëfficient, proportie verklaarde variantie. Deze zeggen in eerste instantie alleen iets
over de
gemiddelde waarden van de gehele steekproef, of van de populatiewaarden voor zover
die op een valide wijze geschat zijn. Ze zeggen echter vrijwel niets over meetwaarden van kenmerken van
individuen
in een steekproef of een populatie, dus nog minder over reële 'oorzaken' en 'effecten' in individuele gevallen.
De derde stap in de statistische analyse is dan ook het toetsen of de steekproefuitkomsten, in hun vertaling naar
populatiewaarden, inderdaad bruikbaar zijn ten behoeve van concrete toepassingen in praktijk
settings.
Dat vereist betrouwbare voorspellingen over nieuwe observaties, d.w.z. meestal veel kleinere steekproeven,
vaak van 'N=1' omvang.
14.1.
Waarborgen voor deductieve validiteit.
Derde steekproef.
Meting van de populatie, volgend stadium.
Derde selectie.
Voorspelling van populatie naar item, 'N=1' steekproef.
Tbv. substitutie, instantiatie, applicatie, deductie (convergentie, down-chunking
).
C.P. van der Velde © 2002, 2010, 2018.