Big Statistics (BigStats)
Sectie voorzitter: Prof. dr. M.A. van de Wiel (mark.vdwiel@amsterdamumc.nl)
In biomedische studies zien we vaak een speciale vorm van Big Data: die waarbij we meer meetpunten (variabelen, bijv. genen of eiwitten) dan individuen (patiënten) hebben: omics-studies. Dit vereist speciale statistische en machine learning technieken om bijv. voorspellingsmodellen te maken of om hypotheses te toetsen. Daarnaast proberen we steeds vaker externe informatie, bijv. uit data bases, te verwerken in onze analyses. Zo maken we onze voorspelmodellen beter en robuuster. We kijken ook naar het grotere plaatje: hoe interacteren de variabelen met elkaar (bijv. genen met eiwitten), één-op-één of in netwerken.
Daarnaast gebruiken we ook Big Data die wel echt Big zijn als het gaat om het aantal individuen. Hierbij specialiseren we ons in causale inferentie: met welke methoden kunnen we conclusies trekken over oorzaak en gevolg? Daarnaast knopen we met statistische technieken (geanonimiseerde) data aan elkaar om zo nog meer gegevens te kunnen gebruiken voor het oplossen van de vraag.
Wij ontwikkelen dus methoden om al deze complexe analyses te kunnen uitvoeren, en resultaten te kunnen toetsen en valideren.
Meer informatie