Lieke Vree, ster in bio-informatica in project VetGalaxy

Samenwerking voor effici毛nte analyse veterinaire data

Portret van Lieke Vree

Lieke Vree is bio-informaticus bij het Expertisecentrum Genetica Diergeneeskunde van de 乐鱼后台. Samen met moleculair geneticus Frank van Steenbeek en de centrale afdeling Research Data Management Support, werkt zij aan de pilot VetGalaxy om te zorgen dat onderzoekers datastromen effici毛nt en gebruiksvriendelijk kunnen analyseren. De bijzondere samenwerking is interessant voor andere genetici, maar ook voor andere onderzoeksafdelingen en faculteiten.

Hoe ben je bij het Expertisecentrum Genetica Diergeneeskunde terecht gekomen?

Mijn moeder is dierenarts en zij gaf advies over fokkerij aan een rasvereniging. Ik ging met haar mee naar een lezing georganiseerd door het Expertisecentrum Genetica en ik werd erg enthousiast van het onderzoek. Ik heb eerst stage gelopen en maak nu al sinds 3 jaar met veel plezier deel uit van het team als bio-informaticus.

Kun je kort uitleggen wat de pilot VetGalaxy inhoudt?

Bij Diergeneeskunde maken we steeds meer gebruik van big data. Zo krijgen we bijvoorbeeld van verschillende laboratoria SNP-data over varianten in het DNA en DNA-sequentiedata van het volledige genoom. Die laboratoria krijgen die data via dierenartspraktijken of eigenaren die met hun honden meewerken aan het onderzoek. Al die data brengen we bij elkaar in een grote dataset. Op dit moment hebben we al een dataset van duizenden honden.

Wat zijn de uitdagingen?

De informatie die je aangeleverd krijgt vanuit verschillende bedrijven en laboratoria kan heel verschillend zijn van vorm. De data zijn bijvoorbeeld anders genoteerd. Een stagiair vanuit de master Bio-informatica, Marilijn van Rumpt, heeft scripts geschreven om die genetische data vanuit verschillende bronnen geautomatiseerd samen te kunnen voegen. Die scripts passen we toe in het gebruiksvriendelijke platform Galaxy, zodat iedereen ermee kan werken. We schonen de data op, doen een kwaliteitscontrole en voegen ze vervolgens samen met de al bestaande dataset.

En wat kunnen onderzoekers ermee?

Ze kunnen er informatie uit halen over hoe ver dieren binnen de dataset genetisch van elkaar af staan en wat de familierelaties zijn. Ook kunnen data van een bepaald ras eruit gehaald worden, waarmee genetisch onderzoek gedaan kan worden. Het programma werkt vrij intu茂tief. Je klikt op wat je wil hebben, en je output rolt eruit. Zonder die scripts zou elke gebruiker programmeertaal moeten gebruiken om de informatie eruit te halen, dat is niet realistisch.

In onze onderzoeksgroep gebruiken we deze data hoofdzakelijk om te bepalen of er een verband is tussen bepaalde gebieden op het genoom en rasgebonden ziekten. En dan wil je uiteindelijk die ene DNA-variant vinden die bepalend is voor een verhoogd risico op een ziekte, zodat je een DNA-test kan ontwikkelen. Met die DNA-test kunnen fokkers vervolgens dieren screenen op het ziekterisico en de mutatie uit het ras proberen te krijgen door niet meer met ouderdieren met een hoog ziekterisico te fokken.

Kun je een voorbeeld geven?

Omdat we al zoveel data hebben verzameld kunnen we in onze database kijken of een gevonden DNA-variant wel echt zeldzaam is. Stel, we kijken naar een neurologische aandoening als epilepsie die specifiek in een ras voorkomt, en vinden een DNA-variant die oorzakelijk lijkt te zijn. Als dezelfde variant ook veel voorkomt in de hondenpopulatie kun je je afvragen of de gevonden DNA-variant wel echt de oorzakelijke variant van de neurologische aandoening is. Je kunt dan bijvoorbeeld aan het programma een maximale frequentie meegeven van de variant in de database, en dan worden varianten die hier niet aan voldoen er al uitgefilterd.

Wat wil je met dit werk bereiken?

Ons doel is het dat onderzoekers relatief gemakkelijk zelf de data van de hondenpopulatie die ze bestuderen kunnen opschonen en verder kunnen werken met kwaliteitsvolle data. Ook kunnen bijvoorbeeld meer controledieren van hetzelfde ras worden toegevoegd vanuit de grote database. Dan hoeft dat niet meer met de hand, en ook niet met programmeertaal. We willen het zo gemakkelijk maken dat ook iemand die niet heel handig is met de computer ermee om kan gaan. En dat lukt op dit moment al redelijk goed!

Met wie werk je samen?

We werken nauw samen met de Research Engineers van Information and Technology Services (ITS). Collega Frank van Steenbeek had gereageerd op hun Autumn Call for Research Engineering projects. De formule is dat zij een project aannemen en helpen uitvoeren van een onderzoeksgroep van de 乐鱼后台. Dat proberen we nu samen voor de eerste keer uit. Wij zijn de pilot, en het gaat hartstikke goed! Het zijn heel capabele mensen, die ook na de pilot beschikbaar blijven voor vragen. Dat is heel prettig voor ons. Verder kijkt Ren茅 Adelerhof mee, ICT Consultant van Diergeneeskunde, om idee毛n op te doen voor toekomstige samenwerkingsmogelijkheden voor de faculteit. Iedereen heeft tenslotte met data te maken.

Krijgen jullie al een beeld van andere mogelijke toepassingen?

Binnen het departement werken we al veel samen aan de data van de onderzoeksgroep OnGo. Verder zijn er mogelijkheden bij Landbouwhuisdieren en Paard; daar worden ook veel genetische data verzameld in het onderzoek. En er is nog veel meer mogelijk dan databeheer en -verwerking. De Research Engineers hebben een heel aanbod. Ik zou zeggen: maak daar gebruik van!

Hoe kijk jij naar de toekomst van genetisch onderzoek in relatie tot big data?

Ik zie allerlei mogelijkheden voor het schrijven van scripts, bijvoorbeeld voor het uitfilteren van mutaties die veel voorkomen in grote databases, of het vergelijken van mutaties die voorkomen bij honden die gediagnosticeerd zijn met een genetische ziekte enerzijds en honden die vrij zijn van de ziekte.

Maar we hebben ook al andere toepassingen, zoals PetScan, het systeem voor registratie van diagnosen, en Fit2Breed, de matching-app voor gezond gefokte honden. Die systemen draaien al. Voor PetScan maak ik de data-analyses, die ik overzichtelijk visualiseer. Voor Fit2Breed verwerk ik de SNP-data waarmee we kunnen berekenen hoezeer er bij een hond sprake is van inteelt. Zo kunnen er verwantschapsberekeningen gemaakt worden tussen honden. We willen dit uitbreiden naar steeds meer hondenrassen, want nu werkt het alleen nog voor het Nederlandse kooikerhondje, maar uitbreidingen komen eraan en we zijn ook heel trots op het platform dat nu al wereldwijd gebruikt wordt door fokkers van kooikerhondjes.

Ook zijn we bezig met het ontwikkelen van out-cross-modules, waarmee we de percentages van verschillende rassen in een hond proberen te bepalen. Zo kunnen we zo gezond mogelijk fokken!

Hoe zie je jouw eigen toekomst?

De pilot VetGalaxy eindigt in maart 2025, maar ik hoop nog lang aan dit soort optimalisatieprojecten te mogen werken. Veel mensen beginnen in een baan en vinden daarna steeds betere werkplekken. Ik hou van dieren, genetica en informatica en heb de perfecte combinatie dus al gevonden. Wat wil je nog meer?