Dataonderzoek wordt ook in de zorg steeds belangrijker. Om tot zorginzichten en de ontwikkeling van effectieve behandelingen te komen, loont het koppelen van grote databestanden uit diverse bronnen. Zorgpartijen riskeren daarbij echter dat gevoelige patiëntendata herleidbaar zijn naar het individu. Zo ook IKNL, dat de data van de meeste Nederlandse kankerregistraties beheert. “Voor onderzoek willen we deze aan data van andere bronnen kunnen koppelen en ze openstellen voor stakeholders,” zegt Gijs Geleijnse, programmamanager innovatie bij IKNL. “Maar hoe meer patiëntengegevens op één plek komen, hoe groter de kans is dat je individuen kunt identificeren.” Om dit op te lossen is IKNL in een al eerder stadium een samenwerking met TNO aangegaan onder de naam CONVINCED waarin oplossingen zijn ontwikkeld om op een privacyvriendelijke manier inzichten te halen uit data van verschillende partijen zonder deze data te hoeven delen of openbaren. “Lancelot is het vervolg daarop,” zegt Geleijnse.
Real World Data
Bij het farmaceutisch bedrijf Janssen speelt een soortgelijk probleem. Voor het ontwikkelen van effectieve behandelingen is het bedrijf gebaat bij het kunnen bestuderen van zoveel mogelijk data. “We willen data kunnen verrijken met meer variabelen en die aan elkaar koppelen,” zegt Ton Peters die zich bezighoudt met real world data. “Daar kunnen we veel van leren. Je ziet bijvoorbeeld in de ontwikkeling van kankergeneesmiddelen dat er steeds duidelijker sprake is van bepaalde mutaties in onze genen die leidend kunnen zijn voor een bepaalde behandeling en die in de meeste gevallen maar over kleine subgroepen gaan. Klinische studies zijn in de regel te klein qua opzet om hierover betere inzichten te krijgen. Real World Data kunnen mogelijk ons daarbij helpen, maar dan uiteraard wel op een privacy veilige manier. Het dilemma is alleen dat de meeste patiënten in Nederland nooit brede toestemming hebben gegeven aan private partijen om met bestaande data onderzoek te doen, ook al helpen ze daarmee de nieuwe patiënten. Dus we zaten al een tijd met de ‘hoe’ vraag.”
Technologie
De drie partijen vonden elkaar en zetten Lancelot op, vooralsnog in een ontwikkelfase waarbij wordt bekeken en getest hoe grote databestanden te koppelen zonder dat patiëntendata op straat komen te liggen. Daniël Worm houdt zich bezig met ICT-innovatie bij TNO en belicht de technische kant van Lancelot. “Er zijn nieuwe technieken die het mogelijk maken om op veilige manier inzichten te halen uit data zonder dat je die data hoeft te delen. Eén van die technieken heet multi party computation (MPC ); een verzameling van cryptografische technieken die data versleutelen. Iemand aan wie je de data geeft, kan daar geen informatie uithalen. Wel kunnen partijen er samen een berekening en analyse op uitvoeren, maar zonder dat ze data van de anderen te zien krijgen. Er zijn raakvlakken met blockchain en cryptocurrency. Daar gaat het ook om meerdere partijen die samen cryptotechnologie gebruiken, in dit geval om gezamenlijk een gedeelde waarheid vast te leggen en niet, zoals in ons geval, om data te beschermen. De rol van de vertrouwde tussenpersoon vervang je in beide gevallen door cryptografische technologie.”
Synthetische data
“We werken samen met epidemiologen die gewend zijn een aantal analysemethodes te gebruiken op centraal verzamelde data,” vult Geleijnse aan. “Voor Lancelot hebben we van die methodes de wiskundig meest ingewikkelde gepakt om te kijken of we die met de MPC techniek van TNO kunnen gebruiken. Met Nederlandse kankerregistratiedata hebben we nooit eerder een algoritme technologie ontwikkeld, een synthetische versie van data die op echte patiënten lijken zonder dat het kenmerken heeft van individuele patiënten. Het is een manier om toch toegang te geven tot realistische data zonder dat deze onder ogen komen van datawetenschappers. De data hadden echt kunnen zijn, maar we zitten nog in de fase van technologieontwikkeling.”
Van elkaar leren
Het unieke van Lancelot is volgens Geleijnse de samenwerking tussen drie partijen met een andere achtergrond. “Het is een mix van mensen die zich bezighouden met data verzamelen, technologisch onderzoek, data-sciences en cryptografische processen en geïntegreerd als één enthousiast team samenwerken. Dat is echt de kracht van Lancelot.” Worm: “We vullen elkaar aan en leren van elkaar. Het is de rol van TNO om vanuit de ICT technologie kennis toepasbaar te maken en dankzij de drie disciplines kun je hier net een stap verder in zetten naar de zorg toe.” “Een uniek project”, zegt ook Peters, “omdat de techniek ervan al bestaat in andere sectoren, maar het is niet eerder toegepast ten behoeve van kankeronderzoek.”
Lastig
“Wel hebben we met Lancelot gezien hoe lastig het in Nederland is om data van verschillende bronnen met elkaar te koppelen,” zet Geleijnse een kritische noot. “We mogen geen gedeeld patiëntnummer of BSN bewaren en we hebben het zo geregeld dat elke registratie zijn eigen opzet heeft. Data koppelen is al lastig, zonder in elkaars dataset te kunnen kijken maakt het nog lastiger. Met Lancelot hebben we daar nu wel een mooie methode voor gevonden, maar dit is echt een uitdaging voor het hele zorgdata-onderzoek in Nederland.”
HERACLES
Onder de naam Heracles is voor de komende 2,5 jaar inmiddels ook het vervolgonderzoek van Lancelot in het leven geroepen. Hierin zitten meer dan tien partijen samen waaronder de drie Lancelotpartijen en meerdere farmaceutische bedrijven, zorg-en technologiepartijen, zowel publiek als privaat. Worm: “Bij Lancelot gebruiken we synthetische data, maar met HERACLES willen we de stap zetten naar echte patiëntendata en alle uitdagingen die daarbij komen kijken.” “Met datapartners, waaronder IKNL en twee academische ziekenhuizen, gaan we specifiek naar long- en ovariumkanker kijken,” licht Peters toe. “In optima forma brengen we Lancelot met Heracles publiek en privaat gezamenlijk in praktijk vanuit verschillende vraagstellingen. Een zorgverzekeraar heeft een andere vraag dan een farmaceutisch bedrijf, een ziekenhuis een andere dan IKNL. Juist door de groep zo rijk en groot mogelijk te maken van achtergrond, ga je komen tot goede oplossingen.”
Internationaal
En dan is er nog een internationale ambitie. Peters: “Nederland is een goed georganiseerd land waar veel data beschikbaar zijn. Ik denk dat de volgende opdracht is om deze te koppelen aan andere landen. Kleine subgroepen worden grote subgroepen als je internationaal gaat denken. Dan ga je een versnelling krijgen in de leercurve en dat is precies wat we willen. Maar wel op een privacy-veilige manier.”
EM-103958