Data science and data security

10 min

Ruben Verborgh over data & privacy

Hoe we de controle over onze persoonlijke data zullen heroveren 

Data is de ‘nieuwe olie’ die onze economie drijft, maar recente dataschandalen manen ons aan om beter na te denken over hoe gemakkelijk we onze data delen. Volgens Ruben Verborgh, expert in semantsiche webtechnologie, is de beste manier om opnieuw controle te krijgen over onze data een terugkeer naar een gedecentraliseerd web, een win-win scenario voor zowel consumenten als bedrijven.

Ruilhandel: mijn data voor jouw diensten

In maart 2018 verscheen het nieuws dat Cambridge Analytica de persoonlijke gegevens van miljoenen facebookgebruikers ingezet had voor politieke doeleinden. Het schandaal toonde vooral aan hoe weinig we erbij stil staan wat er met onze gegevens gebeurt. Tim Berners-Lee, de uitvinder van het World Wide Web, maakte zich al langer zorgen over ons gebrek aan controle over onze eigen data: in 2017 noemde hij dit één van de zorgwekkende trends in de evolutie van het web en beweerde hij dat het internet al lang niet meer zo ‘open’ was als oorspronkelijk bedoeld. 

Hoewel het internet gecreëerd werd als een ‘vrije ruimte voor iedereen’, is het web ondertussen geëvolueerd naar een centraal systeem dat gecontroleerd wordt door een klein aantal grote internetreuzen zoals Google en Facebook. 

Wat ze gemeenschappelijk hebben is hun ‘aantrekkelijke’ businessmodel: we kunnen gratis gebruik maken van hun diensten. Maar – als we de kleine lettertjes in hun databeleid zouden lezen – zouden we ons al snel realiseren dat we wel degelijk betalen, niet met geld, maar wel met onze persoonlijke data. 

De uitspraak ‘data is de nieuwe olie’ zegt genoeg: hoe meer data bedrijven vergaren, hoe sterker hun marktpositie. Voor Facebook zou de data van een gemiddelde gebruiker een jaarlijkse omzet van ongeveer 20 dollar opleveren. Op het eerste zicht lijkt dit een behoorlijk bedrag – zeker voor een site die 2,27 miljard actieve gebruikers heeft – maar vanuit het standpunt van de consument is dit eigenlijk relatief weinig. Laten we het omkeren: stel dat je alle data zou kwijt zijn die je de afgelopen 5 jaar verzameld hebt – al je foto’s en al je berichten – hoeveel zou je dan bereid zijn te betalen om die terug te krijgen? Op die manier bekeken is 20 euro in feite een verwaarloosbaar bedrag om de controle over onze data te heroveren (en zo ook onze privacy te verzekeren).

image

We laten voortdurend een spoor van data achter: data over ons persoonlijk leven, ons winkelgedrag, werkgerelateerde data, enz. Lange tijd leek niemand echt bezord over de hoeveelheid informatie die we ‘geven’ aan bedrijven zoals Facebook, Google en andere. Maar in de nabije toekomst zullen mensen opnieuw de controle over hun persoonlijke data opeisen.

 

Het businessmodel van het huidige gecentraliseerde web heeft niet alleen gevolgen voor onze privacy maar beperkt ook de innovatie op de markt. In dit systeem kan er namelijk maar één winnaar zijn, namelijk diegene die de meeste data bezit. In veel sectoren is die strijd intussen al beslecht en de winnaars zijn vaak weinig gemotiveerd om te innoveren. Waarom zouden ze de regels van het spel willen veranderen terwijl ze de leiding hebben?

Sociale media- en internetbedrijven zijn natuurlijk niet de enige spelers in de wereld van big data. Bijna alle bedrijven verzamelen informatie over hun klanten en zijn dus in zekere zin met big data bezig. Zelfs supermarkten tracken en analyseren wat je koopt en sturen je gepersonaliseerde reclame op basis van je profiel. Voor veel van deze bedrijven is big data slechts een middel om hun doel te bereiken: ze hebben die data nodig om hun diensten en verkoop te optimaliseren, maar zijn op zich niet geïnteresseerd in het verzamelen of beheren van data. Bovendien is data bezitten ook een risico, zeker sinds de GDPR (General Data Protection Regulation) van kracht is: als bedrijven data opslaan, verwachten klanten ook dat ze die kunnen beschermen.

Dromen van een gedecentraliseerd web

Tegen 2035 zullen we opnieuw de controle hebben over onze persoonlijke gegevens. In de praktijk betekent dit dat we zullen kunnen kiezen waar we onze data willen opslaan, los van de applicaties die we gebruiken. Onze persoonlijke data zullen we bewaren in zogenaamde ‘datapods’ die we zelf beheren. In een ideale wereld heeft iedereen meerdere data pods, zodat we bijvoorbeeld een aparte pod hebben voor persoonlijke data, werkgerelateerde data en officiële documenten, enz. Alles wat we posten zal opgeslagen worden in één van onze eigen datapods die bewaard worden op de server die wij kiezen.

Om in dit soort context een sociaal netwerk mogelijk te maken zullen we uiteraard een deel van onze data moeten delen. 

Alleen zullen we in het gedecentraliseerde web van 2035 voor elke applicatie apart kunnen kiezen welke data pod we beschikbaar willen maken. Bovendien zullen er geen kopieën van onze data gemaakt worden. Wel kunnen we applicaties linken naar de data pod (of een gedeelte ervan) dat we met hen willen delen. 

Op die manier blijven we ten alle tijden eigenaar van onze gegevens. Om dit systeem mogelijk te maken, is er een belangrijke voorwaarde: applicaties moeten in staat zijn om elkaars data te lezen en te (her)gebruiken.

Ter verduidelijking kunnen we best even vergelijken met een hedendaags voorbeeld: stel dat al je vrienden op Facebook zitten, maar jij verkiest een minder populair alternatief zoals Ello. In 2019 is dit niet evident, want op Ello zal je niet in interactie kunnen gaan met je vrienden. In het gedecentraliseerde web van 2035 zal het niet langer uitmaken welke sociale netwerksite je vrienden gebruiken. Aangezien applicaties niet langer data zullen bezitten, functioneren sociale media applicaties dan eigenlijk gewoon als verschillende interfaces om informatie uit de datapods van je vrienden weer te geven. Op die manier zou je dus erg gemakkelijk van applicatie kunnen wisselen. De concurrentiestrijd tussen applicaties onderling zou ook niet langer gaan over het bezitten van data, maar over het aanbieden van de beste service en kwaliteit.

Momenteel zit de helft van ons internet verborgen in datasilo’s gecontroleerd door een handvol bedrijven. Dit is eigenlijk min of meer hetzelfde alsof je browser zou bepalen welke websites je kan bezoeken. Stel je voor dat Safari-gebruikers niet in staat zouden zijn om websites gemaakt door Google Chrome-gebruikers te bezoeken. Dit is in feite even onlogisch als een sociale-netwerksite die bepaalt met welke vrienden of kennissen je kan interageren.

image

In een gedecentraliseerde visie worden dataopslag en applicaties van elkaar losgekoppeld. Sociale netwerken zullen elkaar proberen te overtroeven met de gebruiksvriendelijkheid van hun diensten in plaats van met het aantal gebruikers. Daarnaast zal ook een nieuwe markt ontstaan voor servers die dataopslag aanbieden.

 

Het einde van het big data-tijdperk: en dan?

Het web decentraliseren verstoort het huidige big data-businessmodel. Het verandert de manier waarop applicaties met elkaar in competitie gaan: terwijl ze nu voornamelijk nieuwe gebruikers aantrekken simpelweg omdat ze al veel gebruikers hebben, zullen ze hun klanten ineens moeten overtuigen met innovatie, bijvoorbeeld door de meest gebruiksvriendelijke interface aan te bieden, de beste klantendienst, feilloze databeveiliging, enz. Nog belangrijker: ze zullen ook een nieuwe manier moeten bedenken om winstgevend te zijn, bijvoorbeeld door een jaarlijkse bijdrage te vragen. Of misschien zullen ze ons de keuze geven om ofwel een vast tarief te betalen of (bewust) onze data aan hen te verkopen. Het belangrijkste is dat er in deze nieuwe manier van denken wel ruimte voor keuze en diversiteit zal zijn, wat automatisch ook opportuniteiten creëert.

De impact van het heroveren van onze data zal natuurlijk veel verder reiken dan enkel de wereld van sociale media. Veel consumenten weten vandaag bijvoorbeeld niet hoeveel of welke informatie hun supermarkt over hen heeft, laat staan dat ze er enige controle over hebben. In een gedecentraliseerd systeem zullen klanten eigenaar zijn van al deze data. Op het eerste zicht lijkt dit een enorm nadeel voor supermarkten, maar in feite is het ook een opportuniteit voor hen om net meer nuttige data te bemachtigen dan ze ooit zelf zouden kunnen verzamelen. Het wordt eigenlijk een soort ruilspelletje: klanten kunnen toestemming geven om al hun persoonlijke shoppingdata – van elke supermarkt – te delen met een bepaalde supermarkt in ruil voor persoonlijke kortingen. Als supermarkt Y dan bijvoorbeeld merkt dat je altijd yoghurt koopt bij hun concurrent, kunnen ze je een korting aanbieden op hun assortiment zuivelproducten. Op deze manier kunnen supermarkten het volledige winkelpatroon van hun klanten in kaart te brengen, wat waardevolle inzichten kan opleveren om hun aanbod te optimaliseren.

image

De meeste klanten beseffen vandaag niet hoeveel informatie een supermarkt over hen bezit. In een gedecentraliseerd systeem zullen klanten de controle hebben over hun eigen data en die (bewust) kunnen 'verkopen'. Voor supermarkten bijvoorbeeld kan dit een groot voordeel zijn: ze zouden toegang kunnen krijgen tot alle winkelgegevens van een klant, dus ook over zijn winkelgedrag bij andere supermarkten. Op die manier kan de supermarkt het volledige winkelgedrag analyseren en hun aanbod optimaliseren.

 

Waarom is dit hét moment om je privacy terug op te eisen?

Om een gedecentraliseerd web mogelijk te maken moet het brede publiek er natuurlijk eerst van overtuigd zijn dat dit noodzakelijk is. De groeiende bezorgdheid omtrent data privacy is alvast een eerste stap in de juiste richting. In 2018 gaf de Europese Unie ook een belangrijk signaal met de lancering van de General Data Protection Regulation (GDPR), een wetgeving die als voornaamste doel heeft om individuen opnieuw controle te geven over hun persoonlijke gegevens. 

Wetten zoals de GDPR maken het ook duurder voor bedrijven om data te bezitten, wat hen alleen maar kan stimuleren om naar een ander businessmodel te evolueren, vooral voor bedrijven die big data enkel gebruiken om hun diensten te optimaliseren en niet als een centrale component in hun businessmodel. 

Bedrijven zullen anders moeten beginnen denken over data. Net als olie zou het niet enkel opgeslagen moeten worden, maar echt een substantie moeten worden die onze motoren aandrijft. 

Gek genoeg betekent het teruggeven van de controle over data niet dat er minder data beschikbaar zal zijn. Integendeel, in een gedecentraliseerde visie zal er net meer data zijn want bedrijven zullen ook toegang kunnen vragen tot datasets gegenereerd door concurrenten.

 

Hoe werkt imec mee aan deze toekomst?

Natuurlijk hangen er ook een aantal grote technologische uitdagingen vast aan een gedecentraliseerde visie op het web. Big data bezitten en delen is gemakkelijk als alle informatie (zoals nu het geval is) op dezelfde plaats bewaard wordt, maar hoe maken we een big data-applicatie – zoals een sociaal netwerk – mogelijk als de gegevens en posts van gebruikers verspreid zijn over miljoenen individuele servers?

De grootste uitdaging van het gedecentraliseerde web is dat het significant meer rekenkracht en netwerkbandbreedte vraagt omdat de algoritmes veel complexer zijn. Tegelijkertijd zijn individuele locaties voor dataopslag natuurlijk veel minder krachtig dan grootschalige datacenters. De sleutel is samenwerking: elke persoonlijke data store en elk toestel (computers, smartphones, tablets, enz.) heeft zijn eigen CPU. Het grootste deel van de tijd worden die CPU’s eigenlijk niet gebruikt. Bij imec bekijken we daarom hoe we die CPU’s – wanneer ze niet door hun eigenaar gebruikt worden – kunnen laten samenwerken om voldoende rekenkracht en bandbreedte te creëren om een gedecentraliseerd web mogelijk te maken. Om de betrouwbaarheid van deze samenwerking te garanderen, experimenteren we momenteel met blockchain-technologie.


Meer weten? 

  • Voor meer informatie over hoe Ruben Verborgh denkt over het gedecentraliseerde web, neem zeker een kijkje op zijn persoonlijke blog.

Dit artikel is onderdeel van een speciale editie van imec magazine. Naar aanleiding van imecs 35-jarig bestaan vormen we ons een visie van hoe technologie onze maatschappij zal beïnvloeden in 2035.

Over Ruben Verborgh

Ruben Verborgh is onderzoeker in semantische hypermedia bij IDLab, een imec onderzoeksgroep aan de UGent, waar hij in 2014 zijn doctoraat in de computerwetenschappen behaalde. Zijn onderzoek focust op de relatie tussen semantische webtechnologieën en de architecturale eigenschappen van het web, met als ultieme doel om meer intelligente cliënten te bouwen. Tijdens zijn onderzoek raakte hij gefascineerd door Linked Data, REST/hypermedia, Web API’s en gerelateerde technologieën. Hij is co-auteur van twee boeken over Linked Data en verschillende van zijn artikels  over wegerelateerde onderwerpen werden gepubliceerd in internationale tijdschriften. In 2018 werd hij één van de medewerkers van Inrupt, de organisatie die Sir Tim Berners-Lee opzette om een ecosysteem – Solid genaamd – te creëren dat de decentralisatie van het web mogelijk wil maken.

Deze website maakt gebruik van cookies met als enige doel het analyseren van surfgedrag, zonder enige commerciële insteek. Lees er hier meer over. Lees ook ons privacy statement. Sommige inhoud (video's, iframes, formulieren,...) op deze website zal pas zichtbaar zijn na het accepteren van de cookies.

Accepteer cookies