slimme assistenten meeluisteren privacy medewerkers siri google assistant alexa
Privacy

'Afluisterende' slimme assistenten: dit moet je weten

31 juli 2019 om 15:59
Laatste update: 6 augustus 2019 om 17:56

Apple, Google en Amazon laten medewerkers meeluisteren met gesproken opdrachten aan slimme assistenten. Ook naar per abuis gemaakte opnames wordt meegeluisterd. Waarom doen de medewerkers dat? Is het gevaarlijk? En kun je het uitzetten?

Luisteren slimme speakers continu mee met alles wat je zegt?

Nee, slimme speakers luisteren alleen naar het activatiewoord. Denk aan: 'He Siri', 'Oké Google' of 'Alexa'. Pas als ze zo'n woord horen of denken te horen, reageren ze en wordt een opname gestart.

Die opname wordt dan via een beveiligde verbinding naar de servers van het desbetreffende bedrijf gestuurd. Daar genereert de spraakassistent een antwoord. Google werkt al aan een versie van zijn assistent die volledig op een telefoon zelf werkt.

Luisteren mensen mee met slimme assistenten?

Ja, maar het is wel de grote uitzondering. Onlangs waren er verhalen over Apple's Siri, Google Assistant en Amazon Alexa. De bedrijven gaven toe dat ze inderdaad mensen inzetten om hun slimme assistenten verbeteren.

Die medewerkers horen volgens de drie bedrijven 'korte fragmenten' van minder dan 1 of 0,5 procent van de opnames die door slimme speakers, telefoons en horloges zijn gemaakt.

Update: Inmiddels zijn zowel Google als Apple tijdelijk gestopt met het beluisteren van opdrachten. Beide bedrijven willen duidelijker aan klanten melden dat en waarom hun data gebruikt wordt, en het makkelijker maken om die deling van data te weigeren.

Waarom zijn er mensen nodig die meeluisteren?

Om de slimme assistenten te verbeteren, en dus slimmer te maken. De medewerkers luisteren naar twee soorten opnames: vragen die gebruikers bewust stelden, maar die bijvoorbeeld niet werden verstaan of verkeerd werden begrepen, en opnames waarbij de assistent per ongeluk werd geactiveerd.

Bij de bewuste vragen proberen de medewerkers te begrijpen wat een gebruiker bedoelde, waar het fout ging en hoe dat de volgende keer beter kan. Zo kan een gebruiker bijvoorbeeld een accent hebben, of was de vraagstelling anders dan een assistent begrijpt. Met die informatie worden de assistenten slimmer.

Bij opnames door een onbedoelde activatie van een assistent, is het de bedoeling om er achter te komen waarom de assistent per abuis werd geactiveerd. Medewerkers moeten zulke onbedoelde activeringen eruit vissen, en doorgeven aan de ontwikkelaars van de assistent.

Die kunnen er zo voor zorgen dat het aantal onbedoelde activeringen daalt, en een assistent alleen meeluistert als de gebruiker daar zelf om vraagt. Google zegt bijvoorbeeld dat 0,02 procent van alle interacties met zijn assistent onbedoeld is gestart. Zo'n percentage kan alleen bereikt worden door het aantal valspositieven terug te dringen, oftewel het aantal keren dat ten onrechte het activatiewoord wordt herkend. 

Waarom nu deze ophef?

De bedrijven hebben klanten niet duidelijk gezegd dat er medewerkers naar hun geluidsopnames kunnen meeluisteren. Ze hebben dit hooguit vaag in hun voorwaarden vermeld. Zo vraagt Google Assistant bijvoorbeeld of gebruikers akkoord gaan met het verzamelen van 'audiogegevens' om de functies van de spraakassistent te verbeteren.

Geen bedrijf stelt nadrukkelijk de vraag: 'Gaat u ermee akkoord dat fragmenten die deze assistent opneemt door mensen beluisterd worden om de assistent te verbeteren?'

Wie zijn die mensen die meeluisteren?

De mensen die naar geluidsopnames luisteren zijn meestal geen directe werknemers van Apple, Amazon of Google, maar medewerkers van externe bureau's. Zulke externe medewerkers zijn geen uitzondering in de tech-wereld: veel werk wordt uitbesteed, van tijdelijk werk tot handelingen waar andere bedrijven al beter in zijn.

Dit geldt ook voor het keuren van spraakopdrachten, waarvoor de techbedrijven in allerlei landen voor allerlei talen personeel moeten hebben. Techbedrijven werken zoveel met externe ondernemingen, dat bijvoorbeeld Google vorig jaar meer uitzendkrachten had dan vast personeel.

Wat als een medewerker iemand herkent?

Om te zorgen dat extern personeel niet met privédata aan de haal gaat, zijn er verschillende maatregelen. Ten eerste: data is geanonimiseerd. Bij opnames staan geen namen of andere gegevens waarmee de gebruiker te herleiden is.

Ten tweede: de opnames zijn willekeurig. De kans dat een medewerker toevallig een persoon herkent is klein. Wel zou een kwaadwillende medewerker uit kunnen zoeken wie iemand in de opnames is. Dat bewees de VRT, die Vlamingen opspoorde en ze confronteerde met hun eigen Google Assistant-opnames.

Ten derde: misbruik van zulke data is strafbaar. Honderdduizenden mensen in Nederland alleen al hebben dagelijks gevoelige informatie van burgers in handen. Bedrijven die met zulke gegevens omgaan, hebben contracten, geheimhoudingsverklaringen en andere gedragsclausules. Medewerkers die misbruik plegen, zetten daarmee veel op het spel. Er is dan ook nog geen praktijkvoorbeeld bekend waarbij daadwerkelijk misbruik is gemaakt van de opnames van een spraakassistent.

Kan je het meeluisteren door medewerkers uitzetten?

Bij Google Assistent en Alexa wel, bij Siri opvallend genoeg nog niet. Wel belooft Apple dat er binnenkort zo'n optie komt, en dat er tot die tijd niet meegeluisterd wordt.

Bij Google Assistant kunnen gebruikers in Gegevens en personalisatie bij Activiteitsopties hun Spraak- en audioactiviteit uitschakelen. Dan worden opnames niet meer met Google gedeeld voor personalisatie of verbetering van Assistent. Amazon Alexa heeft een vergelijkbare knop op de privacy-pagina van Alexa.

Kunnen virtuele assistenten straks zonder mensen?

Er komt een punt waarop spraakassistenten slim genoeg zijn om elke vraag in elke taal en accent en in elke volgorde en vorm te kunnen begrijpen. Maar daar zijn we nog niet, en daar komen zulke systemen ook niet helemaal alleen. Daarvoor is data nodig, die grotendeels door computers wordt geanalyseerd maar ook nog steeds door mensen.

Willen we dus slimme assistenten hebben, dan moeten we accepteren dat onze data door mensen wordt geanalyseerd. Vandaar misschien de vaagheid van bedrijven: zij weten dat dit een tijdelijke oplossing is, maar als iedereen nu zijn datadeling stopt, loopt ook de ontwikkeling van spraakassistenten vertraging op.

Wat dat betreft is het kiezen of delen: echt slimme assistenten of telkens het antwoord krijgen 'ik weet niet wat je bedoelt, stel de vraag opnieuw'.

Kijk ook: Sonos-speakers besturen met Google Assistant

Volg Bright op YouTube voor meer tech-video's