Gigantes del sector tecnológico como Google, Apple, Amazon o Facebook han sido protagonistas de escándalos de privacidad relacionados con sus altavoces inteligentes. Pese a que utilizar este tipo de dispositivos supone introducir un micrófono en nuestro hogar, las compañías tratan de abanderar la privacidad en sus discursos, por lo que cabe preguntarse hasta qué punto estamos "a salvo" de ser espiados por estos altavoces.
Para responder a estas preguntas, hemos comparado los términos y condiciones de usuario de cada uno de ellos, recopilando del mismo modo algunos de los escándalos más sonados en relación a cada una de las compañías (ninguna se libra de la polémica), para tener algo de contexto acerca de los comportamientos de estos dispositivos.
Hablemos de las Condiciones de usuario
Los términos y condiciones de usuario son el primer punto en el que debemos fijarnos (aunque pueda resultar pesado leerlas por completo) si queremos saber hasta dónde pueden llegar los productos que estamos utilizando. Ya recopilamos de forma individual dichas condiciones de cada uno de los altavoces de las distintas compañías, por lo que vamos a compararlas mano a mano, para ver las principales similitudes y diferencias entre las mismas.
Hemos querido conocer puntos capitales a la hora de introducir un asistente en casa, como la información que se recopila, cuándo y dónde se recopila, si se puede eliminar y si se comparte con terceros
Nos hemos basado en puntos capitales a conocer sobre el comportamiento de los asistentes que utilizan estos altavoces inteligentes, para saber qué información recopilan, cómo se usa, si se envía o no a la nube, si hay posibilidad de eliminarla, y si se comparte o no con terceros dicha información. Los resultados han sido bastante similares, aunque hay ciertas diferencias.
Estos resultados proceden de lo que nos hemos encontrado en las propias políticas de privacidad de los asistentes, en los que cada compañía destaca y comenta dichos aspectos relativos al funcionamiento de los mismos. En otras palabras, aquí se resume de forma breve el funcionamiento esencial de cada uno de ellos... según la versión de cada fabricante.
Altavoces con Alexa
En los Términos y Condiciones de Uso de Alexa, se afirma que Amazon procesa y retiene nuestras interacciones con Alexa, tales como nuestras entradas de voz, listas de reproducción, listas de tareas y de la compra. Esta información queda almacenada en la nube de Amazon, y puede eliminarse aquella información relacionada con nuestras grabaciones de voz.
"Para proporcionar el servicio de Alexa, personalizarlo y mejorar nuestros servicios, Amazon procesa y retiene tus Interacciones con Alexa, tales como tus entradas de voz, listas de reproducción y listas de tareas y de la compra, en la nube. Puedes consultar más información acerca de estos servicios de voz, incluyendo cómo eliminar grabaciones de voz asociadas a tu cuenta."
Amazon asegura que trata de minimizar la cantidad de datos que envía a la nube, aunque el método no es nada del otro mundo. Básicamente, en este punto explican que verifican en la nube la palabra de activación, para recopilar datos tan solo a partir del reconocimiento de la misma (como hacen todos los demás). Esto significa que Alexa no está escuchándonos constantemente (según dice Amazon).
Alexa almacenará los datos referentes a nuestras interacciones con el asistente durante un año y medio, salvo que la eliminemos de forma manual
En cuanto al tiempo durante el que Alexa almacena los datos, Amazon ha comunicado a Xataka que es de 18 meses. Tras este periodo, las grabaciones y sus correspondientes transcripciones se eliminan de forma automática. No obstante, se puede eliminar en cualquier momento esta información de forma manual. Aún así, aunque estos datos se puedan eliminar, Amazon admite que algunos datos se almacenan de forma indefinida.
Google Assistant en Google Home
En el caso de Google no hay política de privacidad específica para cada producto, por lo que cabe consultar las condiciones de uso que aceptamos cuando utilizamos el Asistente de Google. Google es bastante clara, y en sus políticas de privacidad lleva por bandera un claro "al utilizar nuestros servicios, nos confías tus datos".
Toda la información que Google tiene de nuestra cuenta será utilizada por Assistant, amén de las grabaciones de voz que realiza dicho asistente
La compañía afirma que se recoge información desde cualquier dispositivo que se utilice para acceder a los servicios de Google. Entre ellos, se incluyen el tipo de navegador que usamos, sistema operativo, información sobre nuestra red, dirección IP, interacción con aplicaciones y navegadores, etc.
"Recogemos información sobre las aplicaciones, los navegadores y los dispositivos que utilizas para acceder a los servicios de Google. Esto nos permite ofrecerte funciones, como actualizaciones automáticas de productos, y atenuar la pantalla de tu dispositivo si tiene poca batería. Entre la información que recogemos se incluyen los identificadores únicos, el tipo de navegador y su configuración, el tipo de dispositivo y su configuración, el sistema operativo, información sobre la red móvil (como el nombre del operador y el número de teléfono) y el número de versión de la aplicación. También recogemos información sobre la interacción de tus aplicaciones, navegadores y dispositivos con nuestros servicios, como la dirección IP, informes sobre fallos, actividad del sistema, así como la fecha, la hora y la URL de referencia de tu petición."
En cuanto a la escucha, Google también envía la información a sus servidores después de la palabra de activación, 'OK Google', lo cual significa que el altavoz no está enviando todo el audio que recoge a la compañía.
Referente al tiempo durante el que la compañía almacena la información de los usuarios, encontramos algo más de flexibilidad respecto a Amazon. Desde la página de actividad de Google podemos seleccionar los periodos de tiempo en los que se borrará el rastro que hemos ido dejando. Tenemos opción de que los datos se eliminen a los 18 meses (al igual que Amazon), pero también podemos programar que este proceso se realice cada 3 meses, un periodo mucho más breve. Del mismo modo, podemos pedirle al propio asistente que elimine los datos, otro punto a favor.
Altavoces con Facebook Portal
En cuanto a la política de datos de Facebook con Portal, se deja bastante claro el tipo de información que se recopila. En primer lugar, cuentan que se recopila información sobre lo que tú y otras personas "hacéis y nos proporcionáis". Datos sobre nuestras comunicaciones, redes y conexiones, forma de utilizar sus productos, transacciones realizadas con los mismos, información sobre el dispositivo e información sobre terceros que pueden enviar a Facebook información sobre ti.
Aparte de estos datos, comunes a todos los productos de Facebook, desde Portal se recopilan datos sobre nuestras llamadas, cámara, interacciones de voz (cuyos archivos se mandan transcritos a la nube de Facebook), datos del entorno y servicios de terceros.
"Compartimos grabaciones y transcripciones de las interacciones de voz de “Hey Portal” con los proveedores de productos y servicios que nos ayudan a mejorar y perfeccionar nuestros sistemas de reconocimiento de voz, así como a solucionar sus problemas. Portal envía una transcripción de las interacciones de voz a las integraciones, servicios o aplicaciones independientes que responden a los comandos de voz de “Hey Portal” para que puedan contestar. También podemos compartir las interacciones de voz con terceros si creemos de buena fe que la ley así lo exige."
Facebook es la compañía que más tiempo guarda nuestros datos. Las grabaciones de Portal pueden llegar a estar en sus servidores durante un máximo de tres años
Facebook es la compañía que guarda durante más tiempo nuestros datos. En concreto, explican que pueden llegar a almacenar la información referente a nuestras grabaciones de voz durante un periodo máximo de tres años, aunque, al igual que sus competidores, podemos eliminar esta información de forma manual.
Apple y Siri en el Homepod
Siri también recoge datos como el usuario, nombre, contactos, música que se reproduce en el dispositivo o búsquedas que realizamos a través de la misma. El punto principal es que Apple intenta minimizar el envío de información a sus servidores (esto ya nos suena de Amazon), pero de una forma más efectiva.
"Intentamos mantener toda tu información en tu dispositivo, que es donde tiene que estar, y darte opciones para controlar cómo se comparte. Por ejemplo, cuando usas Siri para buscar una foto por ubicación o nombre de álbum, no necesitamos enviar la foto a un servidor para obtener una respuesta."
Como explican, uno de sus objetivos es mantener en local la información que no sea necesaria enviarla a los servidores. Por ejemplo, cuando buscamos información relativa a nuestras fotografías podemos encontrarla, sin necesidad de que dichas fotografías se envíen a la nube para ser analizadas.
En cuanto a la escucha, de nuevo encontramos que el envío a servidores solo se realiza cuando decimos la palabra clave por lo que, sobre el papel, el Homepod no está enviando constantemente los datos de las grabaciones residuales.
Apple es la compañía que más fácil lo pone para eliminar los datos. Además, dichos datos no van asociados a nuestro iCloud, sino a un identificador aleatorio
Referente al tiempo durante el que se almacenan nuestros datos, Siri es una de las propuestas más benevolentes. En este caso, los datos no se vinculan a nuestra cuenta del servicio (como sí hacen el resto de altavoces). Los datos que recoge Siri se vinculan a un identificador aleatorio que se renueva de forma automática cada seis meses, y que puede renovarse de forma manual con tan solo activar y desactivar 'Siri y dictado'. Cada vez que se renueva el identificador aleatorio, se borran todos los datos relacionados con él.
Escándalos y escuchas humanas
Una vez hemos conocido las diferencias y similitudes entre las distintas condiciones, conviene ahondar en los distintos escándalos que se han producido con cada uno de los altavoces inteligentes, ya que nadie está libre de pecado.
Ninguna de las compañías especifica en sus términos que se realicen escuchas por parte de equipos humanos. No obstante, las cuatro han incurrido en este tipo de prácticas
Las dudas sobre si hay equipos humanos o no escuchando lo que le decimos a los asistentes han sido protagonistas de varias noticias durante los últimos meses, dejándonos por el camino casos bastante sonados.
Amazon
En abril de 2019 nos hacíamos eco sobre las escuchas por parte de empleados de Amazon de las grabaciones de Alexa. Como vimos en las condiciones de Amazon, en ningún momento se especifica que haya trabajadores escuchando y analizando las grabaciones, pero, como descubrió Bloomberg, esto era práctica habitual.
Trabajadores de distintas localizaciones (Boston, India, Rumanía, etc) analizaban más de 1.000 clips diarios, para transcribirlos y hacer que el sistema de inteligencia artificial se nutriese de este feedback. En un comunicado de Amazon, la compañía aclaró que "los empleados no tienen acceso directo a la información que puede identificar a la persona o cuenta como parte de ese flujo de trabajo.
"Toda la información se trata de forma totalmente confidencial y usamos autenticación en varios pasos para restringir el acceso, además de implementar el cifrado del servicio y de controlar todo el entorno para protegerlo". Del mismo modo, añaden que los propios clientes pueden eliminar sus expresiones en cualquier momento."
En cuanto a los clips analizados, según Amazon, tan solo "se escucha un número extremadamente pequeño de interacciones de un conjunto aleatorio de clientes para mejorar la experiencia del cliente, siempre después de haber utilizado la palabra de activación de un dispositivo." Del mismo modo, se afirma que los trabajadores no tienen acceso a elementos que identifiquen al cliente y los asocien con clips de audio. Asimismo, admiten que comparten estas grabaciones y transcripciones con servicios de terceros.
Tras conocerse las escuchas humanas, nuevas informaciones apuntaron a lo fácil que resultaría a algunos trabajadores acceder a información sensible de los propios usuarios
Días después de publicar esta información, llegaban nuevas noticias acerca de que, además de las escuchas por parte de los trabajadores, estos podían acceder a información sensible de los usuarios, como su ubicación exacta.
Según Bloomberg, pudieron contactar con empleados de Amazon que explicaban lo sencillo que resultaba acceder a la ubicación de los usuarios. Dichos empleados formaban parte de 'Alexa Data Services', lo que les permitía no solo escuchar los audios del sistema, sino acceder a la latitud y longitud de cada usuario. La justificación para obtener estos datos es que Amazon los necesita para "proveer de mejor información en lo que respecta a sugerencias y preguntas relacionadas con comercios en la zona de los usuarios que preguntan".
Desde Xataka, obtuvimos información al respecto mediante un comunicado de la propia Amazon.
"El acceso a las herramientas internas está altamente controlado, y sólo se concede a un número limitado de empleados que necesitan estas herramientas para formar y mejorar el servicio mediante el procesamiento de una muestra extremadamente pequeña de interacciones. Nuestras políticas prohíben estrictamente el acceso de los empleados o el uso de los datos de los clientes por cualquier otra razón, y tenemos una política de tolerancia cero para el abuso de nuestros sistemas. Auditamos regularmente el acceso de los empleados a las herramientas internas y limitamos el acceso cuando y donde sea posible."
Por parte de Facebook, también tenemos información sobre que hay equipos humanos revisando y transcribiendo los mensajes de voz de Portal. Esta prática es recurrente en la compañía que, tiempo atrás, hizo lo mismo con los mensajes de Facebook Messenger, transcribiendo aquellos audios que se enviaban a través de dicha app.
Por el lado de Portal, Bloomberg confirmó que Facebook transcribía los clips de audio enviados a Portal, a través de treceros que trabajaban con la compañía para "mejorar los algoritmos de software".
"Hicimos una pausa en la revisión humana de las interacciones de voz 'Hey Portal' el mes pasado mientras trabajábamos en un plan que brindaba a las personas más transparencia y control, incluida una forma de desactivarlo"
Si bien "hicieron una pausa en la revisión humana", esta continúa activa, aunque se ofrece a los usuarios de Portal la opción de deshabilitar este servicio. Estas escuchas se escuchan por parte de terceros, contratistas de Facebook que tienen acceso a dichas transcripciones de audio.
A pesar de no estar especificado en sus términos, Google admitió que una pequeña parte de los fragmentos de audio pueden ser escuchados por terceros. En concreto, según la compañía, un 0,2% de los fragmentos de audio, que son enviados a empleados subcontratados para ser analizados.
Según la propia Google el objetivo de enviar estos fragmentos a "expertos en lenguaje" es mejorar el producto, argumento ya conocido y visto a lo largo de este artículo. Del mismo modo, aseguran que estos datos se envían anonimizados, y que de ningún modo se puede acceder a través de ellos a información personal de los usuarios.
El problema principal de este discurso es que si el audio contiene información personal (nombres, direcciones, etc) no hay forma de anonimizarlo, y de forma "indirecta", los empleados subcontratados estarían teniendo acceso a dicha información confidencial.
"Nos asociamos con expertos lingüistas de todo el mundo para mejorar la tecnología de voz transcribiendo un pequeño conjunto de palabras. Este trabajo es clave para desarrollar la tecnología que hace posible productos como el Asistente de Google. Los expertos lingüistas solo revisan alrededor del 0.2% de todos los pequeños fragmentos de audio y esos fragmentos no están asociados con las cuentas de los usuarios en el proceso de revisión."
La cosa no termina aquí con Google y es que, como leemos en Arstechnica, Google Home, junto a dispositivos con Alexa, fue utilizado para hacer phising. Un equipo de hackers camufló aplicaciones presuntamente para consultar el horóscopo pero que, realmente, se quedaban grabando las conversaciones de los usuarios sin su permiso y enviándolas a sus servidores, saltándose las medidas de seguridad de los asistentes.
Apple
Incluso Apple, la compañía que más cuida la privacidad de los usuarios, según hemos visto en esta comparativa sobre la privacidad de los altavoces inteligentes, se vio salpicada por escándalos referentes a escuchas por parte de humanos. La compañía contaba con un programa mediante el que terceros tenían acceso a las grabaciones de Siri.
Esto se traducía en que terceros podían tener acceso a grabaciones con información personal, que eran analizados para mejorar la precisión de Siri. Tras hacerse pública esta información, la compañía hizo un comunicado afirmando que pausaría dichas revisiones y, que en un futuro, los usuarios podrían tener control sobre si partipaban o no en este programa.
"Estamos comprometidos con proporcionar una gran experiencia con Siri al mismo tiempo que protegemos la privacidad del usuario. Mientras llevamos a cabo una exhaustiva revisión, hemos suspendido el programa global de calificación de Siri. Además, como parte de una futura actualización de software, los usuarios podrán elegir el participar en este programa."
No hay comentarios:
Publicar un comentario