Ingenieros De Facebook: No Tenemos Idea De Dónde Guardamos Todos Sus Datos Personales

En una audiencia de descubrimiento, dos ingenieros veteranos de Facebook le dijeron a la corte que la compañía no realiza un seguimiento de todos sus datos personales.

EN MARZO, dos ingenieros veteranos de Facebook se vieron interrogados sobre las extensas operaciones de recopilación de datos de la empresa en una audiencia por la demanda en curso por el mal manejo de la información privada de los usuarios derivada del escándalo de Cambridge Analytica .

La audiencia, cuya transcripción fue revelada recientemente , tenía como objetivo resolver un tema crucial: ¿Qué información, precisamente, almacena Facebook sobre nosotros y dónde está? La respuesta de los ingenieros será un pequeño alivio para aquellos preocupados por la administración de la empresa de miles de millones de vidas digitalizadas: no lo saben.

Las admisiones ocurrieron durante una audiencia con el maestro especial Daniel Garrie, un experto en la materia designado por el tribunal encargado de resolver un punto muerto de divulgación. Garrie estaba intentando que la empresa proporcionara una contabilidad exhaustiva y definitiva de dónde se podrían almacenar los datos personales en unos 55 subsistemas de Facebook.

Ambos ingenieros veteranos de Facebook, con dos décadas de experiencia entre ellos, según LinkedIn, lucharon incluso para aventurar lo que puede estar almacenado en los subsistemas de Facebook. "Solo estoy tratando de entender al nivel más básico de esta lista lo que estamos viendo", preguntó Garrie.

“No creo que exista una sola persona que pueda responder esa pregunta”, respondió Eugene Zarashaw, director de ingeniería de Facebook. “Se necesitaría un esfuerzo de equipo significativo para poder responder esa pregunta”.

Cuando se le preguntó cómo Facebook podría rastrear cada bit de datos asociados con una cuenta de usuario determinada, Zarashaw se quedó perplejo nuevamente: “Se necesitarían varios equipos en el lado de la publicidad para rastrear exactamente el lugar donde fluyen los datos. Me sorprendería si hay incluso una sola persona que pueda responder a esa estrecha pregunta de manera concluyente”.

En una declaración enviada por correo electrónico que no abordó directamente los comentarios de la audiencia, la portavoz de Meta, Dina El-Kassaby, le dijo a The Intercept que la incapacidad de un solo ingeniero para saber dónde se almacenan todos los datos de los usuarios no fue una sorpresa. Ella dijo que Meta trabajó para proteger los datos de los usuarios y agregó: "Hemos realizado, y continuamos haciendo, inversiones significativas para cumplir con nuestros compromisos y obligaciones de privacidad, incluidos amplios controles de datos".

LA DISPUTA SOBRE dónde almacena Facebook los datos surgió cuando, como parte del litigio, ahora en su cuarto año, el tribunal ordenó a Facebook que entregara la información que había recopilado sobre los demandantes de la demanda. La empresa cumplió, pero proporcionó datos que consistían principalmente en material que cualquier usuario podía obtener a través de la herramienta de acceso público "Descargar su información" de la empresa.

Facebook sostuvo que cualquier dato no incluido en este conjunto estaba fuera del alcance de la demanda, ignorando la gran cantidad de información que la empresa genera a través de inferencias, asociaciones externas y otros análisis no públicos de nuestros hábitos, partes del funcionamiento interno del sitio de redes sociales que son oscuros para los consumidores. Brevemente, lo que consideramos como "Facebook" es, de hecho, una combinación de programas especializados que funcionan juntos cuando subimos videos, compartimos fotos o somos objetivo de publicidad. La red social quería mantener fuera de los tribunales el almacenamiento de datos en esas partes de Facebook que no son de consumo.

En 2020, el juez no estuvo de acuerdo con la afirmación de la empresa y dictaminó que la divulgación inicial de Facebook había sido demasiado escasa y que la empresa debe revelar los datos obtenidos a través de su capacidad oceánica para vigilar a las personas en Internet y hacer predicciones monetizables sobre sus próximos movimientos.

El bloqueo de Facebook ha sido revelador por sí solo, proporcionando variaciones sobre el mismo tema: ha acumulado tantos datos sobre tantos miles de millones de personas y los ha organizado de manera tan confusa que la transparencia total es imposible a nivel técnico. En la audiencia de marzo de 2022, Zarashaw y Steven Elia, gerente de ingeniería de software, describieron a Facebook como un aparato de procesamiento de datos tan complejo que desafía la comprensión interna. La audiencia ascendió a dos ingenieros de alto rango en uno de los equipos de ingeniería más poderosos y con más recursos de la historia que describieron su producto como una máquina desconocida.

El maestro especial a veces parecía incrédulo, como cuando preguntó a los ingenieros si existía alguna documentación para un subsistema de Facebook en particular. “Alguien debe tener un diagrama que diga que aquí es donde se almacenan estos datos”, dijo, según la transcripción. Zarashaw respondió:

“Tenemos una cultura de ingeniería un tanto extraña en comparación con la mayoría en la que no generamos muchos artefactos durante el proceso de ingeniería. Efectivamente, el código es a menudo su propio documento de diseño”. Rápidamente agregó: “Por si sirve de algo, esto también es aterrador para mí cuando me uní por primera vez”.

LOS COMENTARIOS EN la audiencia hacen eco de los encontrados en un documento interno filtrado a Motherboard a principios de este año que detalla cómo la disfunción de ingeniería interna en Meta, propietaria de Facebook e Instagram, hace que el cumplimiento de las leyes de privacidad de datos sea imposible. "No tenemos un nivel adecuado de control y explicabilidad sobre cómo nuestros sistemas usan los datos y, por lo tanto, no podemos hacer cambios de política controlados con confianza o compromisos externos como 'no usaremos X datos para Y propósito'", el 2021 documento leído.

El problema fundamental, según los ingenieros en la audiencia, es que la expansión de Facebook ha hecho que ya no se pueda saber en qué consiste; la empresa nunca se molestó en cultivar el conocimiento institucional de cómo funciona cada uno de estos sistemas componentes, qué hacen o quién los usa.

No hay documentación de lo que sucede con sus datos una vez que se cargan, porque eso nunca ha sido algo que la empresa haga, explicaron los dos.

“Es raro que existan artefactos y diagramas sobre cómo se usan esos sistemas y qué datos fluyen realmente a través de ellos”, explicó Zarashaw.

"Es raro que existan artefactos y diagramas sobre cómo se usan esos sistemas y qué datos fluyen realmente a través de ellos".

La incapacidad de Facebook para comprender su propio funcionamiento llevó la audiencia al borde de lo metafísico. En un momento, el maestro especial designado por el tribunal señaló que el archivo "Descargar su información" proporcionado a los demandantes de la demanda no debe haber incluido todo lo que la empresa había almacenado sobre esas personas porque parece no tener idea de lo que realmente almacena sobre nadie.

¿Puede ser que la herramienta designada por Facebook para descargar su información de manera integral no descargue toda su información? Esto, nuevamente, está fuera de los límites del conocimiento.

“Desafortunadamente, la solución a esto es exactamente el trabajo que se realizó para crear el archivo DYI”, señaló Zarashaw. “Y con lo que lucho aquí es para encontrar brechas en lo que puede no estar en el archivo DYI, por definición, necesitaría hacer aún más trabajo del que se hizo para generar los archivos DYI en primer lugar”.

La confusión sistémica del almacenamiento de datos de Facebook hizo que responder incluso a la pregunta más básica fuera inútil. En otro momento, el maestro especial preguntó cómo se podía averiguar qué sistemas contienen realmente datos de usuario que se crearon a través de la inferencia de la máquina.

“No lo sé”, respondió Zarashaw. “Es un enigma bastante difícil”.

Actualización: 7 de septiembre de 2022, 9:56 p. m. ET

Esta historia se actualizó para incluir una declaración de Meta enviada después de la publicación.

Sam Biddle