Fotografías de niños brasileños, que a menudo abarcan toda su infancia, han sido utilizadas sin su consentimiento para alimentar herramientas de inteligencia artificial, incluidos generadores de imágenes populares como Stable Diffusion, advirtió Human Rights Watch (HRW) el lunes.
Según el informe de HRW, esta situación presenta riesgos urgentes para la privacidad de los niños y aumenta la posibilidad de que imágenes generadas por IA sin consentimiento exhiban su imagen.
Hye Jung Han, investigadora de HRW, ayudó a destapar el problema. Ella analizó «menos del 0,0001 por ciento» de LAION-5B, un conjunto de datos creado a partir de imágenes recopiladas de la web pública. Este conjunto no contiene las fotos originales, sino pares de imágenes y textos derivados de 5.850 millones de imágenes y leyendas publicadas en línea desde 2008.
Han encontró 170 fotografías de niños de al menos 10 estados brasileños en el conjunto de datos, mayormente fotos familiares subidas a blogs personales y videos de YouTube con pocas visualizaciones, destinadas a ser compartidas con familiares y amigos, informó Wired.
LAION, la organización alemana sin fines de lucro que creó el conjunto de datos, colaboró con HRW para eliminar los enlaces a las imágenes de los niños.
No obstante, esto podría no resolver completamente el problema. El informe de HRW advirtió que los enlaces eliminados «probablemente representan un conteo significativamente inferior a la cantidad total de datos personales de niños que existen en LAION-5B». Han expresó su preocupación de que el conjunto de datos todavía refiera a fotografías personales de niños «de todo el mundo».
Eliminar los enlaces no borra las imágenes de la web pública, donde pueden seguir siendo referenciadas y usadas en otros conjuntos de datos de IA, especialmente aquellos que dependen de Common Crawl, según Nate Tyler, portavoz de LAION.
«Este es un tema más amplio y preocupante, y como organización voluntaria sin fines de lucro, haremos nuestra parte para ayudar», dijo Tyler a Ars.
HRW señaló que muchas identidades de niños brasileños eran «fácilmente rastreables» debido a que los nombres y ubicaciones se incluyeron en los títulos de las imágenes procesadas al crear el conjunto de datos.
En un momento en que los estudiantes de secundaria y preparatoria son más vulnerables a ser acosados por la creación de «fotos inocuas» en imágenes explícitas, las herramientas de IA pueden estar mejor equipadas para generar clones de inteligencia artificial de niños cuyas imágenes están referenciadas en conjuntos de datos de IA, sugirió HRW.
«Las fotografías revisadas abarcan toda la infancia», indicó el informe de HRW. «Capturan momentos íntimos de bebés en manos enguantadas de médicos, niños pequeños apagando velas de cumpleaños, estudiantes presentando en la escuela y adolescentes posando en carnavales escolares».
El riesgo de que las fotos de los niños brasileños impulsen actualmente herramientas de IA es menor ya que «todas las versiones disponibles públicamente de LAION-5B fueron eliminadas» en diciembre, dijo Tyler a Ars, tras un informe de la Universidad de Stanford que encontró enlaces en el conjunto de datos que apuntaban a contenido ilegal, incluyendo material de abuso sexual infantil. El conjunto de datos no se volverá a publicar hasta que se elimine todo el contenido ilegal identificado.
«LAION está trabajando con la Internet Watch Foundation, el Centro Canadiense para la Protección Infantil, Stanford y Human Rights Watch para eliminar todas las referencias conocidas a contenido ilegal de LAION-5B», dijo Tyler a Ars. «Estamos agradecidos por su apoyo y esperamos volver a publicar pronto un LAION-5B revisado».
En Brasil, «al menos 85 niñas» han denunciado acoso escolar mediante el uso de herramientas de inteligencia artificial para «crear falsificaciones sexualmente explícitas basadas en fotografías de sus perfiles de redes sociales», informó HRW. Estos deepfakes explícitos pueden infligir «daño duradero» y potencialmente permanecer en línea durante toda su vida.
«Los niños no deberían vivir con el temor de que sus fotos sean robadas y utilizadas como arma contra ellos», dijo Han. «El gobierno debería adoptar urgentemente políticas para proteger los datos de los niños del uso indebido impulsado por la IA».
HRW insta a los legisladores brasileños a prohibir la inclusión de datos personales de niños en sistemas de inteligencia artificial, debido a los riesgos de privacidad y el potencial de nuevos abusos a medida que evoluciona la tecnología. También se espera que la Ley General de Protección de Datos Personales de Brasil se actualice para incluir «salvaguardias adicionales e integrales para la privacidad de los datos de los niños», señaló HRW.