Certa tarde, no início de 2017, na sede do Facebook em Menlo Park, Califórnia, um engenheiro chamado Tommer Leyvand estava sentado em uma sala de conferências com um smartphone na aba do boné de beisebol. Elásticos ajudaram a fixá-lo no lugar com a câmera voltada para fora. O absurdo hat-phone, uma versão particularmente nada legal do futuro, continha uma ferramenta secreta conhecida apenas por um pequeno grupo de funcionários. O que isso poderia fazer era notável.
Os poucos homens presentes na sala riam e conversavam entusiasmados, conforme capturado em um vídeo feito naquele dia, até que um deles pediu silêncio. A sala ficou em silêncio; a demonstração estava em andamento.
O Sr. Leyvand virou-se para um homem do outro lado da mesa. A lente da câmera do smartphone – redonda, preta, sem piscar – pairava acima da testa de Leyvand como um olho de ciclope enquanto observava o rosto à sua frente. Dois segundos depois, uma voz feminina robótica declarou: “Zach Howard”.
“Sou eu”, confirmou Howard, engenheiro mecânico.
Um funcionário que viu a demonstração tecnológica achou que era uma piada. Mas quando o telefone começou a chamar nomes corretamente, ele achou assustador, como algo saído de um filme distópico.
O chapéu-telefone para identificação de pessoas seria uma dádiva de Deus para alguém com problemas de visão ou cegueira facial, mas era arriscado. A implantação anterior da tecnologia de reconhecimento facial pelo Facebook, para ajudar as pessoas a marcar amigos em fotos, causou protestos por parte dos defensores da privacidade e levou a uma ação coletiva em Illinois em 2015, que custou à empresa US$ 650 milhões.
Com uma tecnologia como essa na cabeça de Leyvand, o Facebook poderia impedir que os usuários se esquecessem do nome de um colega, lembrar em um coquetel que um conhecido tinha filhos para perguntar ou ajudar a encontrar alguém em uma conferência lotada. No entanto, seis anos depois, a empresa agora conhecida como Meta não lançou uma versão desse produto e Leyvand partiu para a Apple para trabalhar em seus óculos de realidade aumentada Vision Pro.
Nos últimos anos, as start-ups Clearview AI e PimEyes ultrapassaram os limites do que o público pensava ser possível ao lançar motores de busca facial emparelhados com milhões de fotos da web pública (PimEyes) ou mesmo milhares de milhões (Clearview). Com estas ferramentas, disponíveis para a polícia no caso do Clearview AI e para o público em geral no caso do PimEyes, uma fotografia de alguém pode ser usada para encontrar outras fotos online onde esse rosto aparece, revelando potencialmente um nome, perfis de redes sociais ou informações às quais uma pessoa nunca gostaria de ser vinculada publicamente, como fotos picantes.
O que estas start-ups fizeram não foi um avanço tecnológico; foi uma questão ética. Os gigantes da tecnologia desenvolveram a capacidade de reconhecer rostos de pessoas desconhecidas anos antes, mas optaram por reter a tecnologia, decidindo que a versão mais extrema – colocar um nome no rosto de um estranho – era perigosa demais para ser amplamente disponibilizada.
Agora que o tabu foi quebrado, a tecnologia de reconhecimento facial poderá tornar-se omnipresente. Atualmente utilizado pela polícia para solucionar crimes, por governos autoritários para monitorar seus cidadãos e por empresas para manter afastados seus inimigos, poderá em breve ser uma ferramenta em todas as nossas mãos, um aplicativo em nosso telefone – ou em óculos de realidade aumentada – que daria início ao um mundo sem estranhos.
‘Decidimos parar’
Já em 2011, um engenheiro do Google revelado ele estava trabalhando em uma ferramenta para pesquisar o rosto de alguém no Google e trazer outras fotos online dessa pessoa. Meses depois, o presidente do Google, Eric Schmidt, disse numa entrevista no palco que o Google “construiu essa tecnologia e nós a retivemos”.
“Até onde eu sei, é a única tecnologia que o Google desenvolveu e, depois de analisá-la, decidimos parar”, disse Schmidt.
Inadvertidamente ou não, os gigantes da tecnologia também ajudaram a impedir a circulação geral da tecnologia, abocanhando as start-ups mais avançadas que a ofereciam. Em 2010, a Apple comprou uma promissora empresa sueca de reconhecimento facial chamada Polar Rose. Em 2011, o Google adquiriu uma empresa norte-americana de reconhecimento facial popular entre as agências federais chamada PittPatt. E em 2012, o Facebook comprou a empresa israelense Face.com. Em cada caso, os novos proprietários encerraram os serviços das empresas adquiridas a terceiros. Os pesos pesados do Vale do Silício eram os guardiões de fato de como e se a tecnologia seria usada.
Facebook, Google e Apple implantaram tecnologia de reconhecimento facial de maneiras que consideraram relativamente benignas: como uma ferramenta de segurança para desbloquear um smartphone, uma forma mais eficiente de marcar amigos conhecidos em fotos e uma ferramenta organizacional para categorizar fotos de smartphones pelos rostos de as pessoas neles.
Nos últimos anos, porém, os portões foram pisoteados por empresas menores e mais agressivas, como Clearview AI e PimEyes. O que permitiu a mudança foi a natureza de código aberto da tecnologia de redes neurais, que agora sustenta a maioria dos softwares de inteligência artificial.
Compreender o caminho da tecnologia de reconhecimento facial nos ajudará a navegar pelo que está por vir com outros avanços na IA, como ferramentas de geração de imagens e texto. O poder de decidir o que podem ou não fazer será cada vez mais determinado por qualquer pessoa com um pouco de conhecimento tecnológico, que poderá não prestar atenção ao que o público em geral considera aceitável.
‘De pé sobre ombros de gigantes’
Como chegamos a este ponto em que alguém consegue identificar um “pai gostoso” em uma calçada de Manhattan e depois usar o PimEyes para tentar descobrir quem ele é e onde trabalha? A resposta curta é uma combinação de código gratuito partilhado online, uma vasta gama de fotografias públicas, trabalhos académicos que explicam como juntar tudo e uma atitude arrogante em relação às leis que regem a privacidade.
O cofundador da Clearview AI, Hoan Ton-That, que liderou o desenvolvimento tecnológico de sua empresa, não tinha experiência especial em biometria. Antes da Clearview AI, ele criou questionários no Facebook, jogos para iPhone e aplicativos bobos, como “Trump Hair”, para fazer uma pessoa em uma foto parecer penteada como o ex-presidente.
Em sua busca para criar um aplicativo inovador e mais lucrativo, Ton-That recorreu a recursos on-line gratuitos, como o OpenFace – uma “biblioteca de reconhecimento facial” criada por um grupo da Universidade Carnegie Mellon. A biblioteca de códigos estava disponível no GitHub, com um aviso: “Por favor, use com responsabilidade!”
“Não apoiamos o uso deste projeto em aplicações que violem privacidade e segurança”, dizia a declaração. “Estamos usando isso para ajudar usuários com deficiência cognitiva a sentir e compreender o mundo ao seu redor.”
Foi um pedido nobre, mas completamente inexequível.
O Sr. Ton-That colocou o código OpenFace instalado e funcionando, mas ele não era perfeito, então ele continuou pesquisando, vagando pela literatura acadêmica e repositórios de código, experimentando isso e aquilo para ver o que funcionava. Ele era como uma pessoa caminhando por um pomar, provando o fruto de décadas de pesquisa, maduro para ser colhido e gloriosamente livre.
“Eu não poderia ter feito isso se tivesse que construí-lo do zero”, disse ele, citando alguns dos pesquisadores que tinham visão computacional avançada e inteligência artificial, incluindo Geoffrey Hinton, “o padrinho da IA”. de pé sobre ombros de gigantes.”
Sr. Ton-That ainda está construindo. A Clearview desenvolveu uma versão de seu aplicativo que funciona com óculos de realidade aumentada, uma realização mais completa do chapéu de chamada facial que a equipe de engenharia do Facebook havia montado anos antes.
O fim do anonimato
O par de óculos de realidade aumentada de US$ 999, fabricado por uma empresa chamada Vuzix, conecta o usuário ao banco de dados da Clearview de 30 bilhões de rostos. O aplicativo AR da Clearview, que pode identificar alguém a até 3 metros de distância, ainda não está disponível publicamente, mas a Força Aérea forneceu financiamento para seu possível uso em bases militares.
Numa tarde de outono, o Sr. Ton-That me mostrou os óculos no apartamento de sua porta-voz, no Upper West Side de Manhattan, colocando-os e olhando para mim.
“Ooooh, 176 fotos”, disse ele. “Festival de Ideias de Aspen. Kashmir Hill”, leu ele na legenda da imagem de uma das fotos que surgiram.
Então ele me entregou os copos. Eu os coloquei. Embora parecessem desajeitados, eram leves e se ajustavam naturalmente. Ton-That disse que experimentou outros óculos de realidade aumentada, mas estes tiveram melhor desempenho. “Eles têm uma nova versão chegando”, disse ele. “E eles ficarão mais legais, mais modernos.”
Quando olhei para o Sr. Ton-That através dos óculos, um círculo verde apareceu em volta de seu rosto. Toquei em um touchpad na minha têmpora direita. Surgiu uma mensagem num display quadrado que só eu conseguia ver na lente direita dos óculos: “Procurando…”
E então o quadrado se encheu de fotos dele, com uma legenda abaixo de cada uma. Rolei por eles usando o touch pad. Toquei para selecionar um que dizia “CEO da Clearview, Hoan Ton-That”; incluía um link que me mostrava que vinha do site da Clearview.
Olhei para a porta-voz dele, examinei seu rosto e surgiram 49 fotos, incluindo uma de um cliente que ela me pediu para não mencionar. Isto revelou casualmente o quão intrusiva pode ser uma pesquisa no rosto de alguém, mesmo para uma pessoa cujo trabalho é fazer com que o mundo adote esta tecnologia.
Eu queria levar os óculos para fora para ver como eles funcionavam em pessoas que eu não conhecia, mas o Sr. Ton-That disse que não poderíamos, tanto porque os óculos exigiam uma conexão Wi-Fi quanto porque alguém poderia reconhecê-lo e perceber imediatamente o que eram os óculos e o que eles poderiam fazer.
Isso não me assustou, embora eu soubesse que deveria. Ficou claro que as pessoas que possuem uma ferramenta como esta terão inevitavelmente poder sobre aquelas que não a possuem. Mas havia uma certa emoção em ver aquilo funcionar, como um truque de mágica executado com sucesso.
Uma oportunidade perdida?
A Meta trabalha há anos em seus próprios óculos de realidade aumentada. Numa reunião interna no início de 2021, o diretor de tecnologia da empresa, Andrew Bosworth, disse que adoraria equipá-los com capacidades de reconhecimento facial.
Numa gravação da reunião interna, Bosworth disse que deixar o reconhecimento facial fora dos óculos de realidade aumentada era uma oportunidade perdida para melhorar a memória humana. Ele falou sobre a experiência universal de ir a um jantar e ver alguém que você conhece, mas não consegue lembrar seu nome.
“Poderíamos colocar um pequeno crachá neles”, disse ele na gravação, com uma risada curta. “Poderíamos. Nós temos essa capacidade.”
Mas ele expressou preocupação com a legalidade de oferecer tal ferramenta. BuzzFeed relatou suas observações na época. Em resposta, Sr. Bosworth disse que o reconhecimento facial era “extremamente controverso” e que conceder amplo acesso a ele era “um debate que precisamos ter com o público”.
Embora os óculos de realidade aumentada da Meta ainda estejam em desenvolvimentoa empresa desligou o sistema de reconhecimento facial implantado no Facebook para marcar amigos em fotos e excluiu mais de um bilhão de impressões faciais que havia criado de seus usuários.
Seria bastante fácil reativar esse sistema. Quando perguntei a um porta-voz da Meta sobre os comentários de Bosworth e se um dia a empresa poderia colocar reconhecimento facial em seus óculos de realidade aumentada, ele não descartou a possibilidade.