Frequentemente, durante as noites e às vezes nos fins de semana, quando os robôs não estavam ocupados fazendo suas tarefas diárias, Catie e sua equipe improvisada reuniam uma dúzia ou mais de robôs em um grande átrio no meio de X. Bandos de robôs começaram a se mover juntos, às vezes hesitantemente, mas sempre em padrões interessantes, com o que muitas vezes parecia curiosidade e às vezes até mesmo graça e beleza. Tom Engbersen é um roboticista da Holanda que pintou réplicas de obras-primas clássicas em seu tempo livre. Ele começou um projeto paralelo colaborando com Catie em uma exploração de como robôs dançantes poderiam responder à música ou até mesmo tocar um instrumento. Em um ponto, ele teve uma ideia inovadora: e se os robôs se tornassem instrumentos? Isso deu início a uma exploração em que cada junta do robô emitia um som quando se movia. Quando a base se movia, emitia um som grave; quando uma pinça abria e fechava, emitia um som de sino. Quando ligamos o modo de música, os robôs criavam partituras orquestrais exclusivas toda vez que se moviam. Quer estivessem andando por um corredor, separando lixo, limpando mesas ou “dançando” em bando, os robôs se moviam e soavam como um novo tipo de criatura acessível, diferente de tudo que eu já havia experimentado.
Este é apenas o começo
No final de 2022, as conversas de ponta a ponta versus híbridas ainda estavam fortes. Peter e seus colegas de equipe, com nossos colegas do Google Brain, estavam trabalhando na aplicação de aprendizado por reforço, aprendizado por imitação e transformadores — a arquitetura por trás dos LLMs — a várias tarefas de robôs. Eles estavam fazendo um bom progresso em mostrar que os robôs podiam aprender tarefas de maneiras que as tornavam gerais, robustas e resilientes. Enquanto isso, a equipe de aplicativos liderada por Benjie estava trabalhando em pegar modelos de IA e usá-los com programação tradicional para prototipar e construir serviços de robôs que pudessem ser implantados entre pessoas em cenários do mundo real.
Enquanto isso, o Projeto Starling, como a instalação multi-robô de Catie acabou sendo chamada, estava mudando como eu me sentia sobre essas máquinas. Percebi como as pessoas eram atraídas pelos robôs com admiração, alegria e curiosidade. Isso me ajudou a entender que como robôs se movem entre nós, e o som que eles emitem desencadeará profundas emoções humanas; será um fator importante em como, ou se, os receberemos em nossa vida cotidiana.
Estávamos, em outras palavras, à beira de realmente capitalizar a maior aposta que tínhamos feito: robôs movidos por IA. A IA estava dando a eles a capacidade de entender o que eles ouviram (linguagem falada e escrita) e traduzi-la em ações, ou entender o que viram (imagens de câmera) e traduzir isso em cenas e objetos nos quais pudessem agir. E como a equipe de Peter demonstrou, os robôs tinham aprendido para pegar objetos. Depois de mais de sete anos, estávamos implantando frotas de robôs em vários prédios do Google. Um único tipo de robô estava realizando uma série de serviços: limpando mesas em refeitórios de forma autônoma, inspecionando salas de conferência, separando lixo e muito mais.
Foi quando, em janeiro de 2023, dois meses após a OpenAI introduzir o ChatGPT, o Google fechou o Everyday Robots, citando preocupações gerais com custos. Os robôs e um pequeno número de pessoas acabaram chegando ao Google DeepMind para conduzir pesquisas. Apesar do alto custo e do longo cronograma, todos os envolvidos ficaram chocados.
Um Imperativo Nacional
Em 1970, para cada pessoa com mais de 64 anos no mundo, havia 10 pessoas em idade produtiva. Em 2050, provavelmente haverá menos de quatro. Estamos ficando sem trabalhadores. Quem cuidará dos idosos? Quem trabalhará em fábricas, hospitais, restaurantes? Quem dirigirá caminhões e táxis? Países como Japão, China e Coreia do Sul entendem a imediatez desse problema. Lá, robôs não são opcionais. Essas nações tornaram um imperativo nacional investir em tecnologias de robótica.
Dar um corpo à IA no mundo real é tanto uma questão de segurança nacional quanto uma enorme oportunidade econômica. Se uma empresa de tecnologia como o Google decidir que não pode investir em esforços “moonshot” como os robôs movidos a IA que complementarão e suplementarão os trabalhadores do futuro, quem o fará? O Vale do Silício ou outros ecossistemas de startups se apresentarão e, se sim, haverá acesso a capital paciente e de longo prazo? Tenho dúvidas. A razão pela qual chamamos a Everyday Robots de moonshot é que construir sistemas altamente complexos nessa escala foi muito além do que as startups financiadas por capital de risco historicamente tiveram paciência. Enquanto os EUA estão à frente em IA, construir a manifestação física dela — robôs — requer habilidades e infraestrutura onde outras nações, principalmente a China, já estão liderando.
Os robôs não apareceram a tempo de ajudar minha mãe. Ela faleceu no início de 2021. Nossas conversas frequentes perto do fim de sua vida me convenceram mais do que nunca de que uma versão futura do que começamos na Everyday Robots viria. Na verdade, não pode vir cedo o suficiente. Então a questão que nos resta ponderar é: como esse tipo de mudança e futuro acontece? Continuo curioso e preocupado.
Deixe-nos saber o que você pensa sobre este artigo. Envie uma carta ao editor em mail@wired.com.