A OpenAI também está evidentemente intensificando seus próprios esforços em robótica. Na semana passada, Caitlin Kalinowski, que anteriormente liderou o desenvolvimento de headsets de realidade virtual e aumentada na Meta, anunciado no LinkedIn que ela estava ingressando na OpenAI para trabalhar com hardware, incluindo robótica.
Lachy Groom, amigo do CEO da OpenAI, Sam Altman, e investidor e cofundador da Physical Intelligence, junta-se à equipe na sala de conferências para discutir o lado comercial do plano. O noivo usa um moletom de aparência cara e parece extremamente jovem. Ele enfatiza que a Inteligência Física tem muitos caminhos para buscar um avanço no aprendizado de robôs. “Acabei de receber uma ligação com Kushner”, diz ele em referência a Joshua Kushner, fundador e sócio-gerente da Thrive Capital, que liderou a rodada de investimento inicial da startup. Ele também é, claro, irmão do genro de Donald Trump, Jared Kushner.
Algumas outras empresas estão agora buscando o mesmo tipo de inovação. Uma chamada Skild, fundada por roboticistas da Universidade Carnegie Mellon, arrecadou US$ 300 milhões em julho. “Assim como a OpenAI construiu o ChatGPT para linguagem, estamos construindo um cérebro de uso geral para robôs”, diz Deepak PathakCEO da Skild e professor assistente da CMU.
Nem todo mundo tem certeza de que isso pode ser alcançado da mesma forma que a OpenAI decifrou o código de linguagem da IA.
Simplesmente não existe um repositório em escala de internet de ações de robôs semelhantes aos dados de texto e imagem disponíveis para treinamento de LLMs. De qualquer forma, alcançar um avanço na inteligência física pode exigir exponencialmente mais dados.
“As palavras em sequência são, dimensionalmente falando, um pequeno brinquedo comparado a todos os movimentos e atividades dos objetos no mundo físico”, diz Illah Nourbakhsh, roboticista da CMU que não está envolvido com Skild. “Os graus de liberdade que temos no mundo físico são muito mais do que apenas as letras do alfabeto.”
Ken Goldberg, um acadêmico da UC Berkeley que trabalha na aplicação de IA a robôs, adverte que o entusiasmo crescente em torno da ideia de uma revolução de robôs alimentada por dados, bem como de humanóides, está atingindo proporções exageradas. “Para atingir os níveis de desempenho esperados, precisaremos da ‘boa e velha engenharia’, modularidade, algoritmos e métricas”, diz ele.
Russ Tedrakecientista da computação do Instituto de Tecnologia de Massachusetts e vice-presidente de pesquisa robótica do Toyota Research Institute, diz que o sucesso dos LLMs fez com que muitos roboticistas, inclusive ele próprio, repensassem suas prioridades de pesquisa e se concentrassem em encontrar maneiras de buscar o aprendizado robótico de uma forma mais escala ambiciosa. Mas ele admite que permanecem desafios formidáveis.