Você teria que seja corajoso ao apostar contra a ideia de que aplicar mais poder de computação e dados ao aprendizado de máquina – uma receita que deu origem ao ChatGPT – não levará a mais avanços de algum tipo na inteligência artificial. Mesmo assim, você ainda seria mais corajoso em apostar que essa combinação produzirá avanços ou avanços específicos em um cronograma específico, não importa o quão desejável seja.
Um relatório divulgado no fim de semana passado pelo banco de investimento Morgan Stanley prevê que um supercomputador chamado Dojo, que a Tesla está construindo para impulsionar seu trabalho em direção autônoma, poderia adicionar US$ 500 bilhões ao valor da empresa, proporcionando uma enorme vantagem na fabricação de automóveis, robotáxis e venda de software para outras empresas.
O relatório aumentou o preço das ações da Tesla, acrescentando mais de 6%, ou US$ 70 bilhões – aproximadamente o valor da BMW e muito menos do que Elon Musk pagou pelo Twitter – ao valor de mercado do fabricante de EV em 13 de setembro.
O relatório de 66 páginas do Morgan Stanley é uma leitura interessante. Ele apresenta um argumento apaixonado sobre por que o Dojo, os processadores personalizados que a Tesla desenvolveu para executar algoritmos de aprendizado de máquina, e a enorme quantidade de dados de direção que a empresa está coletando dos veículos Tesla na estrada, poderiam render enormes dividendos no futuro. Os analistas do Morgan Stanley dizem que o Dojo proporcionará avanços que darão à Tesla uma vantagem “assimétrica” sobre outras montadoras na direção autônoma e no desenvolvimento de produtos. O relatório ainda afirma que o supercomputador ajudará a Tesla a se ramificar em outras indústrias onde a visão computacional é crítica, incluindo saúde, segurança e aviação.
Há boas razões para ser cauteloso em relação a essas afirmações grandiosas. Você pode ver por que, neste momento específico de mania da IA, a estratégia de Tesla pode parecer tão fascinante. Graças a um salto notável nas capacidades dos algoritmos subjacentes, as habilidades alucinantes do ChatGPT podem ser rastreadas até uma equação simples: mais computação x mais dados = mais inteligente.
Os assistentes da OpenAI foram os primeiros a aderir a este mantra de moar, apostando suas reputações e os milhões de seus investidores na ideia de que superdimensionar a infraestrutura de engenharia para redes neurais artificiais levaria a grandes avanços, inclusive em modelos de linguagem como aqueles que alimentam o ChatGPT. Nos anos anteriores à fundação da OpenAI, o mesmo padrão tinha sido observado no reconhecimento de imagens, com conjuntos de dados maiores e computadores mais poderosos, levando a um salto notável na capacidade dos computadores de reconhecer – embora a um nível superficial – o que uma imagem mostra.
A nova biografia de Musk de Walter Isaacson, que foi extraída liberalmente na semana passada, descreve como a versão mais recente do software Full Self Driving (FSD), de marca otimista da Tesla, que guia seus veículos por ruas movimentadas, depende menos de regras codificadas e mais de uma rede neural treinada para imitar a boa direção humana. Isso parece semelhante a como o ChatGPT aprende a escrever ingerindo infinitos exemplos de texto escrito por humanos. Musk disse em entrevistas que ele espera que um Tesla tenha um “momento ChatGPT” com FSD no próximo ano ou depois.
Musk já fez grandes promessas sobre avanços na condução autônoma muitas vezes, incluindo uma previsão de que haveria um milhão de robotáxis Tesla até o final de 2020. Portanto, vamos considerar isso com cuidado.
Ao desenvolver seus próprios chips de aprendizado de máquina e construir o Dojo, a Tesla certamente poderia economizar dinheiro no treinamento dos sistemas de IA por trás do FSD. Isto pode muito bem ajudá-la a fazer mais para melhorar os seus algoritmos de condução, utilizando os dados de condução do mundo real que recolhe dos seus carros, que faltam aos concorrentes. Mas parece virtualmente impossível prever se essas melhorias irão cruzar um ponto de inflexão na condução autónoma ou na visão computacional em geral.