Pesquisadores do MIT e da IBM estão criando mecanismos de ligação para inovar a engenharia cinemática entre humanos e IA.
A estrutura Linkages aprende maneiras de traçar curvas. Créditos: Imagem cortesia dos autores.
O processo de design computacional em engenharia mecânica geralmente começa com um problema ou uma meta, seguido por uma avaliação da literatura, recursos e sistemas disponíveis para abordar o problema. O Design Computation and Digital Engineering (DeCoDE) Lab no MIT, em vez disso, explora os limites do que é possível.
Trabalhando com o MIT-IBM Watson AI Lab, o líder do grupo, o professor assistente de desenvolvimento de carreira da ABS Faez Ahmed, e o aluno de pós-graduação Amin Heyrani Nobari no Departamento de Engenharia Mecânica estão combinando aprendizado de máquina e técnicas de IA generativa, modelagem física e princípios de engenharia para enfrentar desafios de design e aprimorar a criação de sistemas mecânicos. Um de seus projetos, Linkages, investiga maneiras pelas quais barras planas e juntas podem ser conectadas para traçar caminhos curvos. Aqui, Ahmed e Nobari descrevem seu trabalho recente.
P: Como sua equipe está considerando abordar questões de engenharia mecânica do ponto de vista das observações?
Ahmed : A questão sobre a qual temos pensado é: como a IA generativa pode ser usada em aplicações de engenharia? Um desafio fundamental é incorporar precisão em modelos de IA generativa. Agora, no trabalho específico que temos explorado lá, estamos usando essa ideia de abordagens de aprendizado contrastivo autossupervisionado, onde efetivamente estamos aprendendo essas representações de ligação e curva de design, ou como o design se parece e como ele funciona.
Isso está muito ligado à ideia de descoberta automatizada: podemos realmente descobrir novos produtos com algoritmos de IA? Outro comentário sobre o quadro mais amplo: uma das principais ideias, especificamente com ligações, mas amplamente em torno de IA generativa e modelos de linguagem ampla — todos esses são a mesma família de modelos que estamos observando, e a precisão realmente desempenha um grande papel em todos eles. Então, os aprendizados que temos desses tipos de modelos, onde você tem, em alguma forma de aprendizado orientado a dados assistido por simuladores de engenharia e incorporações conjuntas de design e desempenho — eles podem potencialmente se traduzir para outros domínios de engenharia também. O que estamos mostrando é uma prova de conceito. Então as pessoas podem pegá-la e projetar navios e aeronaves, e problemas precisos de geração de imagens, e assim por diante.
No caso de ligações, seu design parece um conjunto de barras e como elas são conectadas. Como funciona é basicamente o caminho que elas transcreveriam conforme se movem, e nós aprendemos essas representações conjuntas. Então, há sua entrada primária — alguém virá e desenhará algum caminho — e você está tentando gerar um mecanismo que pode rastrear isso. Isso nos permite resolver o problema de uma forma muito mais precisa e significativamente mais rápida, com 28 vezes menos erro (mais preciso) e 20 vezes mais rápido do que abordagens de última geração anteriores.
P: Fale-me sobre o método de vinculações e como ele se compara a outros métodos semelhantes.
Nobari : O aprendizado contrastivo acontece entre os mecanismos, que são representados como gráficos, então, basicamente, cada junta será um nó em um gráfico e o nó incluirá algumas características. As características são a posição, o espaço e o tipo de juntas, pode ser que sejam juntas fixas ou livres.
Temos uma arquitetura que leva em conta algumas das coisas básicas subjacentes quando se trata da descrição da cinemática de um mecanismo, mas é essencialmente uma rede neural de grafos que calcula embeddings para esses grafos de mecanismos. Então, temos outro modelo que toma como entradas essas curvas e cria um embedding para isso, e conectamos essas duas modalidades diferentes usando aprendizado contrastivo.
Então, essa estrutura de aprendizado contrastivo que treinamos é usada para encontrar novos mecanismos, mas obviamente nos importamos com a precisão também. Além de quaisquer mecanismos candidatos que são identificados, também temos uma etapa de otimização adicional, onde esses mecanismos que são identificados serão otimizados ainda mais para chegar o mais perto possível dessas curvas-alvo.
Se você acertou a parte combinatória e está bem perto de onde precisa estar para chegar à curva alvo que você tem, você pode fazer a otimização direta baseada em gradiente e ajustar a posição das juntas para obter um desempenho superpreciso. Esse é um aspecto muito importante para que funcione.
Esses são os exemplos das letras do alfabeto, mas são muito difíceis de serem alcançados tradicionalmente com os métodos existentes. Outros métodos baseados em aprendizado de máquina geralmente não conseguem nem fazer esse tipo de coisa porque são treinados apenas em quatro ou seis barras, que são mecanismos muito pequenos. Mas o que conseguimos mostrar é que, mesmo com um número relativamente pequeno de juntas, você pode chegar muito perto dessas curvas.
Antes disso, não sabíamos quais eram os limites das capacidades de design com um único mecanismo de ligação. É uma pergunta muito difícil de saber. Você consegue mesmo escrever a letra M, certo? Ninguém nunca fez isso, e o mecanismo é tão complexo e tão raro que é como encontrar uma agulha no palheiro. Mas com esse método, mostramos que é possível.
Nós olhamos para o uso de modelos generativos prontos para uso para gráficos. Geralmente, modelos generativos para gráficos são muito difíceis de treinar, e eles geralmente não são muito eficazes, especialmente quando se trata de misturar variáveis contínuas que têm sensibilidade muito alta para o que a cinemática real de um mecanismo será. Ao mesmo tempo, você tem todas essas maneiras diferentes de combinar juntas e ligações. Esses modelos simplesmente não conseguem gerar efetivamente.
A complexidade do problema, eu acho, é mais óbvia quando você olha como as pessoas o abordam com otimização. Com otimização, isso se torna um problema misto-inteiro, não linear. Usando algumas otimizações simples de dois níveis ou mesmo simplificando o problema, eles basicamente criam aproximações de todas as funções, para que possam usar programação cônica mista-inteira para abordar o problema. O espaço combinatório combinado com o espaço contínuo é tão grande que eles podem basicamente ir até sete articulações. Além disso, torna-se extremamente difícil, e leva dois dias para criar um mecanismo para um alvo específico. Se você fizesse isso exaustivamente, seria muito difícil realmente cobrir todo o espaço de design. É aqui que você não pode simplesmente jogar aprendizado profundo sem tentar ser um pouco mais inteligente sobre como fazer isso.
As abordagens de última geração baseadas em aprendizado profundo usam aprendizado por reforço. Elas — dada uma curva alvo — começam a construir esses mecanismos mais ou menos aleatoriamente, basicamente um tipo de abordagem de otimização de Monte Carlo. A medida para isso é comparar diretamente a curva que um mecanismo traça e as curvas alvo que são inseridas no modelo, e mostramos que nosso modelo tem um desempenho 28 vezes melhor do que isso. São 75 segundos para nossa abordagem, e a abordagem baseada em aprendizado por reforço leva 45 minutos. A abordagem de otimização, você a executa por mais de 24 horas, e ela não converge.
Acho que chegamos ao ponto em que temos uma prova de conceito muito robusta com os mecanismos de ligação. É um problema complicado o suficiente para que possamos ver que a otimização convencional e o aprendizado profundo convencional por si só não são suficientes.
P: Qual é o panorama geral por trás da necessidade de desenvolver técnicas como vinculações que permitam o futuro do codesign entre humanos e IA?
Ahmed : O mais óbvio é o design de máquinas e sistemas mecânicos, que é o que já mostramos. Dito isso, acho que uma contribuição fundamental deste trabalho é que é um espaço discreto e contínuo que estamos aprendendo. Então, se você pensar sobre as ligações que estão lá fora e como as ligações estão conectadas umas às outras, esse é um espaço discreto. Ou você está conectado ou não conectado: 0 e 1, mas onde cada nó está, é um espaço contínuo que pode variar — você pode estar em qualquer lugar no espaço. Aprender para esses espaços discretos e contínuos é um problema extremamente desafiador. A maior parte do aprendizado de máquina que vemos, como na visão computacional, é apenas contínuo, ou a linguagem é principalmente discreta. Ao mostrar esse sistema discreto e contínuo, acho que a ideia principal se generaliza para muitas aplicações de engenharia, de metamateriais a redes complexas, a outros tipos de estruturas e assim por diante.
Há etapas nas quais estamos pensando imediatamente, e uma questão natural é em torno de sistemas mecânicos mais complexos e mais física, como, você começa a adicionar diferentes formas de comportamento elástico. Então, você também pode pensar em diferentes tipos de componentes. Também estamos pensando em como a precisão em grandes modelos de linguagem pode ser incorporada, e alguns dos aprendizados serão transferidos para lá. Estamos pensando em tornar esses modelos generativos. Agora, eles estão, em algum sentido, recuperando mecanismos e, em seguida, otimizando a partir de um conjunto de dados, enquanto os modelos generativos gerarão esses métodos. Também estamos explorando esse aprendizado de ponta a ponta, onde a otimização não é necessária.
Nobari : Existem alguns lugares na engenharia mecânica onde eles são usados, e há aplicações muito comuns de sistemas para esse tipo de síntese cinemática inversa, onde isso seria útil. Alguns que vêm à mente são, por exemplo, em sistemas de suspensão de carro, onde você quer um caminho de movimento específico para seu mecanismo de suspensão geral. Normalmente, eles modelam isso em 2D com modelos de planejamento do mecanismo de suspensão geral.
Acredito que o próximo passo, e que no final das contas será muito útil, é demonstrar a mesma estrutura ou uma estrutura semelhante para outros problemas complicados que envolvam valores combinatórios e contínuos.
Esses problemas incluem uma das coisas que tenho pesquisado: mecanismos complacentes. Por exemplo, quando você tem a mecânica de ligações rígidas contínuas — em vez dessas discretas —, você teria uma distribuição de materiais e movimento, e uma parte do material deforma o resto do material para lhe dar um tipo diferente de movimento.
Com mecanismos compatíveis, há um monte de lugares diferentes onde eles são usados, às vezes em máquinas de precisão para mecanismos de fixação, onde você quer uma peça específica que seja mantida no lugar, usando um mecanismo que a fixa, que pode fazer isso consistentemente e com altíssima precisão. Se você pudesse automatizar muito disso com esse tipo de estrutura, seria muito útil.
Todos esses são problemas difíceis que envolvem variáveis de design combinatório e variáveis ??de design contínuo. Acho que estamos muito próximos disso e, no final das contas, esse será o estágio final.
Este trabalho foi apoiado, em parte, pelo MIT-IBM Watson AI Lab.