IA do Google
IA do Google – Enquanto o mundo aguarda a construção do maior reator de fusão até agora, chamado ITER, reatores menores com projetos semelhantes ainda estão funcionando.
Esses reatores, chamados tokamaks, nos ajudam a testar hardware e software.
O teste de hardware nos ajuda a refinar coisas como os materiais usados nas paredes dos contêineres ou a forma e a localização dos ímãs de controle.
Mas, sem dúvida, o software é o mais importante. Para permitir a fusão, o software de controle de um tokamak precisa monitorar o estado do plasma que ele contém e responder a quaisquer alterações fazendo ajustes em tempo real nos ímãs do sistema.
A falha em fazer isso pode resultar em qualquer coisa, desde uma queda na energia (o que leva à falha de qualquer fusão) até ver o plasma sair da contenção (e queimar as paredes do recipiente).
Acertar esse software de controle requer uma compreensão detalhada dos ímãs de controle e do plasma que os ímãs manipulam, ou, seria mais preciso dizer, é necessário obter o software de controle correto.
Porque hoje, a equipe DeepMind AI do Google está anunciando que seu software foi treinado com sucesso para controlar um tokamak.
Fora de controle
IA do Google
Desenvolver o software de controle para um tokamak é um processo complicado.
Com base na experiência anterior com projetos semelhantes, os engenheiros podem extrair alguns dos princípios básicos necessários para o funcionamento do software, como quais entradas de sensores devem ser lidas e como responder a mudanças nelas.
Mas sempre há peculiaridades baseadas no design do hardware e nas energias do plasma que está sendo usado.
Portanto, tende a haver um processo iterativo de medição e modelagem, seguido de ajustes no processo de controle, mantendo o desempenho suficiente para fazer ajustes quase em tempo real.
O software de controle resultante tende a ser bastante especializado. Se os pesquisadores quiserem experimentar uma geometria muito diferente para o plasma no tokamak, pode ser necessária uma revisão significativa do software.
Pesquisadores da área
Último sucesso do grupo de IA do Google
Pesquisadores da área já haviam identificado a inteligência artificial como uma possível solução.
Dê exemplos suficientes de IA correta e ela poderá descobrir quais configurações de controle produzem as propriedades desejadas no plasma.
Isso liberaria as pessoas para se concentrarem no estado final desejado e depois deixariam o software produzi-lo para que pudessem estudá-lo.
Uma IA também deve ser mais flexível; uma vez treinado sobre como controlar o sistema, deve ser capaz de produzir configurações de plasma muito diferentes para estudo sem a necessidade de reprogramação.
Para avançar nessa ideia, tudo o que precisávamos eram especialistas em IA e um tokamak.
Para o novo artigo, a equipe de IA veio da divisão DeepMind do Google, famosa por desenvolver software que poderia lidar com tudo, desde dobragem de proteínas até StarCraft .
O tokamak é cortesia do Swiss Plasma Center na EPFL em Lausanne.
Treinado para fundir
Como liberar a IA no hardware real durante o processo de treinamento poderia ser um desastre, a equipe começou com um simulador de tokamak específico para o hardware do Swiss Plasma Center.
Isso foi bastante preciso, e eles programaram limites na IA que a impediam de direcionar o plasma para uma configuração em que o simulador produzia resultados imprecisos.
A DeepMind então treinou um programa de aprendizado de reforço profundo para alcançar uma variedade de configurações de plasma, permitindo que ele controlasse o simulador.
Durante o treinamento, uma camada intermediária de software forneceu uma função de recompensa que indicava quão próximas as propriedades do plasma estavam do estado desejado.
Outro algoritmo, chamado de “crítico”, aprendeu as recompensas esperadas para várias mudanças nos ímãs de controle do tokamak.
Estes foram usados pela rede neural de controle real para aprender quais ações devem ser tomadas.
IA do Google
A crítica era elaborada e computacionalmente cara, mas era usada apenas durante a parte de treinamento.
Quando o treinamento foi feito, o algoritmo de controle aprendeu quais ações tomar para alcançar uma variedade de estados, e o crítico pode ser descartado.
Para permitir o desempenho em tempo real, o controlador treinado foi empacotado como um executável.
O software de controle padrão seria usado para ativar o tokamak e trazer um plasma para altas energias. Uma vez que o plasma estava estável, ele passou o controle para a IA.
Funciona!
O software resultante funcionou muito bem como você gostaria quando solto no hardware real.
O software poderia controlar execuções experimentais que visavam diferentes condições ao longo do tempo – em um caso de teste, ele aumentou a energia, manteve o plasma estável, alterou a geometria do plasma e realocou o plasma dentro do tokamak antes de reduzir a energia.
Em outro, continha duas estruturas de plasma separadas no mesmo tokamak simultaneamente.
O artigo que descreve este trabalho tem uma grande lista de coisas que os autores precisavam.
Essa lista inclui um simulador de tokamak que foi detalhado o suficiente para ser preciso, mas compacto o suficiente para fornecer feedback com rapidez suficiente para possibilitar o aprendizado por reforço.
O conjunto de treinamento tinha que incluir condições comuns semelhantes a onde o controle foi entregue e condições incomuns que permitissem aprender como fazer a transição para configurações experimentais.
Desenvolvimento de Software
Além disso, os pesquisadores precisavam desenvolver um software que fosse detalhado o suficiente para avaliar uma enorme variedade de opções de controle em potencial, mas também capaz de treinar um controlador de desempenho rápido que pudesse ser compilado em um executável.
As pessoas por trás deste trabalho também estão empolgadas com o que ele pode pressagiar para trabalhos futuros.
Em vez de simplesmente limitar as coisas à modelagem de hardware existente, eles sugerem que deve ser possível dar a uma iteração deste software uma configuração de plasma desejada e deixá-lo identificar a geometria de hardware que permitirá que ele crie isso.
Como alternativa, poderia otimizar o desempenho do hardware existente.
Agora só precisamos esperar por um reator de fusão digno da atenção da IA.
Leia mais:
EA Sports termina oficialmente a parceria da FIFA após 30 anos de jogos
A NASA está apoiando algumas missões de risco sério para a Lua – já não era sem tempo
Roberta e Ken Williams falam sobre seu primeiro videogame em 25 anos
Pagamento retroativo da ajuda de emergência em 2022; consulta ao CPF