Tech

Machine learning, uma poderosa ferramenta para a descoberta de novos materiais

Método abre novos caminhos e perspectivas na área de inovação e tecnologia, auxiliando no desenvolvimento de dispositivos cada vez menores e mais eficientes

Quando, em meados do século XIX, Ada Lovelace escreveu um código para a máquina analítica idealizada pelo cientista Charles Babbage, nem mesmo o mais visionário de seus contemporâneos poderia imaginar a revolução que a escritora e matemática inglesa estava iniciando. A máquina é considerada hoje o “antepassado” dos atuais computadores e o código, um algoritmo, foi o primeiro programa já criado. Pode ser que Ada não vislumbrasse um futuro em que as máquinas seriam capazes, assim como nós humanos, de aprender, mas sua visão pioneira levava a computação a um passo além ao introduzir o conceito de que essas máquinas poderiam executar muito mais tarefas do que simplesmente fazer cálculos matemáticos. 

Hoje, boa parte da população está familiarizada com a palavra algoritmo. Ainda que grande parte tenha dificuldade de explicar exatamente o que é e como funciona, sabe ao menos que é “ele” que determina o que vão ver em suas redes sociais ou os anúncios que aparecem quando navegam pela internet. Ou seja, os rastros que deixamos ao curtir, postar, ou simplesmente navegar pela web permitem que a máquina relacione esses dados de forma a oferecer o conteúdo que acredita ser mais relevante ou interessante. E, quanto mais rastros, mais a máquina se torna capaz de nos conhecer.

Diferentemente de um programa tradicional de computador, em que são estabelecidas regras para obter um resultado específico determinado a partir da introdução de dados, é a partir dos dados coletados e das respostas e interações entre esses dados, da correlação entre eles e da identificação de padrões, que o sistema vai criando suas próprias regras. Mais ou menos como funciona o nosso cérebro na tomada de decisões e resolução de problemas. A máquina aprende pela experiência. A partir das informações acumuladas e contextos, ela é treinada para fazer predições.

O exemplo acima, assim como outras aplicações que já fazem parte do nosso cotidiano, é apenas a ponta do iceberg do que hoje se conhece como machine learning, em português, aprendizado de máquinas, recurso que vem sendo cada vez mais usado pela ciência nos mais variados campos de pesquisa. Um deles, ainda pioneiro, é a descoberta de materiais para o desenvolvimento de novas tecnologias com esse método.

Esse será o tema do evento Machine Learning School for Materials, promovido pela Ilum Escola de Ciência, faculdade do Centro Nacional de Pesquisa em Energia e Materiais (CNPEM), entre os próximos dias 5 e 7 de setembro, com a coordenação dos professores Daniel Cassar, da área de informática de materiais, e James Almeida, doutor em nanociências e materiais avançados, e que atua na área de computação de alto desempenho.

Na pauta, estão o aprendizado de máquina, cálculos de alto rendimento, mineração de dados e processamento de linguagem natural (PLN) aplicado à ciência dos materiais. Os dois primeiros dias de seminários são voltados à comunidade científica, com a participação de especialistas nacionais e internacionais, e o terceiro será dedicado a tutoriais de nível de graduação.

Para entender melhor o aprendizado de máquinas e suas aplicações na ciência de materiais, conversamos com o físico Adalberto Fazzio, diretor da Ilum, estudioso há mais de 40 anos do uso das ferramentas computacionais em pesquisas e coordenador de um estudo inédito com o uso de machine learning que resultou na identificação de 17 materiais promissores para o desenvolvimento de dispositivos eletrônicos cada vez menores, mais eficientes e que funcionam com menor gasto de energia. O trabalho, realizado no CNPEM por Fazzio e pelos pesquisadores Gabriel Schleder e Bruno Focassio, foi publicado na revista científica Applied Physics Reviews, uma das principais publicações na área de física aplicada.

O que o aprendizado de máquina representa para a ciência de materiais e quais são as suas principais aplicações nesta área?

Uma ideia já consolidada no meio científico é de que as novas ferramentas trazem avanços para as ciências tanto quanto os novos conceitos. O aprendizado de máquina identifica padrões de forma automatizada em diferentes conjuntos de dados e de uma forma muito mais rápida em relação aos modelos convencionais de pesquisa. Então, é uma nova classe de ferramentas estatísticas para auxiliar na construção do conhecimento científico. Com esse método, extraímos conhecimento e insights.

O machine learning pode ser usado tanto para obter respostas para problemas que métodos tradicionais não conseguem e também otimizar a solução de problemas que já têm algumas respostas na ciência. É uma ferramenta poderosa para a descoberta e design de novos materiais com propriedades e funcionalidades que são desejadas ou que possam ser melhoradas. Isso tem um grande impacto no conhecimento científico e tecnológico para o desenvolvimento de novos dispositivos.

“Novas ferramentas trazem avanços para as

ciências tanto quanto os novos conceitos. O aprendizado de máquina identifica padrões de forma automatizada em diferentes conjuntos de dados e de uma forma muito mais rápida em relação aos modelos convencionais de pesquisa.”

O aprendizado de máquinas já vem sendo usado há mais tempo e com maior frequência nas áreas de ciências biológicas e de saúde, por exemplo, para assegurar diagnósticos mais precisos e seguros. A aplicação do machine learning para materiais ainda é recente. Por que isso acontece?

Uma das principais dificuldades do uso do machine learning na ciência de materiais é que ainda não temos uma disponibilidade adequada de bancos de dados. Ainda temos poucos dados. Também faltam padronização e consistência nesses bancos.

Além disso, durante muito tempo o desenvolvimento de novos materiais pela metodologia do “faça e veja o que acontece” foi suficiente para dar suporte ao avanço tecnológico da época. Hoje em dia, em diversas áreas, essa metodologia Edisoniana deixa de ser uma alternativa viável para entregar novas tecnologias de forma competitiva levando em consideração tempo e custo de desenvolvimento.

Nesse contexto, qual o papel de eventos como este que está sendo organizado pela Ilum?

Este é um tema que tem de estar na pauta da comunidade científica e acadêmica. Não é mais uma tendência para o futuro, mas uma realidade que traz uma série de novas possibilidades para a pesquisa. Com este evento, pretendemos reunir pesquisadores nacionais e internacionais com o intuito de estimular a troca de conhecimento na área e fortalecer colaborações. Além disso, o evento tem um caráter formativo também, contemplando um dia focado em tutoriais de machine learning para interessados no nível de graduação.

“Tem havido grandes avanços nos recursos computacionais e algoritmos. A ciência computacional pode melhorar a eficiência da descoberta de materiais, trazendo economia de recursos financeiros, humanos e de tempo entre o início da pesquisa e seus resultados.”

Quais são os principais desafios para a descoberta de materiais e as vantagens de aplicar o aprendizado de máquinas nesta área?

Temos uma demanda crescente por novos materiais e o desenvolvimento deles ainda é relativamente lento. O método tradicional de pesquisa se dá por tentativa e erro. O pesquisador escolhe os candidatos que serão estudados e faz os experimentos. Isso exige um trabalho minucioso que costuma demandar tempo, uma equipe especializada, instrumentos de pesquisa disponíveis em poucos lugares, insumos valiosos e escassos.

A grande dificuldade no desenvolvimento de materiais é encontrar os melhores candidatos para cada propriedade ou aplicação que se deseja descobrir ou melhorar. O uso de machine learning otimiza essa busca, pela capacidade de estabelecer relações complexas com rapidez e alto grau de precisão, e pela facilidade de simulação de um grande número de compostos em um catálogo de candidatos.

Tem havido grandes avanços nos recursos computacionais e algoritmos. A ciência computacional pode melhorar a eficiência da descoberta de materiais, trazendo economia de recursos financeiros, humanos e de tempo entre o início da pesquisa e seus resultados.

Como funciona o processo de machine learning?

Basicamente, o trabalho segue quatro passos, que são a definição do problema, a seleção dos dados, a representação e, na última etapa, algoritmos, validação e aplicação.

Na primeira etapa, é definido o que se espera e como a máquina será ensinada para chegar aos resultados, ou seja, como ela será treinada. Uma das técnicas de treinamento é o chamado aprendizado supervisionado, ou preditivo, em que se programa uma pergunta para que a máquina responda a partir da inserção do que será avaliado e as possíveis respostas.

No aprendizado não supervisionado, ou descritivo, o objetivo é encontrar estruturas nos dados brutos. São estabelecidas algumas condições e a máquina agrupa os dados em grupos similares de acordo com as suas características, estabelecendo padrões.

Outros tipos de problemas são a aprendizagem semi-supervisionada, a aprendizagem multitarefa, a transferência de aprendizagem e o chamado aprendizado por reforço. Neste último caso, são fornecidos feedbacks sobre as decisões, levando ao aprendizado, pela experiência, de ações desejadas para obter uma determinada recompensa.

Feito isso, é preciso coletar ou fazer a curadoria de dados que serão usados e limpar esses dados, para ter uma amostragem adequada. Essa é uma etapa muito importante de todo o processo. A quantidade e a qualidade dos dados são fundamentais. É preciso que esses dados sejam representativos do problema a ser estudado, consistentes e que possuam informação relacionada à tarefa a ser realizada.

Tendo os dados brutos tecnicamente corretos, vem a próxima etapa: a escolha da representação adequada ao problema. O algoritmo só será capaz de aprender a relação desejada se as variáveis necessárias forem representadas nesse modelo.

A escolha do algoritmo de aprendizagem é feita de acordo com o tipo de problema determinado e com o modelo escolhido. Um algoritmo pode ser construído para prever um resultado binário, quer dizer, um resultado entre duas opções, ou para que a máquina preveja um resultado entre vários. É a chamada classificação multiclasse. Também há a classificação por regressão, baseada em resultados anteriores.

Finalmente, é feito o treinamento, usando-se conjuntos de testes para validar os modelos e fazer ajustes se for necessário.

Qual foi o foco do trabalho desenvolvido pelo senhor e pelos pesquisadores Gabriel Schleder e Bruno Focassio no CNPEM?

Nosso objetivo foi demonstrar como essa estratégia, o uso do aprendizado de máquinas, pode ser utilizada na descoberta de novos materiais 2D, para depois passarem por um processo de filtragem e seleção de materiais para diversas aplicações.

Mesmo lidando com uma relativa escassez de dados, foi possível revelar 17 materiais promissores para o desenvolvimento de aplicações que tiram proveito das propriedades que buscávamos selecionar.

Quais eram essas propriedades?

Buscamos identificar materiais de duas dimensões (2D), aqueles que são formados por uma única camada de poucos átomos de espessura, com uma propriedade eletrônica específica: a de serem isolantes topológicos. Esses materiais são isolantes no seu interior e condutores na sua superfície, com bordas metálicas. Isso permite que a corrente elétrica flua sem dissipação.

“Os isolantes topológicos são a grande coqueluche na física e ciência de materiais, e têm atraído

grande atenção da comunidade científica devido

 ao potencial para aplicações em nanodispositivos, spintrônica e computação quântica.”

Qual a importância dessa descoberta?

A necessidade de redução do tamanho dos componentes traz dificuldades de controle de suas funções e um maior risco de falha dos circuitos. Com esses novos materiais, é possível ter componentes com controles seguros e eficientes, com menor dissipação de energia.

Os isolantes topológicos são a grande coqueluche na física e ciência de materiais, e têm atraído grande atenção da comunidade científica devido ao seu potencial para aplicações em nanodispositivos, spintrônica e computação quântica.

Como o machine learning impactou esses resultados?

A precisão do método foi de mais de 90% na busca de materiais. O machine learning se mostrou dez vezes mais eficiente na previsão das propriedades dos materiais quando comparado aos experimentos tradicionais realizados por tentativa e erro.

A metodologia usada nesses experimentos foi descrita pela primeira vez. Em que ela é inovadora e quais contribuições pode trazer para novos estudos na área?

Mostramos a importância de investigações detalhadas de cada componente de aprendizado de máquina, levando a resultados diferentes. Foram usados bancos de dados recém-criados com milhares de cálculos ab initio, ou seja, livres de parâmetros, e treinamos modelos de aprendizado de máquina capazes de determinar a topologia eletrônica de materiais 2D.

Com isso, foi possível gerar e filtrar milhares de novos materiais, prevendo eficientemente seu caráter topológico sem a necessidade de conhecimento estrutural.

Diante deste imenso potencial do uso do aprendizado de máquina para a ciência de materiais, entre outras, qual a relevância na área acadêmica e como ferramenta a ser adotada com mais frequência pelos pesquisadores?

O uso de estratégias baseadas em dados na ciência de materiais ainda é muito recente, mas já demonstrou a sua capacidade de solucionar grandes desafios. Cada vez mais, as técnicas de machine learning serão utilizadas e farão parte do cotidiano das novas gerações de pesquisadores.

Uma frase emblemática do cientista de materiais Bryce Meredig é que o machine learning não vai substituir os cientistas, mas os cientistas que usam machine learning vão substituir os que não usam. Por isso, é muito importante que os pesquisadores estejam atentos a essa possibilidade e que os futuros cientistas tenham em mente que esse é um caminho sem volta. Na Ilum, damos muita ênfase à ciência da computação e à matemática. Esse, certamente, será um diferencial para que nossos alunos estejam conectados ao futuro da ciência e possam fazer o melhor uso das novas ferramentas tecnológicas em suas pesquisas.

“O machine learning não vai substituir os  cientistas, mas os cientistas que usam machine learning  vão substituir os que não usam.”

O que esperar do futuro do aprendizado de máquinas na pesquisa científica?

É muito importante que se tenha uma compreensão clara das condições necessárias e favoráveis para a aplicação do aprendizado de máquinas. É preciso também considerar as limitações técnicas que prejudicam e podem impedir ou limitar o uso dessa ferramenta estatística.

O potencial e os resultados crescentes que são obtidos nessa área nas pesquisas envolvendo a descoberta de novas materiais, e toda aplicação prática que resulta disso, dependem do compartilhamento e disseminação dos dados e da sua procedência. É isso o que garante uma ciência mais verificável, reprodutível e robusta.

Acredito que os desafios e possibilidades que virão no futuro serão determinados pela criatividade dos cientistas. É um período animador para usar, desenvolver e compartilhar as ferramentas da ciência de dados e inteligência artificial na interseção com os conhecimentos específicos das áreas como física, química e ciência de materiais.

Sobre a Ilum Escola de Ciência

Com proposta inovadora para a formação de futuros cientistas, a Ilum Escola de Ciência é uma iniciativa do Centro Nacional de Pesquisa em Energia e Materiais (CNPEM), Organização Social sob supervisão do Ministério da Ciência, Tecnologia e Inovações (MCTI). Sem fins lucrativos e gratuita para os alunos, conta com financiamento do Ministério da Educação (MEC) e foi inaugurada em 2011, com início da primeira turma em 2022. A Ilum oferece o curso superior em Ciência, Tecnologia e Inovação, nível bacharelado, com três anos de duração, em período integral. Nota máxima pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), o curso proporciona uma sólida base científica, de forma multidisciplinar e interdisciplinar, e imersões desde o primeiro semestre no CNPEM. A grade curricular abrange disciplinas nas áreas de ciências da vida, ciências da matéria, linguagens matemáticas e humanidades, para uma formação integral de seus alunos, baseada na ética e na cooperação na busca por respostas e soluções às questões globais do mundo moderno.

Sobre o CNPEM

Ambiente sofisticado e efervescente de pesquisa e desenvolvimento, único no Brasil e presente em poucos centros científicos do mundo, o Centro Nacional de Pesquisa em Energia e Materiais (CNPEM) é uma organização privada sem fins lucrativos, sob a supervisão do Ministério da Ciência, Tecnologia e Inovações (MCTI). O Centro opera quatro Laboratórios Nacionais e é o berço do projeto mais complexo da ciência brasileira – Sirius – uma das fontes de luz síncrotron mais avançadas do mundo. O CNPEM reúne equipes multitemáticas altamente especializadas, infraestruturas laboratoriais globalmente competitivas e abertas à comunidade científica, linhas estratégicas de investigação, projetos inovadores em parceria com o setor produtivo e formação de investigadores e estudantes. O Centro é um ambiente impulsionado pela pesquisa de soluções com impacto nas áreas de Agricultura, Saúde, Energia, Ambiente, Novos Materiais, entre outras. A partir de 2022, com o apoio do Ministério da Educação (MEC), o CNPEM expandiu suas atividades com a abertura da Ilum Escola de Ciência. O curso superior interdisciplinar em Ciência, Tecnologia e Inovação adota propostas inovadoras com o objetivo de oferecer formação de excelência, gratuita, em período integral e com imersão nos ambientes de pesquisa do CNPEM.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

4 × 3 =