Técnica para melhorar o machine learning imita o processo de aprendizado de crianças

Apesar dos significativos avanços recentes no campo da inteligência artificial (IA), a maioria dos agentes virtuais ainda precisa de centenas de horas de treinamento para alcançar o desempenho humano em várias tarefas. Mas por que a gente é mais rápido no processo de aprendizado? A física intuitiva e a psicologia intuitiva.

Esses modelos de intuição, que foram observados em seres humanos desde os primeiros estágios de desenvolvimento, podem ser os principais facilitadores da aprendizagem futura. Com base nessa ideia, pesquisadores do Instituto Avançado de Ciência e Tecnologia da Coréia (KAIST) desenvolveram recentemente um método de normalização de recompensa intrínseca que permite que agentes de IA selecionem ações que melhorem seus modelos de intuição. É… Intuição em IA.

Os pesquisadores propuseram especificamente uma rede de física gráfica integrada com aprendizagem de reforço profundo inspirada no comportamento de aprendizagem observado em bebês humanos. A referência derivou de algo que você já deve ter percebido ou escutado falar sobre o caráter “cientista” de crianças.

COMO CRIANÇAS APRENDEM?

Essa perspectiva sugere que bebês humanos, ou crianças em geral, são motivados a conduzir suas próprias experiências, descobrir mais informações e, eventualmente, aprender a distinguir objetos diferentes, por exemplo.

Estudos de psicologia sugerem que, em seus primeiros anos de vida, os seres humanos estão continuamente experimentando seu ambiente, e isso permite que eles formem uma compreensão-chave do mundo. Além disso, quando as crianças observam resultados que não atendem às suas expectativas anteriores, que são conhecidas como violação da expectativa, muitas vezes são encorajadas a experimentar mais para obter uma melhor compreensão da situação em que estão.

Os testes incorporando intuição de crianças:

A equipe de pesquisadores do KAIST tentou reproduzir esses comportamentos em agentes de IA usando uma abordagem de aprendizado por reforço. Em seu estudo, eles introduziram pela primeira vez uma rede de física gráfica que pode extrair relações físicas entre objetos e prever seus comportamentos subsequentes em um ambiente 3D. Posteriormente, eles integraram essa rede com um modelo de aprendizagem de reforço profundo, introduzindo uma técnica de normalização de recompensa intrínseca que encoraja um agente de IA a explorar e identificar ações que melhorarão continuamente seu modelo de intuição.

Usando um motor de física 3D, os pesquisadores demonstraram que sua rede de física gráfica pode inferir eficientemente as posições e velocidades de diferentes objetos. Eles também descobriram que sua abordagem permitiu que a rede de aprendizagem de reforço profundo melhorasse continuamente seu modelo de intuição, encorajando-a a interagir com objetos unicamente com base na motivação intrínseca.

Em uma série de avaliações, a nova técnica desenvolvida por essa equipe de pesquisadores alcançou uma precisão notável, com o agente de IA realizando um maior número de diferentes ações exploratórias.

Futuramente, poderia informar o desenvolvimento de ferramentas de aprendizado de máquina que podem aprender com suas experiências passadas de maneira mais rápida e eficaz.

Texto: Kamila Jessie

Site: https://engenharia360.com/bebes-e-machine-learning/

Foto: Markus Spiske