:Inteligência artificial aprendeu a fazer uma das coisas mais humanas que existem

Inteligência artificial aprendeu a fazer uma das coisas mais humanas que existem - TV Na Rua CornelioDigital Inteligência artificial aprendeu a fazer uma das coisas mais humanas que existem - TVNaRua Cornelio Digital - Notícias, Eventos e Entretenimento
Inteligência artificial aprendeu a fazer uma das coisas mais humanas que existem

O desenvolvimento da inteligência artificial depende do aprendizado das máquinas. De certa forma, elas precisam aprender a aprender. E se o melhor jeito de aprender é através dos nossos erros, elas estão no caminho certo. Um novo algoritmo permite que a inteligência artificial aprenda com seus próprios erros, quase como os seres humanos fazem.

Este avanço acontece graças a um novo algoritmo de código aberto chamado Hindsight Experience Replay (HER), desenvolvido por pesquisadores da empresa OpenAI, que tem sede nos EUA e trabalha o desenvolvimento de inteligência artificial. Nos últimos meses, pesquisadores da OpenAI têm se concentrado no desenvolvimento de inteligência artificial (AI) que aprenda melhor.

O algoritmo ajuda um agente de IA a “olhar para trás” em retrospectiva, por assim dizer, à medida que completa uma tarefa. De acordo com o blog da OpenAI, a máquina passa a interpretar suas falhas como sucessos, para então chegar ao resultado pretendido no início da tarefa.

“O ponto chave da HER é algo o que os humanos fazem intuitivamente: mesmo que não tenhamos sucesso em um objetivo específico, pelo menos conseguimos um objetivo diferente. Então, por que não apenas fingir que queríamos atingir esse objetivo para começar, em vez do que pretendemos alcançar originalmente? Ao fazer essa substituição, o algoritmo de aprendizagem de reforço pode obter um sinal de aprendizado, uma vez que alcançou algum objetivo; mesmo que não fosse esse o que pretendíamos alcançar originalmente. Se repetimos esse processo, eventualmente aprenderemos a alcançar objetivos arbitrários, incluindo os objetivos que realmente queríamos alcançar”, explicam os pesquisadores no texto.

Isso significa que todas as tentativas falhas da inteligência artificial funcionam como outro objetivo “virtual” não planejado.

Acontece algo parecido conosco quando estamos aprendendo. Quando tentamos andar de bicicleta pela primeira vez, não conseguimos nos equilibrar corretamente. Mesmo assim, essas tentativas nos ensinam o que não fazer e o que evitar. Cada fracasso nos aproxima do objetivo. É assim que os seres humanos aprendem – e agora as máquinas também.

Com a HER, o OpenAI quer que suas inteligências artificiais aprendam da mesma maneira. Ao mesmo tempo, esse método se tornará uma alternativa ao sistema de recompensas usual envolvido em modelos de reforço de aprendizagem. Para ensinar a IA a aprender por conta própria, ela tem que trabalhar com um sistema de recompensas. Os sistemas usados hoje ou dão “cookies” para a inteligência artificial quando ela alcança seu objetivo – e não quando não alcança, ou dão os cookies dependendo de quão perto a IA está de atingir seu objetivo.

Recompensando as falhas

Ambos os métodos não são perfeitos. O primeiro não dá nenhum espaço para o aprendizado, enquanto o segundo pode ser bastante complicado de implementar.

Ao tratar cada tentativa como um objetivo em retrospectiva, HER dá a um agente de IA uma recompensa mesmo quando na verdade ele não conseguiu realizar a tarefa especificada. Isso ajuda a inteligência artificial a aprender mais rápido e com maior qualidade.

No vídeo abaixo, é possível ver como isso funciona na prática. São mostradas diversas tarefas feitas pela HER e por outra inteligência artificial. O aprendizado rápido do novo sistema tem resultados muito melhores.

Este método não significa que o HER facilita completamente o aprendizado. “Aprender com HER em robôs reais ainda é difícil, pois ainda requer uma quantidade significativa de amostras”, aponta Matthias Plappert, da OpenAI. Em qualquer caso, como as simulações da OpenAI demonstraram, ela pode ser bastante útil para “encorajar” os agentes de IA para aprender com seus erros. [Science Alert]

Visualizações 757
Fonte: Science Alert
Por: Redação
Data: 07/03/2018 10h03min

Hospital do Câncer de Londrina


CONTATO
[email protected]
[email protected]
(43)99920-1893



TV Na Rua / CornelioDigtal / BandDigital- 2006 - 2023