Uma Introdução às Máquinas Boltzmann com Memória: Máquinas Dinâmicas Boltzmann

Queremos que esta máquina gere todo o conjunto de dados de treinamento por si só ou que gere todo o conjunto de dados de treinamento com base em um taco dos dados originais. Por exemplo, dada uma imagem de bitmap de taco contendo “SCI”, ela geraria “ENCE” por si só a partir dos pesos que aprendeu.

Para obter uma imagem do sistema no olho da nossa mente, considere a Figura 5.

Figure 5: A Estrutura da Máquina Boltzmann com Memória

A máquina contém sete nós. Uma imagem 7 por 35 bitmap representando a palavra CIÊNCIA é a sequência alvo. Um período de treinamento consiste em mostrar à máquina esta seqüência alvo uma vez. O alvo é decomposto em 35 tiras de 7 valores e introduzido na máquina na mesma sequência que a sua aparência no alvo. A Figura 5 mostra como seriam cinco dessas tiras de entrada. Vemos que a primeira tira do nosso bitmap, composta por todos os 1s, é refletida no primeiro valor das entradas dos nós. Isto é como nós inserimos valores na máquina durante o treinamento.

Quando inicializamos a máquina com pesos arbitrários e pedimos a ela para gerar uma seqüência, ela cria algo completamente aleatório. Depois de treinarmos a máquina durante 130.000 períodos de treino, ela é capaz de gerar a sequência inteira por si mesma. Isto significa que durante o treinamento, ele otimiza seus pesos para aprender não apenas a co-ocorrência de bits em uma única etapa de tempo, mas em toda uma seqüência.

Magical, não é? Mas há uma lógica sólida por detrás deste truque de magia. Vamos desvendar o mistério e ver porque esta “Máquina Boltzmann com Memória” funciona.

Virtual world

Uma Introdução às Máquinas Boltzmann com Memória: Máquinas Dinâmicas Boltzmann

Parte 4: Faceoff Between RNNN-Gaussian-DyBM and LSTM

Deixe uma resposta Cancelar resposta

Artigos recentes