Introduzione all'apprendimento per rinforzo. Parte 3: Q-Learning con Reti Neurali, Algoritmo DQN

Puoi eseguire tu stesso il codice TensorFlow in questo link (o una versione PyTorch in questo link), o continuare a leggere per vedere il codice senza eseguirlo. Poiché il codice è un po’ più lungo che nelle parti precedenti, mostrerò solo i pezzi più importanti qui. L’intero codice sorgente è disponibile seguendo il link sopra.

Ecco l’ambiente CartPole. Sto usando OpenAI Gym per visualizzare ed eseguire questo ambiente. L’obiettivo è quello di spostare il carrello a sinistra e a destra, al fine di mantenere il palo in una posizione verticale. Se l’inclinazione del palo è più di 15 gradi dall’asse verticale, l’episodio finirà e ricominceremo da capo. Il video 1 mostra un esempio di esecuzione di diversi episodi in questo ambiente compiendo azioni in modo casuale.

Virtual world

Introduzione all’apprendimento per rinforzo. Parte 3: Q-Learning con Reti Neurali, Algoritmo DQN

Lascia un commento Annulla risposta

Articoli recenti