celeste-ai/celeste/celeste_ai/plotting/plot_predicted_reward.py

import torch
import numpy as np
from pathlib import Path
import matplotlib.pyplot as plt

# All of the following are required to load
# a pickled model.
from celeste_ai.celeste import Celeste
from celeste_ai.network import DQN
from celeste_ai.network import Transition


def predicted_reward(
	model_file: Path,
	out_filename: Path,
	*,
	device = torch.device("cpu")
):
	if not model_file.is_file():
		raise Exception(f"Bad model file {model_file}")
	out_filename.parent.mkdir(exist_ok = True, parents = True)

	# Create and load model
	policy_net = DQN(
		len(Celeste.state_number_map),
		len(Celeste.action_space)
	).to(device)
	checkpoint = torch.load(
		model_file,
		map_location = device
	)
	policy_net.load_state_dict(checkpoint["policy_state_dict"])


	# Compute preditions
	p = np.zeros((128, 128, 9), dtype=np.float32)
	with torch.no_grad():
		for r in range(len(p)):
			for c in range(len(p[r])):
				x = c / 128.0
				y = r / 128.0

				k = np.asarray(policy_net(
					torch.tensor(
						[x, y],
						dtype = torch.float32,
						device = device
					).unsqueeze(0)
				)[0])
				p[r][c] = k


	# Plot predictions
	fig, axs = plt.subplots(2, 5, figsize = (20, 10))
	for a in range(len(axs.ravel())):
		if a >= len(Celeste.action_space):
			continue

		ax = axs.ravel()[a]
		ax.set(
			adjustable = "box",
			aspect = "equal",
			title = Celeste.action_space[a]
		)

		plot = ax.pcolor(
			p[:,:,a],
			cmap = "Greens",
			vmin = 0,
			#vmax = 5
		)

		ax.invert_yaxis()
		fig.colorbar(plot)

	fig.savefig(out_filename)
	plt.close()
Added action plot generator 2023-02-17 22:29:12 -08:00			`import torch`
			`import numpy as np`
Cleanup 2023-02-18 19:50:43 -08:00			`from pathlib import Path`
Added action plot generator 2023-02-17 22:29:12 -08:00			`import matplotlib.pyplot as plt`

Reorganized celeste code 2023-02-19 20:57:19 -08:00			`# All of the following are required to load`
			`# a pickled model.`
			`from celeste_ai.celeste import Celeste`
			`from celeste_ai.network import DQN`
			`from celeste_ai.network import Transition`
Added action plot generator 2023-02-17 22:29:12 -08:00

Reorganized celeste code 2023-02-19 20:57:19 -08:00			`def predicted_reward(`
			`model_file: Path,`
			`out_filename: Path,`
			`*,`
			`device = torch.device("cpu")`
			`):`
			`if not model_file.is_file():`
			`raise Exception(f"Bad model file {model_file}")`
			`out_filename.parent.mkdir(exist_ok = True, parents = True)`
Added plotter 2023-02-19 19:12:51 -08:00
Reorganized celeste code 2023-02-19 20:57:19 -08:00			`# Create and load model`
cleanup 2023-02-18 21:10:13 -08:00			`policy_net = DQN(`
			`len(Celeste.state_number_map),`
			`len(Celeste.action_space)`
Reorganized celeste code 2023-02-19 20:57:19 -08:00			`).to(device)`
Added plotter 2023-02-19 19:12:51 -08:00			`checkpoint = torch.load(`
Reorganized celeste code 2023-02-19 20:57:19 -08:00			`model_file,`
			`map_location = device`
Added plotter 2023-02-19 19:12:51 -08:00			`)`
Added action plot generator 2023-02-17 22:29:12 -08:00			`policy_net.load_state_dict(checkpoint["policy_state_dict"])`


Made plotter faster 2023-02-19 08:49:33 -08:00
			`# Compute preditions`
Tweaked plotter for new model 2023-02-24 14:23:25 -08:00			`p = np.zeros((128, 128, 9), dtype=np.float32)`
Made plotter faster 2023-02-19 08:49:33 -08:00			`with torch.no_grad():`
			`for r in range(len(p)):`
			`for c in range(len(p[r])):`
Tweaked plotter for new model 2023-02-24 14:23:25 -08:00			`x = c / 128.0`
			`y = r / 128.0`

Made plotter faster 2023-02-19 08:49:33 -08:00			`k = np.asarray(policy_net(`
			`torch.tensor(`
Removed "can_dash" input value 2023-02-26 12:09:05 -08:00			`[x, y],`
Made plotter faster 2023-02-19 08:49:33 -08:00			`dtype = torch.float32,`
Reorganized celeste code 2023-02-19 20:57:19 -08:00			`device = device`
Made plotter faster 2023-02-19 08:49:33 -08:00			`).unsqueeze(0)`
			`)[0])`
			`p[r][c] = k`


			`# Plot predictions`
Tweaked plotter for new model 2023-02-24 14:23:25 -08:00			`fig, axs = plt.subplots(2, 5, figsize = (20, 10))`
Added action plot generator 2023-02-17 22:29:12 -08:00			`for a in range(len(axs.ravel())):`
Tweaked plotter for new model 2023-02-24 14:23:25 -08:00			`if a >= len(Celeste.action_space):`
			`continue`

Added action plot generator 2023-02-17 22:29:12 -08:00			`ax = axs.ravel()[a]`
cleanup 2023-02-18 21:10:13 -08:00			`ax.set(`
			`adjustable = "box",`
Made plotter faster 2023-02-19 08:49:33 -08:00			`aspect = "equal",`
			`title = Celeste.action_space[a]`
cleanup 2023-02-18 21:10:13 -08:00			`)`

Added action plot generator 2023-02-17 22:29:12 -08:00			`plot = ax.pcolor(`
Made plotter faster 2023-02-19 08:49:33 -08:00			`p[:,:,a],`
Cleanup 2023-02-18 19:50:43 -08:00			`cmap = "Greens",`
Added action plot generator 2023-02-17 22:29:12 -08:00			`vmin = 0,`
Tweaked plotter for new model 2023-02-24 14:23:25 -08:00			`#vmax = 5`
Added action plot generator 2023-02-17 22:29:12 -08:00			`)`
cleanup 2023-02-18 21:10:13 -08:00
Made plotter faster 2023-02-19 08:49:33 -08:00			`ax.invert_yaxis()`
Added action plot generator 2023-02-17 22:29:12 -08:00			`fig.colorbar(plot)`
Reorganized celeste code 2023-02-19 20:57:19 -08:00
			`fig.savefig(out_filename)`
Added action plot generator 2023-02-17 22:29:12 -08:00			`plt.close()`
Cleanup 2023-02-18 19:50:43 -08:00


Reorganized celeste code 2023-02-19 20:57:19 -08:00
Cleanup 2023-02-18 19:50:43 -08:00