Minor fixes

Added stage completion handling
2023-02-24 17:46:33 -08:00 · 2023-02-24 17:46:07 -08:00
4 changed files with 28 additions and 13 deletions
--- a/celeste/celeste_ai/celeste.py
+++ b/celeste/celeste_ai/celeste.py
@@ -50,7 +50,6 @@ class Celeste:
 	action_space = [
 		"left",		# move left		0
 		"right",	# move right	1
-		#"jump",	# jump
 		"jump-l",	# jump left		2
 		"jump-r",	# jump right	3

@@ -86,6 +85,13 @@ class Celeste:
 		]
 	]

+
+	# Maps room_x, room_y coordinates to stage number.
+	stage_map = [
+		[0, 1, 2, 3, 4]
+	]
+
+
 	def __init__(
 			self,
 			pico_path,
@@ -194,9 +200,7 @@ class Celeste:
 	def state(self):
 		try:
 			stage = (
-				[
-					[0, 1, 2, 3, 4]
-				]
+				Celeste.stage_map
 				[int(self._internal_state["ry"])]
 				[int(self._internal_state["rx"])]
 			)
--- a/celeste/celeste_ai/train.py
+++ b/celeste/celeste_ai/train.py
@@ -341,10 +341,23 @@ def on_state_after(celeste, before_out):
 		dtype = torch.long
 	)

+	finished_stage = False
+	# No reward if dead
 	if next_state.deaths != 0:
 		pt_next_state = None
 		reward = 0

+	# Reward for finishing stage
+	elif next_state.stage >= 1:
+		finished_stage = True
+		reward = next_state.next_point - state.next_point
+		reward += 1
+
+		# Add to point counter
+		for i in range(state.next_point, state.next_point + reward):
+			point_counter[i] += 1
+
+	# Regular reward
 	else:
 		pt_next_state = torch.tensor(
 			[getattr(next_state, x) for x in Celeste.state_number_map],
@@ -401,7 +414,7 @@ def on_state_after(celeste, before_out):

 	# Move on to the next episode once we reach
 	# a terminal state.
-	if (next_state.deaths != 0):
+	if (next_state.deaths != 0 or finished_stage):
 		s = celeste.state
 		with model_train_log.open("a") as f:
 			f.write(json.dumps({
--- a/celeste/ffmpeg.sh
+++ b/celeste/ffmpeg.sh
@@ -22,8 +22,6 @@ render_dir () {
 		$OUTPUT_DIR/${1##*/}.mp4
 }

-
-
 # Todo: error out if exists
 mkdir -p $OUTPUT_DIR

@@ -50,17 +48,18 @@ ffmpeg \
 	-safe 0 \
 	-i video_merge_list \
 	-vf "scale=1024x1024:flags=neighbor" \
-	$OUTPUT_DIR/00-all.mp4
+	$SC_ROOT/1x.mp4

 rm video_merge_list

 # Make accelerated video
 ffmpeg \
 	-loglevel error -stats -y \
-	-i $OUTPUT_DIR/00-all.mp4 \
+	-i $SC_ROOT/1x.mp4 \
 	-framerate 60 \
 	-filter:v "setpts=0.125*PTS" \
 	$SC_ROOT/8x.mp4

 echo "Cleaning up..."
+
 rm -dr $OUTPUT_DIR
--- a/polecart/basic/main.py
+++ b/polecart/basic/main.py
@@ -200,13 +200,12 @@ for ep in range(num_episodes):



+		state = next_state
+		
 		
 		# Only train the network if we have enough
 		# transitions in memory to do so.
 		if len(memory) >= BATCH_SIZE:
-
-			state = next_state
-
 			# Run optimizer
 			optimize.optimize_model(
 				memory,
Author	SHA1	Message	Date
Mark	c372ef8cc7	Minor fixes	2023-02-24 17:46:33 -08:00
Mark	589f41c205	Added stage completion handling	2023-02-24 17:46:07 -08:00