Predicting When RL Training Breaks Chain-of-Thought Monitorability

		Predicting When RL Training Breaks Chain-of-Thought Monitorability (lesswrong.com)
		2 points by gmays 14 days ago \| hide \| past \| favorite