From 6f7e04c94753f13ff70157f31ec4947d91af2caa Mon Sep 17 00:00:00 2001 From: johnjim0816 Date: Mon, 17 Jun 2024 10:46:12 +0800 Subject: [PATCH] [book] errata --- docs/ch1/main.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/ch1/main.md b/docs/ch1/main.md index f27befe..cc6ad37 100644 --- a/docs/ch1/main.md +++ b/docs/ch1/main.md @@ -100,6 +100,6 @@ $\qquad$ 我们先介绍一下关于本书的初衷。其实日前强化学习 $\qquad$ 其次,在具体的学习之前,先给读者做一些基础的知识铺垫。第一,强化学习是机器学习的一个分支,因此读者需要具备一定的机器学习基础,例如基本的线性代数、概率论、数理统计等等。当然只需要读者们修过相关的大学课程即可,不必先去刻意回顾一些知识,原理部分跟随本书的推导即可。第二,在学习强化学习初期是不涉及深度神经网络相关的东西的,这一部分通常称为传统强化学习部分。尽管这部分的算法在今天已经不常用,但是其中蕴含的一些思想和技巧是非常重要的,因此读者们需要对这部分内容有所了解。在过渡到结合神经网络的深度强化学习部分之前,本书会花一章的时间帮助读者整理需要的深度学习知识。 -$\qquad$ 深度学习在强化学习中扮演的角色主要是提供了一个强大的函数拟合能力,使得智能体能够处理复杂、高维度和非线性的环境。深度学习与强化学习之间的关系相当于眼睛和大脑的关系,眼睛是帮助大脑决策更好地观测世界的工具,对于一些没有眼睛的动物例如蚯蚓也可以通过其他的感官来观测并解析状态。再比如,同样大脑水平下,即相同的强化学习算法条件下,正常人要比双目失明的人日常的决策要更方便。但是,即使深度学习部分是相同的,例如正常大人和小孩都能通过眼睛观测世界,然由于大脑决策水平的差异也会让两者表现有所差异。总而言之,深度与强化在更复杂的环境下缺一不可。最后,尽管强化学习算法很多,但基本上就分为两类,即基于价值的和基于策略梯度的算法,这两种算法各有优势,请读者们再学习之后根据实际需要谨慎选择即可。 +$\qquad$ 深度学习在强化学习中扮演的角色主要是提供了一个强大的函数拟合能力,使得智能体能够处理复杂、高维度和非线性的环境。深度学习与强化学习之间的关系相当于眼睛和大脑的关系,眼睛是帮助大脑决策更好地观测世界的工具,对于一些没有眼睛的动物例如蚯蚓也可以通过其他的感官来观测并解析状态。再比如,同样大脑水平下,即相同的强化学习算法条件下,正常人要比双目失明的人日常的决策要更方便。但是,即使深度学习部分是相同的,例如正常大人和小孩都能通过眼睛观测世界,然由于大脑决策水平的差异也会让两者表现有所差异。总而言之,深度与强化在更复杂的环境下缺一不可。最后,尽管强化学习算法很多,但基本上就分为两类,即基于价值的和基于策略梯度的算法,这两种算法各有优势,读者们在学习之后根据实际需要选择即可。