Cm's Blog

关于本站

置顶 | 发表于 2020-12-09 | 更新于 2026-05-01 | 本站相关 | 作者: Cmmmmmm | 2 条评论 | 阅读量:127

该站本质私人Blog 包括且不限于以下内容生活|学习|编程|游戏本站配置 Debian 13 Powered by Typecho Butterfly of Typecho 插件 MarkdownParse
阅读全文...

发表于 2026-06-01 | 更新于 2026-06-01 | 默认分类 | 作者: Cmmmmmm | 0条评论 | 阅读量:16

阅读全文...

发表于 2026-05-20 | 更新于 2026-06-01 | 默认分类 | 作者: Cmmmmmm | 0条评论 | 阅读量:49

常见概念马尔科夫决策过程(Markov DecisionProcess, MDP). 强化学习的数学基础和建模工具, 通常由状态空间, 动作空间, 奖励函数, 状态转移函数, 折扣率等组合. 马尔科夫性质(Markov Property). 马尔科夫性...
阅读全文...

发表于 2026-05-19 | 更新于 2026-05-22 | 默认分类 | 作者: Cmmmmmm | 0条评论 | 阅读量:67

概率论基础生活中充满了随机性。概率论是一门用数学语言来刻画这些随机事件的学科。一个随机事件的概率是一个介于0与1之间的实数，这个实数的大小反映了这个事件发生的可能性。因此，概率为0意味着这个事件不可能发生（不可能事件），概率为1意味着这个事件必然发生（...
阅读全文...