Code Monkey home page Code Monkey logo

ppoxfamily's Introduction

PPO x Family 决策智能入门公开课

欢迎来到 PPO x Family 系列决策智能入门公开课。该系列将深入理解深度强化学习算法 PPO ,灵活运用一个 PPO 算法解决几乎所有常见的决策智能应用 ,帮助一切对于深度强化学习技术有好奇心的人,轻便且高效地制作应用原型,了解和学习最强大最易用的 PPO Family 。

P.S. 路过记得点个 star stars - ppof ,2022年12月起持续更新中~

News

课程大纲

内容导航

章节(视频课) 算法理论资料 补充资料 习题 代码样例 应用样例
第一章:开启决策AI探索之旅 课程PPT
课程文字稿
微课视频
策略梯度
A2C
TRPO
符号表
QA总结
习题
习题题解
PG算法示例
A2C算法示例
PPO算法示例
应用混剪
第二章:解构复杂动作空间 课程PPT
课程文字稿
重参数化
PPO&DDPG
HyAR
QA总结
习题
习题题解
离散动作示例
连续动作示例
混合动作示例
应用训练代码
火箭回收等
第三章:表征多模态动作空间 课程PPT
课程文字稿
表征学习
PPG
不变性
QA总结
习题
习题题解
编码方法示例
Wrapper示例
计算图示例
应用训练代码
软体机器人等
第四章:解密稀疏奖励空间 课程PPT
课程文字稿
逆强化学习
行为克隆BC
QA总结
习题
习题题解
ICM好奇心奖励
RND好奇心奖励
Pop-Art示例
价值缩放
应用训练代码
自动驾驶等
第五章:探索时序建模 课程PPT 随机性策略
RWKV
Belief MDP
QA总结
习题
习题题解
LSTM示例
GTrXL示例
应用训练代码
记忆型决策
第六章:统筹多智能体 课程PPT HAPPO
ACE
值分解
QA总结
习题
习题题解
IndependentPG
MAPG
MAPPO
[HAPPO]
应用训练代码
多智能体协作
第七章:挖掘黑科技 课程PPT Adv 估计
PPO off 版
Entropy
QA总结
习题
习题题解
GAE
Recompute
梯度裁剪
正交初始化
Dual Clip
Value Clip
应用训练代码
学术基准环境
第八章:突破终极界限 LLM RLHF 语言模型 RL 环境

课程特点

一个算法解决万千应用 视频传送门

算法理论和代码实现一一对应 网站传送门

项目结构

.
├── LICENSE
├── assets                       --> 相关图片素材(转载请注明来源)
├── chapter2_action              --> 课程第二章相关内容
└── chapter1_overview            --> 课程第一章相关内容
    ├── chapter1_manuscript.pdf  --> 课程第一章文字稿(对于PPT的补充说明)
    ├── chapter1_lecture.pdf     --> 课程第一章PPT
    ├── chapter1_qa.pdf          --> 课程第一章答疑文稿
    ├── chapter1_homework.pdf    --> 课程第一章习题作业
    ├── chapter1_hw_solution.pdf   --> 课程第一章习题作业题解
    ├── chapter1_supp_trpo.pdf          --> 课程第一章补充材料(算法理论推导等)
    └── chapter1_demo_code.py    --> 课程第一章相关代码实现

课程答疑和反馈

License

PPOxFamily is released under the Apache 2.0 license.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.