Topic: offline-reinforcement-learning Goto Github

Some thing interesting about offline-reinforcement-learning

👇 Here are 71 public repositories matching this topic...

allenpandas / reinforcement-learning-papers

offline-reinforcement-learning,📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.

User: allenpandas

deep-reinforcement-learning reinforcement-learning dqn imitation-learning multi-agent-reinforcement-learning policy-gradient q-learning artificial-intelligence reinforcement-learning-papers reinforcement-learning-conferences

by571 / cql

offline-reinforcement-learning,PyTorch implementation of the Offline Reinforcement Learning algorithm CQL. Includes the versions DQN-CQL and SAC-CQL for discrete and continuous action spaces.

User: by571

reinforcement-learning-algorithms offline-reinforcement-learning dqn sac pytorch-implementation discrete-sac pytorch machine-learning

cryolite / kanachan

offline-reinforcement-learning,A Japanese (Riichi) Mahjong AI Framework

User: cryolite

mahjong japanese-mahjong riichi-mahjong majsoul mahjong-soul machine-learning game-ai mahjong-ai reinforcement-learning deep-learning

desikrengarajan / fedora

offline-reinforcement-learning,[FL-ICML 2023] Code for Federated Ensemble-Directed Offline Reinforcement Learning

User: desikrengarajan

federated-learning federated-reinforcement-learning offline-reinforcement-learning pytorch reinforcement-learning federated-offline-reinforcement-learning

offline-reinforcement-learning,Pytorch Implementation of Stochastic MuZero for gym environment. This algorithm is capable of supporting a wide range of action and observation spaces, including both discrete and continuous variations.

User: dhdev0

arxiv-papers deep-reinforcement-learning gym-environments lstm machine-learning monte-carlo-tree-search multilayer-perceptron muzero muzero-stochastic offline-reinforcement-learning online-reinforcement-learning pytorch resnetv2 rl stochastic-muzero transformer

dsshim0125 / s2p

offline-reinforcement-learning,"S2P: State-conditioned Image Synthesis for Data Augmentation in Offline Reinforcement Learning" (NeurIPS 2022)

User: dsshim0125

data-augmentation generative-model offline-reinforcement-learning neurips-2022 pytorch reinforcement-learning image-generation

elated-sawyer / rl-in-federated-setting

offline-reinforcement-learning,Summarising the research of Offline RL in Federated Setting.

User: elated-sawyer

federated-learning offline-reinforcement-learning offline-rl

enjeeneer / zero-shot-rl

offline-reinforcement-learning,Original implementations of the VC-FB and MC-FB algorithms from "Zero-Shot Reinforcement Learning from Low Quality Data" by Jeen et. al (2024).

User: enjeeneer

Home Page: https://enjeeneer.io/projects/zero-shot-rl/

deep-learning reinforcement-learning world-models offline-reinforcement-learning zero-shot-learning multi-task-reinforcement-learning

facebear-ljx / rgm

offline-reinforcement-learning,The official implementation of "Mind the Gap: Offline Policy Optimization for Imperfect Rewards" (ICLR2023)

User: facebear-ljx

imperfect-reward-function offline-reinforcement-learning pytorch

ganjiro / offlinemania

offline-reinforcement-learning,Official repository of "OfflineMania: A Benchmark Environment for Offline Reinforcement Learning in Racing Games"

User: ganjiro

game-ai offline-reinforcement-learning reinforcement-learning reinforcement-learning-datasets reinforcement-learning-environments trackmania

holarissun / rewardshifting

offline-reinforcement-learning,Code for NeurIPS 2022 paper Exploiting Reward Shifting in Value-Based Deep RL

User: holarissun

Home Page: https://sites.google.com/view/rewardshaping

ensemble exploration-exploitation offline-reinforcement-learning reinforcement-learning reward-design reward-engineering reward-shaping value-based-methods deep-q-network rnd

howuhh / sac-n-jax

offline-reinforcement-learning,Single-file SAC-N implementation on jax with flax and equinox. 10x faster than pytorch

User: howuhh

d4rl offline-reinforcement-learning reinforcement-learning flax jax equinox

hydesmondliu / b2rl

offline-reinforcement-learning,The First Open-Sourced Building Batch Reinforcement Learning Dataset

User: hydesmondliu

deep-reinforcement-learning hvac-control offline-reinforcement-learning open-source optimal-control reinforcement-learning

ikostrikov / jaxrl

offline-reinforcement-learning,JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

User: ikostrikov

deep-learning deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym

instadeepai / og-marl

offline-reinforcement-learning,:battery: Datasets with baselines for offline multi-agent reinforcement learning.

Organization: instadeepai

Home Page: https://instadeepai.github.io/og-marl/

multi-agent-reinforcement-learning reinforcement-learning offline-reinforcement-learning

kschweig / offlinerl

offline-reinforcement-learning,Experiment for Understanding the Effects of Dataset Characteristics on Offline Reinforcement Learning

User: kschweig

reinforcement-learning offline-reinforcement-learning dataset-generation

lanqingli1993 / focal-iclr

offline-reinforcement-learning,Code for FOCAL Paper Published at ICLR 2021

User: lanqingli1993

offline-reinforcement-learning meta-learning distance-metric-learning meta-rl multi-task-learning reinforcement-learning

loopmind-ai / loopquest

offline-reinforcement-learning,A Production Tool for Embodied AI

Organization: loopmind-ai

Home Page: https://www.loopquest.ai/

decision-making-algorithm foundation-model gym gym-environment mlops mlops-workflow reinforcement-learning rlops simulation reinforcement-learning-ops

mamba413 / room

offline-reinforcement-learning,Robust Offline Reinforcement Learning with Heavy-Tailed Rewards

User: mamba413

heavy-tailed-distributions off-policy-evaluation offline-reinforcement-learning robust-statistics

manchery / iql-pytorch

offline-reinforcement-learning,Unofficial PyTorch implementation (replicating paper results) of Implicit Q-Learning (In-sample Q-Learning) for offline RL

User: manchery

implicit-q-learning offline-reinforcement-learning pytorch reinforcement-learning

mohan-zhang-u / smpl

offline-reinforcement-learning,

User: mohan-zhang-u

benchmarks bioinformatics biology chemistry control-theory datasets deep-learning environment manufacturing neurips reinforcement-learning offline-reinforcement-learning

nikhilbarhate99 / min-decision-transformer

offline-reinforcement-learning,Minimal implementation of Decision Transformer: Reinforcement Learning via Sequence Modeling in PyTorch for mujoco control tasks in OpenAI gym

User: nikhilbarhate99

reinforcement-learning deep-reinforcement-learning deep-learning offline-reinforcement-learning pytorch pytorch-transformers transformer machine-learning openai-gym mujoco

nissymori / jax-corl

offline-reinforcement-learning,Clean single-file implementation of offline RL algorithms in JAX

User: nissymori

jax offline-rl single-file flax awac cql decision-transformer iql reinforcement-learning td3bc

polixir / neorl

offline-reinforcement-learning, Python interface for accessing the near real-world offline reinforcement learning (NeoRL) benchmark datasets

Organization: polixir

Home Page: http://polixir.ai/research/neorl

offline-reinforcement-learning

polixir / offlinerl

offline-reinforcement-learning,A collection of offline reinforcement learning algorithms.

Organization: polixir

offline-reinforcement-learning reinforcement-learning

reinholdm / papers-of-offline-rl

offline-reinforcement-learning,Related papers for offline reforcement learning (we mainly focus on representation and sequence modeling and conventional offline RL)

User: reinholdm

offline-reinforcement-learning reinforcement-learning

ryanxhr / bear

offline-reinforcement-learning,Pytorch implementation of BEAR in "Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction"

User: ryanxhr

offline-reinforcement-learning pytorch

ryanxhr / cpq

offline-reinforcement-learning,[AAAI 2022] The official implementation of CPQ in "Constraints Penalized Q-learning for Safe Offline Reinforcement Learning"

User: ryanxhr

constrained-reinforcement-learning offline-reinforcement-learning

ryanxhr / cql

offline-reinforcement-learning, Implementation of CQL in "Conservative Q-Learning for Offline Reinforcement Learning" based on BRAC family.

User: ryanxhr

offline-reinforcement-learning tensorflow

ryanxhr / deepthermal

offline-reinforcement-learning,[AAAI 2022] The official implementation of "DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning"

User: ryanxhr

model-based-reinforcement-learning offline-reinforcement-learning tensorflow

ryanxhr / dwbc

offline-reinforcement-learning,[ICML 2022] The official implementation of DWBC in "Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations"

User: ryanxhr

imitation-learning offline-reinforcement-learning pytorch

ryanxhr / por

offline-reinforcement-learning,[NeurIPS 2022 Oral] The official implementation of POR in "A Policy-Guided Imitation Approach for Offline Reinforcement Learning"

User: ryanxhr

offline-reinforcement-learning pytorch

sail-sg / rosmo

offline-reinforcement-learning,Codes for "Efficient Offline Policy Optimization with a Learned Model", ICLR2023

Organization: sail-sg

Home Page: https://arxiv.org/abs/2210.05980

atari model-based-rl muzero offline-reinforcement-learning reinforcement-learning rl-unplugged jax dm-haiku arcade-learning-environment bsuite

snu-mllab / dppo

offline-reinforcement-learning,Official implementation of "Direct Preference-based Policy Optimization without Reward Modeling" (NeurIPS 2023)

Organization: snu-mllab

offline-reinforcement-learning reinforcement-learning rlhf preference-based-reinforcement-learning

snu-mllab / edac

offline-reinforcement-learning,Official PyTorch implementation of "Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble" (NeurIPS'21)

Organization: snu-mllab

offline-reinforcement-learning

tinkoff-ai / cnf

offline-reinforcement-learning,Official implementation for "Let Offline RL Flow: Training Conservative Agents in the Latent Space of Normalizing Flows", NeurIPS 2022, Offline RL Workshop

Organization: tinkoff-ai

normalizing-flows offline-reinforcement-learning pytorch-implementation deep-reinforcement-learning

tinkoff-ai / corl

offline-reinforcement-learning,High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC

Organization: tinkoff-ai

Home Page: https://arxiv.org/abs/2210.07105

d4rl gym offline-reinforcement-learning reinforcement-learning

tinkoff-ai / lb-sac

offline-reinforcement-learning,Official implementation for "Q-Ensemble for Offline RL: Don't Scale the Ensemble, Scale the Batch Size", NeurIPS 2022, Offline RL Workshop

Organization: tinkoff-ai

offline-reinforcement-learning deep-reinforcement-learning ensemble-learning pytorch-implementation

tinkoff-ai / rebrac

offline-reinforcement-learning,Author's implementation of ReBRAC, a minimalist improvement upon TD3+BC

Organization: tinkoff-ai

offline-reinforcement-learning reinforcement-learning

tinkoff-ai / sac-rnd

offline-reinforcement-learning,Official implementation for "Anti-Exploration by Random Network Distillation", ICML 2023

Organization: tinkoff-ai

offline-reinforcement-learning random-network-distillation flax-implementation deep-reinforcement-learning jax-implementation

weichengtseng / cql-pytorch

offline-reinforcement-learning,

User: weichengtseng

offline-reinforcement-learning reinforcement-learning

xionghuichen / maple

offline-reinforcement-learning,The Official Code for Offline Model-based Adaptable Policy Learning (NeurIPS'21 & TPAMI)

User: xionghuichen

Home Page: https://ieeexplore.ieee.org/document/10255284

reinforcement-learning tensorflow offline-rl offline-reinforcement-learning paper

yangrui2015 / awgcsl

offline-reinforcement-learning, Code for ICLR 2022 paper Rethinking Goal-Conditioned Supervised Learning and Its Connection to Offline RL.

User: yangrui2015

reinforcement-learning offline-reinforcement-learning hindsight-experience-replay

yangrui2015 / rorl

offline-reinforcement-learning,Code for NeurIPS 2022 paper "Robust offline Reinforcement Learning via Conservative Smoothing"

User: yangrui2015

offline-reinforcement-learning reinforcement-learning robust-reinforcement-learning

yihaosun1124 / offlinerl-kit

offline-reinforcement-learning,An elegant PyTorch offline reinforcement learning library for researchers.

User: yihaosun1124

deep-learning deep-reinforcement-learning offlinerl pytorch reinforcement-learning offline-reinforcement-learning

yudasong / hyq

offline-reinforcement-learning,Official code repo for paper: Hybrid RL: Using both offline and online data can make RL efficient.

User: yudasong

offline-reinforcement-learning q-learning reinforcement-learning reinforcement-learning-theory hybrid-reinforcement-learing

zaiyan-x / rfqi

offline-reinforcement-learning,Implementation of Robust Reinforcement Learning using Offline Data [NeurIPS'22]

User: zaiyan-x

offline-reinforcement-learning reinforcement-learning

zhengyaojiang / latentplan

offline-reinforcement-learning,Code release for Efficient Planning in a Compact Latent Action Space (ICLR2023) https://arxiv.org/abs/2208.10291.

User: zhengyaojiang

Home Page: https://sites.google.com/view/latentplan

model-based-reinforcement-learning offline-reinforcement-learning reinforcement-learning generative-model transformer

zhengyinan-air / fisor

offline-reinforcement-learning,[ICLR 2024] The official implementation of "Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model"

User: zhengyinan-air

Home Page: https://zhengyinan-air.github.io/FISOR/

diffusion-models hamilton-jacobi-reachability jax offline-reinforcement-learning safe-reinforcement-learning imitation-learning reinforcement-learning

zhengyinan-air / omiga

offline-reinforcement-learning,[NeurIPS 2023] The official implementation of "Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization"

User: zhengyinan-air

multi-agent-reinforcement-learning offline-reinforcement-learning pytorch mujoco reinforcement-learning

Topic: offline-reinforcement-learning Goto Github

👇 Here are 71 public repositories matching this topic...

allenpandas / reinforcement-learning-papers

by571 / cql

cryolite / kanachan

desikrengarajan / fedora

dhdev0 / stochastic-muzero

dsshim0125 / s2p

elated-sawyer / rl-in-federated-setting

enjeeneer / zero-shot-rl

facebear-ljx / rgm

ganjiro / offlinemania

holarissun / rewardshifting

howuhh / sac-n-jax

hydesmondliu / b2rl

ikostrikov / jaxrl

instadeepai / og-marl

kschweig / offlinerl

lanqingli1993 / focal-iclr

loopmind-ai / loopquest

mamba413 / room

manchery / iql-pytorch

mohan-zhang-u / smpl

nikhilbarhate99 / min-decision-transformer

nissymori / jax-corl

polixir / neorl

polixir / offlinerl

reinholdm / papers-of-offline-rl

ryanxhr / bear

ryanxhr / cpq

ryanxhr / cql

ryanxhr / deepthermal

ryanxhr / dwbc

ryanxhr / por

sail-sg / rosmo

snu-mllab / dppo

snu-mllab / edac

tinkoff-ai / cnf

tinkoff-ai / corl

tinkoff-ai / lb-sac

tinkoff-ai / rebrac

tinkoff-ai / sac-rnd

weichengtseng / cql-pytorch

xionghuichen / maple

yangrui2015 / awgcsl

yangrui2015 / rorl

yihaosun1124 / offlinerl-kit

yudasong / hyq

zaiyan-x / rfqi

zhengyaojiang / latentplan

zhengyinan-air / fisor

zhengyinan-air / omiga

Recommend Projects

Recommend Topics

Recommend Org