안녕하세요. 책에 있는 예제를 돌려보는데, 돌리면 초기 선언 함수에서 아래와 같은 에러가 발생하는데요. 왜 그런건가요?</

뉴럴네트워크를 만들었으니까 predict를 할 수 있어요. 학습 여부와는 상관없어요. <p dir=

강화학습 실행 문제 그리드월드 reinforce_agent.py 실행시 about reinforcement-learning-kr HOT 4 CLOSED

rlcode commented on June 9, 2024

강화학습 실행 문제 그리드월드 reinforce_agent.py 실행시

from reinforcement-learning-kr.

Comments (4)

dnddnjs commented on June 9, 2024

혹시 케라스와 텐서플로우 버전이 어떻게 되나요? 저희가 이 책 예제를 만들 때 썼던 버전이 있는데 최근 버전을 사용하면 문제가 생길 수도 있지 않을까 싶어요.

from reinforcement-learning-kr.

xxxibran commented on June 9, 2024

혹시 케라스와 텐서플로우 버전이 어떻게 되나요? 저희가 이 책 예제를 만들 때 썼던 버전이 있는데 최근 버전을 사용하면 문제가 생길 수도 있지 않을까 싶어요.

답변 감사합니다. 일단 명시되어 있는 버전까지는 다운그레이드 하면 안돌아가서 버전을 낮추긴 했는데, 잘 안되네요. 그래서 제가 직접 짜보고 있는데 궁금한게 있어서 몇 가지 여쭈어 보려고 합니다. 가능하시면 답변 주시면 정말 감사해요.

if name == "main":
# 환경과 에이전트의 생성
env = Env()
agent = ReinforceAgent()

global_step = 0
scores, episodes = [], []

for e in range(EPISODES):
    done = False
    score = 0
    # env 초기화
    state = env.reset()
    state = np.reshape(state, [1, 15])

    while not done:
        global_step += 1
        # 현재 상태에 대한 행동 선택
        action = agent.get_action(state)

여기 메인에서 보면 action = agent.get_action(state)가 있고 이거 관련된 부분이 아래 함수인데,

정책신경망으로 행동 선택

def get_action(self, state):
    policy = self.model.predict(state)[0]
    return np.random.choice(self.action_size, 1, p=policy)[0]

에피소드가 첫 번째라 하면 아무것도 훈련(train) 된게 없는데 어떻게 predict를 할 수가 있는건가요?

초기 선언 보면

def __init__(self):
    self.load_model = False
    # 가능한 모든 행동 정의
    self.action_space = [0, 1, 2, 3, 4]
    # 상태와 행동의 크기 정의
    self.action_size = len(self.action_space)
    self.state_size = 15
    self.discount_factor = 0.99
    self.learning_rate = 0.001

    self.model = self.build_model()
    self.optimizer = self.optimizer()
    self.states, self.actions, self.rewards = [], [], []

    if self.load_model:
        self.model.load_weights('./save_model/reinforce_trained.h5')

마지막 줄에 load_weight를 불러오는데 이미 훈련된 모델을 불러온 상태이기 때문에 predict를 할 수 있는건가요? 제가 이해를 제대로 한건지 궁금합니다 ㅜ

from reinforcement-learning-kr.

dnddnjs commented on June 9, 2024

뉴럴네트워크를 만들었으니까 predict를 할 수 있어요. 학습 여부와는 상관없어요.

from reinforcement-learning-kr.

xxxibran commented on June 9, 2024

뉴럴네트워크를 만들었으니까 predict를 할 수 있어요. 학습 여부와는 상관없어요.

친절한 답변 감사합니다!

from reinforcement-learning-kr.

강화학습 실행 문제 그리드월드 reinforce_agent.py 실행시 about reinforcement-learning-kr HOT 4 CLOSED

Comments (4)

정책신경망으로 행동 선택

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent