[언어지능 딥러닝] [PyTorch] 강화 학습

2024. 11. 7. 16:14·Dev/언어지능 딥러닝

강화 학습 개요

강화 학습은 언제 쓰이는가

  • 주어진 환경에서 가능한 여러 행동 시퀀스 중에서 보상을 최대화하는 최적의 경로를 찾는 것
  • 필요한 주요 요소들이 행동(action) 과 보상(reward)
    -> 특정 상태에서 가능한 행동을 선택하고, 그 선택에 대한 보상을 받으며, 이 정보를 바탕으로 최적의 정책을 학습함

 

** Q-Learning, Dynamic Programming 은 딥러닝이 본격적으로 발전하기 전에 나온 강화학습 및 최적화 기법이다. 본 수업에선 제외한다.  

 

 

Markov Decision Process ppt 226부터

 

 


DRL 이론

 

 

 

 

 

 


DRL구현

'Dev > 언어지능 딥러닝' 카테고리의 다른 글

[언어지능 딥러닝] [PyTorch] Recurrent Neural Networks (RNN)  (0) 2024.11.07
'Dev/언어지능 딥러닝' 카테고리의 다른 글
  • [언어지능 딥러닝] [PyTorch] Recurrent Neural Networks (RNN)
#코딩 공부
#코딩 공부
tildacoding 코딩 공부
  • #코딩 공부
    tildacoding
    #코딩 공부
  • 전체
    오늘
    어제
  • 글쓰기 관리자
  • Personal

    • 홈
    • 태그
    • 방명록
  • link

    • GITHUB
    • 분류 전체보기 (48)
      • Dev (12)
        • python (0)
        • 웹크롤링 (2)
        • 머신러닝 (3)
        • 딥러닝 (4)
        • 언어지능 딥러닝 (2)
        • SQL (1)
        • Spring (0)
      • 코딩테스트 (16)
        • 백준 (3)
        • 프로그래머스 (7)
        • 기타 문제 (2)
        • 코딩테스트를 위한 정리 (4)
      • Study (4)
        • 알고리즘 (2)
        • 자료구조 (2)
      • 대외활동 (15)
        • 에이블스쿨 (15)
        • 공모전 (0)
  • 공지사항

    • 루틴 skrrrrr
  • 인기 글

  • 태그

  • 최근 댓글

  • hELLO· Designed By정상우.v4.10.0
#코딩 공부
[언어지능 딥러닝] [PyTorch] 강화 학습
상단으로

티스토리툴바