'Dev/언어지능 딥러닝' 카테고리의 글 목록

강화 학습 개요강화 학습은 언제 쓰이는가주어진 환경에서 가능한 여러 행동 시퀀스 중에서 보상을 최대화하는 최적의 경로를 찾는 것필요한 주요 요소들이 행동(action) 과 보상(reward)-> 특정 상태에서 가능한 행동을 선택하고, 그 선택에 대한 보상을 받으며, 이 정보를 바탕으로 최적의 정책을 학습함 ** Q-Learning, Dynamic Programming 은 딥러닝이 본격적으로 발전하기 전에 나온 강화학습 및 최적화 기법이다. 본 수업에선 제외한다. Markov Decision Process ppt 226부터 DRL 이론 DRL구현

Recurrent Neural Networks (RNN)자연어 처리를 할 때, 시퀀스 데이터를 처리하기 위해 설계된 초기의 신경망 -> 현재는 많이 쓰이지는 않음시계열 데이터, 텍스트, 오디오와 같은 연속된 데이터를 다루는 데 적합함.일반적인 신경망과 달리 RNN은 내부에 순환 구조가 있어서 이전 입력에 대한 정보를 네트워크 내에서 기억하고 유지할 수 있다. RNN의 구조 1) 두개의 inputx_t (현재 시점의 데이터) : 현재 시점에 해당하는 실제 입력 데이터, 이 상태가 각 시점마다 다음 계산에 전달되어 연속적인 입력 간의 종속성을 학습h_t−1 (이전 시점의 숨겨진 상태) : 이전 시점까지의 정보가 포함된 벡터 ex) 텍스트 처리 - 현재 단어, 시계열 데이터에서->특정 시점의 데이터 값2)..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Dev/언어지능 딥러닝

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역