Before Studying RL, Why We Have to Dive into RL ?

저는 2016년 이세돌 9단을 이긴 Alphago와 5:5 게임인 Dota2에서 프로게이머를 이긴 OpenAI Five 등을 보며 2019년에 딥러닝 세계에 발을 내 딛었습니다. Computer Science (CS)에 대해 아무것도 모르던 저는 학위를 시작하고 이 api들의 core algorithm인 강화 학습 (Reinforcement Learning; RL)을 공부해보고 싶었으나 어려워서 당시에는 제대로 공부하지 못했죠. 그러나 만능일 것 같았던 RL도 실제로 공부해보니 잘 되는 task가 있고 어떨때는 지도 학습 (Supervised Learning)보다 비효율적이어서 닭잡는데 소잡는데 칼 쓰는 경우에 지나지 않을 수 있다는 걸 알았습니다. 게다가 RL을 이용하는 분야는 굉장히 Variance가 커서 심지어 random seed 에따라 학습이 안될때도 있는 굉장히 어려운 분야였죠.

그래서 RL을 탐구해보고 싶으신 분들이 계시다면 먼저 어떤 일들이 RL이 필요한 domain 인지를 잘 생각해보고 시작하면 좋겠다고 생각했고, RL Korea라는 커뮤니티의 왜 강화학습을 공부해야 하는가를 소개해 드리기 위해 이 post를 만들었습니다.

연구 분야를 잘 정하셔서 재밌는 연구를 하시길 바랍니다.

RL 이 쓰이는 분야

Game(게임)
- 대전게임에서 상대해주는 에이전트
- 게임 레벨 컨트롤
Control(제어)
- 차량의 거동 결정(차선을 바꾸고 싶은지, 핸들을 틀고 싶은지)
- 공장 로봇 자동화
- 사람의 업무를 보조하는 로봇
- 의수나 근육 보조 로봇
- 서비스 로봇
- CPS(사이버 물리 시스템)상에서의 안전성
- 전력 시스템
- 도시 문제
Natural Language Processing
- 챗봇의 좀 더 자연스러운 대화
  - p.s. 2022년 말 ChatGPT가 나왔죠
Computer Vision
- Object tracking
- Segmentation 보조하는 에이전트
Recommendation System
- 실시간으로 사용자의 상황에 따라 추천(피드 추천, 광고 추천)
Optimization
- 데이터센터 에너지 최적화
- 최적 설계
- Task scheduling
- Neural Architecture Search

Notes

Before Studying RL, Why We Have to Dive into RL ?

RL 이 쓰이는 분야