[Reinforcement] MDP, Monte-Carlo RL
학습하고, 결론을 내고 끝내는 것이 아니다.학습하고 결과를 바탕으로 또 학습한다. STATE에서 취할 수 있는 ACTION 데이터를 얻어서,→ TREE를 형성하여 SEARCH 한다. ( CONTINUS OR RANDOM하면 TREE SEARCH 불가 ) DataA sequence of state, anction and → rewardS 0, A 0, → R 1, S 1, A 1, → R 2, S 2, … S T-1, A T-1, → R T, S T 첫번째 받은 Reward는 R0이 아니라, R1이다. 약속같은 것이기에, 기억해두자.whereS T is state at step tA T is the action which the agent takes at step TR T is a reward repre..
2025. 1. 23.
[OpenCV] 인터페이스 (디지털 영상 처리)
2025.01.22 - [AI, 논문, 데이터 분석] - [OpenCV] Morphology (침식 / 팽창 / 열림과 닫힘)[실습1] 비디오 처리 - 카메라에서 프레임 읽기 코드 :import cv2def display_info(frame, text, pt, value, color=(120, 200, 90)): text += str(value) font = cv2.FONT_HERSHEY_SIMPLEX cv2.putText(frame, text, pt, font, 0.7, color, 2)capture = cv2.VideoCapture(0) # 0번 카메라 연결if capture.isOpened() == False: raise Exception("카메라 연결 안됨")# 카메라 속..
2025. 1. 21.