본문 바로가기

AI, 논문, 데이터 분석56

[Reinforcement] Temporal-Difference RL (Bootstrapping Approaches) Target Value인 Gt는 R(t+1) + γV(S(t+1)) 로 된다. episode를 모두 다 처음에 생성하는 것이 아니라, S0에서 시작하여,A0를 뽑고 그에 대한 R(t+1)과 S(t+1)을 받고, 그 다음 V를 예측한다.이 과정을 반복하며, 전체 V를 알아나가게 된다. 즉, Monte Carlo는 모든 과정을 다 받아오고 시작하고,Temporal-Difference Learning은 예측값을 갱신하며 한 스텝씩 나아간다.SARSA : 상태(St), 행동(At), 보상(R_{t+1}), 다음 상태(St+1), 다음 행동(At+1) 2025. 1. 25.
[Off-Policy Learning] 개념 Off-Policy LearningOn-policy ⇒ ExploitationLearning fastBut may miss the best policy in a long run결과가 잘 나온 곳 근처만 계속 판다.Off-policy ⇒ ExplorationLearning slowExplore diverse actions for finding the best policy.다양한 곳을 다 판다.E [x^2] Following Laplace Distribution1. 중심 극한 정리 : 가우시안 분포를 따르는 샘플을 추출.2. 이후, 해당 값x는 우리가 원하는 분포(빨간색 그래프) y값 만큼의 가중치를 준다.3. 그럼, 빨간색 분포를 다르는 샘플을 얻을 수 있다.비교적 안정적이고 정확한 Policy가 나온다. 2025. 1. 24.
[PDFMathTranslate] 논문 번역 PDFMathTranslate는 (수학) 논문 PDF를 번역하고, 원본 문서와 번역된 문서를 비교할 수 있는 기능을 제공합니다. 특히 수식, 차트, 목차, 주석 등 원본의 구조를 유지하면서 번역 결과를 제공하고 있어 수학 분야를 비롯한 자연 과학 분야의 논문들을 번역하기에 좋습니다. 다양한 언어 및 외부 번역 서비스 등을 지원하며, 명령줄 도구, GUI, Docker 환경 등 다양한 방식으로 활용할 수 있습니다. https://github.com/Byaidu/PDFMathTranslate GitHub - Byaidu/PDFMathTranslate: PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDFPDF scientifi.. 2025. 1. 24.
[Backpropagation] ‘Backpropagation이 구현이 되어있는가?’ 아는 것이 중요함.Neural Network나 이런 것들을 pytorch 등으로 많이 다뤄봤을텐데 이런 프레임워크는 그냥 NN 학습만을 위해 존재하는 것이 아니라는 것을 알아야 한다.  기울기가 양수면, 기울기 만큼을 빼준 다음 상태(왼쪽)로 이동한다. 반대로, 기울기가 음수면, 음수 기울기 만큼을 빼준 다음 상태(오른쪽)로 이동한다.   기울기 값 만큼을 빼는 이유는, 목표 지점까지 기울기 값은 0으로 수렴하는 형태이기 때문이다. 목표 지점에 다가갈 수록 기울기는 0에 가까워지면서 감소 폭이 줄어들기에, 점점 정교하게 다가갈 수 있다. 2025. 1. 23.
[Reinforcement] MDP, Monte-Carlo RL 학습하고, 결론을 내고 끝내는 것이 아니다.학습하고 결과를 바탕으로 또 학습한다.  STATE에서 취할 수 있는 ACTION 데이터를 얻어서,→ TREE를 형성하여 SEARCH 한다. ( CONTINUS OR RANDOM하면 TREE SEARCH 불가 ) DataA sequence of state, anction and → rewardS 0, A 0, → R 1, S 1, A 1, → R 2, S 2, … S T-1, A T-1, → R T, S T 첫번째 받은 Reward는 R0이 아니라, R1이다. 약속같은 것이기에, 기억해두자.whereS T is state at step tA T is the action which the agent takes at step TR T is a reward repre.. 2025. 1. 23.
[OpenCV] Morphology (침식 / 팽창 / 열림과 닫힘) 모폴리지(morphology)영상 처리에서 형태학(모폴로지)영상의 객체들의 형태(shape)를 분석하고 처리하는 기법영상의 경계, 골격, 블록 등의 형태를 표현하는데 필요한 요소 추출영상 내에 존재하는 객체의 형태를 조금씩 변형시킴으로써 영상 내에서 불필요한 잡음 제거하거나 객체를 뚜렷하게 함침식연산객체의 크기 축소 및 배경 확장영상 내에 존재하는 잡음 같은 작은 크기의 객체 제거 가능소금-후추 잡음과 같은 임펄스 잡음 제거   [실습]이진화(binary)만으로는 잡음을 충분히 제거할 수 없지만, 침식을 추가로 사용하면, 더 효과적으로 노이즈를 제거할 수 있습니다.import numpy as np, cv2image = cv2.imread("chap07/images/morph.jpg", cv2.IMREAD.. 2025. 1. 22.