본문 바로가기

AI 및 Data Analysis88

Pretrained model vs. Transfer learning **Pretrained model(사전학습된 모델)**은 이미 학습이 완료된 모델이고,**Transfer learning(전이학습)**은 그 pretrained model을 가져와서 내 문제에 맞게 다시 학습시키는 방법입니다.즉, pretrained model은 도구,transfer learning은 그 도구를 활용하는 방식이에요.---✅ 차이점 정리항목 Pretrained model Transfer learning의미 대규모 데이터셋으로 미리 학습된 모델 Pretrained model을 기반으로 특정 작업에 맞게 재학습예시 ImageNet으로 학습된 VGG16, BERT VGG16을 사용해 고양이/강아지 분류 모델 재학습역할 학습을 빠르게 시작할 수 있는 기반 제공 새로운 태스크에 맞게 모델을 맞춤화사.. 2025. 6. 9.
LSTM 2025. 6. 6.
[RNN] Parameter Sharing RNN이 시간(time) 축을 따라“항상 동일한”가중치 행렬 $W$를 쓰는 이유는 크게 두 가지입니다. 1. 파라미터의 공유(shared parameters) 2. 은닉 상태(hidden state)에 쌓인 문맥(context)이 두 가지가 결합되면, “주어(명사)를 받아 다음에 올 동사(verb)를 예측”할 때나 “동사를 받아 다음에 올 목적어(object)를 예측”할 때 모두 같은 $W$로 충분히 다른 문장 구조를 학습할 수 있습니다.RNN의 기본 수식과 가중치 공유가장 단순한 형태의 RNN(예: Vanilla RNN)에서는 매 시점 $t$에 다음 수식으로 은닉 상태 $h_t$를 계산합니다. $ \begin{aligned} h_t &= \phi\bigl(W_{xh}\,x_t \;+\; W_{hh}\,.. 2025. 6. 6.
[Cost Function] Linear Regression & Logistic Regression 선형 회귀(Linear Regression)손실 함수: $J(\mathbf{w}) = \frac{1}{N}\sum_{i=1}^N (\mathbf{w}^\top \widetilde{\mathbf{x}}_i - y_i)^2$ (MSE) 해석적 해(정규방정식)가 존재: $\mathbf{w}^* = (\widetilde{X}^\top \widetilde{X})^{-1}\widetilde{X}^\top \mathbf{y}$ 하지만$N$이 너무 크거나,$d$가 너무 커서 $(X^\top X)^{-1}$ 계산이 부담스럽거나,온라인 학습/메모리 제약상 정규방정식을 못 쓸 때,$~\widetilde{X}^\top \widetilde{X}$가 특이(singular)해서 역행렬이 안 만들어질 때→ Gradient Desce.. 2025. 6. 5.
[Linear Regression] Hyperplane 일반적인(순수) 선형 회귀 (linear regression) 모델이 학습하는 함수는$\hat y = w_0 + w_1 x_1 + \cdots + w_d x_d$와 같이 입력 변수들에 대해 1차 결합만을 사용하기 때문에,입력 공간(feature space)에서 보면 항상 평평한(hyperplane) 형태를 가집니다. 입력 차원이 $d$라면, 모형이 만들어내는 결정 경계(decision boundary) 혹은 예측 표면(prediction surface)은 $d$차원의 공간에서 $(d)$-차원(hyperplane)에 해당합니다. $d=1$이면 1차원 상의 직선,$d=2$이면 2차원 상의 1차원 평면(직선) ⇒ 왼쪽 그림, $d=3$이면 3차원 상의 2차원 초평면 ⇒ 오른쪽 그림 일반적으로 특성 차원이 $?.. 2025. 6. 5.
[scGPT] pre-training data sets PAPERhttps://www.nature.com/articles/s41592-024-02201-0GitHub ; Data Downloadhttps://github.com/bowang-lab/scGPT/blob/main/data/cellxgene/data_config.py scGPT/data/cellxgene/data_config.py at main · bowang-lab/scGPTContribute to bowang-lab/scGPT development by creating an account on GitHub.github.com 1. 공통 변수VERSION = "2023-05-08"• CellXGene Census 릴리스 버전MAJOR_TISSUE_LIST• 주요 조직 7종:["heart", "bl.. 2025. 5. 30.