본문 바로가기

AI 및 Data Analysis90

Gene Analysis Papers 여러 연구에서 다양한 계층적 클러스터링 알고리즘과 그 확장 기법이 제안되었으며, 특히 유전자 네트워크 추론이나 기능적 그룹 식별에 적용됩니다. 유전자 수준의 계층적 분석과 관련된 주요 방법론을 다음과 같이 정리합니다.방법설명강점한계계층적 클러스터링유전자 발현 데이터 분석에서 가장 널리 사용되는 기법으로, 덴드로그램(dendrogram) 을 통해 유전자 간 유사성을 시각화합니다.직관적 시각화노이즈 민감성, 계산 비효율성SOTA계층적 클러스터링과 신경망 기법(SOM)의 장점을 결합한 방법으로, 이진 트리 구조를 활용합니다.유연성, 노이즈 내성구현 복잡성Tight Clustering분산 유전자(scattered genes) 를 고려한 고성능 기법입니다.분산 유전자 처리, 안정성높은 계산 부하Tricluster.. 2025. 6. 26.
[Dataset] compare in cellxgene ExperimentsDataset 3가지 scRNA-seq 질병 데이터셋에 대해 기존 연구의 전처리 방법 적용 Cardio: 심근병증 환자 데이터를 활용한 다중 분류 (DCM, HCM, 정상; 세 가지 분류)- Chaffin et al. (2022)의 단일-핵 기반 데이터. 확장성 심근병, 비후성 심근병, 정상군으로 구성됨.COVID: COVID-19 감염 여부를 예측하는 이진 분류- Ziegler et al. (2021)이 공개한 데이터로, COVID-19 환자의 비강 샘플과 건강한 대조군 포함. 세부 질병 상태 중 Long COVID 및 호흡 부전은 샘플 수가 적어 이진 분류로 단순화함Lupus : 전신성 홍반성 루푸스(SLE) 환자와 건강한 사람의 PBMC 샘플로 구성된 scRNA-seq 데이터... 2025. 6. 24.
Pretrained model vs. Transfer learning **Pretrained model(사전학습된 모델)**은 이미 학습이 완료된 모델이고,**Transfer learning(전이학습)**은 그 pretrained model을 가져와서 내 문제에 맞게 다시 학습시키는 방법입니다.즉, pretrained model은 도구,transfer learning은 그 도구를 활용하는 방식이에요.---✅ 차이점 정리항목 Pretrained model Transfer learning의미 대규모 데이터셋으로 미리 학습된 모델 Pretrained model을 기반으로 특정 작업에 맞게 재학습예시 ImageNet으로 학습된 VGG16, BERT VGG16을 사용해 고양이/강아지 분류 모델 재학습역할 학습을 빠르게 시작할 수 있는 기반 제공 새로운 태스크에 맞게 모델을 맞춤화사.. 2025. 6. 9.
LSTM 2025. 6. 6.
[RNN] Parameter Sharing RNN이 시간(time) 축을 따라“항상 동일한”가중치 행렬 $W$를 쓰는 이유는 크게 두 가지입니다. 1. 파라미터의 공유(shared parameters) 2. 은닉 상태(hidden state)에 쌓인 문맥(context)이 두 가지가 결합되면, “주어(명사)를 받아 다음에 올 동사(verb)를 예측”할 때나 “동사를 받아 다음에 올 목적어(object)를 예측”할 때 모두 같은 $W$로 충분히 다른 문장 구조를 학습할 수 있습니다.RNN의 기본 수식과 가중치 공유가장 단순한 형태의 RNN(예: Vanilla RNN)에서는 매 시점 $t$에 다음 수식으로 은닉 상태 $h_t$를 계산합니다. $ \begin{aligned} h_t &= \phi\bigl(W_{xh}\,x_t \;+\; W_{hh}\,.. 2025. 6. 6.
[Cost Function] Linear Regression & Logistic Regression 선형 회귀(Linear Regression)손실 함수: $J(\mathbf{w}) = \frac{1}{N}\sum_{i=1}^N (\mathbf{w}^\top \widetilde{\mathbf{x}}_i - y_i)^2$ (MSE) 해석적 해(정규방정식)가 존재: $\mathbf{w}^* = (\widetilde{X}^\top \widetilde{X})^{-1}\widetilde{X}^\top \mathbf{y}$ 하지만$N$이 너무 크거나,$d$가 너무 커서 $(X^\top X)^{-1}$ 계산이 부담스럽거나,온라인 학습/메모리 제약상 정규방정식을 못 쓸 때,$~\widetilde{X}^\top \widetilde{X}$가 특이(singular)해서 역행렬이 안 만들어질 때→ Gradient Desce.. 2025. 6. 5.