본문 바로가기
AI & Data Analysis/Deep Learning

[protocell4P] Customized Dataset

by doraemin_dev 2025. 8. 14.
  1. run.sh 파일에서, --data lupus_ours  (--lr도 수정 가능) 변경
  2. load_data.py파일에서, 기존 load_covid_data() 함수를 복붙하여,
    1. load_lupus_data()로 함수명 변경
    2. 바로 다음 줄의 데이터 경로 변경 adata = sc.read_h5ad("../data_ours/lupus/lupus_adata_scAce.h5ad")
  3. config.py 파일에서, 53번째 줄쯤에 데이터 불러오는 코드 추가  
elif data.lower() == "lupus_ours": 
            dataset = load_lupus_data(task=task, load_ct=load_ct, keep_sparse=self.keep_sparse)

 

* 논문에서는 사용된 prototype 개수에 대한 명시적인 언급은 없지만, 성능이 가장 좋았던 것은 prototype 16.


가상환경 및 실행

https://github.com/Teddy-XiongGZ/ProtoCell4P

run.sh 실행

--data cardio_ours 지정

load_data.py 데이터 불러오기

  • load_icb_data()
  • load_covid_data()
  • load_cardio_data()

 

Config.py 수정

1.데이터 불러오기

2. 데이터 split

 3. 데이터 형태

Subsample 형성

Model.py 수정

1. forward()데이터 형태  

2. 인코딩 차원

3. pretrain() 데이터 형태


Results 

Covid Dataset

lr = 1e-4 일때 :  

lr = 1e-6 :

 

ICB Dataset

lr = 1e-4 일때 :