본문 바로가기

AI 및 Data Analysis58

[ProtoCell 4P] scRNA Analysis 1. Setupgit clone https://github.com/Teddy-XiongGZ/ProtoCell4P.git# 가상환경 생성, 패키지 설치python -m venv venvsource venv/bin/activatepip install -r requirements.txt# 참고로, 설치해야할 패키지가 하나 더 있다. requirements.txt에 추가해주자.# tensorboard# 다음 명령으로 pip 가 dependency resolution 과정에서 뭘 설치하려는지 로그 볼 수 있습니다:# 여기서 어떤 패키지가 build 하려다가 에러가 나는지 정확히 알 수 있어요.# pip install -r requirements.txt -vvv https://github.com/Teddy-Xion.. 2025. 4. 10.
[PaSCient] Learning multi-cellular representations of single-cell transcriptomic Learning multi-cellular representations of single-cell transcriptomics data enables characterization of patient-level disease stateshttps://neurips.cc/virtual/2024/102865 NeurIPS Learning multi-cellular representations of single-cell transcriptomics data enables characterization of patient-level dAbstract: Over the years, single-cell transcriptomics has emerged as a prominent tool for understan.. 2025. 4. 9.
[Hierarchical MIL] compare AI Model Hierarchical MIL (Multiple Instance Learning) 방법론과 비교하기 위해 사용된 최신 대표 모델에 대해 알아보자.(참고) Hier-MIML 논문 리뷰 : [Hierarchical MIL] Incorporating Hierarchical Information into Multiple Instance Learning for Patient Phenotype Prediction with scRNA-seq Data🔹 ScRAT기반: Transformer 기반 모델핵심 아이디어: 단일 세포 표현 간의 상호작용을 주고받는 self-attention을 이용해, 각 세포 표현을 업데이트장점: 세포 간 관계를 학습하여 세포 간의 영향을 잘 모델링함출처: Mao et al., 2024요약:.. 2025. 4. 7.
[scMILD] Datasets Download scMILD 논문에 소개된 4가지 데이터셋 다운로드   1. Lupus관련 논문 [7]. Igor Mandric, Tommer Schwarz, Arunabha Majumdar, Kangcheng Hou, Leah Briscoe, Richard Perez, Meena Subramaniam, Christoph Hafemeister, Rahul Satija, Chun Jimmie Ye, et al. Optimized design of single-cell rna sequencing experiments for cell-type-specific eqtl analysis. Nature communications, 11(1):5504, 2020.2. COVID-19 Infection관련 논문 [25].  Carly.. 2025. 4. 3.
[Hierarchical MIL] Preprocessing Create '.h5ad' .h5ad 란?구성요소내용adata.X유전자 발현 행렬 (filtered X, shape = cells × genes)adata.obs셀 메타데이터 (meta)adata.var유전자 메타데이터 (adata.var.index = genes)📦 AnnData 객체 형태AnnData object with n_obs × n_vars = [셀 수] × [유전자 수] obs: patient, label, cell_type_annotation, ... var: gene names 즉, 각 셀(row)마다:유전자 발현 값 (X)label, patient ID, cell type 주석 등 (obs)gene names (var)이게 통합된 형태로 저장됩니다.[Hierarchical MIL] Preprocessing .. 2025. 3. 28.
[StratifiedKFold] Key Concepts and Descriptions StratifiedKFold(...): 라벨 비율을 유지하며 환자들을 나누는 K-fold🧾 예시로 이해해보자df = pd.DataFrame({ "patient": ["P01", "P01", "P02", "P03", "P04", "P04", "P05"], "label": [1, 1, 0, 1, 0, 0, 1], "cell_type": ["T", "B", "T", "NK", "T", "B", "T"], ... }) 이 데이터는 총 7개의 세포가 있지만,실제로 환자는 다음처럼 5명만 존재:samples = df[["patient", "label"]].drop_duplicates()→ 이렇게 하면 환자별로 한 줄씩 남긴 표가 samplespatientlabelP011P020P031P040P051그 다음: St.. 2025. 3. 27.