scRNA-seq 분석 전체를 한 문장으로 요약하면, 딱 이렇게 말할 수 있습니다:
“유전자의 발현 패턴을 통해 세포의 정체성과 상태를 이해하자.”
즉, gene은 cell을 설명하는 도구이고, 우리는 그 유전자(gene)를 열심히 들여다봄으로써 cell이 누구고, 뭘 하고 있고, 어떤 상태인지를 추론하는 거죠.
구조
- Cell이 주체 (cell이 "나"라고 말한다면…)
- Gene은 그 cell이 쓰는 언어(language) 또는 표현(expression)
- 우리는 그 표현을 보고,
- 이 cell은 누구인가? (type)
- 어디서 왔는가? (lineage)
- 무슨 상태인가? (activated? exhausted? cancerous?)
→ 이런 질문에 답하려고 합니다.
그래서 marker gene을 찾는 것의 의미 :
"이 유전자가 많이 나온다는 건, 그 세포가 T세포일 가능성이 높군!"
"이 유전자가 나오는 세포는 분화 중인 progenitor이네!"
"이 유전자는 암세포에서만 나오는 걸 보니, 치료 타깃이 될 수 있겠군!"
즉, 유전자 = 세포의 생물학적 서명(signature) 같은 것입니다.
생물학자 vs 컴퓨터의 관점
- 생물학자는: "이 세포가 누구인지 알고 싶어"
- 컴퓨터는: "그럼 그 세포가 발현하는 gene을 보여줘"
'AI & Data Analysis > Deep Learning' 카테고리의 다른 글
| [Multi-Class Classification] recall, precision, auc (2) | 2025.08.08 |
|---|---|
| [ScRAT] sampling() function process (1) | 2025.08.07 |
| [AMIL] Cell Type Annotation Procedure (COVID, Cardio, Parkinson) (0) | 2025.07.30 |
| [ScRAT Dataset] compare in CellFM (0) | 2025.07.23 |
| [ScRAT Dataset] compare in cellxgene (0) | 2025.07.23 |