본문 바로가기

AI 및 Data Analysis66

SRA Toolkit 사용해서 데이터 받기 Step 1. SRA Toolkit 다운받기 https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit 01. Downloading SRA ToolkitSRA Tools. Contribute to ncbi/sra-tools development by creating an account on GitHub.github.com   여기 깃허브 사이트에서, 자기 컴퓨터 사양에 맞는 항목을 다운로드 해준다.     Step 2. 다운받은 폴더를 압축 해제 하자. Step 3.터미널에서 압축 해제한 폴더 위치로 이동(cd)하자. 이제, 내가 다운로드 하고 싶은 SRA파일 이름을 넣은 명령어를 작성하자fastq-dump --split-files --gzip.. 2024. 11. 6.
Gene set enrichment analysis (GSEA) 논문 리뷰 Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles유전자 세트 풍부 분석: 게놈 전체 발현 프로필을 해석하기 위한 지식 기반 접근 방식https://www.pnas.org/doi/10.1073/pnas.0506580102 Abstract •In a typical experiment, mRNA expression profiles are generated for thousands of genes from a collection of samples belonging to one of two classes, for example, tumors that are sensitiv.. 2024. 10. 11.
Gene Ontology (GO) Enrichment analysis 개념 정리 • GO는 세 가지로 구분 1.Molecular Function (MF) : 해당 유전자가 분자 수준에서 수행하는 어떤 활동/기능. Ex) 효소 촉매 작용, 물질 운반 2.Biological Process (BP): 해당 유전자가 관여하는 어떤 생물학적 과정. Ex) DNA 복구, 신호 전달 경로 3.Cellular Component (CC): 해당 유전자가 위치하는 세포 내 구조적 위치. Ex) 미토콘드리아, 세포막 • GO Enrichment analysis : 특정 유전자 리스트에서 관련된 MF, BP 또는 CC가 통계적으로 유의미하게 포함되는지 평가하는 분석 방법. • The structure of GO can be described in terms of a graph, where each GO .. 2024. 10. 10.
Pathway Enrichment analysis 개념 정리 Pathway : 단백질, 유전자, 세포 등 생체 요소간의 상호작용과 역학관계를 세밀하게 설명할 수 있는 생물학적 심층지식 Pathway분석을 위해서는 pathway 데이터베이스가 있어야 한다. 이 데이터베이스들은 실험적인 결과 및 논문을 기반으로 하여 만들어 진다. 특정한 분자들이 서로 연관관계가 있는 다른 분자와의 연결을 할 때에 데이터베이스를 기반으로 하기 때문에 이 데이터베이스의 퀄리티에 따라 pathway의 신빙성도 달라진다. 공공데이터로는 가장 많이 사용되는 KEGG pathway와 wikipathways가 있다. 또한, Reactome 데이터베이스는 전문가들이 선별한 pathway 데이터를 제공하는 유명한 공개 데이터베이스 중 하나다. https://www.incodom.k.. 2024. 10. 10.
[MAST, limma, DESeq2] 공통 DEGs 분석 # MAST, limma, DESeq2에서 추출한 DEG의 rownames (유전자 이름)을 각각 가져옵니다.degs_mast_genes 0), size = 1.5) + scale_color_manual(values = c("blue", "red")) + # 다운레귤레이션(blue), 업레귤레이션(red) theme_minimal() + labs(title = "Volcano Plot of Common DEGs", x = "Log2 (Fold Change)", y = "-log10 (Adjusted P-Value)") + theme(plot.title = element_text(hjust = 0.5))# 업레귤레이션된 유전자up_regulated 0)# 다운레귤레이션된 .. 2024. 9. 19.
[Seurat][DESeq2] DEGs 분석 # Deseq2 :# Convert the Seurat object to a DESeq2 dataset# 필요한 패키지 로드if (!requireNamespace("DESeq2", quietly = TRUE)) { install.packages("DESeq2")}library(DESeq2)# Seurat 객체에서 count 데이터 추출 (유전자 x 세포)# 데이터를 정수형으로 변환counts_data 1.5로 필터링# NA 값을 제거하고 FDR 1.5로 필터링degs_deseq2_filtered 1.5, ]# 필터링된 DEG 확인head(degs_deseq2_filtered)# 필터링된 DEG 개수 확인nrow(degs_deseq2_filtered) 2024. 9. 19.