AI 및 Data Analysis104 Batch Effect, Batch Correction Batch정의:실험에서 동일한 조건 하에서 처리된 데이터 그룹.실험 환경(날짜, 기계, 실험자 등)이 일관된 데이터를 한 그룹으로 묶습니다.Batch Effect정의:실험 조건이 동일하지 않을 때(예: 실험 날짜, 기계, 실험자 등), 배치(batch) 간에 체계적인 차이가 발생하는 현상.생물학적 변동과 무관한 비생물학적 신호로 인해 데이터 비교가 왜곡될 수 있음.예시: 실험 날짜로 정의되는 배치실험이 1월 1일과 1월 2일에 진행되었다고 가정.샘플 ID실험 날짜유전자 1 발현값유전자 2 발현값Sample 11월 1일100200Sample 21월 1일120190Sample 31월 2일200300Sample 41월 2일220310Batch 1: 1월 1일에 처리된 샘플.Batch 2: 1월 2일에 처리된 .. 2024. 11. 21. RNA 데이터 생성 과정 데이터가 만들어지는 과정 (1) 시퀀싱 과정mRNA 추출:각 세포에서 RNA를 추출하고, 이를 **역전사(reverse transcription)**를 통해 cDNA로 변환합니다.cDNA는 시퀀싱 과정에서 안정적으로 읽을 수 있도록 가공됩니다.바코드와 UMI 부여:각 세포의 RNA에는 세포 바코드와 **UMI(Unique Molecular Identifier)**가 부여됩니다.세포 바코드: 어떤 RNA가 어떤 세포에서 나온 것인지를 식별.UMI: 동일한 RNA 분자의 중복 여부를 확인.시퀀싱:시퀀싱 기계가 RNA 서열(cDNA)을 읽어들입니다. 이 데이터는 원시 FASTQ 파일 형태로 저장됩니다.(2) 바이오인포매틱스 처리리드 정렬:시퀀싱된 리드(읽힌 서열)를 **참조 유전체(reference genom.. 2024. 11. 20. SRA Toolkit 사용해서 데이터 받기 Step 1. SRA Toolkit 다운받기 https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit 01. Downloading SRA ToolkitSRA Tools. Contribute to ncbi/sra-tools development by creating an account on GitHub.github.com 여기 깃허브 사이트에서, 자기 컴퓨터 사양에 맞는 항목을 다운로드 해준다. Step 2. 다운받은 폴더를 압축 해제 하자. Step 3.터미널에서 압축 해제한 폴더 위치로 이동(cd)하자. 이제, 내가 다운로드 하고 싶은 SRA파일 이름을 넣은 명령어를 작성하자fastq-dump --split-files --gzip.. 2024. 11. 6. [GSEA] Paper review detail Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles유전자 세트 풍부 분석: 게놈 전체 발현 프로필을 해석하기 위한 지식 기반 접근 방식 https://www.pnas.org/doi/10.1073/pnas.0506580102 [GSEA] Gene set enrichment analysis (GSEA),Pathway Enrichment analysis,Gene Ontology Enrichment analysis [GSEA] Gene set enrichment analysis (GSEA),Pathway Enrichment analysis,Gene Ontology Enrich.. 2024. 10. 11. [Gene Ontology (GO) Enrichment analysis] Concepts • GO는 세 가지로 구분1.Molecular Function (MF) : 해당 유전자가 분자 수준에서 수행하는 어떤 활동/기능. Ex) 효소 촉매 작용, 물질 운반2.Biological Process (BP): 해당 유전자가 관여하는 어떤 생물학적 과정. Ex) DNA 복구, 신호 전달 경로3.Cellular Component (CC): 해당 유전자가 위치하는 세포 내 구조적 위치. Ex) 미토콘드리아, 세포막• GO Enrichment analysis : 특정 유전자 리스트에서 관련된 MF, BP 또는 CC가 통계적으로 유의미하게 포함되는지 평가하는 분석 방법. • The structure of GO can be described in terms of a graph, where each .. 2024. 10. 10. [Pathway Enrichment analysis] Concepts Pathway : 단백질, 유전자, 세포 등 생체 요소간의 상호작용과 역학관계를 세밀하게 설명할 수 있는 생물학적 심층지식 Pathway분석을 위해서는 pathway 데이터베이스가 있어야 한다. 이 데이터베이스들은 실험적인 결과 및 논문을 기반으로 하여 만들어 진다. 특정한 분자들이 서로 연관관계가 있는 다른 분자와의 연결을 할 때에 데이터베이스를 기반으로 하기 때문에 이 데이터베이스의 퀄리티에 따라 pathway의 신빙성도 달라진다. 공공데이터로는 가장 많이 사용되는 KEGG pathway와 wikipathways가 있다.또한, Reactome 데이터베이스는 전문가들이 선별한 pathway 데이터를 제공하는 유명한 공개 데이터베이스 중 하나다. https://www.incodom.kr/Pathway_.. 2024. 10. 10. 이전 1 ··· 13 14 15 16 17 18 다음