본문 바로가기

논문 및 데이터 분석

(16)
[Scanpy] 설치 및 실행 1. Linux 환경에서 설치 밀 실행해 보았다.터미널에서, conda를 사용하여, Scanpy 패키지 설치conda install -c conda-forge scanpy더보기EnvironmentNotWritableError가 나타났습니다. 이는 현재 사용자가 /packages/anaconda3 경로에 대한 쓰기 권한이 없음을 의미합니다. 그래서, conda 가상환경에서 실행해보자.미리 만들어준 가상환경 활성화하고, Scanpy 패키지 설치.conda activate kim89_envconda install -c conda-forge scanpy(가상환경에서) Scanpy 설치 완료!2. Scanpy 설치 확인설치 후 터미널에서 Python 인터프리터를 실행하고 Scanpy를 불러오기python>>> i..
conda 가상환경 생성 및 R 실행 conda를 사용하는 이유관리자 권한 없이 설치 가능: conda는 사용자 디렉토리에서 작동하므로 서버 관리자의 권한 없이도 원하는 버전을 설치할 수 있습니다.독립된 환경: 다른 프로젝트와 충돌하지 않는 독립적인 환경을 생성할 수 있습니다.업데이트 용이: R 및 패키지를 쉽고 빠르게 최신 버전으로 업데이트할 수 있습니다.conda는 Python 패키지 관리뿐만 아니라 다양한 언어(예: R)의 환경 관리에도 사용할 수 있는 강력한 도구입니다. 1. conda 설치 및 확인conda --version 2. 가상 환경 생성conda create -n my_r_env r-base r-essentialsconda create -n kim89_env r-base r-essentials -n my_r_env: 가상 ..
[Linux] 하드 링크 vs 소프트 링크 하드 링크 (Hard Link)동일한 데이터를 가리킨다. (동일한 데이터를 공유한다.)특징 :원본을 수정하면, 링크한 파일도 수정된다.마찬가지로, 링크한 파일 수정하면, 원본에도 수정된다.원본을 삭제하더라도, 링크한 파일은 그대로 존재한다! 데이터까지 모두 존재한다.링크한 파일은 삭제해보려 하더라도 삭제되지 않는다. 원본이 존재하기에! ln {복사해올 파일/파일 경로} {새로 저장(링크)할 폴더명}ln file1.txt hardlink_file.txt소프트 링크 (Soft Link) = 씸볼릭 링크 (Symbolic Link)바로가기처럼 작동한다. (중간 링크를 생성한다.)특징 : 원본을 수정하면, 링크를 통해 링크한 파일에서 확인할 수 있다.링크한 파일에서는, 원본 파일에 접근하여 수정 가능하다. ( ..
Batch Effect, Batch Correction Batch정의:실험에서 동일한 조건 하에서 처리된 데이터 그룹.실험 환경(날짜, 기계, 실험자 등)이 일관된 데이터를 한 그룹으로 묶습니다.Batch Effect정의:실험 조건이 동일하지 않을 때(예: 실험 날짜, 기계, 실험자 등), 배치(batch) 간에 체계적인 차이가 발생하는 현상.생물학적 변동과 무관한 비생물학적 신호로 인해 데이터 비교가 왜곡될 수 있음.예시: 실험 날짜로 정의되는 배치실험이 1월 1일과 1월 2일에 진행되었다고 가정.샘플 ID실험 날짜유전자 1 발현값유전자 2 발현값Sample 11월 1일100200Sample 21월 1일120190Sample 31월 2일200300Sample 41월 2일220310Batch 1: 1월 1일에 처리된 샘플.Batch 2: 1월 2일에 처리된 ..
RNA 데이터 생성 과정 데이터가 만들어지는 과정 (1) 시퀀싱 과정mRNA 추출:각 세포에서 RNA를 추출하고, 이를 **역전사(reverse transcription)**를 통해 cDNA로 변환합니다.cDNA는 시퀀싱 과정에서 안정적으로 읽을 수 있도록 가공됩니다.바코드와 UMI 부여:각 세포의 RNA에는 세포 바코드와 **UMI(Unique Molecular Identifier)**가 부여됩니다.세포 바코드: 어떤 RNA가 어떤 세포에서 나온 것인지를 식별.UMI: 동일한 RNA 분자의 중복 여부를 확인.시퀀싱:시퀀싱 기계가 RNA 서열(cDNA)을 읽어들입니다. 이 데이터는 원시 FASTQ 파일 형태로 저장됩니다.(2) 바이오인포매틱스 처리리드 정렬:시퀀싱된 리드(읽힌 서열)를 **참조 유전체(reference genom..
Cell Ranger 설치 및 실행 STEP 0. 공식 튜토리얼이 자세히 잘 나와있다. 잘 참고하자.https://www.10xgenomics.com/support/software/cell-ranger/latest/tutorials Cell Ranger - Official 10x Genomics SupportA set of analysis pipelines that perform sample demultiplexing, barcode processing, single cell 3' and 5' gene counting, V(D)J transcript sequence assembly and annotation, and Feature Barcode analysis from single cell data.www.10xgenomics.comSTE..
SRA Toolkit 사용해서 데이터 받기 Step 1. SRA Toolkit 다운받기 https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit 01. Downloading SRA ToolkitSRA Tools. Contribute to ncbi/sra-tools development by creating an account on GitHub.github.com   여기 깃허브 사이트에서, 자기 컴퓨터 사양에 맞는 항목을 다운로드 해준다.     Step 2. 다운받은 폴더를 압축 해제 하자. Step 3.터미널에서 압축 해제한 폴더 위치로 이동(cd)하자. 이제, 내가 다운로드 하고 싶은 SRA파일 이름을 넣은 명령어를 작성하자fastq-dump --split-files --gzip..
[MAST, limma, DESeq2] 공통 DEGs 분석 # MAST, limma, DESeq2에서 추출한 DEG의 rownames (유전자 이름)을 각각 가져옵니다.degs_mast_genes 0), size = 1.5) + scale_color_manual(values = c("blue", "red")) + # 다운레귤레이션(blue), 업레귤레이션(red) theme_minimal() + labs(title = "Volcano Plot of Common DEGs", x = "Log2 (Fold Change)", y = "-log10 (Adjusted P-Value)") + theme(plot.title = element_text(hjust = 0.5))# 업레귤레이션된 유전자up_regulated 0)# 다운레귤레이션된 ..