본문 바로가기

AI, 논문, 데이터 분석71

[Linux] 하드 링크 vs 소프트 링크 하드 링크 (Hard Link)동일한 데이터를 가리킨다. (동일한 데이터를 공유한다.)특징 :원본을 수정하면, 링크한 파일도 수정된다.마찬가지로, 링크한 파일 수정하면, 원본에도 수정된다.원본을 삭제하더라도, 링크한 파일은 그대로 존재한다! 데이터까지 모두 존재한다.링크한 파일은 삭제해보려 하더라도 삭제되지 않는다. 원본이 존재하기에! ln {복사해올 파일/파일 경로} {새로 저장(링크)할 폴더명}ln file1.txt hardlink_file.txt소프트 링크 (Soft Link) = 씸볼릭 링크 (Symbolic Link)바로가기처럼 작동한다. (중간 링크를 생성한다.)특징 : 원본을 수정하면, 링크를 통해 링크한 파일에서 확인할 수 있다.링크한 파일에서는, 원본 파일에 접근하여 수정 가능하다. ( .. 2024. 11. 26.
Batch Effect, Batch Correction Batch정의:실험에서 동일한 조건 하에서 처리된 데이터 그룹.실험 환경(날짜, 기계, 실험자 등)이 일관된 데이터를 한 그룹으로 묶습니다.Batch Effect정의:실험 조건이 동일하지 않을 때(예: 실험 날짜, 기계, 실험자 등), 배치(batch) 간에 체계적인 차이가 발생하는 현상.생물학적 변동과 무관한 비생물학적 신호로 인해 데이터 비교가 왜곡될 수 있음.예시: 실험 날짜로 정의되는 배치실험이 1월 1일과 1월 2일에 진행되었다고 가정.샘플 ID실험 날짜유전자 1 발현값유전자 2 발현값Sample 11월 1일100200Sample 21월 1일120190Sample 31월 2일200300Sample 41월 2일220310Batch 1: 1월 1일에 처리된 샘플.Batch 2: 1월 2일에 처리된 .. 2024. 11. 21.
RNA 데이터 생성 과정 데이터가 만들어지는 과정 (1) 시퀀싱 과정mRNA 추출:각 세포에서 RNA를 추출하고, 이를 **역전사(reverse transcription)**를 통해 cDNA로 변환합니다.cDNA는 시퀀싱 과정에서 안정적으로 읽을 수 있도록 가공됩니다.바코드와 UMI 부여:각 세포의 RNA에는 세포 바코드와 **UMI(Unique Molecular Identifier)**가 부여됩니다.세포 바코드: 어떤 RNA가 어떤 세포에서 나온 것인지를 식별.UMI: 동일한 RNA 분자의 중복 여부를 확인.시퀀싱:시퀀싱 기계가 RNA 서열(cDNA)을 읽어들입니다. 이 데이터는 원시 FASTQ 파일 형태로 저장됩니다.(2) 바이오인포매틱스 처리리드 정렬:시퀀싱된 리드(읽힌 서열)를 **참조 유전체(reference genom.. 2024. 11. 20.
Cell Ranger 설치 및 실행 STEP 0. 공식 튜토리얼이 자세히 잘 나와있다. 잘 참고하자.https://www.10xgenomics.com/support/software/cell-ranger/latest/tutorials Cell Ranger - Official 10x Genomics SupportA set of analysis pipelines that perform sample demultiplexing, barcode processing, single cell 3' and 5' gene counting, V(D)J transcript sequence assembly and annotation, and Feature Barcode analysis from single cell data.www.10xgenomics.comSTE.. 2024. 11. 7.
SRA Toolkit 사용해서 데이터 받기 Step 1. SRA Toolkit 다운받기 https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit 01. Downloading SRA ToolkitSRA Tools. Contribute to ncbi/sra-tools development by creating an account on GitHub.github.com   여기 깃허브 사이트에서, 자기 컴퓨터 사양에 맞는 항목을 다운로드 해준다.     Step 2. 다운받은 폴더를 압축 해제 하자. Step 3.터미널에서 압축 해제한 폴더 위치로 이동(cd)하자. 이제, 내가 다운로드 하고 싶은 SRA파일 이름을 넣은 명령어를 작성하자fastq-dump --split-files --gzip.. 2024. 11. 6.
Gene set enrichment analysis (GSEA) 논문 리뷰 Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles 유전자 세트 풍부 분석: 게놈 전체 발현 프로필을 해석하기 위한 지식 기반 접근 방식https://www.pnas.org/doi/10.1073/pnas.0506580102 Abstract •In a typical experiment, mRNA expression profiles are generated for thousands of genes from a collection of samples belonging to one of two classes, for example, tumors that are sensitiv.. 2024. 10. 11.