본문 바로가기

논문5

[논문 리뷰] Adding Conditional Control to Text-to-Image Diffusion Models (CVPR2023) (Controllable Image Generation) RAG란?Query(질문)이 들어오면 q(x)로 임베딩, 이후 검색, Top-K 선택한계점 : 검색 품질 제한, 단순 추론, 리소스 낭비Introduction답변 생성 시, 여러개가 도출.SETP 1 : Retrieve on Demand ; Retrieve가 필요 여부 결정(실시간) 후 검색하든/하지않든STEP 2 : Generate segment in parallel ; 각 segment마다 critiqueREFLECTION TOKEN : Retrieve(검색 필요한가?), IsREL(관련성 판정), IsSUP(신뢰도 판정), IsUSE(답변 유용성 판정)STEP 3MethodRetrieve on Demand는 segment를 만들 때, 실시간으로 적용장점검색 품질 향상자체 검증추론 능력 강화일관성 향.. 2025. 2. 1.
[논문 리뷰] Zero-Shot Text-to-Image Generation (DALL-E) https://arxiv.org/abs/2102.12092 Zero-Shot Text-to-Image GenerationText-to-image generation has traditionally focused on finding better modeling assumptions for training on a fixed dataset. These assumptions might involve complex architectures, auxiliary losses, or side information such as object part labels or segmentatiarxiv.org 연구 목적기존의 작은 데이터셋에서 벗어나, 대규모 데이터 & 파라미터를 활용한 → 고품질 이미지 생성Backgroun.. 2025. 1. 31.
[논문 리뷰] BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding https://arxiv.org/abs/1810.04805 BERT: Pre-training of Deep Bidirectional Transformers for Language UnderstandingWe introduce a new language representation model called BERT, which stands for Bidirectional Encoder Representations from Transformers. Unlike recent language representation models, BERT is designed to pre-train deep bidirectional representations from unlaarxiv.org  IntroductionBERT 이.. 2025. 1. 31.
[논문 리뷰] InstructPix2Pix: Learning to Follow Image Editing Instructions https://arxiv.org/abs/2211.09800 InstructPix2Pix: Learning to Follow Image Editing InstructionsWe propose a method for editing images from human instructions: given an input image and a written instruction that tells the model what to do, our model follows these instructions to edit the image. To obtain training data for this problem, we combine thearxiv.orgBackgroundDiffusion Model,Conditional .. 2025. 1. 31.
[PDFMathTranslate] 논문 번역 PDFMathTranslate는 (수학) 논문 PDF를 번역하고, 원본 문서와 번역된 문서를 비교할 수 있는 기능을 제공합니다. 특히 수식, 차트, 목차, 주석 등 원본의 구조를 유지하면서 번역 결과를 제공하고 있어 수학 분야를 비롯한 자연 과학 분야의 논문들을 번역하기에 좋습니다. 다양한 언어 및 외부 번역 서비스 등을 지원하며, 명령줄 도구, GUI, Docker 환경 등 다양한 방식으로 활용할 수 있습니다. https://github.com/Byaidu/PDFMathTranslate GitHub - Byaidu/PDFMathTranslate: PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDFPDF scientifi.. 2025. 1. 24.