본문 바로가기

분류 전체보기127

[논문 리뷰] General Image-to-Image Translation withOne-Shot Image Guidance (ICCV 2023) arxiv : https://arxiv.org/abs/2307.14352 code : https://github.com/CrystalNeuro/visual-concept-translator 1. Introduction 논문이 다루는 task : image2image translation, style transfer Input : 2 images (reference image, source image) Output : image (source image의 structure는 보존하고, reference image의 concept(style)을 적용한 new image) 2. Related Work GAN Image2Image translation task에서 기존의 GAN 기반 방법론들은 학습이 어렵고, .. 2024. 1. 24.
[논문 리뷰] MetaICL: Learning to Learn In Context (NAACL 2022) arxiv : https://arxiv.org/abs/2110.15943 code : https://github.com/facebookresearch/MetaICL 1. Introduction 논문이 다루는 task : in-context learning Input : x_1,y_1, ... ,x_k Output : y_k 해당 task에서 기존 연구 한계점 기존의 연구들에 따르면 LM의 모델 사이즈가 크거나(68B 이상), task reformatting 혹은 task-specific templates가 있어야만 in-context learning이 가능하다. 그러나 본 연구에서 제시하는 MetaICL은 훨씬 더 작은 언어 모델들로, specific한 formula없이 in-context learnin.. 2024. 1. 20.
[논문 리뷰] Null-text Inversion for Editing Real Images using Guided Diffusion Models (CVPR 2023) arxiv : https://arxiv.org/abs/2211.09794 code : https://github.com/google/prompt-to-prompt/#null-text-inversion-for-editing-real-images 1. Introduction 논문이 다루는 task : text guided image editing Input : image Output : (text guidance를 통해 condition된) image 해당 task에서 기존 연구 한계 Text-to-Image generation task에서 특정한 사람이나 사물을 보존하면서, condition하게 image를 생성하려면 DDIM Inversion process가 반드시 필요하다. DDIM inversion이.. 2024. 1. 18.
논문 리뷰 방향성 최근 논문 리뷰 포스팅을 자주 못하고 있는데, 논문 리뷰 포스팅을 어떻게 해야하나 고민이 된다. 논문을 읽는 시간도 오래 걸리는데, 리뷰하는데는 거의 그정도의 시간이 또 들기때문에 시간 효율 상 고민이 되는 것 같다. 하루에 최소 한 편의 논문을 읽으려고 하는데 기록 및 생각정리를 하지 않으면 금방 휘발될 것 같다는 생각이 든다. (A to Z로 다 읽는 것이 비효율적이라는 생각도 들지만, 영어 논문 읽는 속도를 높힐 겸 이렇게 하고 있다. 효과는 아주 조금 있는 것 같다.) 참고로 요즘 주로 읽는 논문은 주로 in-context learing, LLM, diffusion, consistency model 등의 주제이고 연구에 필요한 medical domain의 논문도 읽고있다. 최근 구독한 두 블로거가.. 2024. 1. 12.
[Weekly paper review] 10월 1주차 논문 리뷰 (ImageBrush: Learning Visual In-Context Instructions for Exemplar-Based Image Manipulation) 이번주에 읽은 논문은 아래 1편의 논문이다. [읽음] ImageBrush: Learning Visual In-Context Instructions for Exemplar-Based Image Manipulation 이번주에는 주로 현재 생각중인 아이디어를 MNIST dataset으로 구현하는데 시간을 많이 할애했다. unet에 image condition을 어떻게 주어야할지가 조금 고민인데, 우선 IP-Adapter, Visii 등의 방식과 비슷하게 구현중이다. 원래는 논문을 안 읽으려했는데, unet에 image condition을 주는 reference paper들을 찾아보다가 이 논문을 발견하였다. 논문에서 하고자 하는 것이 내가 생각한 아이디어와 비슷한 것 같아서 바로 읽어보았다. (코드가 공개되.. 2023. 10. 7.
[Weekly paper review] 9월 4주차 논문 리뷰 (ControlNet, Visii, InstructPix2Pix, Prompt-to-Prompt Diffusion) 이번주에 읽으려고 계획했던 논문은 아래 7편의 논문이다. [읽음] Adding Conditional Control to Text-to-Image Diffusion Models (10 Feb 2023) - ICCV 2023 Visual Instruction Inversion: Image Editing via Visual Prompting (26 Jul 2023) - Neurips 2023 InstructPix2Pix: Learning to Follow Image Editing Instructions (17 Nov 2022) - CVPR 2023 Prompt-to-Prompt Image Editing with Cross Attention Control (2 Aug 2022) - ICLR 2023 (Oral).. 2023. 10. 1.