본문 바로가기

Diffusion18

[논문 리뷰] IMPUS: IMAGE MORPHING WITH PERCEPTUALLY UNIFORM SAMPLING USING DIFFUSION MODELS (ICLR 2024) AID: Attention Interpolation of Text-to-Image Diffusion 논문과 비슷하게 image interpolation task(여기서는 image morphing task)를 수행한 연구다.실험부분에 AID와의 비교가 없어서 찾아보니, 이 논문이 선행연구여서 AID의 Appendix E에 본 논문(IMPUS)과 DiffMorpher(CVPR 2024)과의 비교가 있었다. 본 논문에서는 AID 이전에 있었던 diffusion interpolation 논문인 Interpolating between Images with Diffusion Models (ICMLW 2023)하고만 비교한다. 선행연구인 Interpolating ~ 이 논문이 real image에 대한 interp.. 2024. 6. 10.

[논문 리뷰] FastDrag: Manipulate Anything in One Step (arxiv0524) Gradient based optimization 논문들을 찾아보다가 발견한 논문. DragGAN이나 DragDiffusion 등을 몇 번 들어봤었는데, Drag xxx의 sota model인 것 같다. 이해하는데 꽤 어려웠지만, 배울점이 많은 논문이였다.arxiv : https://arxiv.org/abs/2405.15769code : x Before reading논문 제목을 보고 해당 모델이 어떤 방법론을 바탕으로 할지 가설을 세워봅시다.~~~ Anything이란 제목을 그닥 좋아하지는 않지만 manipulate anything이라니 .. 방법이 굉장히 궁금했다. one step이란 단어는 처음에는 눈에 들어오지 않았는데, related work를 읽으며 기존에 drag xx 방식이 전부 몇십 ste.. 2024. 6. 7.

[논문 리뷰] Diffusion Self-Guidance for Controllable Image Generation (NeurIPS 2023) NeurIPS 2023 논문.openreview를 보면 6 6 5 7을 받아 accept되었는데, 내가 논문의 contribution을 덜 이해한건지 조금 아쉽긴 했다. (논문이 별로라기보단, NIPS의 명성과 더 좋은 논문들이 reject되는걸 너무 많이 봐서 약간의 아쉬움 정도..)arxiv : https://arxiv.org/abs/2306.00986code : https://github.com/Sainzerjj/Free-Guidance-Diffusion(non official) Before reading논문 제목을 보고 해당 모델이 어떤 방법론을 바탕으로 할지 가설을 세워봅시다.Self Guidance? additional한 condition없이 스스로 guiding 하는 방법론 인 것 같다. (.. 2024. 6. 4.

[논문 리뷰] Self-Rectifying Diffusion Sampling with Perturbed-Attention Guidance (arxiv 24/03/26) arxiv : https://arxiv.org/abs/2403.17377code : https://github.com/KU-CVLAB/Perturbed-Attention-Guidance Before reading논문 제목을 보고 해당 모델이 어떤 방법론을 바탕으로 할지 가설을 세워봅시다.Rectifying이란 단어를 몰랐는데, 바로 잡는다는 뜻이다. self-guidance와 같이 스스로 바로잡는(?) 아마 cfg도 self guidance 느낌이니 그런 느낌이지 않을까 생각한다.(+ perturbed attention guidance를 덧붙인..)논문의 main figure를 보고 전체 흐름을 유추해봅시다. Figure가 정말 기가 막히다. CFG를 쓰는 논문을 정말 많이 보았지만, 이 그림이 CFG를.. 2024. 6. 3.

[논문 리뷰] Improving Sample Quality of Diffusion Models Using Self-Attention Guidance (ICCV 2023) arxiv : https://arxiv.org/abs/2210.00939code : https://github.com/KU-CVLAB/Self-Attention-Guidance cfg에 대한 깊은 고민을 하다가 관련 연구들을 좀 찾아보았다.김승룡 교수님 연구실에서 낸 SAG와 PAG를 읽고, 몇 개의 다른 guidance 관련 논문들을 읽어보려한다.(https://arxiv.org/abs/2401.02847, https://arxiv.org/abs/2301.12334, https://arxiv.org/abs/2404.07724, https://arxiv.org/abs/2312.02150, https://arxiv.org/abs/2302.07121, https://arxiv.org/abs/2306.0098.. 2024. 6. 3.

[논문 리뷰] DreamStyler: Paint by Style Inversion with Text-to-Image Diffusion Models (AAAI 2024) arxiv : https://arxiv.org/abs/2309.06933code : https://github.com/webtoon/dreamstyler Before reading논문 제목을 보고 해당 모델이 어떤 방법론을 바탕으로 할지 가설을 세워봅시다.Style Inversion이라는 것을 통해 style을 저장(?)한 뒤 그 style을 원하는 프롬프트 혹은 이미지에 입혀서 새로운 이미지를 생성하는 논문일 것 같다.논문의 main figure를 보고 전체 흐름을 유추해봅시다.이해되지 않는 파트가 있나요? 있다면 미리 표시해두고 집중적으로 읽어봅시다figure만 보고 유추를 해보자면, Style을 BLIP-2를 이용해 captioning을 하고 그 정보 C_c와 prompt로 부터의 token C_o.. 2024. 5. 28.

이전 1 2 3 다음

티스토리툴바