본문 바로가기

분류 전체보기127

[Weekly paper review] 9월 3주차 논문 리뷰 (Planning with Diffusion for Flexible Behavior Synthesis, IS CONDITIONAL GENERATIVE MODELING ALL YOUNEED FOR DECISION-MAKING?) 이번주에 읽으려고 계획했던 논문은 아래 2편의 논문이다. [읽음] - Planning with Diffusion for Flexible Behavior Synthesis (ICML 2022) - IS CONDITIONAL GENERATIVE MODELING ALL YOUNEED FOR DECISION-MAKING? (ICLR 2023) 두 논문 다 강화학습(RL)에서 diffusion을 사용한 논문인데, 요즘 강화학습의 trend가 generative model(diffusion)을 활용해 decision-making을 하는 것이라고 하여 한번 읽어보았다. 강화학습에 대해 잘 알지는 못하지만, 환경도 구축해보며 이번 한 주 동안 열심히 공부해봤다. https://hyunsooworld.tistory.co.. 2023. 9. 25.
[RL] Colab(+ vscode)으로 mujoko-py 및 gym 환경 구축하기 !pip install colab_ssh --upgrade from colab_ssh import launch_ssh_cloudflared, init_git_cloudflared launch_ssh_cloudflared(password="test") 최근 diffusion + RL 관련 paper들을 읽으며 코드를 돌려봐야 할 일이 생겼다. 강화학습 환경을 구축하려면 docker를 사용해야 편하고 정신건강에 좋다고 하는데 기존에 쓰던 A6000 서버는 sudo 권한이 없어서 여러모로 어려움이 많았다. docker를 쓰지 않고 colab(pro)과 vscode를 연동해서, 패키지들을 하나씩 설치했는데, 그 과정을 적어보려한다. 우선 코랩에서 아래 코드를 통해 구글 드라이브를 연동하고 colab ssh 실행.. 2023. 9. 22.
[Weekly paper review] 9월 2주차 논문 리뷰 (IP-Adapter, In-Context Learning Unlocked for Diffusion Models, DALL-E 2, DIFFUSION MODELS ALREADY HAVEA SEMANTIC LATENT SPACE) 이번주에 원래 읽으려고 계획했던 논문은 아래 5편의 논문이다. [읽음] - IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models - In-Context Learning Unlocked for Diffusion Models (Prompt Diffusion) - DIFFUSION MODELS ALREADY HAVE A SEMANTIC LATENT SPACE (asyrp) - Hierarchical Text-Conditional Image Generation with CLIP Latents (DALL-E 2) [못 읽음] - Photorealistic Text-to-Image Diffusion Models with.. 2023. 9. 17.
[Weekly paper review] 9월 1주차 논문 리뷰 (SDEdit, GLIDE, ILVR, Dreambooth) 이번주에 원래 읽으려고 계획했던 논문은 아래 5편의 논문이다. [읽음] - SDEdit: Guided Image Synthesis and Editing with Stochastic Differential Equations - GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models - ILVR: Conditioning Method for Denoising Diffusion Probabilistic Models - DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation [못 읽음] - Diffusion .. 2023. 9. 11.
[Weekly paper review] 8월 5주차 논문 리뷰 (DDIM, Plug-and-Play Diffusion, DIFFUSIONCLIP) 이번주에 원래 읽으려고 계획했던 논문은 아래 6편의 논문이다. [읽음] - Denoising Diffusion Implicit Models (DDIM) - Plug-and-Play Diffusion Features for Text-Driven Image-to-Image Translation - DIFFUSIONCLIP: TEXT-GUIDED IMAGE MANIPULATION USING DIFFUSION MODELS [못 읽음] - Diffusion Models already have a Semantic Latent Space - GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models - SDEd.. 2023. 9. 5.
4학년 1학기를 앞두며 어느덧 학부 졸업까지 1년 남았다. "대학원을 꼭 가야하나" 라는 고민을 아직 해결하지는 못하였지만, 대학원스러운(?) 공부를 많이 하고 있는 요즘이다. 최근 근황은 우선 멘토님들과의 diffusion 연구가 지속되고 있다. 셋이서 시작한 연구가 혼자 남아서 할지 말지 조금 고민이였고, 멘토님들께도 조금 죄송했는데 끝까지 해보자고 하셔서 감사했고 열심히 해야겠다는 생각이 많이 들었다. (아마 남은 학부 1년에서의 가장 최우선 목표가 될 것 같다.) 원래 하던 diffusion + text generation 보다는, 조금 더 vision에 가까운 task들로 주제를 변경할 것 같다. (in-context learning) 이것은 오히려 좋은 것 같기도하고, 해오던 공부들이 조금 아깝기도 했지만 공부해온 .. 2023. 8. 26.