Schedule

MINDS SEMINAR

MINDS Seminar Series | U-Jin Choi (KAIST) - 제1부: Denoising Diffusion Probabilistic Model(DDPM) / 제2부: Variational Distribution Learning for Unsupervised Text-to-Image Generation

MINDS SEMINAR
period : 2023-11-21 ~ 2023-11-21
time : 16:00:00 ~ 18:00:00
개최 장소 : Math Bldg 208& Online streaming (Zoom)
Topic : 제1부: Denoising Diffusion Probabilistic Model(DDPM) / 제2부: Variational Distribution Learning for Unsupervised Text-to-Image Generation
개요
Date 2023-11-21 ~ 2023-11-21 Time 16:00:00 ~ 18:00:00
Speaker U-Jin Choi Affiliation KAIST
Place Math Bldg 208& Online streaming (Zoom) Streaming link ID : 688 896 1076 / PW : 54321
Topic 제1부: Denoising Diffusion Probabilistic Model(DDPM) / 제2부: Variational Distribution Learning for Unsupervised Text-to-Image Generation
Contents 제 1부 : Ho et al 연구팀이 NeurIPS2020 에 발표한 논문입니다. 확산모델을(전방향) 가우시안 마르코프 체인으로 가정하여 주어진 데이터를 완전한 가우시안 노이즈로 변환한 다음 Denoising Process( Reverse Time Process)도 가우시안 마르코프체인을 따르는 Score Function을 학습한 다음 학습 된 스코어함수를 Langevin Dynamics에 대입하여 샘플을 생성하는 구조로 되어 있습니다. 역방향의 가우시안 마르코프 모델의 평균과 분산이 전방향의 가우시안에서 미리 설정된 매개변수로 표시하는 매우 테크니칼한 유도과정을 정밀 토의 합니다. 이 때 네트웍의 파라메터를 최적화 하는 목적함수가 표준정규분포에서 추출 되는 가우시안 노이즈와 이를 추정 하는 네트웍의 L2-Metric로 표현 되는 과정을 심층 토의합니다. / 제2부: 2013년 발표 된 Variational Auto-Encoder 알고리 네트웍과 2014년에 제안 된 GAN 네트웍을 결합하여 Text-to-Image 생성모델에 대한 연구는 컴퓨터비젼 연구의 핵심 주제 입니다. CVPR. Open As. 2023에 발표된 논문을 통하여 최근의 연구결과 및 동향을 관찰 할 수 있습니다. 이 논문에서는 Contrastive Language-Image Pretraining(CLIP)를 활용하여 Zhou et al 의 LAFITE, CVPR2022 결과 보다 매우 좋은 실험결과를 보였습니다. Score Matching 확산확율모델과 상이한 생성모델이며 응용분야가 보다 광범위 한것을 관찰 할수 있습니다.
MinDS MinDS · 2023-11-01 15:00 · Views 391