본문 바로가기
728x90
반응형

Textual Inversion2

diffusion의 확장 모델인 dreambooth에 대해 알아보고 이미지 생성해보기 Dreambooth는 2022년에 Google 연구팀과 보스턴 대학교의 연구자들이 개발한 딥러닝 생성 모델입니다. Dreambooth는 기존의 텍스트-이미지 모델을 세부적으로 조정하거나 새로운 이미지를 생성할 수 있습니다. Dreambooth는 다른 디퓨전 모델(예: DALL.E 2, 미드저니, Stable Diffusion)이 할 수 없거나 부족한 것들을 할 수 있습니다. Dreambooth는 사진부스와 비슷하지만, 한 번 주제를 캡처하면 꿈에서 볼 수 있는 곳 어디든 합성할 수 있다고 합니다. 예를 들어, 자신의 사진을 업로드하고 'as a full body shot of you in a suit’이라고 입력하면 Dreambooth가 자신의 사진을 바탕으로 정장 차림의 전신샷을 그리는 이미지를 생성합.. 2023. 3. 12.
스테이블 디퓨전 Textual Inversion에 대해 속성으로 알아보도록 하겠습니다. 생성 커뮤니티에서 Stable Diffusion이 굉장히 핫해지고, 생성 AI에 대한 발전이 급속도로 이루어지고 있는데요. 그 중 하나가 Textual Inversion입니다. 아래는 논문으로 개제 된 정식 명칭인데요. An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion 텍스트 반전을 이용해서, 개인화 된 텍스트 투 이미지 생성을 하겠다라는 목표를 가지고 있습니다. 여기에는 기존의 Latent Diffusion Models을 사용했다고 언급 했구요. 미리 학습 되어 있는 텍스트-이미지 모델(Latent DIffusion Models)의 임베딩 공간에 새로운 '단어'를 사용하여 개인 사물이나 예술.. 2023. 3. 11.
728x90
반응형