🤖 AI 이미지 생성 모델
✅ Zoo
🦓Zoo는 다양한 텍스트-이미지(Text 2 img) AI 모델을 사용하여 사실적인 이미지를 생성할 수 있는 무료 텍스트기반 AI 이미지 생성 사이트로, 수십억 명의 사람들이 단 몇 초 만에 놀라운 예술 작품을 제작할 수 있도록 하는 것을 목표로 하고 있습니다.
텍스트를 입력하면 ‘SDXL, DALL-E, Kandinsky’과 같이 현재 가장 인기있는 오픈소스 모델의 출력 작품들을 비교하고 바로 다운로드할 수 있습니다. 이 도구는 AI 및 오픈소스 머신 러닝 프로젝트의 인프라를 제공하는 Replicate에 의해 구동되며, AI 발전에 관심있는 모든 사람들이 손쉽게 접근하고 협업할 수 있는 공간을 제공합니다.
- 8가지 모델 중에서 사용하고 싶은 모델을 선택해 체크합니다.
- 프롬프트 입력란에 생성하고 싶은 이미지의 특징을 간략하게 텍스트로 입력합니다.
- GO 버튼을 클릭해 창의적인 이미지를 생성합니다.
- 생성된 이미지를 클릭한 후 [Open Link -> 마우스 우 클릭 > 이미지 저장] 버튼을 클릭해 다운로드 합니다.
- 원하는 그림이 없다면 GO 버튼을 클릭해 이미지를 재생산 합니다.
✅ Stablie Diffution Xlarge ⭐⭐⭐⭐
스테이블 디퓨전 SDXL(Stablie Diffution Xlarge)은 Stability AI에서 개발한 가장 최신의 AI 이미지 생성 모델로 이전 모델보다 훨씬 더 향상된 이미지 구성과 실사에 가까운 얼굴 이미지를 생성할 수 있습니다.
SDXL은 거의 모든 예술 스타일의 고품질 이미지를 생성할 수 있는 포토리얼리즘을 위한 최고의 오픈 모델입니다. 특히 1024×1024 해상도에서 더 넓은 대비, 조명, 그림자를 제공하기 때문에 출력 시 더 생동감 있고 선명한 이미지를 생성할 수 있습니다. SDXL은 짧은 단어로 구성된 프롬프트 만으로도 이전 모델보다 훨씬 더 정교한 이미지를 생성할 수 있습니다.
- 차세대 포터리얼리티 기능
- 읽을 수 있는 텍스트 생성
- 풍부한 비주얼과 놀라운 미학
- 사실적인 실사 이미지 생성
- 짧은 프롬프트를 사용하여 이미지 생성
- 더 나은 인체 해부학
- 예술적 스타일 제공
- 향상된 이미지 구성
✅ Stable Diffusion 1.5 / 2.1 ⭐⭐
스테이블 디퓨전 1.5는 텍스트 프롬프트에서 고해상도 이미지를 생성하는 텍스트 대 이미지 생성 모델입니다. Stability AI의 파트너인 런웨이 Ml에 의해 2022년 10월에 출시되었으며 사전 학습된 텍스트 인코더 CLIP ViT-L/14를 사용합니다.
스테이블 디퓨전 2.1은 Stability AI 개발한 고해상도 이미지 합성 및 생성 모델로 2022년 12월에 출시되었습니다. 2.1 버전에는 LION(대규모 인공지능)에서 개발한 새로운 텍스트 인코더 OpenCLIP-ViT/H를 사용해 CLIP을 사용한 V-1.5 보다 더 크고 상세한 이미지를 생성할 수 있게 되었습니다. V-2.1에서는 사용자가 이미지 합성을 제어할 수 있는 가중 프롬프트를 지원하며 KARLO와 같은 다른 모델들과 결합하여 사용할 수 있습니다.
두 모델 모두 텍스트 프롬프트를 사용하여 이미지를 생성하거나 기존 이미지를 수정 및 변형할 수 있는 모델입니다.
1.5 | 2.1 | |
이미지 해상도 | 512 x 512 픽셀 | 768 x 768 픽셀 |
Negative & weighted prompts | 지원되지 않음 | 지원됨 |
Non-standard resolution & aspect ration | 지원되지 않음 | 지원됨 |
특징 및 활용 | 사람 | 사람, 건축, 인테리어, 야생동물 등등 |
✅ Kandinsky – 2.1 / 2.2 ⭐⭐⭐
Kandinsky 2.0는 러시아의 비영리 AI 연구단 체인 ai-forever와, Sber AI에서 2022년 11월 23일 출시한 러시아 최초의 다국어 text2image 모델입니다. 텍스트를 사용해 이미지를 생성하거나 이미지의 누락된 부분을 채울 수 있는 인페인팅 기능을 지원합니다. 텍스트로 멋진 비주얼을 만들거나 오래된 사진을 복원하려는 사람들에게 적합합니다
Kandinsky 2.2는 Sber AI에서 2023년 7월 13일 출시한 매우 창의적인 이미지 생성 모델입니다. 미드저니(Midjourney)와 비슷한 접근 방식을 취하지만 미드저니 보다 조금 더 사실적인 이미지를 생성하는 경향이 있습니다. 2.2에서는 더욱 새롭고 강력한 이미지 인코더인 CLIP-ViT-G 및 ControlNet을 도입하여 전반적으로 성능이 상향되었으며 이전보다 훨씬 더 사실적인 1024×1024 크기의 고해상도의 이미지를 만들 수 있게 되었습니다.
✅ DALL-E ⭐⭐
DALL-E는 OpenAI에서 2021년 1월 5일 공개한 인공지능 신경망 기반의 이미지 생성 모델로, 텍스트를 이미지로 변환하는 AI 기반 이미지 생성기입니다. 텍스트로 이루어진 설명과 단어만으로 이미지를 생성할 수 있는 최초의 모델이었기 때문에 많은 비예술가 유저들에 관심을 끌었습니다. GPT-3 언어 모델과 GAN 모델을 조합해 사실적인 이미지를 생성합니다. ‘DALL-E’의 뜻은 예술가 살바도르 달리와 인기 애니메이션 주인공 월-E를 결합한 것으로 초현실적이고 상상력이 풍부한 이미지를 생성 모델을 의미합니다. 현재는 DALL-E 2라는 두 번째 버전이 개발되면서 성능 크게 업그레이드되었습니다.
✅ Deepfloyd-IF ⭐⭐⭐
딥플로이드 IF는 Stable Diffusion을 개발한 stability.ai와 DeepFloyd 팀이 합작해 새롭게 출시한 이미지 생성 모델입니다. 차세대 이미지-텍스트 모델 학습을 위한 대규모의 데이터 세트인 LAION-5B 에서 약 12억 개의 이미지로 훈련되었기 때문에 다른 어떤 이미지 모델보다 언어를 더 잘 이해합니다. 이는 일관성 있는 이미지를 생성하기 위해 많은 수동 조정이 필요했던 이전 모델보다 상당히 개선된 것입니다.
Deppfloyd-IF를 사용하려면 최소 16GB VRAM이 필요하며 가장 큰 모델의 경우 24GB 이상의 VRAM을 권장됩니다. 현재 Deepfloyd IF의 첫 번째 버전은 일시적으로 피드백을 수집하기 위해서 제한된 라이선스로 배포되어 상업적으로 사용할 수 없습니. 향후 DeepFloyd와 StabilityAI 팀은 완전 무료로 사용할 수 있는 버전을 출시할 예정입니다.
✅ Material-Diffusion ⭐⭐
Material-Diffusion은 SD v1.5 모델을 활용하여 타일링 가능한 이미지를 생성하는 확산 모델입니다. 이 모델은 컴퓨터 그래픽, 게임 개발 등 다양한 애플리케이션에서 사용할 수 있는 타일링 가능한 텍스처와 패턴을 생성하는 데 특히 유용합니다.
예를 들어 컴퓨터 그래픽 분야에서 이 모델을 사용해 고품질의 사실적인 3D 텍스처를 생성하여 가상 환경의 시각적 외관을 향상시킬 수 있습니다. 또한 게임 개발자는 이 모델을 활용하여 지형지물이나 벽 또는 배경과 같은 패턴을 만들 수 있습니다. 또한 타일형 텍스처가 제품 렌더링 및 프로토타입 제작에 자주 사용되는 산업 디자인 분야에서도 이 모델을 활용할 수 있습니다. 전반적으로 메테리얼 확산 모델은 여러 산업 분야에서 타일형 패턴과 텍스처를 생성하는 효율성과 품질을 크게 향상시킬 수 있는 잠재력을 가지고 있습니다.
📖 FAQ
2023년 최고의 AI 이미지 생성기는 무엇입니까?
뛰어난 성금과 더불어 가장 사용하기 쉬운 이미지 생성기를 찾는다면 DALL·E 2 모델을 추천합니다. 만약 최고의 퀄리티를 원한다면 Stable Diffusion XL, Kandinsky 2.2, Midjourney가 적합할 수 있습니다.
AI로 생성한 이미지를 판매해도 상관없나요?
네, AI 이미지를 판매하는 것은 대부분 합법입니다. 단 AI 이미지가 어떤 라이선스로 생성되는지 확인해야 합니다. 예를 들어 Midjourney, Stable Diffution은 해당 모델로 생성된 모든 이미지에 대한 상업적 사용을 허용하기 때문에 생성된 이미지를 판매해 돈을 벌 수 있습니다.
사용자가 이미지를 업로드하면 AI 공통된 특성을 파악해서 이미지를 만들 수 있나요?
네, Stable Diffusion WebUI의 강력한 확장인 ControlNet을 사용하면 사용자가 업로드한 이미지와 텍스트 프롬프트를 기반으로 유사한 여러 이미지를 생성할 수 있습니다.