Hoe werkt dat precies? Er zijn twee (belangrijke) soorten Afbeeldings generatie AI's.
1 De GAN (Generative Adversarial Networks) manier werkt met een Generator en een Discriminator. De Generator genereert fake images. De Discriminator bekijkt de afbeelding en zegt: real of fake. Als de Generator een afbeelding kan genereren die de Discriminator niet van fake kan onderscheiden heb je een goed afbeelding gegenereerd. Hoe beter de Discriminator fakes kan onderscheiden, hoe beter de output.
2 Diffusion Models. Deze genereren een afbeelding door het verspreiden van pixels en door stelselmatig de ruis om te zetten in gestructureerde afbeeldingen.
De prompt wordt ook geïnterpreteerd met een NLP, er wordt een vector van gemaakt die later zal gebruikt worden als een rulebook om te zien dat alle nodige elementen aanwezig zijn en of ze met mekaar interageren (bijvoorbeeld apple onder boom, appel op hoofd).