Op de website van het GameLab wilde ik graag de studenten een plekje geven. Het leek me wel leuk om dan profielfoto’s te hebben die er een beetje game-achtig uitzien. Maar hoe doe je dat? Gelukkig wist één van de studenten raad: Stable Diffusion is daar de ideale tool voor.
In Stable Diffusion kun je magische dingen doen met AI. Via het ingeven van een simpele prompt, genereer je de meest fantastische kunstzinnige afbeeldingen. Dat is mooi allemaal, maar kun je er ook profielfoto’s mee maken van personen uit je omgeving? Dat moest mogelijk zijn, dus zijn we dat gaan onderzoeken.
Als je zoekt op wat Stable Diffusion is, leer je dat het een deep learning, text-to-image model is, dat uitgekomen is in 2022 en gebaseerd is op diffusion technieken. Dat klinkt best wel gaaf, maar dan weet je natuurlijk nog niet wat ermee kan. Je kunt er foto’s en plaatjes mee genereren van vrijwel alles en in allerlei stijlen, gebaseerd op beschrijvingen die prompts heten.
Installeren van Stable Diffusion
Het blijkt niet heel eenvoudig om Stable Diffusion te installeren. Het meeste moet je in Windows doen vanaf de DOS-prompt. Je hebt software als Python en GIT nodig, waar de meeste mensen normaal gesproken niet mee te maken krijgen. De benodigde AI modellen zijn te vinden op een website als CivitAI.
Om Stable Diffusion te kunnen bedienen heb je een webinterface nodig. De populairste is automatic1111. Gelukkig is er een YouTube video die uitlegt hoe je Stable Diffusion moet installeren. Ga er wel even goed voor zitten, want hij is langer dan een uur.
Grafische kaart
Ik kwam er direct achter dat de grafische kaart in zowel mijn Mac als in mijn PC niet voldoende krachtig was om AI images te genereren. Daar is een NVIDIA-kaart voor nodig die geoptimaliseerd is voor AI. Ik ging me er eens in verdiepen en kwam uiteindelijk uit op de RTX 4070. Die is op het moment van schrijven ruim 900 euro maar heeft toch de beste prijs/prestatie verhouding.
Als je alle software geïnstalleerd en opgestart hebt, dan beschik je over een webinterface met een overweldigend aantal opties en instellingen. Ook hiervoor zul je flink aan de zelfstudie moeten. En er moet nog wat bij, want om afbeeldingen van personen te kunnen maken, heb je ControlNet en InstantID nodig. Dit zijn uitbreidingen op Stable Diffusion. Hoe je dat moet installeren vind je in deze video.
Experimenteren
Nu ik eenmaal alles heb draaien, is het leuk om ermee te experimenteren. Via CivitAI kun je diverse modellen downloaden die het makkelijker maken bepaalde stijlen te creëeren. Een website als PromptHero helpt bij het creëren van prompts, zodat je niet van scratch hoeft te beginnen en je weet wat werkt en wat niet.
Ons doel voor het GameLab is bereikt: er is nu een mooie pagina die alle studenten in cyberpunk stijl weergeeft. Maar nu gaat het eigenlijk pas beginnen. We hebben in het lab nu ook de beschikking over AI-compute power. Er is nog genoeg te ontdekken met Stable Diffusion.
Wil je overigens wat sneller van start met AI image generation en is Stable Diffusion nog een stap te ver, dan is Adobe Firefly een toegankelijker alternatief, waar je ook veel mee kan. De coverfoto van deze post is daar bijvoorbeeld mee gemaakt.