Hva er DALL-E-3?

Hva er DALL-E-3?

DALL-E-3 er et kraftig verktøy, basert på kunstig intelligens som lar deg generere bilder basert på tekst (promts). DALL-E-3 er laget av OpenAI, som også eier og driver ChatGPT.

Dall-E-3 ble lansert høsten  2023, og er kraftig forbedret fra Dall-E-2. Det mest åpenbare er at du nå bruker chatboten ChatGPT 4 for å hjelpe til med å fylle ut promts. Det er altså langt enklere å bruke DALL-E-3 enn Dall-E-2, og kvaliteten på det du får generert (output) er jevnt over mye bedre enn tidligere.

DALL-E-3: Litt om praktisk bruk

Rent praktisk får man tilgang gjennom å logge seg inn på sin ChatGPT-profil. Deretter går man i en vanlig chat, velger GPT-4, og huker av for DALL-E-3. Slik:

DALL-E-3 er tilgjengelig for ChatGPT Plus og Enterprise-kunder. Man får altså (pr. november 2023) ikke tilgang til DALL-E-3 gjennom gratis-versjonen av ChatGPT.

DALL-E-3 fungerer altså slik at man logger inn i ChatGPT 4, og skriver inn en prompt, så genereres ett eller flere bilder. Man kan deretter endre bildet, gjennom å chatte med GhatGPT. Man trenger altså ikke skrive inn promptet på nytt også gjøre endringer i det, man kan både justere bilde og promts gjennom samtale med ChatGPT. Det er ekstremt enkelt.

Se eksempel nedenfor:

Det er også verdt å merke seg at OpenAI har lagt til flere sikkerhetstiltak i DALL-E-3, som begrenser verktøyets evne til å generere innhold som er over kanten, enten det er voldelig, “voksent” eller hatefullt. Det er også lagt inn tiltak for å avvise forespørsler som ber om bilder av en offentlig figur ved navn, eller de som ber om bilder i stilen til en levende kunstner. Hvis du ber om å få et bilde i stilen til en konkret kunstner vil DALL-E-3 skrive om promtet på en måte som beskriver den aktuelle stilen, heller enn å benytte et prompt der kunstnerens navn inngår. Jeg vil gjette på at dette er et result av de ganske mange rettsakene som verserer mot OpenAI for brudd på opphavsretten til både billedkunstnere og forfattere.

Rettigheter til bilder av DALL-E-3

Når det gjelder rettighetene til det som skapes, eies disse av brukeren, og det kan også benyttes kommersielt (uten at jeg eller denne siden på noen måte tar ansvar for at dette eller noe annet på siden eller generelt i livet er korrekt). OpenAI får imidlertid en bruksrett til output. Alt dette følger av Terms of use (openai.com) per november 2023. Vær imidlertid obs på at en KI ikke kan være opphaver, og dermed ikke kan få opphavsrett. Du har altså ikke like sterke rettigheter til grafikk (eller tekst) skapt ved hjelp av ChatGPT eller DALL-E som det du lager selv. Så, betyr det at andre også kan benytte det du har laget da? Kanskje – jeg vet ikke. Kanskje vil også svaret være ulikt i ulike land.

Og hva med bildene DALL-E-3 er trent på, og hva hvis “output” er likt noe som andre har rettigheter tid? Vanskelige spørsmål, og ikke alle disse er avklarte enda. Det er mange pågående rettsaker om generativ kunstig intelligent. Det kan nok være lurt å være forsiktig.

Bruksområder for DALL-E-3

Lage bilder

Så langt har vi sett at DALL-E-3 kan lage bilder på en praktisk og overbevisende måte. Det er supert for bainstorming, eller til å lage kunst, grafikk, og hva det skulle være.

Dette kan naturlivis være fornøyelig nok, men man kan også be om bilder som forklarer det ene eller det andre. Se eksemplet nedenfor der jeg ba om følgende:

“Please make an infographic about the solar system, showing the size of the planets and the distance between them”.

Den observante leser vil se at grafikken bare er sprøyt, og ikke riktig i det hele tatt. Noen nye planeter har vi også fått! Hvorfor? Jo, fordi jeg ikke var spesifikk i utformingen av promptet. Hvis jeg hadde beskrevet størrelser og avstander, ville det (i alle fall relativt sannsynlig) blitt riktig. Bullshit in, bullshit out, akkurat som med ChatGPT for øvrig. Dette viser imidlertid en begrensning i både DALL-E-3 og ChatGPT. Det finnes åpenbart tilgjengelig informasjon som kunne satt opp en riktig grafikk, slik jeg ba om, uten at jeg måtte legge inn den aktuelle informasjonen selv.

Forstå bilder – og lage bilder

“Visual” er egentlig en funksjon til ChatGPT, men den kan brukes på en kul måte med DALL-E-3, og nevnes derfor her. ChatGPT kan nå forklare hva den ser på bilder. For å gjøre dette må man gå til “Deafult mode”, som vist på bildet ovenfor.

Deretter trykker man på bildet, og verlger noe man har lokalt lagret.

Herfra er det egentlig bare fantasien som setter grenser. Man kan for eksempel be om iterasjoner/variasjoner av den man legger inn.Se eksempel nedenfor.

Herfra kan man be ChatGPT om å beskrive bildet, og justere promtet.

Så vise det seg at promtet som ChatGPT lagde, ble for drøyt for ChatGTP. Der fikk vi også se DALL-E-3s nevnte begrensning av seg selv. 

Heldigvis er det, som nevnt, enkelt å justere…

Logoer, markedsføring, og slikt?

Min favoritt er idemylding, men DALL-E-3 kan åpenbart brukes til mye.

Dersom man vurderer å faktisk bruke det som kommer ut av DALL-E-3 bør man imidlertid tenke over rettighetssituasjonen nevnt ovenfor. Det er jo litt kjipt hvis du bruker en logo som DALL-E-3 har laget, også har du ikke (alene) alle rettighetene til denne.

Pris og tilgjengelighet

DALL-E-3 er tilgjengelig nå, via ChatGPT. Det koster 20 USD per måned. Se mer i egen artikkel om ChatGPT.

Anbefaling?

DALL-E-3 viker som en game-changer innen tekst-til-bilde generering. Resultatene blir overbevisende (men ikke nødvendigvis bedre enn ved bruk av Nightcafe eller Midjourney), men det er så voldsomt enkelt å bruke DALL-E-3. Rettighetspolitikken er også, med alle forbehold i verden, mer liberal enn for en del lignende tjenester.

Andre poster: