Ny algoritme kan redigere overbevisende billeder ud fra tekst

Vær ikke ked af det, hvis du ikke har de mest overbevisende evner til at redigere et billede i Photoshop. Virksomheden OpenAI, som er bedst kendt for sin AI-alogitme GPT-3, har nemlig udviklet en ny algoritme kaldet DALL-E 2, som kan netop det – redigere billeder.

DALL-E 2 er et AI-program, der er i stand til at generere temmelig overbevisende billeder udelukkende på baggrund af en kort tekstbeskrivelse, som algoritmen tolker. Som navnet indikerer, er der tale om en ny version af den tidligere DALL-E-alogitme, som virksomheden præsenterede i januar 2021.

Version 2 af DALL-E kommer med højere opløsning, lavere responstid og har nye funktioner såsom muligheden for at redigere et eksisterende foto.

Læs også: Hvad er kunstig intelligens? Sådan ser fremtiden med AI ud

Resultat for tekstbeskrivelsen “en skål suppe, der ligner et monster, strikket af uld.”

En tekstbeskrivelse er alt, der skal til at skabe et billede

DALL-E er utrolig simpel. Den behøver blot en tekstbeskrivelse såsom ”en koala der ridder på en motorcykel”, ”en skål med suppe, der ligner et monster, strikket af uld” eller ”isbjørn der spiller bas”.

Straks genereres et fotorealistisk billede, som aldrig før har eksisteret – og umiddelbart må det siges at se temmelig overbevisende ud.

Resultat for tekstbeskrivelsen “Shiba Inu-hund iført baret og sort rullekrave”.

Algoritmen kan også redigere i eksisterende billeder. For eksempel kan en hund, der ligger på en stol, hurtigt forvandles til en kat, hvis man beder algoritmen om det.

Algoritmen kan også tage et eksisterende billede og skabe nye varianter af det fra forskellige vinkler i forskellige stilarter.

Resultat for tekstbeskrivelsen “bamser, der blander glitrende kemikalier som gale videnskabsmænd, steampunk.”

Ikke tilgængelig for alle – endnu

Ligesom OpenAI’s øvrige AI-algoritmer er de til at starte med ikke tilgængelige for den brede offentlighed, men i stedet kun for forskere, som kan få online adgang til dem.

Firmaet har dog givet tredjepartstjenester adgang til sine tidligere algoritmer, så før eller siden vil DALL-E 2 også være integreret i forskellige tredjepartsapps, der finder på spændende anvendelsesmuligheder med den overbevisende algoritme.

Forsøger at bremse misinformation og deepfakes

Der er utvivlsomt stort potentiale i så nem og overbevisende billedgenerering, men det åbner også op for endnu nemmere at skabe fake news og deepfakes. Det har OpenAI forsøgt at sætte en stopper for.

DALL-E kan derfor ikke generere nogen let genkendelige ansigter ud fra navne – selv Mona Lisas ansigt vil blive skabt i en variant, der afviger fra det originale.

OpenAI har også forhindret brugere i at uploade eller generere billeder, der ikke har vurderingen “G”, som man kender fra film, eller som ”kan forårsage skade”.

Hadsymboler, nøgenhed, obskøne fagter eller ” større konspirationer eller begivenheder i forbindelse med større igangværende geopolitiske begivenheder” er derfor bandlyst.

Firmaets mest omtalte algoritme GPT-3 har tidligere fået kritik for at være racistisk og biased – noget som OpenAI har forsøgt at rette op på med efterfølgeren InstructGTP.

Læs også: Nyheder om kunstig intelligens