Root NationNyhederIT nyhederLigesom i filmene: Googles nye billedbehandlings-AI gør skalering og forbedring af dem til en realitet

Ligesom i filmene: Googles nye billedbehandlings-AI gør skalering og forbedring af dem til en realitet

-

Du har sikkert set fantasyfilm eller tv-serier, hvor hovedpersonen beder om at forstørre billedet og forbedre resultatet – for at vise et ansigt, en nummerplade eller en hvilken som helst anden nøgledetalje. Googles nyeste kunstig intelligens (AI) systemer, baseret på den såkaldte diffusionsmodeller, er i stand til at udføre dette trick.

Det er en vanskelig proces at mestre, fordi det i bund og grund er at tilføje detaljer til et billede, som kameraet ikke oprindeligt fangede, ved at bruge supersmarte gæt baseret på andre lignende billeder.

Google

Hos Google kaldes denne teknik for naturlig billedsyntese, og i dette særlige scenario ultrahøj billedopløsning. Du starter med et lille, pixeleret foto og ender med noget skarpt, klart og naturligt. Det er måske ikke ligefrem originalen, men det er tæt nok til at se ægte ud for det menneskelige øje.

Google har introduceret to nye AI-værktøjer til dette job. Den første hedder SR3 eller Super-Resolution via Repeated Refinement, og den virker ved at tilføje støj til et billede og derefter fjerne det. Gennem en række sandsynlighedsberegninger baseret på en stor database af billeder og noget maskinlæringsmagi kan SR3 forestille sig, hvordan en superhøjopløsningsversion af et lavopløsningspixelbillede ser ud.

Det andet værktøj er CDM, eller Cascaded Diffusion Models. Google beskriver disse som "pipelines", langs hvilke diffusionsmodeller – inklusive SR3 – kan rettes til billedopskalering i høj kvalitet. Det tager forbedringsmodeller og gør dem til større billeder.

Google

Ved at bruge forskellige forbedringsmodeller i forskellige opløsninger er CDM-tilgangen i stand til at udkonkurrere alternative billedopskaleringsmetoder, ifølge Google. Den nye AI-motor blev testet på ImageNet, en gigantisk database med træningsbilleder, der almindeligvis bruges til forskning i visuel objektgenkendelse.

Slutresultaterne af SR3 og CDM er imponerende. I en standardtest med 50 menneskelige frivillige blev billeder af menneskelige ansigter genereret af SR3 forvekslet med rigtige billeder omkring 50 % af tiden – og i betragtning af, at en ideel algoritme skulle opnå 50 %, er det imponerende. Det er værd at gentage, at disse forbedrede billeder ikke er nøjagtige matcher af originalerne, de er omhyggeligt beregnede simuleringer baseret på sandsynlighedsmatematikken.

Google

Google lover meget mere fra sine nye AI-motorer og relaterede teknologier – ikke kun med hensyn til at forstærke billeder af ansigter og andre naturlige objekter, men også inden for andre områder af probabilistisk modellering.

Læs også:

Tilmelde
Giv besked om
gæst

0 Kommentarer
Indlejrede anmeldelser
Se alle kommentarer