Rediger bilder og bilder med IA på 5 sekunder fra Gemini AI Studio

Gemini 2.0 Flash fra Google revolusjonerer bildeforbedring ved å tilby enkel, hurtig redigering med naturlige språkforespørsler, tilgjengelig for alle gratis i Google AI Studio.
Jeg skal ikke gjenta den vanlige melodien om hvordan kunstig intelligens har gjort enorme fremskritt de siste årene, men denne gangen kan jeg ikke holde tilbake entusiasmen og undringen (i teknologiske termer) over et utrolig kraftig verktøy. Med versjonen Gemini 2.0 Flash, AI-modellen utviklet av Google, er det mulig å endre hvert bilde på bare 5 sekunder på en radikal måte. Det er ikke bare teori, alle kan prøve og endre bilder på de mest fantasifulle og varierte måtene.
Gemini 2.0 Flash er en avansert versjon av en kunstig intelligens laget av Google. Vi har allerede skrevet om hvordan få tilgang til Gemini 2.0 uten begrensninger for å lage forespørsel og analyser. Nå kan vi bruke det, gratis, også til å redigere bilder.
Har du noen gang sett på et bilde og tenkt: "Jeg burde endret posisjon", eller "Hvordan ville dette bildet sett ut med en annen bakgrunn?". Vel, med ankomsten av Gemini 2.0 Flash Image Generation, går kunstig intelligens inn i verden av fotoredigering på en utrolig enkel og kraftig måte.
Hva er Gemini 2.0 Flash?
Gemini er et multimodalt system, som betyr at det kan jobbe med tekst, bilder og til og med lyd. Dets særegenhet ligger i at det ikke bare kan generere bilder fra bunnen av basert på en beskrivelse, men også endre eksisterende bilder på en enkel og intuitiv måte. Tenk deg å kunne si til datamaskinen: “Legg til en katt på denne stolen” eller “Endre fargen på denne bilen” og se det skje på noen sekunder, uten behov for komplisert grafikkprogramvare. Dette kan gjøres nå med Gemini 2.0 Flash.
Fra mars 2025 vil denne eksperimentelle versjonen være tilgjengelig for alle via Google AI Studio, en gratis plattform hvor alle kan prøve den. I AI Studio, på høyre side, velg Gemini 2.0 Flash (Image generation) Experimental.
Hvordan fungerer bildemodifiseringen?
Den ekte magien med Gemini 2.0 Flash ligger i dens evne til å endre bilder gjennom enkle kommandorer i naturlig språk. Bare last opp et bilde, beskriv hva du vil gjøre med enkle ord, uten lange forespørsel, så gjør AI det. Her er noen eksempler:
- Legge til eller fjerne elementer: Vil du sette en hatt på hodet til noen i et bilde? Eller fjerne en gjenstand som ødelegger bakgrunnen? Bare si det: “Legg til en rød hatt” eller “Fjern den stolen”. AI forstår og endrer bildet mens resten forblir intakt.
- Endre farger eller detaljer: Hvis du har et bilde av en blå bil og ønsker å se den rød, kan du skrive: “Gjør den rød”. Gemini gjør ikke bare tilfeldige fargevalg, men prøver å gjøre resultatet realistisk, med tanke på lys og skygger.
- Endre posisjon og uttrykk for en person i bildet: La oss ta et bilde av oss selv og be om å strekke ut armene, smile eller lage en morsom grimase.
- Endre klær på en person: I et bilde kan vi endre looken, klærne, legge til jakker, hatter, briller og hva enn vi ønsker.
- Sett inn tekst i bildene: I motsetning til andre verktøy, er Gemini 2.0 Flash flink til å sette tekst i bilder på en klar og presis måte. Du kan si: “Legg til ordet ‘Velkommen’ øverst” og den vil gjøre det uten feil eller forvrengte tegn.
- Kunstneriske refleksjoner: Vil du forvandle et bilde til en annen stil? Prøv å si: “Gjør det til et oljemaleri” eller “Lag det i tegneseriestil”. AI kan gjenskape kunstneriske stiler med en overraskende nøyaktighet.
- Kombinere to bilder: Ta et bilde av deg selv, last opp et bilde av en bok eller en smarttelefon, og be om å kombinere dem; resultatet vil bli at du holder den gjenstanden.
Alt skjer på en konversasjonell måte: du kan fortsette å gi instruksjoner trinn for trinn, slik som om du snakket med en venn. For eksempel, først ber du om å legge til en katt, så om å gjøre den svart, og til slutt be om å sette et halsbånd på den. Gemini følger tråden i samtalen uten å miste konteksten.
I tillegg, siden det er gratis (i hvert fall i sin eksperimentelle versjon på Google AI Studio), er det et økonomisk alternativ til betalte programmer.
Nedenfor legger jeg ved en interessant tråd på X med mange eksempler på bildeendringer.
Fremtiden for AI bildebehandler er her
Den nye Google Gemini 2.0 Flash-modellen er fantastisk, du kan redigere bilder med enkel tekst og... det er helt gratis
10 eksempler:
La henne holde hvilket som helst produkt med konsistens pic.twitter.com/I44TFS5AwO
— el.cine (@EHuanglu) 17. mars 2025
Hva gjør det forskjellig fra andre verktøy?
Mange AI-bildeprogrammer, som DALL·E eller Midjourney, er fantastiske for å lage bilder fra bunnen av, men ikke for å endre dem. Det er nesten umulig å endre et bilde og bevare konsistensen, det vil si den samme personen, det samme ansiktet, det samme håret, de samme klærne osv. Vi har allerede snakket om dette, og løsningen var å endre bilder via Face Swap, det vil si å sette inn ansiktet til en person på kroppen til en annen.
Gemini 2.0 Flash, derimot, lar deg jobbe med et eksisterende bilde, enten det er et bilde av deg selv eller noe du har generert med AI, og endre det raskt på ønsket måte. Denne fleksibiliteten er et stort fremskritt.
I tillegg, i motsetning til andre modeller som kombinerer en tekstgenerator med en separat for bilder, er Gemini iboende multimodal. Enkelt sagt, det er en enkelt “hjerne” som forstår både ord og bilder, uten å måtte gå fra et system til et annet. Dette gjør det raskere og mer presist i å forstå hva du ønsker.
Hvordan bruke det i praksis
La oss forestille oss et konkret eksempel. Du har et bilde av en piknik med venner, men du ønsker å legge til noe som mangler, eller kanskje du vil fjerne en person eller et forstyrrende element, eller endre scenariet, stedet eller bakgrunnen. Slik kan du bruke Gemini 2.0 Flash:
- Gå til Google AI Studio (du trenger bare en Google-konto).
- Last opp bildet av pikniken.
- skriv: “Legg til en blå ballon som flyr på himmelen”.
- På få sekunder setter AI-inn ballongen på en naturlig måte, som om det alltid har vært der.
- Likte du ikke resultatet? Du kan si: “Flytt den til venstre” eller “Gjør den større”.
- Fra mine tester, hvis man ønsker å gjøre mange tillegg eller endringer, er det best å gjøre dem en om gangen.
Du kan også lage en visuell historie. Skriv: “Fortell en historie om en liten fugl som lærer å fly og legg til et bilde for hver scene”. Gemini vil generere både teksten og bildene, og opprettholde samme stil og emne fra begynnelse til slutt.
Begrensninger og små feil
Ingen verktøy er perfekte, og Gemini 2.0 Flash har fortsatt mange forbedringsområder. Siden det fortsatt er i eksperimentell fase, har det noen feil:
- Kvalitet etter mange endringer: Hvis du gjør for mange endringer på det samme bildet, kan kvaliteten bli litt redusert.
- Komplekse forespørseler: Noen ganger sliter den med veldig detaljerte instruksjoner eller med flere bilder sammen.
- Vannmerker og opphavsrett: Du kan bruke Gemini til å fjerne vannmerker og copyright-merker fra beskyttede bilder (som de fra Shutterstock), men dette reiser etiske og juridiske spørsmål. Google kan snart legge til begrensninger for å unngå misbruk.
- Skarp filter: Et annet problem jeg har funnet, er hvor strengt Gemini klassifiserer bilder og fotos ved å avslå å behandle dem fordi de anses som upassende, selv om de virkelig er uskyldige. Dette problemet kan overvinnes ved å prøve seg frem, endre beskrivelsen og forsøke å unngå ord som kan misforstås.
Disse aspektene er imidlertid under forbedring, og Google samler inn tilbakemeldinger for å perfektionere systemet.
Et blikk mot fremtiden
Det er sannsynlig at denne teknologien vil bli integrert i forskjellige Google-plattformer og applikasjoner, som for eksempel:
- Google Foto: Fotoadministrasjonsappen kan få nye AI-baserte redigeringsfunksjoner.
- Søkeverktøy: I fremtiden kan vi kanskje være i stand til å redigere.
- Neue applikasjoner og tjenester: Google kan lansere nye apper eller tjenester dedikert til generering og redigering av bilder med Gemini 2.0.
Foreløpig er dette en utmerket mulighet til å prøve noe nytt og se hva moderne teknologi kan gjøre for å gjøre kreativiteten vår enklere, morsommere og også mer produktiv (tenk på sosiale medier).
Gemini 2.0 Flash Image Generation er et stort skritt fremover innen anvendt kunstig intelligens i fotografering. Dets brukervennlighet, kombinert med kraften i dens evner, åpner nye grenser for digital kreativitet, og gjør redigering og generering av bilder tilgjengelig for et stadig større publikum.
Vanlige spørsmål fra våre lesere
Kan Gemini lage bilder?
Ja, Gemini kan lage bilder. Her er noen punkter som forklarer dette:
- - Generativ AI, som Gemini, kan ikke bare analysere data, men også skape nytt innhold.
- Teknologien brukes til å generere bilder, musikk og kode.
- Muligheten til å lage bilder åpner for kreative prosesser og utvikling av visuelle konsepter. Dette gjør Gemini til et nyttig verktøy for designere, kunstnere og mange andre.
Hva heter Googles AI?
Googles AI heter Gemini. Her er noen viktige punkter om Gemini:
- -
Lansering:
- Google har nylig introdusert Gemini som sitt nye AI-system.
- Formål: Gemini er designet for å forbedre brukeropplevelsen og levere smartere og mer relevante resultater.
- Funksjoner: AI-en er utviklet for å være mer avansert enn tidligere modeller, med bedre forståelse av kontekst og brukerspørsmål. For mer detaljer kan det være nyttig å lese videre om spesifikasjonene og funksjonaliteten til Gemini.
"}}]}
Hvis du vil lese flere artikler som Rediger bilder og bilder med IA på 5 sekunder fra Gemini AI Studio, kan du besøke kategorien Applikasjoner.
Legg igjen en kommentar