A Google Gemini a Google DeepMind által fejlesztett mesterséges intelligencia platform, amely különböző alkalmazási területeken nyújt fejlett AI megoldásokat. 2023 végén indult, és a legmodernebb nyelvi modelleket multimodális képességekkel ötvözi, így képes mind szövegeket, mind képeket értelmezni és generálni.
A ChatGPT a legismertebb, de nem az egyetlen mesterséges intelligencia modell, mely a mesterséges intelligencia úttörőjének számít. Ez a legrégebbi és jelenleg is a legnépszerűbb AI-platform, de a korábban csak tesztelőknek elérhető Google Gemini (korábban Bard néven) végre már külön is telepíthető, mint alkalmazás. Így szabadon hozzáférhetünk a Google saját mesterséges intelligenciájához.
A Google Gemini főbb jellemzői:
- Multimodális képességek: A Gemini képes egyszerre szövegeket és képeket kezelni, ami alkalmassá teszi kreatív és gyakorlati feladatokra, például képek létrehozására vagy szövegek elemzésére.
- Fejlett kontextusmegértés: Az újabb modellek, mint a Gemini 1.5 Pro, akár 1 millió tokent is képesek kezelni. Ez lehetővé teszi nagy adatmennyiségek, hosszú dokumentumok vagy videók és kódállományok feldolgozását, így összetett feladatokat, például több e-mail összegzését is hatékonyan végzi.
- Feladat automatizálás és integráció: A Gemini különböző Google alkalmazásokkal integrálódik, és képes feladatok automatizálására, például a Google Workspace-ben vagy a Google Messages-ben.
- Természetes beszélgetési képességek: A „Gemini Live” funkcióval a felhasználók hangalapú, természetes beszélgetéseket folytathatnak az AI-jal a legkorszerűbb beszédfelismerő technológia segítségével.
- Többnyelvű támogatás: A Gemini számos nyelvet támogat, így különböző nyelveken is képes hatékonyan kommunikálni és értelmezni a feladatokat.
A szöveges, képi vagy akár hangalapú promptokat is fogadó LLM (Large Language Model, azaz nagy nyelvi modell) motor sokféleképpen segíthet kreatív feladatokban. Képes összefoglalni dokumentumokat vagy akár üzleti terveket is generálni.
A Gemini megállja a helyét fordítóként is, hiszen több mint 200 nyelvet ismer és képes videókat és hangfájlokat is feldolgozni.
A Microsoft-féle versenytárshoz, a Copilothoz hasonlóan itt is kapunk egy képgenerátort, mely megbízható, de sokat „hallucinál”, többet, mint a szövegeknél.
Google Gemini – előnyök, hátrányok
A Gemini képes kapcsolódni a Gmail-hez, a Drive-hoz, így aztán e-maileket és meglévő dokumentumokat is felhasználhatunk a kommunikációban.
Az alkalmazás legnagyobb hátránya, hogy lecseréli a hagyományosan elérhető Google Segédet, annak ellenére, hogy nem teljesen fedi le annak képességeit. Így nem fér például hozzá az operációs rendszerhez és a többi telepített programhoz sem. Ennek köszönhető a negatív értékelések túlnyomó része.
Szerencsére a beállításokban lehetőségünk van visszatérni a Segédhez.
További hátránya, hogy a Google minden, a Geminivel folytatott beszélgetést elment és fel is használ az AI további tanításához. Szóval tesztelni csak akkor érdemes, ha ez nem zavar minket.
A Gemini még nincs készen, folyamatosan fejlesztik, módosítgatják, így valószínű, hogy a teszt során észlelt problémák hamarosan eltűnnek.
A használata mindenesetre jelenleg ingyenes, csak a kapcsolt felhőszolgáltatás tárhelyét korlátozzák.
Vissza a blog cikkekhez