Az OpenAI legújabb mesterséges intelligencia-fejlesztése, a GPT-4o új mérföldkövet jelenthet a digitális kommunikációban. A technológia, amely képes egyszerre szöveges, hang alapú és képi adatok feldolgozására, mostantól mindenki számára hozzáférhető lesz, nem csak az előfizetők számára. Ez a fejlesztés jelentős hatással lehet a digitális asszisztensek piacára, ahol eddig olyan ismert szereplők domináltak, mint az Alexa, a Google Segéd vagy a Siri.
Mira Murati, az OpenAI technológiai vezetője egy lenyűgöző félórás prezentáció során mutatta be a GPT-4o-t, amely az „omni” jelzőt kapta, utalva arra, hogy a modell minden típusú kommunikációra képes lesz. Az új modell összekapcsolja a beszédértést, a kérdés megértését és a válaszalkotást egyetlen zökkenőmentes folyamatban, így biztosítva gyorsabb és természetesebb kommunikációt.
A prezentációban bemutatott egyik példa során a GPT-4o folyamatosan tolmácsolt olaszról angolra, majd vissza, miközben az izguló szakembert is megtanította nyugodtabban lélegezni a színpadon.
Bár a GPT-4o modell ingyen hozzáférhető lesz, a fizetős felhasználók több erőforrást kapnak a rendszer használatához. Ez a fejlesztés nagy hatással lehet az Apple-re és a Google-re is, amely vállalatok hamarosan megtartják éves fejlesztői konferenciáikat, így gyorsan kell reagálniuk az OpenAI új technológiájára.
A GPT-4o az elődjeinél fejlettebb képességeivel új lehetőségeket nyithat a mesterséges intelligencia fejlesztési területén. A technológiai közösség már nagy várakozással figyeli, hogy ez az új verzió milyen változásokat hozhat a jövő digitális asszisztenseinek fejlesztésében.
(Borítókép: Mira Murati, az OpenAI technikai igazgatója. Fotó: YouTube)