Google го најави Gemini Omni, нов систем со вештачка интелигенција дизајниран да функционира како универзален модел кој може да процесира и генерира содржини од различни формати. За разлика од досегашните алатки кои се базираа исклучиво на текстуални команди, Omni е изграден врз основната архитектура на Gemini и овозможува комбинирање на текст, слики, аудио и постоечки видео записи како влезни податоци за создавање нови видео материјали.
Според компанијата, целта на овој модел е да обезбеди конзистентни резултати кои се базираат на разбирање на физиката и логиката во реалниот свет.
Првата верзија од оваа серија, наречена Gemini Omni Flash, нуди напредни можности за уредување на веќе постоечки видео материјали, покрај можноста за генерирање на целосно ново видео.
Корисниците можат да прикачуваат сопствени видеа и преку разговорни текстуални насоки да менуваат специфични детали, како што се позадината, аголот на снимање или визуелниот стил, без притоа да се изгуби континуитетот на оригиналната сцена.
Моделот е дизајниран подобро да симулира гравитација, кинетичка енергија и динамика на течности, што треба да придонесе за пореални визуелни прикази при генерирањето и модифицирањето на содржината.
Имплементацијата на Gemini Omni Flash започнува веднаш за претплатниците на премиум пакетите на Google, преку апликацијата Gemini и креативната платформа Google Flow, додека подоцна се очекува проширување на пристапот за програмерите преку соодветни интерфејси.
Со цел да се адресираат безбедносните предизвици поврзани со вештачки генерираните медиуми, сите материјали создадени или модифицирани со овој модел автоматски ќе содржат вграден дигитален воден печат SynthID, кој овозможува софтверско препознавање на содржини креирани со вештачка интелигенција.







































