Google официјално го претстави Gemini Omni, нов мултимодален јазичен модел за генерирање видео

Новиот систем ги комбинира можностите за логичко заклучување со генерирањето медиумски содржини, овозможувајќи креирање и уредување видео преку различни влезни податоци

Од

Мишо Лекиќ

20.05.2026 - 13:23

Google го најави Gemini Omni, нов систем со вештачка интелигенција дизајниран да функционира како универзален модел кој може да процесира и генерира содржини од различни формати. За разлика од досегашните алатки кои се базираа исклучиво на текстуални команди, Omni е изграден врз основната архитектура на Gemini и овозможува комбинирање на текст, слики, аудио и постоечки видео записи како влезни податоци за создавање нови видео материјали.

Според компанијата, целта на овој модел е да обезбеди конзистентни резултати кои се базираат на разбирање на физиката и логиката во реалниот свет.

Првата верзија од оваа серија, наречена Gemini Omni Flash, нуди напредни можности за уредување на веќе постоечки видео материјали, покрај можноста за генерирање на целосно ново видео.

Корисниците можат да прикачуваат сопствени видеа и преку разговорни текстуални насоки да менуваат специфични детали, како што се позадината, аголот на снимање или визуелниот стил, без притоа да се изгуби континуитетот на оригиналната сцена.

Моделот е дизајниран подобро да симулира гравитација, кинетичка енергија и динамика на течности, што треба да придонесе за пореални визуелни прикази при генерирањето и модифицирањето на содржината.

We’re dropping Gemini Omni: our first step towards a model that can create anything from anything – starting with video.

It combines Gemini’s intelligence with our generative media systems – representing a leap forward in world understanding, multimodality, and editing 🧵 pic.twitter.com/GAtqzr0VIV
— Google DeepMind (@GoogleDeepMind) May 19, 2026

Имплементацијата на Gemini Omni Flash започнува веднаш за претплатниците на премиум пакетите на Google, преку апликацијата Gemini и креативната платформа Google Flow, додека подоцна се очекува проширување на пристапот за програмерите преку соодветни интерфејси.

Со цел да се адресираат безбедносните предизвици поврзани со вештачки генерираните медиуми, сите материјали создадени или модифицирани со овој модел автоматски ќе содржат вграден дигитален воден печат SynthID, кој овозможува софтверско препознавање на содржини креирани со вештачка интелигенција.

Google ја уништи NetNut, мрежа од над 2 милиони заразени уреди…

Објавено видео од експериментален оперативен систем на Microsoft базиран на Copilot

E-commerce Meetup: Инфлуенсер маркетингот повеќе не е само промоција – домашните…

GitHub нуди добивање на репозиториумите на „CD-ROM“ како сатира на трендот…

Повеќето корисници сè уште ги плакнат садовите пред да ги стават…

Како да ја изберете соодветната Linux дистрибуција

Како да го оптимизирате вашиот простор со Samsung Q-Symphony

Насоки за купување телевизор: Вашиот целосен водич за избор на совршен…

Скриените функции на Galaxy Z Fold7: Совети и трикови за напредни…

Марк Гурман со критики за големината на надградбата која ја донесуваат…

Што следи на крипто пазарот

Мисија: Национална развојна стратегија

Да зборуваме за Дина – Dune (2021)

Quiet Place II (2021)

Рецензија Samsung Galaxy A57 5G: Премиум изработка и рафинирани перформанси во…

Рецензија Samsung Galaxy S26 Ultra: Сличен со ланскиот модел, но со…

Samsung Galaxy S25 Ultra по една година: Сè уште еден од…

Samsung Galaxy A56 5G: Средна класа со премиум амбиции

Samsung Galaxy S25 Ultra е најбрзиот Galaxy досега

Пријавувањето за Виз Ер Скопски маратон 2026 е во полн ек

Македонски студенти по архитектура како дел од делегацијата на Saint-Gobain го посети…

Најголемата спортска сала во Македонија станува Т Арена

Европскиот Pepco официјално пристигна во Скопје: Најавени продавници и во Охрид…

Македонското шоу што го привлече Холивуд: Луѓе од E! Entertainmen и…

Google официјално го претстави Gemini Omni, нов мултимодален јазичен модел за генерирање видео

Google ја уништи NetNut, мрежа од над 2 милиони заразени уреди...

Објавено видео од експериментален оперативен систем на Microsoft базиран на Copilot

E-commerce Meetup: Инфлуенсер маркетингот повеќе не е само промоција – домашните...

GitHub нуди добивање на репозиториумите на „CD-ROM“ како сатира на трендот...

Tidal ги укинува авторските хонорари за музика целосно генерирана од вештачка...