Фото: Google

Минатата недела, Google официјално ја претстави четвртата генерација од својата серија на модели со отворен код, Gemma 4. За разлика од претходните верзии каде компанијата наметнуваше одредени ограничувања за користење, новите модели се целосно достапни под популарната Apache 2.0 лиценца. 

Овој потег им овозможува на програмерите слободно да ги користат, модифицираат и дистрибуираат моделите, со што Google директно одговара на потребите на заедницата за поголема транспарентност и контрола врз вештачката интелигенција. 

Моделите се изградени врз истата истражувачка основа и технологија која го движи нивниот најмоќен комерцијален систем, Gemini 3.

Gemma 4 семејството пристигнува во четири различни големини, дизајнирани за покривање на широк спектар на хардверски капацитети.

Најмалите верзии се Effective 2B (E2B) и Effective 4B (E4B), кои се оптимизирани за извршување на мобилни телефони, IoT системи и уреди на работ на мрежата. 

За посериозни пресметковни потреби, Google нуди 26B Mixture of Experts (MoE) модел кој обезбедува баланс помеѓу перформанси и брзина на одзив, како и најголемиот 31B Dense модел наменет за работни станици и сервери. 

Сите верзии доаѓаат со поддршка за над 140 јазици и значително зголемен контекстуален прозорец, кој изнесува 128 илјади токени кај помалите и 256 илјади токени кај поголемите модели.

Новата генерација носи значителни подобрувања во самите можности на системот, преминувајќи ги границите на едноставни генеративни разговори. Gemma 4 сега поддржува напредно резонирање, способност за повеќечекорно планирање и длабока логика. Фокусот е ставен на таканаречените агентски работни процеси, што значи дека моделите можат автономно да користат надворешни алатки и сервиси преку структурирано повикување на функции. 

Покрај ова, сите модели поддржуваат мултимодално процесирање на слики и видеа, додека најмалите верзии наменети за мобилни уреди вклучуваат и поддршка за аудио влез наменет за препознавање на говор.

За програмерите, една од најпривлечните карактеристики на новите модели е можноста за нивно целосно локално извршување. Помалите верзии се развивани во соработка со тимовите кои стојат зад процесорите на паметните телефони, со цел да работат непречено и без латенција директно на самите уреди, без потреба од интернет конекција. Ова овозможува претворање на стандардна работна станица или дури и мобилен телефон во приватен асистент за пишување код или систем за локална обработка на податоци, што е клучно за зачувување на приватноста на корисниците. 

Новите модели се веќе достапни за преземање преку платформи како Hugging Face, Kaggle и Ollama.