Фото: Anthropic

Anthropic оваа недела го претстави Claude Mythos Preview, модел кој компанијата го опишува како далеку најмоќниот ВИ јазичен модел кој досега го направиле. За разлика од претходните модели во семејството Claude кои беа достапни за широката јавност, Mythos Preview засега нема да биде јавно достапен, а причината е токму тоа што може да го прави.

Моделот покажува исклучително силни способности во откривањето и експлоатирањето на софтверски ранливости, односно безбедносни пропусти кај програмите. За оние кои не се толку запознаени со оваа тематика, „ранливост” е грешка во кодот која може да биде злоупотребена за да се добие неовластен пристап до систем, а „експлоатирање” значи практично искористување на таа грешка за напад. 

Досега ваквите работи ги правеа исклучиво високо обучени безбедносни експерти, а сега тоа за прв пат може автономно да го направи ВИ модел.

Anthropic објави детален технички блог во кој ги прикажува конкретните резултати од тестирањето. Моделот пронашол безбедносни пропусти кај секој голем оперативен систем и секој голем веб прелистувач. Некои од овие грешки биле стари и по 20 или 27 години и никогаш претходно не биле откриени, ниту од човечки ревизии, ниту од автоматски алатки за тестирање.

Еден од најинтересните примери е ранливост во OpenBSD, оперативен систем познат токму по својата безбедност, која постоела од 1998 година. Моделот автономно ја идентификувал грешката во имплементацијата на SACK, дел од TCP протоколот за мрежна комуникација. Грешката овозможувала далечински напаѓач да го „сруши” секој OpenBSD систем кој одговара преку TCP. Тоа значи дека со еден пакет испратен преку интернет, сервер би можел да биде онеспособен.

Друг значаен пример е 16 годишна ранливост во FFmpeg, една од најкористените библиотеки за обработка на видео, која се наоѓа зад речиси секој сервис за „стриминг” и видео конверзија на интернет. FFmpeg е еден од најтемелно тестираните софтверски проекти во светот, а сепак моделот пронашол грешка во H.264 „кодекот” која никој претходно не ја забележал.

Можеби најимпресивното е способноста на моделот да „поврзе” повеќе ранливости заедно за да изгради комплетен напад. Кај Linux оперативниот систем, Mythos Preview автономно идентификувал и поврзал две, три, па и четири различни ранливости за да добие целосен „root” пристап, најпривилегираниот корисничкиот пристап кој дозволува целосна контрола над системот.

Кај веб прелистувачите пак, моделот демонстрирал способност да го „пробие” и самиот „sandbox”, заштитниот слој кој ги изолира веб страниците од остатокот на системот. Во еден случај, со комбинирање на повеќе ранливости, моделот создал веб страница која, доколку ја посети жртвата, му овозможува на напаѓачот директен пристап до оперативниот систем.

Клучно е тоа што овие способности не биле намерно тренирани. Anthropic објаснува дека тие се појавиле како последица на општите подобрувања во кодирањето, резонирањето и автономијата на моделот. Истите подобрувања кои го прават моделот подобар во поправање на грешки, го прават подобар и во нивно пронаоѓање и злоупотреба.

Поради ова, Anthropic одлучи моделот да не го пушти во широка употреба, туку да го стави на располагање на ограничена група партнери преку Project Glasswing, иницијативата за која пишувавме порано денеска. 

Партнерите, меѓу кои се Apple, Google, Microsoft и Amazon, ќе го користат моделот исклучиво за дефанзивни цели, односно за пронаоѓање и поправање на пропустите пред тие да бидат злоупотребени.

Досега Anthropic идентификувал илјадници ранливости со висока и критична тежина кои се во процес на одговорно пријавување до одржувачите на софтверот. Кај 89% од 198-те рачно прегледани извештаи, независни безбедносни експерти се согласиле со проценката на моделот за тежината на пропустот.

За технички поупатените читатели, вреди да се спомене дека целиот процес користи едноставен агентски „scaffold”, контејнер изолиран од интернет кој го стартува софтверот заедно со изворниот код, и Claude Code со Mythos Preview добива инструкција во стилот на „пронајди безбедносна ранливост”. Моделот потоа автономно го чита кодот, поставува хипотези, ги потврдува со извршување на програмата, и на крај доставува извештај со репродукциски чекори.

Anthropic во блогот отворено предупредува дека ова е само почеток. Моделите ќе продолжат да стануваат посилни, а тоа значи дека прозорецот меѓу откривањето на ранливост и нејзиното злоупотребување од напаѓачи ќе стане сè помал. Компанијата препорачува организациите веднаш да почнат да ги скратуваат циклусите на „затворање”, да го автоматизираат одговорот на инциденти и да експериментираат со ВИ алатки за безбедност, дури и со моментално достапните модели кои, иако помалку способни од Mythos Preview, сепак можат да пронајдат стотици пропусти.

Долгорочно, Anthropic верува дека ВИ моделите ќе им донесат повеќе корист на одбранбената страна отколку на напаѓачите, но транзицијата до таа нова рамнотежа нема да биде едноставна, а Mythos Preview е јасен сигнал дека сајбер безбедноста влегува во сосема нова ера.