Класифікація як інфраструктура / СистемаУкраїнська версія · Читати повний нарис англійською →

SAGEN: ситуаційна обізнаність для генеративних агентів

Архітектура агентів ШІ

Модульна когнітивна архітектура для стійкого стану в агентних системах на мовних моделях. SAGEN переосмислює памʼять агента: не задача зберігання, а задача архітектури - шість спеціалізованих модулів на спільній «дошці» (AwarenessState), що дають LLM-агенту структуровану, тривку ситуаційну обізнаність між кроками.

Джейк Лоуренс · Незалежний дослідник · Система · Системи ШІ

Прогалина: не памʼять, а обізнаність

Між потужним міркуванням LLM усередині одного контекстного вікна і операційною незвʼязністю між послідовними взаємодіями лежить розрив. Проблема архітектурна, а не «інтелектуальна». Пошук у стилі RAG відповідає на питання «що агент знає?», але не на «що він намагається зробити, що змінилося, на що звертати увагу?».

Чотири принципи проєкту: модульність, доменна агностичність, стиснення замість накопичення (натхнене згасанням памʼяті в ACT-R: рутина блякне, провали лишаються) і дизайн, орієнтований на інʼєкцію стану.

Архітектура: шість модулів на дошці

Модель «дошки» (родовід - Hearsay-II, Erman та ін., 1980) тримає єдиний обʼєкт стану AwarenessState із шести когнітивних модулів: Граф цілей (з життєвим циклом і походженням), Траєкторія (стиснена часова шкала подій), Модель світу (граф сутностей з явним обліком припущень і невідомого), Модель себе (спроможності, повноваження, бюджети, історія невдач), Пріоритети уваги (черга загроз, можливостей, аномалій із часом життя) та Протокол взаємодії (операційний контракт).

Шестимодульний поділ визначає, що агент може представити й на що діяти. Агент без модуля Траєкторії не відрізнить зміну теми від її полишення; без типізованої Уваги - не розподілить терміновість. Це і є «таксономічна прихильність»: несуча структура, а не нейтральний опис.

Цикл Спостерігай-Онови-Інʼєктуй

Рушій координує три фази. Спостереження: доменний адаптер розбирає сирий вхід і витягує структуру (теми, сутності, настрій, цілі, питання) - єдине доменно-специфічне місце. Оновлення: рушій застосовує спостереження (upsert для сутностей, append для цілей і уваги), прибирає прострочене, цокає глобальним годинником - повністю доменно-агностично.

Інʼєкція: адаптер рендерить стан як компактний текст у тегах sagen, розміром під бюджет токенів і з пріоритетом (цілі, увага, теми, невідоме). Уся доменна логіка зосереджена в шести методах адаптера, тож адаптери розмови і кодування мають нуль спільних типів сутностей (окрім «концепту») і нуль спільних патернів сканування, але працюють на тому самому рушії й схемі без змін.

Оцінювання

На розмові з чотирьох кроків стан еволюціонує передбачувано (цілі 3, 4, 5, 6; зростають сутності та елементи уваги). Проти базових ліній: охоплення 98,5% у SAGEN проти 20,5% у згортковому резюме і 10,5% у сирому буфері; щільність інформації 11,23 проти 9,59 і 2,28 на 100 токенів.

Замкнений цикл: згенероване LLM сприйняття дає 0,94 узгодженості з ручним аналізом. Серіалізація стану - 4,7 КБ JSON; розділена сесія відтворює рівно той самий стан, що й безперервне виконання. Обмеження чесно названі: немає навчання в ML-сенсі; кожне спостереження коштує додаткового виклику інференсу; поки один домен за раз; обсяг оцінювання обмежений.

SAGEN ставиться до обізнаності як до першокласної архітектурної турботи, а не до запізнілого зберігання. Результат - агент, який розуміє свою поточну ситуацію: що робить, що змінилося, на що зважати і де межі власних спроможностей. Патерн адаптера дає повторне використання між доменами без переписування.

Повна стаття

Повний опис шести модулів і схеми AwarenessState, циклу Спостерігай-Онови-Інʼєктуй, адаптерів розмови й кодування, повне оцінювання з таблицями і запускний браузерний стенд (з відкритим кодом, ліцензія MIT) доступні в англомовній версії.

Відкрити повну версію (англійською) →