Управління контекстом та надійність

Q: Що найчастіше перевіряють у домені Context Management?

Обрізання verbose виводів інструментів до релевантних полів, persistent fact blocks для збереження точних даних поза сумаризованою історією, structured error propagation із типом збою і isRetryable, та розрізнення access failure від валідного empty result.

Q: Які anti-patterns критичні для Домену 5?

Два найнебезпечніші: (1) мовчазне придушення помилок (порожній success при збої) — coordinator не може прийняти правильне рішення; (2) агресивна сумаризація без persistent fact blocks — модель «забуває» точні суми, дати, номери.

Q: Як правильно організувати progressive summarization?

Ключовий принцип: транзакційні факти (числа, дати, ідентифікатори, обіцянки) зберігати в окремому persistent блоці поза сумаризованою історією. Цей блок додається в кожен промпт незмінним, а сумаризується лише «м'який» контекст.

Question 1

Агент дає лише 55% first-contact resolution при цілі 80%. Логи показують: він ескалює прості кейси (стандартні заміни з фото-доказом), але намагається сам обробляти складні ситуації з винятками з політики. Як найкраще покращити калібрування ескалації?

Accepted Answer

Додати у system prompt явні критерії ескалації з прикладами «коли ескалювати, а коли вирішувати»

Answer

Просити агента самооцінювати власну confidence за шкалою 1–10 і слати до людини нижче заданого порогу

Answer

Розгорнути окрему classifier-модель на історичних тікетах, що передбачає потребу в ескалації кейсу

Answer

Додати sentiment-аналіз вхідних повідомлень і ескалювати при перевищенні порогу негативного тону клієнта

Question 2

lookup_order повертає 40+ полів на замовлення, з яких для типового кейсу повернення релевантні лише ~5. У довгих діалогах ці виводи накопичуються й з'їдають контекст. Який підхід найкращий?

Accepted Answer

Обрізати verbose-виводи інструмента до релевантних полів ще до того, як вони потраплять у контекст

Answer

Збільшити max_tokens моделі, щоб вона спокійно вмістила всі 40+ полів кожного замовлення в діалозі

Answer

Періодично робити progressive summarization усієї історії діалогу разом із виводами замовлень у ній

Answer

Вимкнути lookup_order і просити клієнта диктувати потрібні деталі замовлення вручну в повідомленні

Question 3

get_customer повертає кількох клієнтів, що збігаються за наданим іменем. Як агенту коректно вчинити?

Accepted Answer

Попросити додатковий ідентифікатор (email, номер замовлення), а не обирати збіг за евристикою

Answer

Обрати найновіший за датою створення акаунт як найбільш імовірний відповідно до контексту запиту

Answer

Обрати акаунт із найбільшою кількістю замовлень як того клієнта, що найчастіше звертається до підтримки

Answer

Об'єднати всі знайдені збіги в один зведений профіль і продовжити обробку звернення на його основі

Question 4

На початку діалогу клієнт прямо й однозначно вимагає з'єднати його з живим оператором. Як вчинити агенту?

Accepted Answer

Виконати ескалацію негайно, без спроби спершу самостійно розслідувати кейс клієнта

Answer

Спершу спробувати вирішити питання самому, і лише якщо не вдасться — тоді ескалювати на оператора

Answer

Запитати причину вимоги й переконати клієнта, що агент цілком здатен розв'язати його питання сам

Answer

Підняти confidence-поріг для цього діалогу й продовжити обробляти звернення автономно без людини

Question 5

У довгих діалогах ви робите progressive summarization історії. Згодом помічаєте, що агент «забуває» точну суму повернення, дату покупки й обіцянки, дані клієнту. Як це виправити?

Accepted Answer

Витягувати транзакційні факти в окремий persistent «case facts» блок, що додається в кожен промпт

Answer

Повністю відмовитись від сумаризації й завжди надсилати моделі всю історію діалогу без скорочень

Answer

Сумаризувати історію ще агресивніше, щоб лишалось більше місця в контексті під нові факти й репліки

Answer

Зберігати точні транзакційні факти лише в системі логування на бекенді, поза контекстом самої моделі

Question 6

Клієнт просить price-match під ціну конкурента. Політика описує лише коригування під власні попередні ціни магазину й нічого не каже про конкурентів. Що має зробити агент?

Accepted Answer

Ескалювати запит, бо політика мовчить і неоднозначна щодо цього кейсу

Answer

Відмовити клієнту за принципом «якщо ніде не написано — значить заборонено»

Answer

Погодити price-match самостійно, спираючись на відсутність явної заборони

Answer

Вигадати власний розумний відсоток знижки як компромісне рішення на місці

Question 7

Під час тривалої сесії дослідження великої кодбази Claude починає давати непослідовні відповіді й посилатися на «типові патерни» замість конкретних класів, знайдених раніше. Як протидіяти цій деградації контексту?

Accepted Answer

Вести scratchpad-файл із ключовими знахідками й звертатись до нього у нових питаннях

Answer

Перезапускати сесію повністю з нуля при кожному наступному новому питанні до цієї кодбази

Answer

Підвищити temperature, щоб відповіді стали різноманітнішими, ширшими й нібито точнішими

Answer

Ігнорувати — для довгих дослідницьких сесій це начебто очікувана нормальна поведінка

Question 8

Під час тривалої багатофазної сесії контекст заповнюється багатослівним discovery-виводом, і ви бачите, що місця лишається все менше. Яка вбудована команда допоможе зменшити споживання контексту по ходу?

Accepted Answer

/compact — стискає накопичений контекст під час сесії, звільняючи місце

Answer

/reset — повністю очищає й обнуляє весь стан та контекст поточної сесії

Answer

/verbose — перемикає рівень деталізації виводу команд і інструментів

Answer

/tokens — показує поточний лічильник спожитих токенів контексту

Ключові теми

Типові anti-patterns

Приклади питань — Домен 5

get_customer повертає кількох клієнтів, що збігаються за наданим іменем. Як агенту коректно вчинити?

На початку діалогу клієнт прямо й однозначно вимагає з'єднати його з живим оператором. Як вчинити агенту?

Часті питання про Домен 5

Що найчастіше перевіряють у домені Context Management?

Які anti-patterns критичні для Домену 5?

Як правильно організувати progressive summarization?