Дизайн інструментів та MCP-інтеграція

Q: Що найчастіше перевіряють у домені Tool Design & MCP?

Якість опису інструментів (деталі формату входу, межі, edge cases), конфігурація MCP по scope (project .mcp.json vs user ~/.claude.json), structured error responses з errorCategory і isRetryable, та принцип мінімальних привілеїв.

Q: Які anti-patterns критичні для Домену 2?

Два найпоширеніші: (1) однаковий рядок помилки для всіх типів збоїв — агент не може прийняти правильне рішення про ретрай; (2) занадто великий набір інструментів (15+) — деградує якість вибору. Оптимум — 4–6 цільових інструментів.

Q: Чому MCP resources важливіші за exploratory tool calls?

MCP resources виставляють каталоги доступних даних наперед, дозволяючи агенту побачити структуру без реальних дорогих викликів. Це знижує latency і кількість токенів на «розвідку».

Question 1

Логи показують, що агент часто кличе get_customer на запити про замовлення (напр. «перевір моє замовлення #12345») замість lookup_order. Обидва інструменти мають мінімальні описи («Retrieves customer information» / «Retrieves order details») і приймають схожі формати ідентифікаторів. Який найефективніший перший крок?

Accepted Answer

Розширити опис кожного інструмента: очікувані формати входу, приклади запитів, edge cases і чіткі межі застосування

Answer

Додати 5–8 ретельних few-shot прикладів у system prompt, що скеровують order-запити саме на lookup_order

Answer

Реалізувати окремий routing-шар, що парсить ввід і наперед обирає інструмент за ключовими словами

Answer

Об'єднати обидва інструменти в один lookup_entity, що сам визначає потрібний бекенд за вводом

Question 2

Усі MCP-інструменти повертають при збої однаковий рядок «Operation failed». Через це агент однаково реагує і на таймаут, і на порушення політики, і на невалідний ввід. Як це виправити?

Accepted Answer

Повертати структуровані метадані: errorCategory, isRetryable і людиночитний опис

Answer

Додати у system prompt інструкцію завжди автоматично повторювати спробу при збої

Answer

Логувати помилки на бекенді детальніше, лишивши агенту той самий загальний рядок

Answer

Підвищити timeout усіх інструментів, щоб технічні помилки траплялись помітно рідше

Question 3

process_refund відхиляє запит, бо сума перевищує ліміт політики (бізнес-правило, не технічний збій). Що інструмент має повернути, щоб агент відреагував коректно?

Accepted Answer

Структуровану помилку isError з retriable:false і клієнт-дружнім поясненням причини

Answer

Той самий формат, що й для технічного таймауту, аби агент повторив виклик ще раз

Answer

Порожній успішний результат без позначки помилки, щоб зайвий раз не турбувати клієнта

Answer

Голий HTTP 500 без категорії помилки, прапора retriable чи опису її причини знову

Question 4

Команда поступово дала агенту 18 інструментів. Тепер він почав плутатись у виборі й інколи бере не той інструмент. Який принцип допоможе найбільше?

Accepted Answer

Звузити набір до 4–5 інструментів, релевантних саме ролі цього агента

Answer

Додати ще інструментів-«хелперів», щоб завжди був точний інструмент під кейс

Answer

Перейменувати всі 18 наявних інструментів у коротші й лаконічніші назви

Answer

Завжди форсувати tool_choice на перший інструмент у списку доступних

Question 5

Synthesis-агент часто має перевіряти конкретні факти, повертаючи керування coordinator'у → web-search → знову synthesis (+2–3 round trips, +40% latency). 85% перевірок — прості факт-чеки (дати, імена, статистика), 15% — глибше дослідження. Як зменшити overhead, зберігши надійність?

Accepted Answer

Дати synthesis-агенту scoped-інструмент verify_fact для простих lookup'ів, а складні лишити через coordinator

Answer

Накопичувати всі потреби верифікації й одним батчем повертати їх coordinator'у вже наприкінці проходу синтезу

Answer

Дати synthesis-агенту повний необмежений доступ до всіх web-search інструментів для самостійної перевірки фактів

Answer

Web-search агент має проактивно кешувати додатковий контекст навколо кожного джерела «про запас» заздалегідь

Question 6

Synthesis-агент час від часу намагається сам робити веб-пошуки й використовує інструменти поза своєю спеціалізацією, псуючи результат. Який принцип розподілу інструментів допоможе?

Accepted Answer

Обмежити набір інструментів кожного subagent'а лише тими, що релевантні саме його ролі

Answer

Дати всім subagent'ам однаковий повний набір усіх інструментів заради гнучкості всієї системи

Answer

Прибрати в synthesis-агента геть усі інструменти, лишивши йому тільки роботу з текстом

Answer

Форсувати tool_choice synthesis-агента на web-search, щоб уніфікувати його поведінку з рештою

Question 7

Інженер просить знайти всі місця виклику конкретної функції по кодбазі. Який built-in інструмент обрати?

Accepted Answer

Grep — пошук за вмістом файлів: імена функцій і рядки помилок

Answer

Glob — пошук файлів за патерном імені чи розширення по дереву

Answer

Read — послідовно читати кожен файл цілком, шукаючи виклики очима

Answer

Bash із інтерактивним редактором для ручного перегляду коду

Question 8

Потрібно знайти всі тестові файли за патерном **/*.test.tsx по проєкту. Який інструмент пасує?

Accepted Answer

Glob — пошук шляхів файлів за патерном імені чи розширення

Answer

Grep — пошук текстових входжень усередині вмісту файлів

Answer

Edit — точкова заміна фрагмента за унікальним текстом-якорем

Answer

Write — створення нового файлу або повний перезапис наявного

Ключові теми

Типові anti-patterns

Приклади питань — Домен 2

process_refund відхиляє запит, бо сума перевищує ліміт політики (бізнес-правило, не технічний збій). Що інструмент має повернути, щоб агент відреагував коректно?

Команда поступово дала агенту 18 інструментів. Тепер він почав плутатись у виборі й інколи бере не той інструмент. Який принцип допоможе найбільше?

Інженер просить знайти всі місця виклику конкретної функції по кодбазі. Який built-in інструмент обрати?

Потрібно знайти всі тестові файли за патерном **/*.test.tsx по проєкту. Який інструмент пасує?

Часті питання про Домен 2

Що найчастіше перевіряють у домені Tool Design & MCP?

Які anti-patterns критичні для Домену 2?

Чому MCP resources важливіші за exploratory tool calls?