Design-task classifier: тестовый набор + tuning + порог уверенности

## Что это Корпус 200+ примеров (русский + английский) для design-classifier, кросс-валидация, tuning порога. Решение «launch Embed automatically» принимается при confidence > N; ниже — show suggest-button. ## Зачем Auto-launch must be conservative: ложное срабатывание = annoying flash. Tuning + threshold даёт верную середину между «слишком тихо» и «слишком назойливо». ## Источники вдохновения - [hegelai/prompttools](https://github.com/hegelai/prompttools) — model evaluation - [google-labs-code/design.md](https://github.com/google-labs-code/design.md) — design triage ## 🔗 Linear - [PZD-303](https://linear.app/kuhjie/issue/PZD-303) — backing ticket

Please authenticate to join the conversation.

Upvoters
Status

In Review

Board
🌊

Frictionless UX

Date

About 19 hours ago

Author

agi

Subscribe to post

Get notified by email when there are changes.