مسارات المهارات للانضمام
الهدف
هذا الدليل هو المسار الوحيد للتوجيه لكل من وضعي استخدام Decision Gate:
- يحرس DG تنفيذ المهارات الخارجية.
- يُطلق على DG مهارة التقييم الحتمي.
كما يحدد كيفية تكوين كلا الوضعين بأمان (الحلقات التكرارية) دون السماح بانحراف السياسة التي كتبها LLM.
أي مسار يجب استخدامه
| Intent | Path | Enforcement Strength |
|---|---|---|
تغيير الحالة الخارجية (deploy, delete, pay, publish) | تنفيذ مهارة حراس DG | حد صارم (فشل مغلق) |
| إنتاج التحليل/التقارير/دعم القرار | DG كمهارة تقييم | حساب فقط ما لم يتم تغليفه بحد |
| حلقات وكيل متعددة الخطوات تقوم بالتأليف ثم التنفيذ | تركيب تكراري (حارس خارجي + تقييم داخلي) | حد صارم عند الحلقة الخارجية |
المسار A: تنفيذ مهارات حراس DG (الإعداد الافتراضي للإنتاج)
استخدم هذا عندما تكون للإجراءات آثار جانبية.
عقد تشغيلي
- ملكية البوابة مملوكة للإنسان/السياسة.
- مواصفات البوابة هي مواد مُعتمدة على الإصدارات، وليست اختراعات LLM أثناء التشغيل.
- يجب أن تمر كل استدعاء مهارة متغيرة بتقييم DG المباشر قبل التنفيذ.
- نتائج غير ناجحة (
hold,fail,unknown) تمنع التنفيذ.
قائمة التحقق للإعداد
- تعريف خريطة بوابة لكل إجراء.
- قم بتأليف وتسجيل مواصفات السيناريو لكل فئة إجراء.
- تنفيذ غلاف وقت تشغيل رقيق:
evaluate -> allow/deny -> execute. - تصدير والتحقق من حزم التشغيل للتدقيق.
مثال على خريطة الإجراءات:
{
"deploy_to_prod": {
"scenario_id": "release-boundary-v1",
"required_min_lane": "verified",
"allowed_outcomes": ["advance", "complete"]
},
"publish_external_report": {
"scenario_id": "publication-boundary-v1",
"required_min_lane": "verified",
"allowed_outcomes": ["complete"]
}
}
مثال على منطق التغليف:
def guarded_skill_call(action_name, action_args):
policy = action_gate_map[action_name]
run_id = start_run(policy["scenario_id"])
result = scenario_next(policy["scenario_id"], run_id, feedback="trace")
outcome = extract_outcome_kind(result)
if outcome not in policy["allowed_outcomes"]:
return {"allowed": False, "reason": "gate_not_satisfied", "result": result}
skill_result = call_external_skill(action_name, action_args)
runpack = runpack_export(policy["scenario_id"], run_id)
verify = runpack_verify(runpack["dir"], runpack["manifest_path"])
return {"allowed": True, "skill_result": skill_result, "runpack_verify": verify}
مراجع التنفيذ:
scenario_define,scenario_start,scenario_next: integration_patterns.md- مسار تدقيق runpack: integration_patterns.md
- مثال على تدفق مباشر من البداية إلى النهاية: openai_agents_live_loop.py
المسار ب: مهارة تقييم DG
استخدم هذا للتحليل المنظم عندما لا يتم تنفيذ أي إجراء مباشر ذو تأثير جانبي.
عقد تشغيلي
- يتم استدعاء DG كمقيّم مطالبات حتمي.
- المخرجات تدفع التفسير/التقارير، وليس التغيير المباشر.
- إذا تم طلب الطفرة لاحقًا، انتقل إلى حدود المسار A أولاً.
تدفق الأدوات النموذجي
- اكتشف القدرات:
providers_list,provider_contract_get,provider_check_schema_get. - بناء العناصر:
claim_inventory,capability_matrix,claim_condition_map. - تقييم:
precheckللتكرار، ثمscenario_nextالمباشر عندما تتطلب السياسة إثباتًا مباشرًا. - تحقق من النزاهة عند الحاجة إلى التدقيق:
runpack_export,runpack_verify.
عقد قياسي: llm_native_playbook.md
المسار C: التركيب التكراري (حلقة التأليف + حدود التنفيذ)
هذه هي القلق الشائع “DG داخل سير العمل DG”.
استخدم نموذج الحلقة:
- الحلقة الداخلية: DG-as-skill لمساعدة تحليل/تحقق المطالبات.
- الحلقة الخارجية: حارس DG للعمل التبعي.
قواعد صارمة:
- قد يقترح الحلقة الداخلية خرائط؛ ولا يمكنها تخفيف سياسة الحلقة الخارجية.
- تظل تعريفات بوابة الحلقة الخارجية مؤلفة من النظام ومُعَدَّلة.
- كتل الحلقة الخارجية على أي مطالبة مطلوبة غير محلولة بغض النظر عن نص ثقة الحلقة الداخلية.
- تحقق من تشغيل الحزمة في الحلقة الخارجية هو مصدر الحقيقة للتدقيق.
نموذج مضاد يجب تجنبه:
"The agent self-evaluated with DG and therefore can deploy."
نمط صحيح:
"The agent used DG for analysis, then the system-enforced deployment gate passed live, then deploy executed."
مسار الانضمام السريع (المستودع)
استخدم هذه السلسلة عند إدخال البشر أو وكلاء LLM إلى كلا المسارين.
- قم بتشغيل الاختبار السريع الذي يتكون من أمر واحد (كلا المسارين + حالة الرفض القسري):
scripts/bootstrap/skill_pathways_quickstart.sh configs/presets/quickstart-dev.toml
- اقرأ llm_native_playbook.md وهذا الدليل.
- تثبيت المهارات:
scripts/skills/install_local.sh
- قم بتشغيل حلقة التوجيه من البداية إلى النهاية:
python3 examples/frameworks/openai_agents_live_loop.py \
--fixture-dir examples/agentic/onboarding/basic
- تشغيل مصفوفة الصحة الحتمية:
python3 scripts/skills/eval_runner.py \
--mode deterministic \
--trials 1 \
--cases all \
--out-dir .tmp/skills/eval-deterministic-local
- قم بتشغيل مدقق صحة الانضمام:
python3 scripts/onboarding/provider_onboarding_check.py \
--cases all \
--out-dir .tmp/onboarding/local
تعريف الانتهاء (الحد الأدنى بدون أخطاء)
قبل إعلان اكتمال التبني:
- يتم تغليف المهارات المتغيرة بواسطة منطق حدود المسار A.
- مواصفات البوابة مُعتمدة على إصدار وملكية سياسة (وليس نصًا عشوائيًا).
- تتضمن التعليمات الموجهة لـ LLM قواعد توقف صارمة واضحة.
- تقارير تقييم المهارات الحتمية تمر للحالات المطلوبة.
- تقرير صحة الانضمام يحدد جميع الحالات المكتملة.
- اجتياز التحقق من حزمة التشغيل في سير العمل الحي.