أركسي دوكس

توثيق تسجيل الإثبات والأدلة المقاومة للتلاعب.

وثائق المنتجات الأخرى

نظام Arxi - اختبار وبنية التحقق

Audience: Engineers maintaining release confidence, deterministic الجمهور: المهندسون الذين يحافظون على ثقة الإصدار، والتحقق الحتمي، وقطع الاختبار الجاهزة للتدقيق.


جدول المحتويات

  1. نظرة عامة تنفيذية
  2. عقد اختبار النظام
  3. جرد مدفوع بالسجل
  4. مصفوفة التغطية ونموذج الفجوة
  5. عقد الأثر والنصوص
  6. أدوات التنفيذ
  7. هيكل المجموعة
  8. مرجع متقاطع ملف بملف

نظرة عامة تنفيذية

نظام Arxi-اختبارات النظام يتحقق من السلوك من خلال حدود الإنتاج الحقيقية (CLI و adapter ingest)، ويصدر مواد منظمة، ويتتبع التغطية باستخدام ملفات registry + gaps TOML. تم تصميم الحزمة للحفاظ على تشغيلات حتمية وقابلة للتفتيش.

F:system-tests/README.md L12-L39 F:system-tests/AGENTS.md L12-L35


عقد اختبار النظام

اختبارات النظام تتطلب:

  • تأكيدات الفشل المغلقة،
  • لا توجد دقة تعتمد على النوم،
  • أوامر الإنتاج وواجهات البيانات،
  • إصدار الأرتيفكت لكل اختبار إلزامي.

F:system-tests/AGENTS.md L14-L37

تساعد ميزة التحكم في الوصول على إبقاء اختبارات النظام واضحة في CI والتشغيلات المحلية. F:system-tests/README.md L34-L45


جرد مدفوع بالسجل

system-tests/test_registry.toml هو المرجع المعتمد لـ:

  • الفئات،
  • بيانات التعريف لكل اختبار،
  • نقاط دخول الأوامر،
  • العناصر المطلوبة،
  • الوقت المقدر للتشغيل.

F:system-tests/test_registry.toml L5-L14 F:system-tests/test_registry.toml L15-L480


مصفوفة التغطية ونموذج الفجوة

system-tests/TEST_MATRIX.md يحدد لقطات تغطية الأهداف P0/P1/P2. F:system-tests/TEST_MATRIX.md L12-L42

system-tests/test_gaps.toml تتبع الفجوات المفتوحة/المغلقة مع معايير قبول واضحة وتخطيط الفئات/الأولويات. F:system-tests/test_gaps.toml L4-L74 F:system-tests/test_gaps.toml L75-L190

اعتبارًا من 2026-02-07، تم إغلاق جميع فجوات P1 الأساسية المتعقبة (إزالة التكرار لمحدد المركب، نقاط تثبيت جزئية، فشل الإغلاق المتقاطع بين المقاطع، فشل إغلاق التعلق، توازن SQLite/في الذاكرة). تظل تغطية الضغط/الأداء P2 مفتوحة عمدًا. اعتبارًا من نفس التاريخ، تم تأمين نتائج أمان OSS Launch 0 من خلال اختبار النظام لحدود/سياسات CLI، ومسارات التلاعب الهيكلي في البيان، وتجسيد فساد SQLite، وإنفاذ المقاطع المفتوحة الواحدة. اعتبارًا من نفس التاريخ، يتم تأمين دورة حياة HTTP لجهاز sidecar واستمرارية إعادة التشغيل من خلال اختبار النظام مع عمليات فرعية حقيقية لجهاز sidecar + سير عمل نقل TCP. اعتبارًا من 2026-02-08، يتم عكس متابعة توسيع CLI OSS من الطراز العالمي بالكامل في اختبارات النظام: التحقق من شكل recorder-id، وفحوصات فشل الإغلاق المدخلات العدائية لتسجيل التعلق، ومدة الإغلاق التلقائي/مسارات دورة الحياة المجمعة، وتجزئة JSON للاستعلام + حواجز الحماية فوق الحد، ومسارات أوامر ingest-fixture لفشل/نجاح صارم في Decision Gate CLI. اعتبارًا من 2026-02-08، يتم أيضًا تأمين تعبئة حاوية Docker عبر اختبار النظام من خلال مجموعة sidecar_docker (فحوصات تعزيز الأصول + مسار e2e لـ Docker Compose مع سياسة تخطي/فشل صريحة عبر ARXI_REQUIRE_DOCKER). اعتبارًا من 2026-02-08، يتحقق مسار Docker Compose أيضًا من سلوك بدء التشغيل/استعداد الحاويات (/startup، /ready) قبل وبعد انتقالات دورة الحياة لفتح المقاطع.


عقد الأثر والنصوص

كل تشغيل اختبار يصدر على الأقل:

  • summary.json,
  • summary.md,
  • tool_transcript.json.

TestReporter و TestArtifacts ينشئان جذور تشغيل حتمية، يفرضان سياسة إعادة استخدام جذور التشغيل، وينتجان مستندات ملخص موحدة.

F:system-tests/tests/helpers/artifacts.rs L65-L131 F:system-tests/tests/helpers/artifacts.rs L133-L214 F:system-tests/tests/helpers/cli.rs L19-L107


أدوات التنفيذ

Python المساعدات:

  • test_runner.py: registry-based execution with optional parallelism, test_runner.py: تنفيذ قائم على السجل مع إمكانية التوازي الاختياري، جذور الأثر لكل اختبار، وتوليد البيان.
  • coverage_report.py: ينشئ مستندات من السجل + الفجوات.
  • gap_tracker.py: يسرد/يعرض/يغلق الفجوات ويولد مطالبات التنفيذ.

F:scripts/system_tests/test_runner.py L64-L112 F:scripts/system_tests/test_runner.py L119-L199 F:scripts/system_tests/coverage_report.py L43-L101 F:scripts/system_tests/gap_tracker.py L92-L140


هيكل المجموعة

تغطي وحدات المجموعة:

  • smoke: بدء تشغيل CLI وفحوصات المساعدة/الإصدار،
  • bundle: بناء/تحقق/تفتيش واكتشاف التلاعب،
  • persistence: إعادة التشغيل، الحتمية، وفحوصات التوافق بين SQLite/الذاكرة.
  • operations: query ordering/cursor plus JSON pagination/limit guardrails and operations: ترتيب الاستعلامات/المؤشر بالإضافة إلى ترقيم JSON/حدود الحماية و recorder-id + التحقق من التوافق في تكوين ختم تلقائي.
  • security: bounded CLI input surfaces, malformed-identifier rejection, secure signer-file policy, signer-rotation recovery/corruption behavior, contract path safety, hostile bundle parse-boundary checks, and hostile security: أسطح إدخال CLI المحدودة، رفض المعرفات غير الصحيحة، سياسة ملف الموقّع الآمن، سلوك استرداد/فساد دوران الموقّع، سلامة مسار العقد، فحوصات حدود تحليل الحزم العدائية، وفحوصات حدود record-with-attachments العدائية،
  • recorder: lifecycle plus auto-seal count/duration/combined behavior and recorder: دورة الحياة بالإضافة إلى عدد/مدة الإغلاق التلقائي/السلوك المدمج و فحوصات استمرارية تسجيل المرفقات عبر الحدود الحقيقية لواجهة سطر الأوامر،
  • sidecar: real sidecar process lifecycle over HTTP (record/seal/build/verify) sidecar: دورة حياة عملية sidecar الحقيقية عبر HTTP (تسجيل/إغلاق/بناء/تحقق) وفحوصات الاستمرارية المتعلقة بإعادة التشغيل والتكرار/الصراع.
  • sidecar_docker: Dockerfile/Compose/config hardening checks and Docker Compose build/up/down with containerized sidecar startup/readiness probe sidecar_docker: فحوصات تعزيز الأمان لملف Dockerfile/Compose/التكوين وبناء/تشغيل/إيقاف Docker Compose مع فحوصات بدء/جاهزية الحاوية الجانبية بالإضافة إلى سير العمل المفتوح/التسجيل/الاستعلام،
  • integration_openclaw: fixture-driven OpenClaw gateway/CLI ingest, signed/unsigned verification lanes, sequence-gap policy checks, sensitive integration_openclaw: بوابة/واجهة سطر الأوامر OpenClaw المدفوعة بالمكونات، مسارات التحقق الموقعة/غير الموقعة، فحوصات سياسة فجوات التسلسل، حذف الحقول الحساسة، وفحوصات التعامل مع الحمولة المحدودة.
  • integration_decision_gate: fixture-driven Decision Gate MCP runpack flow ingest through the production arxi-decision-gate-adapter crate, signed/unsigned verification lanes, runpack-integrity strict-vs-anomaly policy checks (including manifest self-integrity recomputation), sensitive transcript-field redaction, bounded transcript payload handling checks, CLI decision-gate ingest-fixture command-path validation, and a fixture conformance gate that enforces canonical Decision Gate tool request/response shapes (including export-vs-verify checked_files الدلالات).

F:system-tests/tests/suites/smoke.rs L15-L43 F:system-tests/tests/suites/recorder.rs L20-L678 F:system-tests/tests/suites/bundle.rs L64-L684 F:system-tests/tests/suites/persistence.rs L24-L468 F:system-tests/tests/suites/operations.rs L23-L570 F:system-tests/tests/suites/security.rs L19-L1024 F:system-tests/tests/suites/sidecar.rs F:system-tests/tests/suites/sidecar_docker.rs F:system-tests/tests/suites/integration_openclaw.rs L1-L200 F:system-tests/tests/suites/integration_decision_gate.rs L1-L1161 F:Docs/architecture/arxi_openclaw_integration_architecture.md L1-L160 F:Docs/architecture/arxi_decision_gate_integration_architecture.md L1-L170


مرجع متقاطع لكل ملف

المنطقةالملفالملاحظات
العقد والمعاييرsystem-tests/AGENTS.mdمتطلبات سلوكية وفنية للاختبارات النظامية.
نظرة عامة على التنفيذsystem-tests/README.mdكيفية تشغيل وتوسيع الحزم.
لقطة تغطيةsystem-tests/TEST_MATRIX.mdمصفوفة P0/P1/P2.
سجل الاختباراتsystem-tests/test_registry.tomlجرد موثوق وأوامر التشغيل.
بيانات تتبع الفجواتsystem-tests/test_gaps.tomlفجوات التغطية ومعايير القبول.
مساعد الأرتيفكتsystem-tests/tests/helpers/artifacts.rsعقدة توليد الجذر والملخص.
مساعد CLIsystem-tests/tests/helpers/cli.rsتنفيذ أوامر CLI الحقيقية والتقاط النصوص.
مساعد Sidecarsystem-tests/tests/helpers/sidecar.rsبدء/إيقاف عملية Sidecar الحقيقية والتقاط النصوص HTTP.
مساعد Dockersystem-tests/tests/helpers/docker.rsاستكشافات Docker daemon/compose ومساعدات الأوامر للمسارات المعبأة.
حزمة Sidecarsystem-tests/tests/suites/sidecar.rsدورة حياة HTTP لـ Sidecar والتحقق من إعادة التشغيل.
حزمة Docker لـ Sidecarsystem-tests/tests/suites/sidecar_docker.rsتعزيز تعبئة حاوية Sidecar والتحقق من سير العمل Docker Compose، بما في ذلك استكشافات بدء التشغيل/الجاهزية.
حزمة تكامل OpenClawsystem-tests/tests/suites/integration_openclaw.rsتحقق من إدخال المحول المدفوع بالترتيبات لتدفقات البوابة + CLI الوهمية.
ترتيبات OpenClawsystem-tests/tests/fixtures/openclaw_gateway_mock_events.jsonترتيب حدث تدفق وهمي للبوابة متماشي مع مخطط أحداث OpenClaw.
ترتيبات OpenClawsystem-tests/tests/fixtures/openclaw_cli_mock_events.jsonترتيب حدث تدفق بأسلوب التراجع لـ CLI متماشي مع مخطط أحداث OpenClaw.
بنية تكامل OpenClawDocs/architecture/arxi_openclaw_integration_architecture.mdخريطة إصدار، حذف، وعقدة سياسة الحمولة المحدودة.
محول إنتاج Decision Gatecrates/arxi-decision-gate-adapter/src/adapter.rsتنفيذ خريطة Decision Gate إلى Arxi القياسية التي تم اختبارها بواسطة الاختبارات النظامية.
حزمة تكامل Decision Gatesystem-tests/tests/suites/integration_decision_gate.rsتحقق من تدفق MCP المدفوع بالترتيبات لربط مستوى التحكم.
ترتيب Decision Gatesystem-tests/tests/fixtures/decision_gate_runpack_mock_flow.jsonترتيب تدفق MCP وهمي متماشي مع نص Decision Gate وتخطيط حزمة التشغيل.
بنية تكامل Decision GateDocs/architecture/arxi_decision_gate_integration_architecture.mdخريطة تدفق MCP بالإصدار، سياسة سلامة حزمة التشغيل، وحذف النصوص/عقد الحدود.
تحليل البيئةsystem-tests/src/config/env.rsتحليل صارم للبيئة لتكوين الاختبار.
نص البرنامجscripts/system_tests/test_runner.pyمحرك تنفيذ مدفوع بالسجل.
مولد وثائق التغطيةscripts/system_tests/coverage_report.pyخط أنابيب وثائق الاختبار المولدة.
نص إدارة الفجواتscripts/system_tests/gap_tracker.pyأدوات دورة حياة الفجوات.