ما هو

يُعد ONNX Runtime محرك ذكاء اصطناعي بمستوى إنتاجي، صُمم خصيصاً لحل العقبات الشائعة المتعلقة بتحسين نماذج التعلم الآلي لتناسب بيئات الأجهزة والبرمجيات المتنوعة. من خلال توفير واجهة موحدة للتدريب والاستنتاج، فإنه يتيح للفرق نشر النماذج عبر وحدات المعالجة المركزية (CPUs)، ووحدات معالجة الرسومات (GPUs)، ووحدات المعالجة العصبية (NPUs) دون التضحية بالأداء. سواء كنت تعمل مع نماذج لغوية كبيرة (LLMs) أو نماذج تنبؤية قياسية، يضمن هذا المحرك أن تحافظ تطبيقاتك على زمن انتقال منخفض وإنتاجية عالية، بغض النظر عن البنية التحتية الأساسية. صُمم المحرك ليوفر مرونة فائقة، حيث يدعم مجموعة واسعة من لغات البرمجة—بما في ذلك Python وC# وC++ وJava وJavaScript وRust—مما يجعله خياراً متعدد الاستخدامات لمكدسات التكنولوجيا المعقدة. إنه يسد الفجوة بين التطوير والإنتاج، مما يمكن المطورين من الحفاظ على سلوك ثابت للنماذج عبر أنظمة Linux وWindows وmacOS، بالإضافة إلى منصات الأجهزة المحمولة ومتصفحات الويب. ومن خلال تبسيط تنفيذ النماذج المتطورة، فإنه يمنح المهندسين القدرة على التركيز على بناء ميزات ذكية بدلاً من استكشاف أخطاء توافق الأجهزة أو تدهور الأداء وإصلاحها.

الميزات الأساسية

تسريع الأجهزة

يعمل على تحسين الأداء من حيث زمن الانتقال، والإنتاجية، واستخدام الذاكرة عبر مجموعة واسعة من الأجهزة، بما في ذلك CPUs وGPUs وNPUs، مما يضمن تشغيل نماذجك بكفاءة على أي جهاز.

دعم متعدد المنصات

يوفر توافقاً قوياً عبر أنظمة التشغيل الرئيسية مثل Linux وWindows وmacOS، بالإضافة إلى منصات الأجهزة المحمولة ومتصفحات الويب، مما يسمح باستراتيجية ذكاء اصطناعي قابلة للنقل فعلياً.

دعم لغات برمجة متعددة

يوفر تكاملاً أصلياً للمطورين الذين يستخدمون Python وC# وC++ وJava وJavaScript وRust، مما يسهل دمج الذكاء الاصطناعي عالي الأداء في مكدسات التكنولوجيا المتنوعة والقائمة.

تكامل الذكاء الاصطناعي التوليدي

يُمكّن من نشر النماذج اللغوية الكبيرة (LLMs) المتطورة، مع دعم مهام متقدمة مثل توليد النصوص وتوليف الصور مباشرة داخل تطبيقات الإنتاج الخاصة بك.

كيفية الاستخدام

ابدأ بتثبيت حزمة وقت التشغيل عبر مدير الحزم المفضل لديك، مثل 'pip install onnxruntime' أو 'pip install onnxruntime-genai'، لإعداد بيئة العمل الخاصة بك.
قم بتهيئة وقت التشغيل عن طريق تمرير مسار ملف نموذج التعلم الآلي الخاص بك إلى فئة 'InferenceSession'، مما يجهز المحرك لتنفيذ نموذجك المحدد.
قم بتنسيق بيانات الإدخال الخاصة بك في هيكل الموتر (tensor) المطلوب، مع التأكد من توافقه مع مخطط الإدخال المتوقع للنموذج لتجنب أخطاء وقت التشغيل أثناء المعالجة.
قم بتنفيذ النموذج عن طريق استدعاء طريقة 'session.run' مع بيانات الإدخال المجهزة، مما يحفز المحرك على توليد التنبؤات أو المخرجات بكفاءة.
راجع النتائج التي تم إرجاعها من الجلسة لدمج تنبؤات النموذج بسلاسة في سير عمل تطبيقك الحالي أو منطق الخدمة الخاص بك.

حالات الاستخدام

نشر الذكاء الاصطناعي على الحافة (Edge AI)

يمكن للمطورين نشر نماذج ذكاء اصطناعي عالية الأداء على الأجهزة ذات الموارد المحدودة مثل الهواتف المحمولة أو أجهزة إنترنت الأشياء (IoT) من خلال الاستفادة من تكوينات وقت التشغيل المحسنة.

خدمة النماذج في بيئة الإنتاج

يمكن للمهندسين تقديم نماذج التعلم الآلي بشكل موثوق في بيئات الإنتاج، مما يضمن استفادة تطبيقات المستخدم النهائي من زمن انتقال منخفض وإنتاجية عالية.

تطوير التطبيقات متعددة المنصات

يمكن للفرق التي تبني تطبيقات لمنصات متعددة استخدام وقت تشغيل واحد وموحد للحفاظ على أداء ذكاء اصطناعي ثابت عبر بيئات سطح المكتب، والأجهزة المحمولة، والويب.