تعاون بين F5 وإنفيديا لتسريع عمليات الاستدلال الخاصة بالذكاء الاصطناعي

· حل (F5 BIG-IP Next for Kubernetes) المدعوم بوحدات (BlueField) لمعالجة البيانات يرفع من معدلات إنتاج الرموز ويعيد تشكيل بنى الذكاء الاصطناعي لمواكبة عصر الوكلاء

كتب : باسل خالد

كشفت شركة F5 المتخصصة عالمياً في مجال تسليم التطبيقات وواجهات برمجة التطبيقات وتأمينها، اليوم عن توسيع نطاق تعاونها القائم مع شركة إنفيديا، بهدف تسريع أداء البنية التحتية الخاصة بتشغيل نماذج الذكاء الاصطناعي عند الاستخدام الفعلي، ورفع كفاءتها التشغيلية.

ويجمع هذا التكامل الموسع بين حل (F5 BIG-IP Next for Kubernetes) ووحدات معالجة البيانات (NVIDIA BlueField-3)، لتشكيل طبقة بنية تحتية ذكية قائمة على تحليل البيانات التشغيلية في الوقت الفعلي، بما يسهم في رفع معدل معالجة المخرجات من نماذج الذكاء الاصطناعي، وتحسين كفاءة استخدام وحدات معالجة الرسومات، وتقليل زمن الاستجابة، ودعم تشغيل منصات ذكاء اصطناعي متعددة المستخدمين ضمن بيئات آمنة وقابلة للتوسع.

في أنظمة الذكاء الاصطناعي، تمثل "الرموز" وحدة القياس الأساسية لمخرجات النماذج، سواء كانت كلمات أو إشارات أو أجزاء من البيانات يتم توليدها ومعالجتها أثناء مرحلة الاستدلال. ويعد حجم هذه الرموز وسرعة إنتاجها من العوامل الحاسمة في تحديد جودة تجربة المستخدم، وكفاءة البنية التحتية، والعائد الذي يتم تحقيقه من كل معالج تسريع.

مع اتجاه المؤسسات ومزوّدي خدمات وحدات معالجة الرسومات كخدمة (GPUaaS) إلى تحقيق عوائد من تقنيات الذكاء الاصطناعي، والانتقال من مرحلة التجارب إلى تقديم خدمات محققة للإيرادات، أصبحت كفاءة البنية التحتية من المعايير الحاسمة في هذا السياق. ولم يعد النجاح يقاس بحجم القدرات الحاسوبية المنشورة فحسب، بل بمؤشرات أكثر دقة ترتبط باقتصاديات معالجة الرموز، ومعدلات إنتاجها المستدامة، والزمن اللازم لظهور أول مخرج (TTFT)، وتكلفة الرمز الواحد، والعائد المتحقق من كل معالج تسريع. وفي هذا الإطار، يأتي الحل المشترك بين F5 وإنفيديا ليعالج هذه المؤشرات بصورة مباشرة.

تحسين اقتصاديات معالجة الرموز عبر بنية تحتية ذكية للذكاء الاصطناعي

إن الانتقال من نماذج الاستدلال القائمة على التطبيقات إلى مسارات عمل يقودها الذكاء الاصطناعي القائم على الوكلاء، يتطلب اعتماد مقاربات معمارية جديدة تعزز من معدل إنتاج الرموز وتحد من التكاليف. ويستفيد حل (BIG-IP Next for Kubernetes) من بيانات (NVIDIA NIM)، وإشارات بيئة التشغيل (Dynamo)، وقياسات أداء وحدات معالجة الرسومات، لاتخاذ قرارات توجيه مدركة لعمليات الاستدلال قبل تنفيذها. ومن خلال مواءمة أعباء العمل مع معالجات التسريع الأنسب في الوقت الفعلي، يساهم هذا النهج في تحسين اقتصاديات معالجة الرموز، ورفع مستويات الاستخدام المستدام، وتقليل زمن الاستجابة، والحد من الحاجة إلى إعادة المعالجة.

من جهته قال كونال أناند، كبير مسؤولي المنتجات في شركة F5: "لم تعد البنية التحتية للذكاء الاصطناعي تقتصر على إتاحة الوصول إلى وحدات معالجة الرسومات أو توسيع نطاق نشرها، بل باتت ترتكز على تعظيم العائد الاقتصادي لكل معالج. وبالتعاون مع إنفيديا، فقد بتنا نتيح لما يعرف بمصانع الذكاء الاصطناعي التعامل مع إنتاج الرموز كمؤشر أعمال قابل للقياس. ويوفر حل (BIG-IP Next for Kubernetes) القدرات الذكية وأطر الحوكمة اللازمة لزيادة إنتاجية وحدات معالجة الرسومات، وخفض تكلفة الرمز الواحد، وتوسيع نطاق منصات الذكاء الاصطناعي المشتركة بثقة".

نتائج موثقة تعكس تحسن ملموس في كفاءة البنية التحتية

تعكس مؤشرات الأداء هذا التقدم بوضوح. ففي اختبارات تم التحقق منها من قبل جهة "ذا تولي جروب"، حقق حل (BIG-IP Next for Kubernetes)، المعزز بوحدات معالجة البيانات (NVIDIA BlueField-3)، زيادة في معدل إنتاج الرموز بنسبة تصل إلى 40%، وأسهم في تسريع زمن ظهور أول مخرج (TTFT) بنسبة 61%، إلى جانب خفض إجمالي زمن الاستجابة للطلبات بنسبة 34%.

ولا تقتصر هذه النتائج على تحسينات تدريجية محدودة، بل تمثل نقلة واضحة في كفاءة التشغيل. فمن خلال إسناد مهام الشبكات، والتشفير عبر بروتوكول TLS، وموازنة الأحمال المدركة لعمليات الذكاء الاصطناعي، وإدارة حركة البيانات إلى وحدات معالجة البيانات (NVIDIA BlueField-3)، يحافظ حل (BIG-IP Next for Kubernetes) على قدرات المعالجة في وحدات المعالجة المركزية، ويتيح لوحدات معالجة الرسومات التركيز على وظيفتها الأساسية، وهي تنفيذ عمليات الاستدلال بكفاءة عالية وبمعدلات إنتاج مستدامة وعلى نطاق واسع. ويترتب على ذلك تحسين مستويات استخدام وحدات معالجة الرسومات، وتقليل فترات الانتظار، وزيادة إنتاج الرموز، بما يتيح خفض تكلفة الرمز الواحد ضمن البنية التحتية القائمة. والأهم أن هذه المكاسب تحققت دون الحاجة إلى إجراء أي تعديلات على النماذج، ما يسهّل تطبيقها مباشرةً ضمن بيئات تشغيل الذكاء الاصطناعي الحالية. وبالنسبة للمؤسسات ومزوّدي خدمات البنية السحابية الجديدة (NeoCloud) الذين يتنافسون على اقتصاديات معالجة الرموز، يشكّل هذا الفارق الحدّ الفاصل بين بنية تحتية تقيد إنتاج الذكاء الاصطناعي وأخرى تعزز من وتيرته.

من جانبه، قال كيفن ديرلينغ، نائب الرئيس الأول لشبكات الحوسبة لدى "إنفيديا": "إن الجمع بين البنية التحتية للحوسبة المسرعة من إنفيديا ومنصة F5 لتسليم التطبيقات والأمن المدركة لعمليات الذكاء الاصطناعي يتيح تحقيق مستويات متقدمة من اقتصاديات معالجة الرموز ضمن ما يعرف بمصانع الذكاء الاصطناعي، مع دعم تنفيذ عمليات الاستدلال على نطاق واسع وبكفاءة من حيث التكلفة، دون الحاجة إلى إجراء أي تعديلات على النماذج. وبالتعاون بين F5 وإنفيديا، فإننا نتيح للمؤسسات توسيع نطاق عمليات الاستدلال ضمن مصانع الذكاء الاصطناعي بكفاءة تشغيلية واقتصادية".