🎙️ حلقة 30706:43 • ١٧ يونيو ٢٠٢٦
LLM Fallback Routing: كيف تنجو من سحب نموذج
اسمع الحلقة دي
مناقشة من إنشاء AI بواسطة Alex و Jamie
عن هذه الحلقة
انضموا للمذيعين أليكس وجيمي في الحلقة المشوقة دي من Nerd Level Tech البودكاست الذكي، وهما بيتعمقوا في فوضى LLM Fallback Routing وسط السحب الصادم لـ Claude Fable 5 من شركة Anthropic. اكتشف إزاي قرار حكومي ممكن يخلي المطورين في حالة ارتباك شديد، واتعلم الاستراتيجيات الحيوية عشان تحافظ على استمرارية تطبيقات الذكاء الاصطناعي بتاعتك وقت الكوارث. تابعونا عشان تعرفوا أكتر عن التعامل مع عالم نماذج الذكاء الاصطناعي المتقلب وأهمية إن يكون عندك خطة بديلة!
التفريغ النصي
[أليكس]: أهلاً بكم من جديد في نيردو البودكاست الذكي—البودكاست الوحيد اللي فيه كلمة "استدعاء النموذج" (model recall) معناها أكتر من مجرد "أوبس، نسيت كلمة السر بتاعتي تاني". [جيمي]: وأنا لسه مستني الـ LLM بتاعي يفتكر طلب القهوة بتاعي. أنا جيمي. [أليكس]: وأنا أليكس. حلقة النهاردة بعنوان: "توجيه الـ LLM البديل: إزاي تنجو من عملية استدعاء نموذج ذكاء اصطناعي". ويا جماعة، الحلقة دي هتكون سخنة جداً. هنتكلم عن اللي بيحصل لما نموذج الذكاء الاصطناعي المفضل عندك يتسحب فجأة من الخدمة—أيوة، ده حصل فعلاً. [جيمي]: قصدك زي اللي حصل في استدعاء Claude Fable 5 الأسبوع اللي فات؟ جروب الشات عندي كان في حالة انهيار. المطورين في كل حته بيصرخوا: "ليه كل حاجة باظت؟!" [توقف] [أليكس]: بالظبط. في 12 يونيو، وزارة التجارة الأمريكية داسوا على الزرار الأحمر لشركة Anthropic بخصوص Claude Fable 5—ومعاه كمان Mythos 5. بوم. اختفوا. ولو التطبيق بتاعك بيكلم Fable 5 بس؟ يبقى أهلاً بيك في مدينة الأخطاء. [جيمي]: يعني، خليني أفهم صح. أنت بتبني تطبيقك كله على نموذج واحد، وفجأة—بففف—مبقاش موجود؟ ده زي ما تكون باني بيتك على سيرفر واحد في سنة 2008. [أليكس]: أسوأ بكتير بصراحة. على الأقل مع السيرفرات، أنت متوقع إن الخدمة تقع. هنا، الموضوع ملوش علاقة بس بوقت التشغيل. الموضوع متعلق بتوجيهات حكومية، وسياسات دولية، وظاهر كمان إشاعات عن "كسر حماية" (jailbreaking) للنموذج. [توقف] [جيمي]: طيب إيه اللي حصل فعلاً؟ هل كان عيب تقني (bug)، ولا حد كسر حماية Fable 5 وعلمه إزاي يكتب قصائد عن أسرار الأمن القومي؟ [أليكس]: [يضحك] الحقيقة إن وزارة التجارة استشهدت بـ "مخاطر على الأمن القومي" وأمرت بوقف الخدمة. شركة Anthropic، بدل ما تحاول تبني فلتر جنسيات غريب في يوم وليلة، قفلت النماذج للكل لحد ما يلاقوا حل لموضوع الامتثال ده. [جيمي]: كلاسيك. يعني لو تطبيقك كان متوصل بـ Fable 5 بشكل مباشر، كنت غرقت. بس في تطبيقات مباظتش. ليه؟ [أليكس]: عشان الأذكياء كان عندهم حاجة اسمها "سلسلة بدائل الـ LLM" (LLM fallback chain). ببساطة، طريقة لتوجيه الطلبات لمزودين متعددين. لو واحد وقع—بقرار حكومي مثلاً—السلسلة بتنقل للنموذج اللي بعده في الدور. [جيمي]: زي ما يكون عندك فرقة احتياطية لما المغني الأساسي يجيله التهاب في الحنجرة. [أليكس]: بالظبط. أو بلغة سنة 2026، زي ما يكون عندك بطارية احتياطية لما الـ Cybertruck بتاعتك تعطل بسبب تحديث نظام. [جيمي]: تمام، إزاي بقى نبني سلسلة البدائل السحرية دي فعلاً؟ أتوقع إن الموضوع أكبر من مجرد "if/else" وشوية مفاتيح API. [أليكس]: [يضحك] أكتر بكتير. أولاً، محتاج واجهة موحدة (normalized interface)—طريقة قياسية الكود بتاعك بيكلم بيها أي مزود، سواء كان Anthropic، OpenAI، Google... أو حتى نموذج مفتوح الأوزان (open-weight) مشغله عندك في البدروم. [توقف] [جيمي]: استنى، نماذج مفتوحة الأوزان؟ قصدك نماذج "أنا نزلت الأوزان بتاعتها ومحدش يقدر ياخدها مني"؟ [أليكس]: بالظبط. دي خطة الطوارئ القصوى: لو أنت بتتحكم في الأوزان، محدش يقدر يستدعي النموذج بتاعك. بس هنوصل لده بعدين. أول خطوة: توحيد الطلب والرد. كل API شكلها مختلف شوية، فبتحدد "عقد" (contract)—حاجة كدة زي: "يا سيدي، أنا هديك الرسايل دي وحد أقصى للتوكنز، وأنت تديني نص وتقولي مين اللي رد على الطلب فعلاً". [جيمي]: يعني تطبيقك مش فارق معاه بيكلم Claude، GPT، أو حتى "نموذج بوب الرخيص". المهم ياخد إجابة منطقية. [أليكس]: صح. وكمان بتحدد إيه الأخطاء اللي "ينفع تعيد المحاولة فيها". زي لو وصلت لحدود الاستخدام، أو خطأ في السيرفر، أو دلوقتي "النموذج غير موجود" عشان تم استدعاؤه. بس لو الخطأ من المستخدم—زي إنه بعت "برومبت" غلط—مفيش فايدة إنك تكلم كل المزودين عشان تترفض أربع مرات. [جيمي]: ده هيكون زي إنك تجرب نفس الباسورد الغلط في كل صفحة دخول وتتمنى نتيجة مختلفة. [أليكس]: [يضحك] بالظبط. وفر على نفسك—وعلى محفظتك—التعب ده. [جيمي]: طيب، عندك الواجهة الموحدة دي، وعندك المزودين جاهزين. إزاي بقى بتوجه الطلبات فعلاً؟ [أليكس]: هنا بيجي دور "موجه البدائل" (fallback router). فكر فيه كأنه سباق تتابع: لو أول مزود وقع منه العصاية، اللي بعده بياخدها. بس—وده المهم—أنت محتاج كمان "قاطع دائرة" (circuit breaker). لو مزود معين بيفشل باستمرار، متفضلش تضغط عليه وتزود وقت الانتظار. بعد مثلاً تلات مرات فشل ورا بعض، بتتخطاه لفترة، وبعدين تجربه تاني بعدين. [جيمي]: يعني زي برج المراقبة في المطار. "المدرج رقم 1 مقفول، هنحولك للمدرج رقم 2". [أليكس]: [يضحك] أيوة. وتقدر ترتب أولوياتك: ممكن تبدأ بـ Opus من Anthropic، وبعدين تجرب GPT-5.5 من OpenAI، وبعدين ممكن نموذج مفتوح الأوزان مستضاف ذاتياً زي Kimi K2.7 Code كحل أخير. [جيمي]: استنى—Kimi K2.7 Code؟ الاسم ده كأنه فرقة K-pop ونواة Linux خلفوا بيبي. [أليكس]: [يضحك] يا ريت. هو في الحقيقة نموذج مفتوح الأوزان بـ 1 تريليون بارامتر تقدر تشغله بنفسك. ضخم جداً، وأقرب حاجة لكونه "مضاد للاستدعاء". العيب الوحيد: محتاج حوالي 600 جيجابايت من ذاكرة الـ GPU، فاتمنى يكون عندك "سيرفر راك" جاهز. [جيمي]: يعني عملياً، أنت بتقول: خلي عندك على الأقل بديل واحد من شركة تانية—عشان لو الحكومة جت لشركة، ممكن تاخد كل نماذج الشركة دي. ولو أنت "بارانويد" بزيادة، خلي عندك بديل مستضاف ذاتياً عشان تكون مستقل فعلاً. [أليكس]: بالظبط. واختار بدائلك بحكمة. لو نموذجك الأساسي جودته عالية جداً والبديل بتاعك هو "نموذج بوب الرخيص"، المستخدمين هيلاحظوا الفرق. اختبر بدائلك عشان تتأكد إن التحويل التلقائي مبيخليش تطبيقك أسوأ من غير ما تحس. [جيمي]: مفيش أصعب من "شات بوت" يتحول من شكسبير لـ... لـ شخص زيي، لما النموذج الأساسي يقع. [أليكس]: [يضحك] يا سيدي، أنت على الأقل جودتك زي نموذج 7B مضغوط (quantized). [توقف] [جيمي]: طيب، نلخص اللي قلناه: استدعاء النماذج بقى حقيقة دلوقتي. متحطش كل الـ "توكنز" بتاعتك في سلة واحدة. ابني واجهة موحدة، وزع الطلبات على كذا مزود، ضيف "قاطع دائرة" عشان متضيعش وقت على روابط ميتة، وخلي عندك خطة بديلة لما الجهات الرقابية تخبط على الباب. [أليكس]: جبت الخلاصة. ونصيحة للمحترفين، في منصات دلوقتي زي LiteLLM تقدر تعملك كتير من عمليات التوجيه دي لو مش عايز تبنيها بنفسك. بس إنك تفهم الأجزاء دي؟ هو ده اللي بيفرق الـ "نيرد" عن الـ "سكريبت كيدز". [جيمي]: وعشان كدة بتسمعوا نيردو البودكاست الذكي. عشان إحنا بنبسط الأمور، نموذج مستدعى ورا التاني. [أليكس]: شكراً لمتابعتكم! لو عجبتكم الحلقة، اشتركوا، سيبولنا تقييم، أو ابعتولنا أحسن "ميم" عندكم عن "النموذج غير موجود". هنرجع الأسبوع الجاي مع مغامرات جديدة في عالم الذكاء الاصطناعي. [جيمي]: لحد ما نشوفكم، خليكم مرنين، خليكم متعددي المزودين، ومسيبوش الـ LLMs بتاعتكم من غير خطة بديلة! [موسيقى النهاية تبدأ في الظهور] [أليكس]: نشوفكم المرة الجاية يا جماعة! [جيمي]: سلام!