🎙️ حلقة 30507:45 • ١٥ يونيو ٢٠٢٦

Gemini 3.5 Flash: اختبارات الأداء والأسعار و API (2026)

#ai #ai-generated #development #javascript #nerd-level-tech #python #tech-podcast #technology

اسمع الحلقة دي

مناقشة تم إنشاؤها بواسطة AI بواسطة Alex و Jamie

عن هذه الحلقة

انضم إلى المضيفين أليكس وجيمي في هذه الحلقة من Nerd Level Tech البودكاست الذكي وهما يحللان أحدث إصدارات Google، وهو Gemini 3.5 Flash. من سرعته المذهلة ومعايير أدائه إلى السؤال المثير للاهتمام حول ما إذا كان يستحق الاستثمار فيه لترسانتك التقنية، يقومان بتفصيل ما يجعل نموذج البرمجة هذا يغير قواعد اللعبة في المهام المعقدة. تابعونا للحصول على رؤى ستساعدكم في تحديد ما إذا كان الوقت قد حان لتطوير معداتكم التقنية أو التمسك بأجهزتكم القديمة الموثوقة!

النص المكتوب

[أليكس]: أهلاً بكم من جديد في البودكاست الذكي من نيرد ليفل تك، حيث نقرأ سجلات التغيير بدلاً عنكم! أنا أليكس—

[جيمي]: —وأنا جيمي. اليوم، سنقوم بتحليل إطلاق Gemini 3.5 Flash: الاختبارات المرجعية، والأسعار، وتغييرات API، والسؤال الذي يشغل بال الملايين—هل يجب أن تنتقل إليه؟

[أليكس]: أو كما أحب أن أسميه، "هل يستحق الأمر رهن مزرعة الـ GPU الخاصة بي من أجل أحدث ألعاب جوجل اللامعة؟"

[جيمي]: [يضحك] مزرعة الـ GPU الخاصة بي هي مجرد لابتوب ألعاب بائس وجهاز Raspberry Pi، لذا سأضطر لتصديق كلامك. حسناً يا أليكس، ابدأ بنا: ما هو Gemini 3.5 Flash ولماذا يتحدث الجميع عنه فجأة؟

[أليكس]: سؤال جيد. Gemini 3.5 Flash هو أحدث نموذج برمجة وكيل (agentic) من جوجل—فكر فيه كأنه العداء السريع في تشكيلة Gemini. تم الإعلان عنه في مؤتمر Google IO 2026، وعلى عكس البرمجيات الوهمية المعتادة، فقد تم إطلاقه فعلياً كنسخة متاحة للجميع في اليوم الأول.

[جيمي]: نموذج برمجة وكيل... إذاً، هل هذا لبناء Skynet، أم مجرد أتمتة قائمة مهامي؟

[أليكس]: بل الأخير—رغم أنه مع سياق يصل لمليون توكن، قد يتذكر قائمة مهامك فعلاً لمرة واحدة. [توقف] باللغة البسيطة، "وكيل" تعني أنه مصمم للمهام المعقدة متعددة الخطوات—فكر في توليد الكود، وتنسيق سير العمل، ومعالجة المستندات، وأي شيء يحتاج إلى وكلاء فرعيين أو تنفيذ متوازٍ. ليس مجرد دردشة.

[جيمي]: فهمت. إذاً، أشياء ذكية جداً، ولكن سريعة. ما مدى السرعة التي نتحدث عنها؟

[أليكس]: تدعي جوجل أن 3.5 Flash أسرع بنحو أربع مرات من النماذج الأخرى التي توصف بأنها "رائدة"، وهي طريقتهم في قول "إنه سريع جداً حقاً". في الاختبارات المرجعية، يتفوق على Gemini 3.1 Pro السابق في مهام البرمجة والمهام الوكيلية الأساسية. ولكن، وإليك نصيحة احترافية، تأكد دائماً من أن هذه الأرقام تأتي من وثائق جوجل، وليس من مدونة عشوائية بها عدد مريب من الإعلانات المنبثقة.

[جيمي]: [بجدية مصطنعة] أنا لا أثق إلا في الاختبارات المرجعية التي تأتي مع ثلاث حواشي سفلية على الأقل ورسم بياني دائري.

[أليكس]: أو ميم (meme). الاختبارات المرجعية كـ ميمز، هي الصيحة الأكثر رواجاً في 2026.

[جيمي]: حسناً، وقت الأرقام. أين يقع 3.5 Flash في لوحة النتائج؟

[أليكس]: وفقاً لأرقام جوجل الخاصة: في Terminal-Bench 2.1، سجل 76.2؛ وفي MCP Atlas، سجل 83.6؛ وفي CharXiv Reasoning، سجل 84.2؛ وفي GDPval-AA، سجل 1656 Elo. [توقف] الترجمة: إنه يتصدر في البرمجة الوكيلية، واستخدام الأدوات، وفهم المخططات متعددة الوسائط، والمهام الاقتصادية في العالم الحقيقي.

[جيمي]: انتظر، Elo؟ هل نلعب الشطرنج مع هذا الشيء؟

[أليكس]: تقريباً! درجة Elo في GDPval-AA تتعلق كلياً بالتفكير ذو القيمة الاقتصادية—فكر فيها كأولمبياد الذكاء الاصطناعي لسير العمل التجاري.

[جيمي]: إذاً، هو ذكي وسريع و... أخمّن أنه ليس رخيصاً؟

[أليكس]: خمنّت صح. إليك صدمة السعر: 3.5 Flash يكلف 1.50 دولار لكل مليون توكن مدخلات و9.00 دولار لكل مليون توكن مخرجات. هذا ثلاثة أضعاف سعر Gemini 3 Flash Preview السابق. [توقف]

[جيمي]: أوف. إذاً، إذا كنت أقوم بتشغيل وظائف ذات حجم كبير، فإن فاتورة السحاب الخاصة بي انتقلت للتو من "ربما سأدرج هذا في المصاريف" إلى "حان الوقت لبيع بطاقات Magic الخاصة بي".

[أليكس]: [يضحك] أو مجرد دمى Funko Pops غير المفتوحة. لكن، الجانب المشرق: لا يزال أرخص بنسبة 25% من Gemini 3.1 Pro، الذي كان سعره 2 دولار لكل مليون مدخلات و12 دولار لكل مليون مخرجات. لذا، أنت تدفع أكثر من ذي قبل، ولكن أقل من فئة Pro الحقيقية.

[جيمي]: وماذا تتضمن توكنز المخرجات تلك؟ هل هي مجرد كلمات، أم...؟

[أليكس]: ملاحظة ممتازة—توكنز المخرجات تشمل "توكنز التفكير". لذا، إذا كنت تطلب تفكيراً عميقاً أو حلاً لمشكلات معقدة، فسيتم محاسبتك عليها أيضاً. إذا كنت تلخص وصفة طعام فقط، فمن المحتمل أن يكون رخيصاً. أما إذا كنت تقوم بتصحيح خوارزمية كمومية، فاستعد.

[جيمي]: [تنهيدة مصطنعة] آمالي في تصحيح أخطاء الكم الرخيص تحطمت مرة أخرى.

[أليكس]: [توقف] ولكن، إذا استخدمت Batch API من جوجل، يمكنك خفض تلك التكاليف إلى النصف. وهناك ميزة التخزين المؤقت للسياق (context caching) لتجنب الدفع مرة أخرى لنفس المدخلات.

[جيمي]: جميل. الآن، ما هي القصة مع نافذة السياق؟ ما زلت أسمع "مليون توكن" تتردد هنا وهناك مثل قصاصات الورق الملون.

[أليكس]: هذه هي الميزة الأبرز. يدعم Gemini 3.5 Flash نافذة مدخلات تبلغ 1,048,576 توكن—لذا يمكنك تزويده بقواعد كود كاملة، أو ملفات PDF ضخمة، أو الأعمال الكاملة لشكسبير وسيظل هناك متسع لسيرتك الذاتية. المخرجات تصل إلى 65,536 توكن.

[جيمي]: إذاً، لأول مرة، يمكن للذكاء الاصطناعي الخاص بي أن يتذكر فعلاً أول شيء قلته له... حتى لو بدأت في الاسترسال بلا هدف؟

[أليكس]: تقريباً. فقط ضع في اعتبارك أن تاريخ انقطاع المعرفة هو يناير 2025. لذا، إذا كنت بحاجة إلى حقائق محدثة حتى اللحظة، ستحتاج إلى استخدام ميزات الربط بالبحث (Search grounding) أو سياق الروابط (URL context).

[جيمي]: لا توجد مواعيد لجولات تايلور سويفت من عام 2026، فهمت.

[أليكس]: عذراً لمحبّي سويفت.

[جيمي]: دعنا نتحدث عن تغييرات API. هل يجب أن يقلق المطورون من تعطل الأشياء؟

[أليكس]: هناك بعض الأمور التي يجب الانتباه لها. بارامتر "thinking_level" أصبح الآن نصاً (string) بأربع قيم—minimal، low، medium، high. الافتراضي هو "medium" الآن، وليس "high". وتلك البارامترات القديمة لأخذ العينات—temperature، top_p، top_k؟ تقول جوجل تخلصوا منها لجميع موديلات 3.x.

[جيمي]: إذاً، لا مزيد من التلاعب بالـ temperature لجعله يبدو شاعرياً؟

[أليكس]: كلا. النموذج مضبوط وفقاً لإعداداته الافتراضية الخاصة. أيضاً، استجابات استدعاء الوظائف (function-calling) أصبحت أكثر صرامة—يجب أن تطابق كل استجابة الاستدعاء الأصلي تماماً، وإلا ستظهر لك أخطاء.

[جيمي]: هذا... في الواقع جيد نوعاً ما؟ أخطاء غامضة أقل.

[أليكس]: [يضحك] إلا إذا كنت تحب الأخطاء الغامضة، وفي هذه الحالة، لدي بعض JavaScript لك.

[جيمي]: [يتأوه] أرجوك، لا مزيد من جحيم الـ callbacks.

[أليكس]: للمشاريع الجديدة، توصي جوجل باستخدام Interactions API بدلاً من generateContent API القديم—لكن كلاهما مدعوم، لذا ليس عليك إعادة كتابة كل شيء بين عشية وضحاها.

[جيمي]: وكيف يمكنني استدعاء هذا الشيء فعلياً؟ Python، JavaScript... REST؟

[أليكس]: كل ما سبق. بالنسبة لـ Python، الأمر ببساطة كالتالي:

[جيمي]: [منبهر] هذا... بسيط بشكل منعش. حتى أنا يمكنني نسخ ولصق ذلك.

[أليكس]: في JavaScript، الأمر بنفس السهولة. وبالنسبة لمحبي REST، طلب POST واحد وستبدأ العمل.

[جيمي]: أي ميزات جديدة رائعة يجب أن أعرف عنها؟

[أليكس]: Batch API مدعوم، والتخزين المؤقت للسياق، ونشر الوكلاء الفرعيين، كل شيء ما عدا "Computer Use" والتحكم المباشر في المتصفح. إذا كنت بحاجة إلى ذلك، فالتزم بالنموذج الأقدم في الوقت الحالي.

[جيمي]: وماذا عن Gemini 3.5 Pro؟ هل أنتظر، أم أن Flash هو الطريق الصحيح؟

[أليكس]: تم الإعلان عن Pro بجانب Flash، ولكن اعتباراً من منتصف يونيو، لم يتوفر للجميع بعد. إذا كنت تقوم باسترجاع بيانات ضخمة ذات سياق طويل، أو كنت تحب تعذيب نفسك، فقد تنتظر. بالنسبة لمعظم مهام البرمجة والمهام الوكيلية، 3.5 Flash جاهز وقابل للاستخدام الآن.

[جيمي]: إذاً، بالنظر للصورة الكبيرة—هل يستحق Gemini 3.5 Flash التجربة؟

[أليكس]: إذا كنت بحاجة إلى سير عمل وكيلي عالي السرعة وعالي الذكاء ويمكنك تحمل زيادة السعر، فنعم. بالنسبة لأعباء العمل الحساسة للتكلفة، ربما تريث أو جرب Flash-Lite. وكما هو الحال دائماً، تحقق من أي ادعاءات للاختبارات المرجعية مباشرة من جوجل—لا تثق في الشخص الذي يبيع "أسرار الذكاء الاصطناعي" على يوتيوب.

[جيمي]: [يضحك] أو أولئك الذين يخترعون اختبارات مرجعية جديدة مثل "جودة صور القطط المولدة بالذكاء الاصطناعي".

[أليكس]: سأفوز في ذلك الاختبار بكل تأكيد.

[جيمي]: حسناً، هذا كل ما لدينا اليوم في البودكاست الذكي من نيرد ليفل تك. لا تنسوا التقييم والاشتراك وإرسال قصائد الهايكو المفضلة لديكم والمولدة بالذكاء الاصطناعي.

[أليكس]: وإذا كنت قد انتقلت بالفعل إلى Gemini 3.5 Flash، فأخبرنا بما تحبه—أو تكرهه—فيه. نحن نقرأ كل تعليق... بمساعدة نافذة سياق سعتها مليون توكن.

[جيمي]: شكراً لاستماعكم، ونراكم في المرة القادمة! [موسيقى الختام]