Google Gemini 2.0: الجيد، السيئ، والمعتدل
أُطلق Google Gemini لأول مرة في ديسمبر 2023، وقد خضع مؤخرًا لترقية كبيرة مع إصدار Gemini 2.0 في أوائل ديسمبر. تم تصميمه لما تسميه Google “عصر الوكالة”، مع قدرات تسمح له بالعمل بشكل أكثر استقلالية في العمليات المعقدة متعددة الخطوات.
تشمل التحسينات الأساسية الأخرى معالجة الصور والصوت الأصلية، وأوقات استجابة أسرع، وقدرات ترميز محسّنة، وتكاملات جديدة قيد التطوير مع تطبيقات وحلول Google الأخرى للمساعدة في تشغيل هاتف Android الذكي والكمبيوتر والأجهزة المتصلة الأخرى.
هجمة جديدة من نماذج Gemini
طرحت Google مؤخرًا عددًا كبيرًا من نماذج الذكاء الاصطناعي المختلفة، مع إصدار إصدارات جديدة متعددة في الأسابيع القليلة الماضية. في بعض النواحي، مثل السرعة في 2.0 Flash، تكون التحسينات ملحوظة بسهولة. البعض الآخر في مجالات أكثر تخصصًا، مثل الترميز. في هذه الأثناء، لا يزال 2.0 Pro قيد التطوير.
تتوفر نماذج 2.0 الجديدة على سطح المكتب، ومؤخرًا في تطبيق Gemini للجوال، حيث ستجد محددًا للاختيار من بينها. ودعونا لا ننسى نموذج Nano على الجهاز، والذي يعمل بالفعل على تشغيل ميزات Google Pixel معينة مثل ملخصات المكالمات. تجدر الإشارة أيضًا إلى ظهور نموذج جديد آخر، 2.0 Experimental Advanced، على سطح المكتب في الأيام القليلة الماضية.
كما يشير تايلور كيرنز، فإن Gemini أصبح أكثر تعقيدًا، ويصبح من الصعب تتبع جميع المتغيرات. نظرًا لعدم توفر الكثير من المعلومات حول Experimental Advanced، فقد التزمت بالاثنين في المقارنة أدناه.
الميزة | Gemini 1.5 Pro | Gemini 2.0 Flash Experimental |
---|---|---|
نافذة السياق | 1 مليون رمز (حوالي 750000 كلمة أو 1500 صفحة نص) | 1 مليون رمز (حوالي 750000 كلمة أو 1500 صفحة نص) |
السرعة | الردود في غضون بضع ثوان | أسرع بحوالي مرتين |
استهلاك الطاقة | أعلى | أقل |
الاستدلال / المنطق | استدلال قوي وتعاون | يدعي تحسين الاستدلال ويضيف قدرات وكالة |
متعدد الوسائط | يتم تحويل الصور والصوت إلى نص للمعالجة. | معالجة الصور والصوت الأصلية. يمكن الآن “التحدث” باستخدام أصوات الذكاء الاصطناعي. |
إنشاء الصور | تم تعليقه | مدعوم | الترميز | يمكنه إنشاء التعليمات البرمجية | يمكنه إنشاء التعليمات البرمجية وتنفيذها، وتحليل استجابات واجهة برمجة التطبيقات، ودمج البيانات في تطبيقات خارجية |
Gemini 2.0 Flash يتميز بالسرعة والكفاءة
كما يوحي الاسم، تم تصميم Gemini 2.0 Flash لتحقيق السرعة. تدعي Google أنه يضاعف سرعة سابقه، وكمستخدم لكل من 1.5 Pro و 2.0 Flash Experimental، يمكنني أن أشهد على سرعته.
يوفر 2.0 استجابات فورية تقريبًا لنفس الاستفسارات التي قد تستغرق 1.5 Pro بضع ثوان. قد لا يبدو ذلك تأثيرًا كبيرًا، لكن الاستجابة الفورية تفتح إمكانات جديدة لتطبيقات الوقت الفعلي مثل تفاعلات الكلام. كما أنه يجعل تجربة المستخدم الإجمالية تبدو أكثر دقة. على الرغم من زيادة قوته، تم تصميم Gemini 2.0 Flash أيضًا ليكون أكثر كفاءة في استخدام الطاقة، مما قد يترجم مباشرة إلى عمر بطارية أفضل على هاتفك الذكي.
Gemini يريد أن يكون وكيل الذكاء الاصطناعي الخاص بك
ينقل الذكاء الاصطناعي الوكيل Gemini نحو المساعدة الاستباقية. هذا يعني أن Gemini يمكنه الآن العمل كوكيل، والقيام بمهام متعددة الخطوات نيابة عنك. ستشمل التطبيقات المستقبلية كل شيء من الألعاب والروبوتات إلى تخطيط السفر.
Gemini 2.0 يمكنه الرؤية والسمع والتحدث
التقدم في المدخلات والمخرجات متعددة الوسائط ضمن Gemini 2.0 هو ميزة رئيسية أخرى. من خلال دمج المعلومات بسلاسة من مصادر مختلفة مثل النص والصور والفيديو والصوت، يمكن لـ Gemini 2.0 تجربة العالم بشكل أشبه بنا. هذا يمهد الطريق لمزيد من التواصل الشبيه بالبشر.
توفر معالجة الصور والصوت الأصلية تحسينات ملحوظة
تحسين رائع في Gemini 2.0 هو قدرته على معالجة الصور والصوت مباشرة. في المقابل، قام أسلافه بتحويل هذه المدخلات إلى نص، مما أدى إلى مزيد من فقدان المعلومات. تسمح المعالجة المباشرة بفهم أعمق للمدخلات. لا يمكن لـ Gemini 2.0 تحديد العناصر داخل صورة أو صوت فحسب، بل يمكنه أيضًا فهم العلاقات المتبادلة والمشهد ككل.
عودة إنشاء الصور في Gemini، لكن هل يهتم أحد؟
على الرغم من الضجة حول القدرات المحسّنة لـ Gemini 2.0، إلا أن عودة ميزة إنشاء صور Imagen كانت باهتة بعض الشيء. بعد الجدل الأولي والإعاقة اللاحقة للميزة بسبب التحيزات وعدم الدقة، يبدو إعادة الإصدار غير مثيرة للاهتمام. ربما تم تخفيف Imagen لتجنب المزيد من الجدل، أو ربما يكون مجرد أن حداثة إنشاء صور الذكاء الاصطناعي قد تلاشت خلال فترة توقف Google الطويلة.
التكاملات الجديدة تنذر بالمستقبل
من خلال نسج قدرات Gemini في الخدمات الأساسية مثل البحث والخرائط ومساحة العمل، تهدف Google إلى تقديم تجربة مستخدم أكثر توحيدًا.
في المستقبل، ستؤدي استعلامات البحث الخاصة بك على Google إلى ظهور استجابات ديناميكية تعتمد على الذكاء الاصطناعي والتي من المحتمل أن تستند إلى معلومات من رسائل البريد الإلكتروني والمستندات وحتى سجل المواقع الجغرافية لتوفير نتائج أكثر صلة بك شخصيًا. تجري Google بالفعل تجارب مع ملخصات البحث بالذكاء الاصطناعي التي تتميز بملخصات صوتية على غرار منتجها الشقيق، NotebookLM.
Google تبني أساسًا متينًا للذكاء الاصطناعي مع Gemini
يُعد Gemini 2.0 خطوة كبيرة إلى الأمام بالنسبة لذكاء Google الاصطناعي، حيث يوفر سرعات أسرع، وتحسينًا في التفكير، وتكاملًا سلسًا متعدد الوسائط. يُسلط عودة إنشاء الصور الباهتة ومجموعة المتغيرات النموذجية المُربكة الضوء على تعقيدات هذه الفئة سريعة الحركة. ومع ذلك، فإن التقدم في مجال الذكاء الاصطناعي الوكيل، والترميز الجديد، وقدرات الصوت والصورة، إلى جانب التكامل الأعمق مع خدمات Google الأساسية، ينذر بأشياء جيدة قادمة في عام 2025.