بعد طول انتظار، كشفت شركة OpenAI أخيراً عن أحدث إصداراتها لنماذج الذكاء الاصطناعي “GPT- 4”.، خلال بث رسمي استمر قرابة ال 24 دقيقة ، تناولت خلاله الشركة أبرز مميزات النقلة التكنولوجية الجديدة، وعرضت خلاله أكثر من مثال لمدى تفوق النموذج الجديد روبوت الدردشة “GPT-4” عن الروبوت المُطلق سابقًا “ChatGPT”
ما هو GPT-4؟ وهو برنامج روبوتي للمحادثة وتكوين المحتوى اللغوي، يعمل بالذكاء الاصطناعي، كان قيد التطوير بسرية تامة طوال العام الماضي. وهو برنامج لغوي متعدد الوسائط، أي أنه يمكنه الاستجابة لكل من النصوص والصور.كيف سيتم استخدامه؟ يعتبر GPT-4 أحدث إصدار من أنظمة النماذج اللغوية العاملة بالذكاء الإصطناعي الصادرة عن شركة «OpenAI». وهي خوارزمية ذكاء اصطناعي مُبرمجة للكتابة مثل الإنسان . والتي تم تدريبها على التنبؤ بالكلمة التالية في الجملة عن طريق استيعاب كميات هائلة من النصوص من الإنترنت والعثور على أنماط ومرادفات لها من خلال التجربة والخطأ. كذلك يمكن لـ GPT-4 إنشاء أي صورة في ثوانٍ معدودة. مع إجراء بحث وكتابة فيلم. وحتى بناء أكواد البرمجة شديدة التعقيد . سيكون قادر على إنجازها جميعها بدقة أكبر وتوقيت أسرع. وذكرت الشركة بأنه سيتم تعديل سقف الاستخدام الدقيق اعتمادًا على الطلب وأداء النظام في الممارسة العملية.
GPT-4
ما الفرق بين GPT-4 عن ChatGPT ؟ منذ تشرين الثاني / نوفمبر الماضي انتشر “شات جي بي تي” ChatGPT بأنحاء العالم، مثيراً ضجة كبرى على الساحة التقنية، ليكون التطبيق الأكثر انتشاراً بـ100 مليون مستخدم في شهراً واحد. وذلك لقدرته على التحاور بسلاسة و كتابة مقالات و رمز كمبيوتر. بُني النظام في ChatGPT على أساس نموذج لغة كبير يسمى GPT-3.5، وهو إصدار سابق من التكنولوجيا.لكن مع الاستخدام اتضحت بعض الثغرات في بعض النقاط أبرزها كانت إجابات ليست صحيحة و غير مناسبة. بينما GPT-4 وفقاً “للبث المباشر للشركة” سيكون على مستوى أكبر من الدقة. لاتساع قاعدة المعلومات المزود بها. حيث سيكون لديه القدرة على تجاوز 90 % من اختبار امتحان Uniform Bar، وهو اختبار الشهادة للمحامين. كذلك ذكرت الشركة بأنه سيكون أكثر أماناً ، فهو لن يستجيب لطلبات البحث عن “المحتوى المحظور” ، باحتمالية أقل ب 82% من استجابة GPT-3.5. و أشار فيديو البث المباشر أن GPT-4 سيكون أكثر واقعية . حيث سيتمكن من قبول إدخالات نصية أطول من سابقاتها- ليستوعب وبنتج ما يصل إلى 25000 كلمة، مقارنة بـ 3000 كلمة لـ ChatGPT.
روبوت
روبوت يرى! لعلّ الفارق الأول، أن النموذج الجديد “GPT-4” هو نموذج متعدد الوسائط. أي إنه قادر على تحليل النصوص والصور معاً . وهذا هو الفارق الأكبر بينه وبين النسخ السابقة له . فعندما تعرض عليه صورة، يمكنه تحليل مكونات تلك الصورة، وربطها بالسؤال الذي تسأله، وتوليد إجابة عن السؤال. فمثلاً، يمكنك أن تعرض عليه صورة من محتويات ثلاجتك وتسأله ما الوجبة التي يمكن أن تُحضِّرها، سيقوم الروبوت بتحليل الصورة ومعرفة ما تلك المحتويات، ثم يقترح عليك عددا من الوجبات التي يمكنك تحضيرها بالمكونات الموجودة في ثلاجتك. وبهذا يمكن توقع وجود عدّة تطبيقات لهذه الميزة الجديدة. فمثلاً عرضت الشركة إمكانية كتابة كود برمجي بالنموذج الجديد بناء على صورة مُلتقطة لهذا الكود مكتوبة بخط اليد في مفكرة عادية. كما أشارت الشركة إلى قدرة الروبوت على فهم الصور المضحكة وترجمة “الميمز” وما تعنيه وتحديد ما المضحك بها.أكثر منطقية تؤكد “أوبن إيه آي” أن نموذجها الجديد “GPT-4” أفضل في المهام التي تتطلب إبداعاً أو تفكيراً منطقياً، –ولكن هذا لايمكن التأكد منه إلا بعد التجربة–. وتشير الشركة إلى أن النموذج الجديد أفضل في بعض العمليات المنطقية الأساسية من نموذج “شات جي بي تي” الحالي. مثل تلخيص نص أو مقال ما. وبدورها أشارت صحيفة “نيويورك تايمز “، بأن النموذج الجديد يقدم ملخصا دقيقا وصحيحا للمقال، حتى في حالة إضافة جملة عشوائية إلى الملخص. وعند سؤال الروبوت عن مدى صحة هذا الملخص، فسوف يشير إلى وجود هذه الجملة الدخيلة.
وتملك النسخة الجديدة أيضاً شخصيات مختلفة، أو ما يُعرف بمصطلح “القابلية للتوجيه” (Steerability) الذي يُشير إلى قدرة الروبوت على تغيير سلوكه وطريقة حديثه عند الطلب. فغالبا عند استخدامك لنسخة “شات جي بي تي” الحالية ستجد أنه يتحدث بنبرة وأسلوب ثابت، لكن في النسخة الجديدة سيتمكَّن المستخدم من طلب شخصية مناسبة للحديث ، بأسلوب ونبرة مختلفة حسب طبيعة الشخصية.معالجة أفضل عرف سابقاً، بأنه عند الشروع باستخدام نماذج لغوية كبيرة فإن البرامج تتدرب على الملايين من صفحات مواقع الويب والكتب والمقالات والبيانات النصية الأخرى. ولكن عندما تُجري محادثة فعلية مع المستخدم، هناك حدود لحجم ما يمكن للنموذج وضعه في الذاكرة القصيرة . ولا تُقاس هذه الذاكرة بعدد الكلمات، لكنها تُقاس بالرموز “توكين” (Tokens). وكان هذا الحد في نموذج “GPT-3.5” يصل إلى 4096 توكين، أي نحو 8 آلاف كلمة. أي ما يقرب من أربع إلى خمس صفحات من كتاب. وتجاوز الروبوت لهذا الحد يمكن أن يفقده مسار المحادثة.
لكن مع نموذج “GPT-4” فيبلغ الحد الأقصى لعدد الرموز أكثر من 32 ألف توكين، وهو ما يُترجم إلى نحو 64 ألف كلمة، أو 50 صفحة من النصوص. وهو ما يكفي لكتابة قصة قصيرة ، أو معالجة ورقة بحثية كاملة في مرة واحدة. وهذا يعني ، أنه أثناء المحادثة أو خلال كتابة النص، سيتمكَّن الروبوت من الاحتفاظ بما يصل إلى 50 صفحة في ذاكرته القصيرة، أي إنه سيتذكر ما تحدثت عنه في الصفحة العاشرة من المحادثة مثلا، أو عند كتابته لقصة أو مقال طويل، قد يشير إلى الأحداث التي وقعت قبل 20 صفحة. هذه الأداة التي طال انتظارها، والتي يمكنها وصف الصور بالكلمات، تعتبر أحدث مفاجأة من الشركة، التي تتخذ من سان فرانسيسكو مقراً لها. واعتبرتها صحف ومواقع تكنولوجية أنها تمثل قفزة هائلة في قوة الذكاء الاصطناعي ، في حين حذرت بعضها من أنها قد تشكل تحولا رئيسيا آخرا في المعايير الأخلاقية، لأنها تتطرق لجميع مناحي الحياة.