وصول OpenAI GPT-4 في منتصف مارس 2023

OpenAI GPT-4 على وشك الإصدار. إنه متعدد الوسائط، مما يعني أنه إذا لم تكن Google قلقة، فيجب أن تبدأ الآن

أكد أندرياس براون، CTO في Microsoft ألمانيا، أن GPT-4 قادم في غضون أسبوع من 9 مارس 2023 وأنه سيكون متعدد الوسائط. يعني الذكاء الاصطناعي متعدد الوسائط أنه سيكون قادرًا على العمل ضمن أنواع متعددة من المدخلات، مثل الفيديو والصور والصوت.

تم التحديث: إصدار GPT-4 في 14 مارس 2023

أصدر OpenAI GPT-4 في 14 مارس 2023. إنه نموذج متعدد الوسائط يقبل مطالبات الصور والنص.

Modal هي عبارة تستخدم في التعلم الآلي للإشارة إلى أشكال الإدخال مثل النص ولكن أيضًا الحواس مثل الصوت والبصرية والرائحة وما إلى ذلك.

وصف إعلان OpenAI حجم التقدم في GPT-4:

“… بينما أقل قدرة من البشر في العديد من سيناريوهات العالم الحقيقي، فإنه يعرض أداءً على مستوى الإنسان في مختلف المعايير المهنية والأكاديمية.

على سبيل المثال، يجتاز امتحان شريط محاكاة مع درجة حول أعلى 10٪ من المتقدمين للاختبار؛ في المقابل، كانت نتيجة GPT-3.5 حول أدنى 10٪.

لقد أمضينا 6 أشهر في محاذاة GPT-4 بشكل متكرر باستخدام دروس من برنامج اختبار الخصومة الخاص بنا وكذلك ChatGPT ، مما أدى إلى الحصول على أفضل النتائج على الإطلاق (على الرغم من أنها بعيدة عن الكمال) فيما يتعلق بالوقائع وقابلية التوجيه ورفض الخروج من حواجز الحماية. “

نماذج اللغات الكبيرة متعددة الوسائط

تتمثل النتيجة الكبيرة من الإعلان في أن GPT-4 متعدد الوسائط (توقع SEJ أن يكون GPT-4 متعدد الوسائط في يناير 2023).

الطريقة هي إشارة إلى نوع الإدخال الذي (في هذه الحالة) يتعامل فيه نموذج لغة كبير.

يمكن أن تشمل الوسائط المتعددة النص والكلام والصور والفيديو.

يعمل كل من GPT-3 وGPT-3.5 بطريقة واحدة فقط، النص.

وفقًا لتقرير الأخبار الألماني، قد يكون GPT-4 قادرًا على العمل بأربع طرق على الأقل، الصور، الصوت (السمعي)، النص والفيديو.

مقتبس عن الدكتور أندرياس براون، CTO Microsoft Germany:

“سنقدم GPT-4 الأسبوع المقبل، سيكون لدينا نماذج متعددة الوسائط تقدم إمكانيات مختلفة تمامًا – على سبيل المثال مقاطع الفيديو …”

تفتقر التقارير إلى تفاصيل GPT-4، لذلك من غير الواضح ما إذا كان ما تمت مشاركته حول الوسائط المتعددة خاصًا بـ GPT-4 أم بشكل عام فقط.

استخدم قدراتك الإبداعية لإنتاج محتوى جذاب وفريد من نوعه مع ContentShake. تجربة متكاملة لأتمتة إنشاء المحتوى تتيح لك الحصول على أفكار متخصصة، وكتابة مقالات متميزة، وتعديلها بدقة، ونشرها بكل سهولة ويسر – كل ذلك بضغطة زر واحدة. اغتنم فرصة التميز في عالم المحتوى مع ContentShake.

شرح هولجر كين، مدير استراتيجية الأعمال في Microsoft ، الأساليب المتعددة ولكن لم يكن من الواضح ما إذا كان يشير إلى تعدد وسائط GPT-4 أو تعدد الوسائط في الأجناس.

أعتقد أن إشاراته إلى الوسائط المتعددة كانت خاصة بـ GPT-4.

شارك التقرير الإخباري:

“أوضح كين ما يدور حوله الذكاء الاصطناعي متعدد الوسائط، والذي يمكنه ترجمة النص ليس فقط إلى صور، ولكن أيضًا إلى موسيقى وفيديو.”

هناك حقيقة أخرى مثيرة للاهتمام وهي أن Microsoft تعمل على ” مقاييس الثقة ” من أجل إرساء أسس الذكاء الاصطناعي لديها بالحقائق لجعلها أكثر موثوقية.

مايكروسوفت كوزموس -1

الشيء الذي لم يتم الإبلاغ عنه على ما يبدو في الولايات المتحدة هو أن Microsoft أصدرت نموذج لغة متعدد الوسائط يسمى Kosmos-1 في بداية مارس 2023.

وبحسب ما أورده موقع الأخبار الألماني Heise.de:

“… أخضع الفريق النموذج المدرَّب مسبقًا لاختبارات مختلفة، وحققت نتائج جيدة في تصنيف الصور، والإجابة على أسئلة حول محتوى الصورة، ووضع العلامات الآلي للصور، والتعرف البصري على النص، ومهام إنشاء الكلام.

… يبدو أن التفكير البصري، أي استخلاص استنتاجات حول الصور دون استخدام اللغة كخطوة وسيطة، هو المفتاح هنا … “

Kosmos-1 هو نموذج متعدد الوسائط يدمج أساليب النص والصور.

يذهب GPT-4 إلى أبعد من Kosmos-1 لأنه يضيف طريقة ثالثة، الفيديو، ويبدو أيضًا أنه يتضمن طريقة الصوت.

يعمل عبر لغات متعددة

يبدو أن GPT-4 يعمل عبر جميع اللغات. يوصف بأنه قادر على تلقي سؤال باللغة الألمانية والإجابة عليه باللغة الإيطالية.

هذا مثال غريب لأن من سيطرح سؤالًا باللغة الألمانية ويريد الحصول على إجابة باللغة الإيطالية؟

هذا ما تم تأكيده:

“… وصلت التكنولوجيا إلى حد أنها” تعمل في جميع اللغات “: يمكنك طرح سؤال باللغة الألمانية والحصول على إجابة باللغة الإيطالية.

باستخدام الوسائط المتعددة، ستقوم Microsoft (-OpenAI) “بجعل النماذج شاملة”. “

أعتقد أن الهدف من الاختراق هو أن النموذج يتجاوز اللغة بقدرته على جذب المعرفة عبر لغات مختلفة. لذلك إذا كانت الإجابة باللغة الإيطالية، فستعرفها وستتمكن من تقديم الإجابة باللغة التي تم طرح السؤال بها.

هذا من شأنه أن يجعله مشابهًا لهدف منظمة العفو الدولية متعددة الوسائط من Google والتي تسمى، MUM. يقال إن أمي قادرة على تقديم إجابات باللغة الإنجليزية والتي لا تتوفر البيانات الخاصة بها إلا بلغة أخرى، مثل اليابانية.

تطبيقات GPT-4

لا يوجد إعلان حالي عن مكان ظهور GPT-4. ولكن تم ذكر Azure-OpenAI على وجه التحديد.

تكافح Google للحاق بمايكروسوفت من خلال دمج تقنية منافسة في محرك البحث الخاص بها. يؤدي هذا التطور إلى تفاقم التصور القائل بأن Google تتخلف عن الركب وتفتقر إلى القيادة في مجال الذكاء الاصطناعي الذي يواجه المستهلك.

تقوم Google بالفعل بدمج الذكاء الاصطناعي في العديد من المنتجات مثل Google Lens و Google Maps وغيرها من المجالات التي يتفاعل معها المستهلكون مع Google. هذا النهج هو استخدام الذكاء الاصطناعي كتقنية مساعدة لمساعدة الأشخاص في المهام الصغيرة.

الطريقة التي تطبقها Microsoft هي أكثر وضوحًا، وبالتالي فهي تستحوذ على كل الاهتمام وتعزز صورة Google على أنها تتعثر وتكافح من أجل اللحاق بالركب.

المصدر: searchenginejournal

شاهد المزيد:

أفضل مواقع البحث

إنشاء حساب جديد فيسبوك

إنشاء حساب PayPal

إنشاء حساب انستقرام

تسجيل دخول Gmail

إنشاء حساب Hotmail

إنشاء حساب Yahoo

أنت تستخدم إضافة Adblock

يعتمد موقع انشاء على الاعلانات كمصدر لدعم الموقع، يجب عليك ايقاف تشغيل حاجب الاعلانات لمشاهدة المحتوي