يقول الرئيس التنفيذي لشركة أوبن أيه آي سام ألتمان إن نقص القدرة على الحوسبة يؤخر منتجات الشركة
في أحد مقالات AMA على Reddit، اعترف الرئيس التنفيذي لشركة أوبن أيه آي OpenAI سام ألتمان بأن نقص القدرة على الحوسبة هو أحد العوامل الرئيسية التي تمنع الشركة من شحن المنتجات بالقدر الذي تريده.
كتب ردًا على سؤال حول سبب استغراق نماذج الذكاء الاصطناعي التالية لشركة أوبن أيه آي OpenAI وقتًا طويلاً: “أصبحت كل هذه النماذج معقدة للغاية. كما نواجه الكثير من القيود والقرارات الصعبة حول [كيف] خصصنا حوسبتنا للعديد من الأفكار الرائعة”.
تشير العديد من التقارير إلى أن شركة أوبن أيه آي OpenAI تكافح لتأمين البنية التحتية الكافية للحوسبة لتشغيل وتدريب نماذجها التوليدية. في هذا الأسبوع فقط، ذكرت رويترز نقلاً عن مصادر أن شركة أوبن أيه آي OpenAI تعمل منذ شهور مع شركة Broadcom لإنشاء شريحة ذكاء اصطناعي لتشغيل النماذج، والتي قد تصل في أقرب وقت ممكن في عام 2026.
قال ألتمان، نتيجة للقدرة المحدودة جزئيًا، إن ميزة المحادثة الواقعية التي تقدمها أوبن أيه آي OpenAI لـ ChatGPT، Advanced Voice Mode، لن تحصل على قدرات الرؤية التي تم الإعلان عنها لأول مرة في أبريل في أي وقت قريب. في مؤتمرها الصحفي الذي عقد في أبريل، أظهرت أوبن أيه آي OpenAI تطبيق ChatGPT يعمل على هاتف ذكي ويستجيب للإشارات المرئية، مثل الملابس التي يرتديها شخص ما، في مجال رؤية كاميرا الهاتف.
كشفت تقارير من Fortune لاحقًا أن العرض التوضيحي تم التعجيل به لجذب الانتباه بعيدًا عن مؤتمر مطوري Google I/O، الذي أقيم في نفس الأسبوع. لم يعتقد الكثيرون داخل أوبن أيه آي OpenAI أن GPT-4o جاهز للكشف عنه – ومن المثير للاهتمام أن الإصدار الصوتي فقط من Advanced Voice Mode تأخر لعدة أشهر.
في AMA، أشار ألتمان إلى أن الإصدار الرئيسي التالي من مولد الصور الخاص بـ OpenAI، DALL-E، ليس له جدول زمني للإطلاق. (“ليس لدينا خطة إصدار حتى الآن”، كما قال). وفي الوقت نفسه، تم إعاقة Sora، أداة توليد الفيديو الخاصة بـ أوبن أيه آي OpenAI ، بسبب “الحاجة إلى إتقان النموذج، والحصول على الأمان/الانتحال/أشياء أخرى بشكل صحيح، وتوسيع نطاق الحوسبة”، كما كتب كيفن ويل، كبير مسؤولي المنتجات في أوبن أيه آي OpenAI ، والذي شارك أيضًا في AMA.
وبحسب ما ورد عانى نظام Sora من انتكاسات تقنية جعلته في وضع ضعيف مقارنة بالأنظمة المنافسة من Luma وRunway وغيرها. ووفقًا لـ The Information، استغرق النظام الأصلي، الذي تم الكشف عنه في فبراير، أكثر من 10 دقائق من وقت المعالجة لإنشاء مقطع فيديو مدته دقيقة واحدة.