أعلنت شركة OpenAI عن إطلاق “المشغل“، وكيل ذكاء اصطناعي شامل يمكنه التحكم في متصفح الويب وتنفيذ مهام مستقلة نيابة عن المستخدم، مثل حجز الإقامة في الفنادق أو التسوق عبر الإنترنت وغيرها.
وتقدم الشركة حاليًا “Operator” ضمن اشتراك ChatGPT Professional، والذي يكلف 200 دولار شهريًا، مع خطط للتوسع لاحقًا لإتاحته ضمن اشتراكات Plus وTeam وEnterprise في الأشهر المقبلة.
وتوفر واجهة “المشغل” خيارات متعددة للمهام، مثل التسوق، والتوصيل، وطلب الطعام، والسفر، ويمكن للوكيل الذكي تنفيذ هذه المهام تلقائيًا. عند تفعيل “Operator”، تظهر نافذة متصفح مخصصة تعرض العمليات التي يقوم بها الوكيل خطوة بخطوة، مع إمكانية تدخل المستخدم في أي وقت.
يعتمد “المشغل” على نموذج الذكاء الاصطناعي لعامل استخدام الكمبيوتر (CUA)، والذي يجمع بين إمكانات الرؤية والتحليل البصري لنموذج GPT-4o مع خصائص الاستدلال لنماذج OpenAI المتقدمة. يعمل النموذج من خلال التفاعل مع واجهات مواقع الويب بطريقة تشبه البشر، دون الحاجة إلى استخدام واجهات برمجة مخصصة، حيث يمكنه النقر على الروابط والتمرير وتعديل الخيارات وإدخال بعض البيانات وما إلى ذلك.
يطلب “المشغل” تأكيد المستخدم قبل القيام بأي خطوة مهمة ومؤثرة، مثل تأكيد الطلبات أو إرسال رسائل البريد الإلكتروني، مما يسمح للمستخدم بمراجعة المهام قبل تنفيذها. ومع ذلك، تؤكد الشركة أن النموذج قد لا يعمل بكفاءة في جميع المواقف، حيث تتطلب بعض العمليات الحساسة، مثل المعاملات المصرفية، إشرافًا مباشرًا من المستخدم.
أوضحت OpenAI أيضًا أن Operator لا يجمع أو يلتقط صورًا للبيانات الشخصية، وقد دخل في شراكة مع شركات مثل DoorDash وeBay وInstacart وUber وغيرها لضمان الامتثال لشروط استخدام خدماته.
ويمثل «المشغل» نقلة نوعية في قدرات الذكاء الاصطناعي، إذ يتجاوز مجرد توفير المعلومات إلى تنفيذ إجراءات فعلية عبر الإنترنت.
ومن الجدير بالذكر أن شركة OpenAI تأخرت قليلاً في الإعلان عن هذه التقنية، والتي سبقتها شركات منافسة أخرى مثل Google وAnthropic، إلا أنها أكدت أنها تسعى لضمان السلامة في استخدام هذه التقنية.
مع إطلاق المشغل، يبدأ فصل جديد في كيفية تفاعل المستخدمين مع الإنترنت وأجهزة الكمبيوتر.
وكلاء الذكاء الاصطناعي (AI Brokers) عبارة عن برامج كمبيوتر ذكية مصممة لإدراك أشياء محددة واتخاذ قرارات لتحقيق أهداف محددة. يختلف الوكلاء عن برامج الذكاء الاصطناعي التقليدية في قدرتهم على التفاعل مع بيئة ديناميكية واتخاذ الإجراءات بناءً على هذا التفاعل.

















