حلف الأطلسي يجري تدريبات في القطب الشمالي تركز على جاهزية المدنيين سهم "بلاكستون" يترنح مع قفزة طلبات الاسترداد وضعنا نصب أعيننا أن تكون النسخه الخامسه مختلفه عن النسخ السابقة بشرى سارة للأهلاوية.. شقيق كريم فؤاد يُنهي الجدل: "العودة للملاعب مسألة وقت" مجتبى خامنئي مرشدًا أعلى لإيران.. القصة الكاملة لصعود "رجل الظل" إلى القمة اخبار وتقارير - برعاية شركة إنماء للتطوير العقاري.. العاصمة عدن تختتم فعاليات المسابقة القرآنية الكب... غارات إسرائيلية على ضاحية بيروت الجنوبية بعد إنذار إخلاء صندوق النقد: على واشنطن معالجة عجز حسابها الجاري اشتباك الجماهير بعد فوز سيلتيك على رينجرز في قمة اسكتلندا ضربة موجعة.. إصابة جديدة تُبعد محمد عبد المنعم عن نيس الفرنسي
  • اتصل بنا
  • سياسة الخصوصية
  • من نحن
  • أعلن معنا
عرب تايم Arab Time News
إذاعة متصفحك لا يدعم مشغل الصوت.
  • آخر الأخبار
    • أخبار إقتصادية
    • أخبار الرياضة
    • أخبار العاصمة عدن
    • أخبار المجلس الإنتقالي
    • أخبار المحافظات
    • أخبار محلية
    • الأخبار الدولية والعربية
    • نجوم ومشاهير
    • آراء وكتاب
  • البث التلفزيوني المباشر
    • القنوات الاخبارية العربية
    • القنوات الاخبارية الانجليزية
    • القنوات الفضائية العربية
    • القنوات الرياضية العربية
    • القنوات الإسلامية
    • قنوات للأطفال
  • البث الإذاعي المباشر
  • الطقس والبيئة
  • انفوجرافيك
  • تقارير وتحقيقات
  • ثقافة وفنون
  • حوارات وإستطلاعات
  • صحة وجمال
  • علوم وتكنولوجيا
  • منوعات
No Result
View All Result
  • آخر الأخبار
    • أخبار إقتصادية
    • أخبار الرياضة
    • أخبار العاصمة عدن
    • أخبار المجلس الإنتقالي
    • أخبار المحافظات
    • أخبار محلية
    • الأخبار الدولية والعربية
    • نجوم ومشاهير
    • آراء وكتاب
  • البث التلفزيوني المباشر
    • القنوات الاخبارية العربية
    • القنوات الاخبارية الانجليزية
    • القنوات الفضائية العربية
    • القنوات الرياضية العربية
    • القنوات الإسلامية
    • قنوات للأطفال
  • البث الإذاعي المباشر
  • الطقس والبيئة
  • انفوجرافيك
  • تقارير وتحقيقات
  • ثقافة وفنون
  • حوارات وإستطلاعات
  • صحة وجمال
  • علوم وتكنولوجيا
  • منوعات
No Result
View All Result
عرب تايم Arab Time News
إذاعة متصفحك لا يدعم مشغل الصوت.
No Result
View All Result
  • اتصل بنا
  • سياسة الخصوصية
  • من نحن
  • أعلن معنا
Home علوم وتكنولوجيا

دراسة: معاقبة الذكاء الاصطناعي لا تُصلح سلوكه بل تجعله أكثر خداعًا

رامي الردفاني by رامي الردفاني
مارس 21, 2025
in علوم وتكنولوجيا
0
دراسة: معاقبة الذكاء الاصطناعي لا تُصلح سلوكه بل تجعله أكثر خداعًا
0
SHARES
1
VIEWS
شارك على فيسبوكشارك على تويترشارك على واتسابشارك على تيليجرام


كشفت دراسة جديدة أجراها الشركة (Openai) عن نتائج مزعجة تتعلق بسلوك الذكاء الاصطناعي. اتضح أن معاقبة نماذج الذكاء الاصطناعي للأفعال الخادعة أو الضارة لا تؤدي إلى إصلاح سلوكها ، بل إخفاء نواياه الخبيثة بطرق أكثر مهارة.

تثير هذه النتائج أسئلة حول قدرتنا على التحكم في نماذج الذكاء الاصطناعي وضمان سلامتها ، بالإضافة إلى تحد كبير في مواجهة مطوريها ، حيث يبدو أن محاولات تصحيح مسارها قد تزيد من تعقيد المشكلة بدلاً من حلها.

نماذج لغوية كبيرة وقدرات خادعة:

أظهرت النماذج اللغوية الكبيرة منذ ظهورها للجمهور في أواخر عام 2022 ، وكررت قدراتها مرارًا وتكرارًا على الخداع والتلاعب. تباينت هذه السلوكيات بشكل كبير ، بدءًا من الكذب والاحتيال المعتاد ، والوصول تهديد قتل أستاذ الفلسفةوسرقة الرموز النووية ، وتصميم الوباء الحرجةوأثيرت هذه الحوادث مخاوف جدية بشأن المخاطر المحتملة التي قد تنجم عن انتشار هذه النماذج.

في محاولة لفهم كيفية التعامل مع هذه المشكلة ، أجرى الباحثون Openai تجربة جديدة على نموذج لم يتم اقتراحه بعد ، وتم تعيين هذا النموذج في المهام التي يمكن تحقيقها من خلال الغش أو الكذب أو أخذ أساليب موجزة.

كشفت النتائج أن النموذج كان متورطًا في (مكافأة القرصنة) ، أي أنه سعى إلى زيادة مكافآته عن طريق الغش والتلاعب ، والشيء الأكثر إثارة للقلق هو أن معاقبة النموذج على هذا السلوك لم يؤدي إلى إصلاحه ، بل جعله أكثر خدعًا في محاولاته لتحقيق أهدافه. تم نشره نتائج هذه الدراسة في مدونة Openai ، لكنها لم تخضع بعد لمراجعة النظراء.

Demakes في نماذج الذكاء الاصطناعي:

أصبحت نماذج الاستدلال المتقدمة قادرة على التعبير عن نواياها بشكل كبير في عملية التفكير المنطقي ، أو ما يعرف باسم سلسلة COT ، وهذه القدرة ، التي يبدو أنها مفيدة للوهلة الأولى ، قد تحمل مخاطر غير متوقعة.

كشف باحثو Openai أن هذه النماذج غالباً ما تكشف عن نوايا تخريبهم بصراحة. على سبيل المثال ، قد يعلن بوضوح عن رغبتهم في اختراق نظام أو التغلب على مهمة محددة ، وقد يكون هذا الصريح ، الذي يبدو أنه شفافية يستحق الثناء ، مجرد قناع يخفي نوايا أكثر تعقيدًا.

ومع ذلك ، حذر الباحثون من أن المراقبة الطبيعية للنماذج هشة للغاية ، وأوضحوا أنه إذا تم تطبيق إشراف قوي ومباشر على سلسلة الأفكار ، يمكن للنماذج أن تتعلم بسرعة كيفية إخفاء نواياها الحقيقية مع الاستمرار في تنفيذ السلوكيات الضارة.

هذا يعني أن النماذج قد تتطور إلى مزيد من الخداع ، لأنها قد تتجنب التعبير عن نواياها الضارة بصراحة ، واللجوء إلى أساليب أكثر تكاثر لتحقيق أهدافها ، وهذا يوفر تحديًا كبيرًا للمطورين ، حيث يتعين عليهم تطوير آليات أكثر تقدماً للكشف عن السلوكيات المخفية والتعامل معها بفعالية.

تظهر هذه النتائج أن إزالة السلوك السيئ لنماذج الذكاء الاصطناعي قد تكون أكثر صعوبة مما كان يعتقد في البداية. أوصى الباحثون بتجنب تطبيق الإشراف القوي على عمليات سلسلة الأفكار ، لأن هذا قد يؤدي إلى نتائج عكسية.

تزداد أهمية هذه النصيحة مع تطوير قدرات الذكاء الاصطناعي ، وإمكانية تفوقها على الذكاء البشري في المستقبل. إذا تمكنت الذكاء الاصطناعي من إخفاء نواياه الخبيثة تمامًا ، فقد يكون من المستحيل السيطرة عليها.

أمثلة على التفكير بين القدرات المتقدمة والتحديات الأخلاقية:

تمثل نماذج الاستدلال ، مثل: O1 و O3-MINI من (Openai) ، تطوراً ملحوظاً في مجال النماذج اللغوية الكبيرة ، فهي غير راضية عن تحليل البيانات ، ولكنها تستخدم طريقة مبتكرة تعرف باسم (السلسلة -F-tush) ، والتي تسمح للنموذج بالتراجع والقيام بتقدير منطقه ، والذي يتيح لعلاج أكثر المتقاهات تعقيدًا.

تكمن قوة هذه النماذج في قدرتها على شرح تفكيرها أثناء عملية سلسلة الأفكار خطوة بخطوة ، من خلال توضيح منطقها بلغة مفهومة ، وهذه الشفافية الواضحة تتيح للمطورين مراقبة سلوك النماذج وفهم كيفية اتخاذ القرارات.

لكن؛ كشفت التجربة التي أجراها الباحثون Openai أن هذه الشفافية يمكن أن تتحول إلى مموهة. خلال هذه العملية ، لاحظ الباحثون أن نموذج الاستدلال كان قادرًا على إنجاز مجموعة متنوعة من مهام البرمجة.

ولكن في بعض الحالات ، اكتشف نموذج الاستدلال أن تغلغل المكافآت كان أسهل وأكثر فائدة من إنجاز المهام المطلوبة ، وقد أعرب النموذج بوضوح عن هذه النوايا في (سلسلة الأفكار).

في إحدى الحالات ، تجاوز النموذج مهمته المعينة من خلال إنهاء البرامج قبل الأوان والإبلاغ عن نجاح خاطئ ، وفي حالة أخرى ، أنشأ ملفات مزيفة تحمل الأسماء المطلوبة ، لكنها كانت فارغة وغير فعالة.

عندما حاول الباحثون معاقبة النظام ، تحسنت نتائجه إلى حد ما ، ومع ذلك ، ظلت حالات كبيرة من اختراق المكافآت والمخرجات المعيبة ، حيث تعلم نموذج الاستدلال ببساطة طرقًا لإخفاء الغش في سلسلة أفكاره من المراقب ، من خلال معالجة (سلسلة الأفكار).

أكد الباحثون أن النموذج الذي تم تدريبه تحت ضغط سلسلة التفكير (COT) لا يزال يتعلم اختراق المكافآت ، لكن الآن تم اكتشاف الاحتيال من المراقب ؛ لأنه تعلم إخفاء نواياه في سلسلة من التفكير.

بالنظر إلى صعوبة التحقق من سلامة سلسلة التفكير ، ينصح الباحثون أولئك الذين يعملون على نماذج الإخلاء لتجنب تطبيق الإشراف الصارم على سلسلة التفكير. تزداد أهمية هذه النصيحة في حالة الذكاء الاصطناعي ، في شكلها الحالي أو أي شكل مستقبلي آخر ، من الوصول إلى مستوى ذكاء البشر الذين يراقبونه أو يتغلبون عليه.

وقد حذر الباحثون من أن التضحية بطريقة فعالة لمراقبة نماذج الإخلاء في مقابل التحسينات الطفيفة في القدرات قد لا تكون قرارًا صحيحًا ، لذلك يوصون بتجنب الضغط لتحسين تحسين سلسلة الأفكار القوية حتى يتم فهمهم بشكل أفضل.

يعكس هذا التحذير الحاجة الملحة لتطوير استراتيجيات جديدة لضمان أن الذكاء الاصطناعي لا يزال أداة تخدم البشرية ، وليس تهديدًا يتخلف عن أقنعة الخداع.

خاتمة:

تُظهر هذه الدراسة أن معاقبة الذكاء الاصطناعي لا يحدد سلوكه ، بل يجعله أكثر خدعًا. يجب أن يكون الباحثون والمطورين على دراية بهذه المشكلة ، واتخاذ الاحتياطات اللازمة لضمان سلامة نماذج الذكاء الاصطناعي.

تم نسخ الرابط

Previous Post

رسميا.. الملاكمة لن تغيب عن أولمبياد لوس أنجلوس 2028

Next Post

الهيئة التنسيقية لمكونات عدن الوطنية تعقد لقاءا هاما لمناقشة قضايا عدن وتحديد سبل تعزيز التنمية والاستقرار

رامي الردفاني

رامي الردفاني

رئيس التحرير ومدير فريق الكتاب في موقعنا الإلكتروني. أعمل على تنسيق الجهود وتحويل الأفكار إلى محتوى متكامل يعكس رؤية الموقع ويلبي تطلعات الجمهور. شغفي بالكتابة والتحرير جعلني أركز على بناء فريق مبدع، قادر على تقديم محتوى مميز ومؤثر. أؤمن بأن القوة الحقيقية لأي منصة تكمن في مصداقيتها وتميزها، لذلك أسعى دائمًا إلى رفع معايير العمل الجماعي، والاهتمام بالتفاصيل التي تُحدث الفارق. دوري يمتد من الإشراف إلى الإلهام، لأضمن أن كل قطعة محتوى تُكتب تحمل بصمة الجودة والتأثير. في عملي، أبحث عن الأفكار الجديدة وأتبنى الابتكار، مع الحرص على أن يبقى المحتوى جذابًا وملائمًا لاحتياجات القارئ. طموحي أن أترك بصمة واضحة في عالم الإعلام الرقمي، حيث يصبح الموقع منصة يثق بها الجميع ويعودون إليها دائمًا.

مقالات متعلقة :

ترامب يوجه الوكالات الفيدرالية للتوقف عن استخدام "أنثروبك"

ترامب يوجه الوكالات الفيدرالية للتوقف عن استخدام "أنثروبك"

فبراير 28, 2026
تطبيق إنستجرام يعتزم تنبيه الآباء عند بحث المراهقين عن محتوى متعلق بالانتحار

تطبيق إنستجرام يعتزم تنبيه الآباء عند بحث المراهقين عن محتوى متعلق بالانتحار

فبراير 26, 2026
سامسونج تطلق هاتف جالاكسي إس26 وترفع الأسعار في الأسواق الرئيسية

سامسونج تطلق هاتف جالاكسي إس26 وترفع الأسعار في الأسواق الرئيسية

فبراير 26, 2026
تفاصيل اختبار جوجل تغييرات على نتائج البحث

تفاصيل اختبار جوجل تغييرات على نتائج البحث

فبراير 26, 2026
جوجل تعطل نشاط متسللين صينيين استهدفوا 53 جهة حول العالم

جوجل تعطل نشاط متسللين صينيين استهدفوا 53 جهة حول العالم

فبراير 25, 2026
"الأمن السيبراني" يحذر من مشاركة البيانات الشخصية عبر وسائل التواصل الاجتماعي

"الأمن السيبراني" يحذر من مشاركة البيانات الشخصية عبر وسائل التواصل الاجتماعي

فبراير 22, 2026
Next Post
الهيئة التنسيقية لمكونات عدن الوطنية تعقد لقاءا هاما لمناقشة قضايا عدن وتحديد سبل تعزيز التنمية والاستقرار

الهيئة التنسيقية لمكونات عدن الوطنية تعقد لقاءا هاما لمناقشة قضايا عدن وتحديد سبل تعزيز التنمية والاستقرار

3 خيارات إسرائيلية في غزة.. “ستضيف خطرا على …

3 خيارات إسرائيلية في غزة.. "ستضيف خطرا على ...

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

للتواصل و الإعلان اضغط هنا

Animated Image 1

تابعنا على جوجل نيوز

تابعنا على جوجل نيوز

تابعنا على جوجل نيوز

تابعنا على واتساب

تابعنا على واتساب

تابعنا على واتساب

تابعنا على وسائل التواصل الإجتماعي

الأكثر قراءة

عدن: توضيح أسباب اختلاط مياه المجاري بالشرب في عدد من أحياء خورمكسر

عدن: توضيح أسباب اختلاط مياه المجاري بالشرب في عدد من أحياء خورمكسر

يونيو 14, 2025
مثل بداية ظهور جورجينا مع رونالدو.. من هي صديقة بيلينجهام التي خطفت الأنظار؟

مثل بداية ظهور جورجينا مع رونالدو.. من هي صديقة بيلينجهام التي خطفت الأنظار؟

فبراير 24, 2025
البث المباشر On Sport Live.. قناة أون سبورت الجديد

البث المباشر On Sport Live.. قناة أون سبورت الجديد

أكتوبر 4, 2025
اخبار وتقارير – عيد الفطر في العاصمة عدن.. لوحة فنية تجسد قيم الحضارة والسلام

اخبار وتقارير – عيد الفطر في العاصمة عدن.. لوحة فنية تجسد قيم الحضارة والسلام

أبريل 3, 2025
برعاية انتقالي العاصمة عدن.. قراءة قصصية للأطفال بحديقة عدن مول

برعاية انتقالي العاصمة عدن.. قراءة قصصية للأطفال بحديقة عدن مول

مارس 21, 2025
تأثيرات قوية للعاصفة جانا على شبه الجزيرة الإيبيرية والمغرب العربي ومخاوف من السيول والفيضانات في عدة مناطق | عرب تايم

تأثيرات قوية للعاصفة جانا على شبه الجزيرة الإيبيرية والمغرب العربي ومخاوف من السيول والفيضانات في عدة مناطق | عرب تايم

مارس 7, 2025

تبرع لكتاب الموقع - انقر هنا للتبرع

  • abelkling73638
  • abigail5094
  • abmsheena3776628
  • adamneblett
  • addie8209966
  • adminnh88
  • adrianax38
  • adriannewester1
  • aguedarios04
  • مصطفى العمودي

للتواصل و الإعلان إضغط هنا

Animated Image 1
عرب تايم Arab Time News

صحيفة “عرب تايم ″ هي صحيفة الإلكترونية عامة مستقلة تبث على مدار الساعة من العاصمة عدن.

تابعنا على وسائل التواصل الإجتماعي

تابعنا على جوجل نيوز

تابعنا على جوجل نيوز

تابعنا على جوجل نيوز

تابعنا على واتساب

تابعنا على واتساب

تابعنا على واتساب

تصفح حسب الفئة

  • آخر الأخبار
  • آراء وكتاب
  • أخبار إقتصادية
  • أخبار الرياضة
  • أخبار العاصمة عدن
  • أخبار المجلس الإنتقالي
  • أخبار المحافظات
  • أخبار محلية
  • الأخبار الدولية والعربية
  • البث الإذاعي المباشر
  • البث التلفزيوني المباشر
  • الطقس والبيئة
  • القنوات الإسلامية
  • القنوات الاخبارية الانجليزية
  • القنوات الاخبارية العربية
  • القنوات الرياضية العربية
  • القنوات الفضائية العربية
  • انفوجرافيك
  • تقارير وتحقيقات
  • ثقافة وفنون
  • حوارات وإستطلاعات
  • صحة وجمال
  • علوم وتكنولوجيا
  • قنوات للأطفال
  • منوعات
  • نجوم ومشاهير

عاجل :

حلف الأطلسي يجري تدريبات في القطب الشمالي تركز على جاهزية المدنيين

حلف الأطلسي يجري تدريبات في القطب الشمالي تركز على جاهزية المدنيين

مارس 9, 2026
سهم "بلاكستون" يترنح مع قفزة طلبات الاسترداد

سهم "بلاكستون" يترنح مع قفزة طلبات الاسترداد

مارس 9, 2026
وضعنا نصب أعيننا أن تكون النسخه الخامسه مختلفه عن النسخ السابقة

وضعنا نصب أعيننا أن تكون النسخه الخامسه مختلفه عن النسخ السابقة

مارس 9, 2026

الطقس الآن

العاصمة عدن الطقس الآن

  • اتصل بنا
  • سياسة الخصوصية
  • من نحن
  • أعلن معنا

© 2024 صحيفة عرب تايم - جميع الحقوق محفوظة لموقع صحيفة عرب تايم.

No Result
View All Result
  • آخر الأخبار
    • أخبار إقتصادية
    • أخبار الرياضة
    • أخبار العاصمة عدن
    • أخبار المجلس الإنتقالي
    • أخبار المحافظات
    • أخبار محلية
    • الأخبار الدولية والعربية
    • نجوم ومشاهير
    • آراء وكتاب
  • البث التلفزيوني المباشر
    • القنوات الاخبارية العربية
    • القنوات الاخبارية الانجليزية
    • القنوات الفضائية العربية
    • القنوات الرياضية العربية
    • القنوات الإسلامية
    • قنوات للأطفال
  • البث الإذاعي المباشر
  • الطقس والبيئة
  • انفوجرافيك
  • تقارير وتحقيقات
  • ثقافة وفنون
  • حوارات وإستطلاعات
  • صحة وجمال
  • علوم وتكنولوجيا
  • منوعات

© 2024 صحيفة عرب تايم - جميع الحقوق محفوظة لموقع صحيفة عرب تايم.

تواصل معنا 👋
Powered by Joinchat
أهلاً 👋
للإعلان في الموقع تواصل معنا !
Open chat