تحدث أشياء مفاجئة عندما تجمع 25 عميلًا من عملاء الذكاء الاصطناعي معًا في مدينة آر بي جي

تكبير / لقطة شاشة للعرض التوضيحي “Generative Agents” حيث تعيش 25 شخصية يتحكم فيها الذكاء الاصطناعي الحياة في بلدة تدعى سمولفيل.

JS Park، JC O’Brien، CJ Cai، M. Morris، P. Liang، MS Bernstein

قامت مجموعة من الباحثين في جامعة ستانفورد وجوجل بإنشاء عالم افتراضي مصغر بأسلوب آر بي جي مشابه لـ سيمز، حيث يعيش 25 حرفًا ، يتم التحكم فيها بواسطة ChatGPT والرمز المخصص ، حياتهم بشكل مستقل بدرجة عالية من السلوك الواقعي. كتبوا عن تجربتهم في ورقة أكاديمية ما قبل الطباعة صدر يوم الجمعة.

“يستيقظ وكلاء التوليد ، ويطبخون الإفطار ، ويتوجهون إلى العمل ؛ يرسم الفنانون ، بينما يكتب المؤلفون ؛ إنهم يشكلون الآراء ، ويلاحظون بعضهم البعض ، ويبدأون المحادثات ؛ يتذكرون ويفكرون في الأيام الماضية كما يخططون لليوم التالي ،” اكتب الباحثين في ورق، “Generative Agents: Interactive Simulacra of Human Behavior.”

لتحقيق ذلك ، اعتمد الباحثون بشكل كبير على نموذج لغة كبير (LLM) للتفاعل الاجتماعي ، وتحديداً واجهة برمجة تطبيقات ChatGPT. بالإضافة إلى ذلك ، قاموا بإنشاء بنية تحاكي العقول بالذكريات والخبرات ، ثم تركوا الوكلاء يتحركون في العالم للتفاعل. ويمكن للبشر التفاعل معهم أيضًا.

أمثلة على التفاعلات في سمولفيل من ورقة <em> Generative Agents </em>.” src=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/gen_agents_diagram_1-640×393.jpg” width=”640″ height=”393″ srcset=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/gen_agents_diagram_1.jpg 2x” decoding=”async” class=”amp-wp-enforced-sizes”/></a><figcaption class=

يكتبون: “يمكن للمستخدمين المراقبة والتدخل عندما يخطط العملاء لأيامهم ، ومشاركة الأخبار ، وتكوين العلاقات ، وتنسيق أنشطة المجموعة”. إنه عمل جون سونغ بارك ، جوزيف سي أوبراين ، كاري جاي كاي ، ميريديث رينجل موريس ، بيرسي ليانج ، ومايكل إس بيرنشتاين.

تضمنت ألعاب الكمبيوتر والفيديو شخصيات يتحكم فيها الكمبيوتر منذ سبعينيات القرن الماضي ، ولكن لم يتمكنوا من قبل من محاكاة بيئة اجتماعية مع تعقيد اللغة الطبيعية التي قد تكون ممكنة الآن بفضل نماذج الذكاء الاصطناعي التوليدية مثل ChatGPT. في حين أن بحث المجموعة ليس بالضرورة “لعبة” ، فقد يكون نموذجًا أوليًا لمستقبل تتفاعل فيه شخصيات آر بي جي الديناميكية بطرق معقدة وغير متوقعة.

READ حصريًا: تشرح Apple كيف تم تصميم جهاز MacBook Air الجديد للسفر

“تخيلوا قتل أحد الشخصيات غير القابلة للعب والعودة إلى المدينة ورؤية جنازة لهم “. دينيس هانسن عند الرد على موضوع حول الآثار الناشئة للورقة. بناءً على هذا البحث ، قد لا يكون هذا سيناريو بعيد المنال.

الحياة في سمولفيل

لدراسة مجموعة عملاء الذكاء الاصطناعي ، أنشأ الباحثون مدينة افتراضية تسمى “سمولفيل” ، والتي تضم منازل ومقهى ومتنزهًا ومتجرًا للبقالة. لأغراض التفاعل البشري ، يتم تمثيل العالم على الشاشة من عرض علوي باستخدام رسومات بكسل بأسلوب عتيق تذكرنا بلعبة آر بي جي يابانية كلاسيكية ذات 16 بت.

رسم تخطيطي لـ — تكبير / رسم تخطيطي “سمولفيل” من *وكلاء التوليد* ورق.

سمولفيل هي موطن لمجتمع من 25 فردًا متميزًا ، كل منهم يمثله صورة رمزية أساسية. لالتقاط هوية كل وكيل وعلاقاته بأعضاء آخرين في المجتمع ، أنشأ الباحثون فقرة لوصف اللغة الطبيعية كذاكرة بذرة. تتضمن هذه الأوصاف تفاصيل حول مهنة كل وكيل وعلاقاته مع الوكلاء الآخرين. على سبيل المثال ، إليك مقتطف من إحدى هذه الذاكرة الأولية المتوفرة في الورقة:

John Lin هو صاحب متجر صيدلية في Willow Market and Pharmacy يحب مساعدة الناس. إنه يبحث دائمًا عن طرق لجعل عملية الحصول على الدواء أسهل لعملائه. يعيش جون لين مع زوجته مي لين ، أستاذة جامعية ، وابنه إيدي لين ، وهو طالب يدرس نظرية الموسيقى. جون لين يحب عائلته كثيرا.

كبيئة افتراضية ، تنقسم سمولفيل إلى مناطق وكائنات. يمكن للمستخدمين البشريين دخول العالم كعامل حالي أو جديد ، ويمكن لكل من المستخدمين والوكلاء التأثير على حالة الأشياء من خلال الإجراءات. يمكن للمستخدمين البشريين أيضًا التفاعل مع وكلاء الذكاء الاصطناعي من خلال المحادثة أو عن طريق إصدار التوجيهات كـ “صوت داخلي”. يتواصل المستخدمون بلغة طبيعية ، مع تحديد شخصية يفهمها الوكيل ، أو يمكنه استخدام الصوت الداخلي للتأثير على تصرفات الوكيل.

READ قد لا يكون هاتف Pixel 7 Pro من Google أكثر ذكاءً بعد ثمانية أشهر ، ولكنه خصم 200 دولار

في تطوير العالم الافتراضي ، جاء أحد التحديات من “الذاكرة” المحدودة للـ LLMs. تأتي هذه الذاكرة كـ “نافذة سياق” ، وهي عدد الرموز المميزة (أجزاء الكلمات) التي يمكن لـ ChatGPT معالجتها في كل مرة. للتغلب على هذه القيود ، صمم الباحثون نظامًا يتم فيه استرجاع “الأجزاء الأكثر صلة من ذاكرة العامل” وتوليفها عند الحاجة.

“يدرك الوكلاء بيئتهم ، ويتم حفظ جميع التصورات في سجل شامل لتجارب الوكيل يسمى تدفق الذاكرة. واستنادًا إلى تصوراتهم ، تستعيد البنية الذكريات ذات الصلة ، ثم تستخدم تلك الإجراءات المسترجعة لتحديد الإجراء. هذه الذكريات المسترجعة هي أيضًا تُستخدم لتشكيل خطط طويلة الأجل ، ولإنشاء انعكاسات ذات مستوى أعلى ، وكلاهما يتم إدخالهما في تدفق الذاكرة للاستخدام المستقبلي “.

من المثير للاهتمام ، أنه عندما تواجه الشخصيات في عالم sandbox بعضها البعض ، فإنهم غالبًا ما يتحدثون مع بعضهم البعض باستخدام اللغة الطبيعية التي يوفرها ChatGPT. بهذه الطريقة ، يتبادلون المعلومات ويشكلون ذكريات عن حياتهم اليومية. عندما جمع الباحثون هذه المكونات الأساسية معًا وأجروا المحاكاة ، بدأت تحدث أشياء مثيرة للاهتمام.

سلوك ناشئ

في الورقة ، ذكر الباحثون ثلاثة سلوكيات ناشئة غير متوقعة ناتجة عن المحاكاة. لم يكن أي من هؤلاء مبرمجًا مسبقًا بل نتج عن التفاعلات بين العوامل.

وشملت هذه “نشر المعلومات” (وكلاء يخبرون بعضهم البعض بمعلومات وينتشرونها اجتماعيًا بين المدينة) ، و “ذاكرة العلاقة” (ذاكرة التفاعلات السابقة بين الوكلاء وذكر تلك الأحداث السابقة لاحقًا) ، و “التنسيق” (التخطيط وحضور حفلة عيد الحب مع وكلاء آخرين).

خلال تجربة عيد الحب ، خططت إحدى وكلاء منظمة العفو الدولية ، تُدعى إيزابيلا رودريغيز ، لحفلة عيد الحب في “مقهى هوبز” ودعت الأصدقاء والعملاء. قامت بتزيين المقهى بمساعدة صديقتها ماريا ، التي دعت حبيبها كلاوس إلى الحفلة.

رسم تخطيطي لـ "سمولفيل" الوكلاء الذين يتفاعلون فيما يتعلق بحفلة عيد الحب من صحيفة <em> Generative Agents </em>.” src=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/valentines_party-640×423.jpg” width=”640″ height=”423″ srcset=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/valentines_party-1280×847.jpg 2x” decoding=”async” class=”amp-wp-enforced-sizes”/></a><figcaption class=

كتب الباحثون: “بدءًا من فكرة واحدة فقط يحددها المستخدم بأن وكيلًا واحدًا يريد إقامة حفلة عيد الحب” ، “نشر الوكلاء بشكل مستقل الدعوات إلى الحفلة على مدار اليومين المقبلين ، والتعرف على معارف جديدة ، وسؤال بعضهم البعض في المواعيد للحفلة ، وتنسيقها لتظهر للحفلة معًا في الوقت المناسب “.

READ لقد أعطيت صندوق البريد الخاص بي هذه الترقية الذكية بقيمة 29 دولارًا وهي تغيير جذري لقواعد اللعبة

بينما سمع 12 عميلاً عن الحفلة من خلال آخرين ، حضر خمسة عملاء فقط (بما في ذلك كلاوس وماريا). قال ثلاثة منهم إنهم كانوا مشغولين للغاية ، وأربعة عملاء لم يذهبوا. كانت التجربة مثالًا ممتعًا لمواقف غير متوقعة يمكن أن تنشأ من التفاعلات الاجتماعية المعقدة في العالم الافتراضي.

أكثر إنسانية من الإنسان؟

وكجزء من بحثهم ، استعانت المجموعة بمقيمين بشريين لمشاهدة عمليات إعادة المحاكاة لقياس مدى نجاح عملاء الذكاء الاصطناعي في إنتاج سلوك يمكن تصديقه بناءً على بيئتهم وتجاربهم ، بما في ذلك “الخطط المعقولة وردود الفعل والأفكار” و “نشر المعلومات والعلاقة تشكيل وتنسيق الوكلاء عبر جيوب مختلفة من المجتمع “.

في موقع الويب التجريبي <em> Generative Agents </em> ، يمكنك النقر فوق الشخصيات لمعرفة ما يفكر فيه كل شخص ويشعر به.” src=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/gen_agents_characters-640×568.jpg” width=”640″ height=”568″ srcset=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/gen_agents_characters.jpg 2x” decoding=”async” class=”amp-wp-enforced-sizes”/></a><figcaption class=

كما طلب الباحثون من البشر تمثيل ردود الوكلاء على أسئلة المقابلات بصوت الوكيل الذي شاهدوا إعادته. ومن المثير للاهتمام أنهم وجدوا أن “بنية العامل التوليدي الكامل” أنتجت نتائج أكثر تصديقًا من البشر الذين لعبوا الأدوار.

هذا يؤدي إلى قضايا أخرى ، مثل الآثار الأخلاقية ومخاطر هذه التكنولوجيا. حذر الباحثون من مخاطر مثل تكوين “علاقات اجتماعية” غير مناسبة ، وتأثير الاستدلالات غير الصحيحة ، وتفاقم المخاطر الحالية المرتبطة بالذكاء الاصطناعي التوليدي ، وخطر الاعتماد المفرط على العوامل المولدة في عملية التصميم.

لضمان النشر الأخلاقي والمسؤول اجتماعيًا ، يجادل الباحثون بأن المطورين يجب أن يلتزموا بمبادئ مثل الكشف صراحة عن الطبيعة الحسابية للوكلاء ، وضمان توافق القيمة ، واتباع أفضل الممارسات في تصميم الذكاء الاصطناعي البشري ، والحفاظ على سجلات التدقيق للمدخلات والمخرجات ، وليس استبدال المدخلات البشرية الحقيقية في الدراسات وعمليات التصميم.

لإلقاء نظرة على سمولفيل ، قام الباحثون بنشر ملف عرض تفاعلي عبر الإنترنت من خلال موقع ويب خاص ، ولكنها “إعادة محسوبة مسبقًا لمحاكاة” موصوفة في الورقة وليست محاكاة في الوقت الفعلي. ومع ذلك ، فإنه يقدم توضيحًا جيدًا لثراء التفاعلات الاجتماعية التي يمكن أن تظهر من عالم افتراضي بسيط ظاهريًا يعمل في صندوق رمل للكمبيوتر.

Ayhan

“معجب بوسائل التواصل الاجتماعي. باحث شغوف بثقافة البوب. محلل. لحم مقدد. عاشق شرير للطعام.”

alshahedonline.net

تحدث أشياء مفاجئة عندما تجمع 25 عميلًا من عملاء الذكاء الاصطناعي معًا في مدينة آر بي جي – Ars Technica

الحياة في سمولفيل

سلوك ناشئ

أكثر إنسانية من الإنسان؟

اترك تعليقاً إلغاء الرد

ناسا تقترب من اتخاذ قرار بشأن ما يجب فعله بمركبة ستارلاينر الفضائية المتعثرة من بوينج

حفل افتتاح أولمبياد باريس 2024: الشعلة الأولمبية تحلق فوق باريس وسط دهشة سيلين ديون للحشود

قامت شركة Capcom بصنع لعبة لا تنتمي إلى عام 2024 وهي رائعة

حريق جاسبر: أحدث خريطة بعد اندلاع حرائق الغابات في حديقة جاسبر الوطنية في ألبرتا