نظریه بازی پیشگیرانه
ترجمه : فائزه تقدسی
چکیده: نظریه بازی در انواع متفاوتی از زمینهها چه در داخل و خارج از علوم اجتماعی استفاده میشود. روششناسی استاندارد این است که توصیف بازی را یادداشت کرده و NASH و SUBGAME آن را مشخص کند، این توصیف نمایش خوبی از رفتار مشاهدهشده است. هدف تئوری بازی پیشبینی و توسعه مدلهایی است که رفتار واقعی آنها در حوزه و آزمایشگاه بهتر میتوان پیشبینی کرد. سؤالات اصلی عبارتاند از: چه چیزی رفتار مردم را برای اولین بار که یک بازی ناشناخته را بازی میکنند مشخص میکند؟
چگونه مردم بازی را بر اساس مشاهدات خود بهروز میکنند؟
چه نوع «نظریه ذهن»، معمولاً برای هدایت بازی استفاده میشود و مردم درباره هدف و عقلانیت مخالفان خود چه فکری میکنند؟ مردم درباره بازیها به راهحلهای بسیار زیادی فکر میکنند - چه نوع اقدامی در این کار دخیل است؟ چه زمانی میتواند شبیه به یک بازی تعادلی باشد و کدام تعادل ظاهر خواهد شد؟ بهطور مشابه، در یک بازار غیرمتمرکز، چه زمانی با یک نتیجه پایدار همگرا میشود؟
برای توسعه پاسخها، محققان باید بینشهایی را از اقتصاد رفتاری ترکیب کنند.
- اهمیت تحقیق-روش تحقیق
روش استاندارد در کاربرد نظریه بازیها, نوشتن توصیفی از بازی و توصیف تعادل NASH یا SUBGAME است.
این نقطه شروع خوبی برای تحلیل نظریه بازیها بود و تعدادی از بینشهای کیفی را ارائه کرده که در برخی موارد, تقریب خوبی از رفتار مشاهدهشده را ارائه میدهد, اما در بسیاری دیگر, بسیار مبهم است که مفید یا دقیق باشد, اما در مورد اینکه چگونه بازیها واقعاً بازیکن هستند. با افزایش کاربرد نظریه بازی در زمینههای مختلف درون و خارج از علوم اجتماعی, زمان آن رسیده است که فراتر از تحلیل تعادل پیش برویم تا پیشبینیهای دقیقتر از رفتار در مزرعه و در آزمایشگاه انجام دهیم. در حال حاضر, برخی گامهای آزمایشی برای این هدف, از جهات مختلف, وجود داشته است; چالش گستراندن و شاید یکپارچه کردن این ابتکار برای ایجاد یک نظریه پیشبینی کننده بسیار منسجم است. تحلیل تعادل قسمت کلیدی این برنامه، جهت توسعه بیشتر و توجیه تطبیقی برای تعادل است که این تعادل ناشی از نتیجه طولانیمدت یک فرآیند غیر تعادلی یادگیری یا تکامل است. کار موجود بر روی قوانین یادگیری که قابلیت رام شدن است، تمرکز کرده است که حاوی بینش کیفی در مورد پیامدهای بلندمدت هستند.
اکنون پژوهشگران باید قواعد یادگیری را در نظر بگیرند که بهطور دقیقتر توضیح دهند که چگونه سوژهها با توجه به مشاهدات خود، بازی خود را بهروز میکنند. یک احتمال این است که محدودیتهای شناختی مختلفی را در یادگیری وجود داشته باشد که در مشکلات تصمیمگیری مشاهدهشده است، مانند استفاده از مقولههای زبر، اشتباهات در محاسبه احتمالات و غیره. همچنین، موضوعات مربوط به انطباق و یادگیری در بازیهای گسترده، باید فراتر از رویکرد منطقی برای انجام آزمایشها باشد، با توجه به دلایل دیگری که ممکن است نتایج یک اقدام بهظاهر نامناسب را مورد آزمایش قرار دهند. راههای دیگر برای بهبود عملکرد افزودن الگوهای صریح نظریههای ذهن است - باورها در مورد اینکه چگونه موضوعات دیگر در مورد بازی فکر میکنند - و ادغام «ترجیحات اجتماعی» به نظریه یادگیری غیر تعادلی: حتی زمانی که توابع سود پولی در آزمایشگاه به دانش عمومی تبدیل میشوند. اهداف یک عامل ممکن است منعکسکننده چنین نگرانیهایی بهعنوان نوعدوستی، انصاف و یا علیرغم آن باشد و گستره چنین ترجیحات اجتماعی بهندرت اطلاعات عمومی محسوب میشود.
چند مورد نگرانی از موضوعات؟ چگونه پرسشنامه نظرسنجی پس از بازی با اولویتهای اجتماعی ارتباط دارد (در بین سوژهها و در میان حجم زیاد از موضوعات)؟ علاوه بر این، پژوهشگران باید به تکمیل نتایج یا رفتار جانبی نتایج بر روی نرخ همگرایی و همچنین نتایجی که در محیطهای آزمایشگاهی اعمال میشوند که در آن سوژهها معمولاً ده و حداکثر پنجاهوسه بازی را تکرار میکنند، تکمیل شوند. در یک بازی گسترده، حتی بازیکنان باتجربه ممکن است یاد نگرفته باشند که چگونه مخالفانی که به اقداماتی واکنش میدهند بهندرت مورداستفاده قرارگرفتهاند. علاوه بر این، در بسیاری از موارد در آزمایشگاه، عوامل تجربه کافی برای یادگیری حتی مسیر بازی را ندارند، بهطوریکه باورها و نگرشهای اولیهشان میتواند نقش بزرگی در تعیین آنچه در افق مرتبط مشاهده میشود ایفا کند. این مربوط به مؤلفه کلیدی دوم در برنامه، توسعه بیشتر مدلهای سلسلهمراتب شناختی و تفکر سطح k است. که برای شرح نتیجه، برای بار اول افراد یک بازی ناآشنا را بازی میکنند، بهعنوان «باورهای بازیکنان» در مورد بازی عوامل سطح ۰ بهطور ساده بازی میکنند.
کار ابتدایی بر روی بازیهای دارای ماتریس ساده متمرکز است و فرض میشود که عوامل سطح - ۰ به هر دستور احتمال برابری میدهند، اما متناسب کردن این مدلها با بازیهای پیچیدهتر نیاز به تغییرات تک منظوره در سطح صفر دارند و هنگامیکه همه توزیعها بر روی بازی سطح ۰ مجاز هستند اجازه میدهند که نظریه دارای محتوای پیشگویانه باشد؛ بنابراین، مدلهای سلسلهمراتب شناختی باید با روش پیشینی برای تعیین بازی ۰ - ۰ که اولویتهای اجتماعی را در نظر میگیرند، کامل شوند. ما همچنین به یک نظریه درباره اینکه چگونه این باورها در پرتو مشاهدات بهروز میشوند و آنچه درنتیجه بازی خواهد آمد، نیاز داریم که بهخصوص برای استفاده از این تکنیک مهم است.
ب) تعداد زیادی از بازیها تعادل چندگانه دارند، حتی زمانی که به مفاهیم راهحل استاندارد محدود میشوند و به بازیکنان اجازه میدهد تا باورهای اشتباهی از مسیر را داشته باشند ( مانند تعادل خود - تائید ) تنها مجموعه تعادل را بزرگتر میکند . بااینحال هیچ راهحل عمومی و تجربی برای انتخاب بین آنها وجود ندارد . پیش از آن یک ادبیات نظری بزرگ وجود دارد که بحثهای تکاملی / تطبیقی را برای اینکه چرا باید همکاری در بازیهای تکراری رعایت شود وجود دارد، اما تئوریهای موجود یک مسابقه ضعیف برای دادهها از تجربیات آزمایشگاهی هستند : به نظر میرسد که وقتی دستاوردهای همکاری به حد کافی زیاد هستند، اما در برخی از تنظیماتی که تعادل مشارکت دارند، همکاری نمیکنند . بنابراین زمانی که سؤال تحقیق بهطور تجربی مشخص میشود که همکاری چه زمانی رخ میدهد ( عملکرد بازدهی متفاوت، چه موضوعاتی در مورد موضوعات دیگر وجود دارند و غیره ) و سپس یافتهها را به روشی سازماندهی میکنند که پیشبینیهای قابلآزمایش را میسازد. همچنین یک تاریخچه نظری قابلتوجه در " تعادل " و یک تاریخچه با استفاده از ثبات تصادفی برای انتخاب تعادل وجود دارد. ادبیات تجربی که بر روی موارد خاص بازیهای هماهنگ و بازیهای سیگنال متمرکزشده است، یک ویژگی تجربی رفتار است که بهعنوان محدودیت در تئوری انتخاب تعادل عمل میکند.
C. پیادهسازی درخت و تشابه
چگونه افراد تعاملات استراتژیک پیچیده را ساده میکنند - به کلاسها و توابع به همان اندازه نگریسته میشوند و کدامیک کنار گذاشته میشوند؟ چگونه افراد از تجربه گذشته تا یک بازی برای بازی در یک فیلم مشابه برونیابی کنند و چه نوع بازیهایی بهصورت ارتباط در نظر گرفته میشوند؟ ایدههای علوم کامپیوتر و نیز روانشناسی ممکن است در اینجا مفید باشند: محاسبه مجموعه تعادل نش از بازیهای بزرگ دلخواه، پیچیده است، اما برخی از کلاسها نمایش مختصر و مقرونبهصرفهای دارند که به پیچیدگی زمانی چند جملهای کمک میکنند. این ایدهها ممکن است اجازه برآورد کارآمدتر از قوانین رفتاری در محیطهای اقتصادی پیچیده را بدهند، چراکه قوانین رفتاری مبتنی بر مدلهای سادهشده این عوامل برخلاف خود محیط هستند.
D. تئوری تطبیقی
نظریه تطبیق کلاسیک مبتنی بر ایده یک مسابقه پایدار است، اما پایداری تقریب خوبی از نتایج آزمایشگاهی بر روی تطبیق غیرمتمرکز نیست، بهجز در بازارهای بسیار کوچک با یک نتیجه پایدار و منحصربهفرد. هنگامیکه چندین پیامد پایدار وجود دارد، تحلیل بازارهای غیرمتمرکز شباهتهای زیادی میان آنالیز تعادل ایجاد میکند و پرسشهای مشابهی را مطرح میکند: چه زمانی یک نتیجه پایدار به وجود خواهد آمد و چه زمانی اتفاق میافتد؟
E. اعتبارسنجی تجربی
کار بر روی نظریه بازی پیشگویانه باید بر روی دادههای آزمایشگاهی و میدانی تنظیم شود و در بسیاری از موارد با آنالیز دادههای آشکار همراه خواهد بود. قواعد یادگیری فردی برای شناسایی از دادههای آزمایشگاهی بسیار دشوار است، بنابراین تمرکز، نتایج کلی یک جمعیت از عاملهای توزیع قواعد است. یک احتمال دیگر استفاده از نظرسنجیهای خروج و باور به بازی در بازی است. یک چالش در استفاده از دادههای میدانی این است که روش استاندارد شکلی از تعادل کامل را بهعنوان شرط شناسایی برای تخمین پارامترهای مدل وضع میکند. کار اخیر توسط Fershtman و Pakes این مسئله را رها کرد و به بازیکنان اجازه داد تا باورهای نادرست خود را جوری حفظ کنند که با مشاهدات خودسازگار باشند. چالشهای موجود در اینجا ( ۱ ) به لحاظ نظری انواع تعادل را تشخیص میدهند که الگوریتم آنها تمایل دارد انتخاب کند، ( ۲ ) تست اگر انتخاب موازنه ضمنی در طول زمان ثابت باشد و ( ۳ ) یک روش تست را توسعه دهد اگر فرض تعادل معتبر باشد یا اگر بازیکنان مسیر بازی را نیاموخته باشند. چالش دیگر مطالعه سازگاری غیر تعادلی و یادگیری در دادههای میدانی است؛ که میتواند با اجرای آزمایشها میدانی بر روی اینترنت، چه بر روی سایتهای آزمایشگاه و چه در موارد تجاری، آسان در نظر گرفته شود. علاوه بر این، موج کنونی آزمایشها میدانی مبتنی بر اینترنت از یک بیس در نظریه یادگیری - بهرهمند خواهد شد.
- مفاهیم ضمنی
بهترین تئوری این است که دانش آموزان از این حوزههای کاربردی بیشتر غفلت کنند. این برنامه همچنین از یک برنامه جدید برای خوشههای آزمایشگاهی نسبت به درخت z، با یک رابط بصری بیشتر سود خواهد برد. هر دو مؤلفه تجربی و آزمایشگاهی از پیشرفتها در تئوری بازی محاسباتی سود خواهند برد - این ادبیات باید به بهبود روشها برای محاسبه تعادل نش یا تعادل کامل در بازیهای مربوط به اقتصادی ادامه دهد، اما همچنین باید مشکلات محاسبه و برآورد مفاهیم تعادل را که امکان منحرف کردن باورهای غلط و / یا خطاهای شناختی و شبیهسازی و برآورد دینامیکهای غیر تعادلی را فراهم میکند را نیز در نظر بگیرد.
- چه کسی تحقیقات محرک انجام میدهد؟
هدف بسیار ناقص بعدی، ارائه درکی از این دامنه در دستور کار است؛ هدف این نیست که جامع و یا حتی یک راهنما باشد و نشانگر قابلیت دسترسی مؤلف باشد. این سخنان حاکی از آن است که Camerer، Costas، Miguel Costas، وینس کرافورد، Rosemarie Nagel و دیل استال در حال هدایت موج بر روی سلسلهمراتب شناختی هستند و Falk، Fehr و Simon Gachter در حال مطالعه تجربی اولویتهای اجتماعی هستند. Dal، Dreber، Guillaume Frechette و دیو رند درزمینهٔ همکاری در بازیها پیدرپی تلاش میکنند؛ Schotter استفاده محرکی از استنباط اعتقادی بازی را برانگیخته است. Esponda، Jehiel و دیوید کی لوین رهبران در مطالعه فرآیندهای انطباقی در بازیهای شکلی گسترده و انواع نتایج تعادل نش است که حتی زمانی که بازیکنان تجربه زیادی با بازی داشته باشند، میتواند ادامه پیدا کند. Benaim، hofbauer و Sylvain sorin در ریاضیات سیستمهای دینامیکی به پیشرفتهای مهمی دستیافتهاند و آنها را به دینامیکهای غیر تعادلی وارد میکنند. بسیاری از مردم در خصوص محدودیتهای شناختی در مشکلات تصمیمگیری، ازجمله Freixas، Laibson، sendhil Mullinaithan و مت رابین فعالیت میکنند، اما این کار تاکنون برای یادگیری دربازیها اعمالشده است. Konstaninos Daskalakis و tuomas Sandholm نظریهپردازان بازی الگوریتمی مهیج با توجه به مشکلات اقتصادی هستند. فدریکو Echinique، Niederle و Leeat Yariv در حال مطالعه تطبیق غیرمتمرکز در آزمایشگاه هستند. تیم سالمون و Nathaniel از پیشگامان قواعد یادگیری آزمایشگاهی هستند.Chaim Fershtman و Pakes روشهای تخمین برای دادههای میدانی هستند که امکان منحرف کردن باورهای نادرست مسیر را فراهم میکنند. Stengel رهبر نظریه بازی رایانهای است و Shamma از پیشگامان ادبیات کنترل فیدبک و پیشگام برای مطالعه یادگیری در بازیها است.