نظریه بازی ها (Game Theory) یک رشته از ریاضیات است که به مطالعه تصمیمگیری در شرایطی که دو یا چند فرد (یا نهاد) با هدف حداکثر کردن منافع شخصی خود در تعامل هستند، میپردازد. در واقع، این نظریه برای تحلیل رفتارها، تصمیمگیریها و اثرات مختلفی که در مواجهه با شرایط تعاملی به وجود میآیند، استفاده میشود. در این مقاله از مجله پی استور درباره نظریه بازی ها و مفاهیم آن صحبت خواهیم کرد.
مقدمه
علوم اجتماعی نظیر علوم سیاسی، اقتصاد، جامعه شناسی و غیره نقش مهم خود در بهبود فرهنگ، کشور داری، سبک زندگی، مدیریت منابع و تخصیص منابع محدود نشان داده اند، حال سوال اینجاست که نظریه بازی ها چه کمکی می تواند به بشریت بکند؟ و اساساً چرا نظریه بازی ها باید مطالعه شود.
مثال ها و شواهد زیادی در زندگی وجود دارد که نشان می دهد انسان در هر لحظه در شرایط بازی قرار دارد. مانند بازی فرزندان با والدین، یک شخص با دوستان و دشمنان، دانشجو با استاد، کارگر و کارفرما، دو همکار و همسایه باهم و غیره. شاید در مواجه با این تعاملات روزانه با دیگران است که هر شخص بهطور شهودی و شعوری، تجربه و تخصیص در انجام بازی را می آموزد.
در نظریه بازی ها مهارت هایی آموخته می شود که به هر شخص کمک می کند تا در شرایط تعاملی با دیگران، که به آن بازی نیز اطلاق می شود، تجربه و تخصص خود را ارتقا بخشد. یادگیری این دانش به فرد کمک میکند تا بفهمد در تعاملات خود با دیگران چگونه عمل کند. به عبارت دیگر هر جان افراد، گروه ها و جوامع باهم در تعاملاند و درصدد تلاش برای حل تعارض ها و ضربه زدن به یکدیگر هستند، مجبور به فراگیری نظریهی بازی نیز هستند.
نظریه بازی ها چیست؟
برای ورود به این بحث بهتر است تعریف خود از بازی را مشخص کنیم. در نگاه عامیانه بازی مترادف با مفاهیمی مانند قمار، شرط بندی، ورزش ها ست و کمتر در حوزه های سیاسی، اقتصادی و روابط کار و غیره مطرح است. در بازی های عامیانه نتایج بازی برد، باخت یا مساوی است. اما آنچه در نظریه بازیها به آن بازی گفته می شود عبارت است از: روابط متقابل که در آن بین تصمیم دو طرف یا بیشتر وابستگی و ارتباط متقابل وجود داشته باشد. به عبارت دیگر هرگاه سود و منافع یک فرد فقط متاثر از تلاش خود نبوده و می تواند تحت تاثیر تصمیمات طرف دیگر باشد، به آن بازی گفته می شود.
مهم ترین نکته در شرایط بازی این است که هر بازیکن قبل از تصمیم گیری باید واکنش دیگران نسبت به تصمیم خود را تجزیه و تحلیل کرده و سپس تصمیم بگیرد که برایش منافع بیشتری داشته باشد.
محیطی که در آن چنین تاثیر و واکنش متقابل میان تصمیمات افراد وجود دارد را محیط استراتژیک می گویند و هریک از تصمیم گیران در این محیط را بازیگر می نامند. فرض اساسی همیشه این است که در محیط استراتژیک بازیکن عاقلانه رفتار می کند و تصمیماتی می گیرد که بیشتر منافع را برایش داشته باشد.
استراتژی نوعی مهارت ذهنی و مغزی برای خوب بازی کردن در یک بازی است. مثلا در یک بازی ورزشی ممکن است یک بازیکن مهارت های فیزیکی خوبی داشته باشد ولی اینکه هر مهارت فیزیکی را در کجا و کی استفاده کند مستلزم یک محاسبه و تفکر است که بر اساس آن بهترین عمل یا عکس العمل را در مقابل حریف انجام دهد. این محاسبات و در نتیجه انتخاب یک عمل را استراتژی می گویند.
تفاوت میان تصمیم گیری و بازی
وقتی فردی در تعامل با دیگری یا دیگران عملی انجام میدهد و میداند این عمل او عکس العملی از سوی طرف مقابل خواهد داشت و در انتخاب عمل خود واکنش طرف مقابل را در نظر میگیرد، در این صورت وارد یک بازی شدهاند. اما تصمیم عبارت است از وضعیتی که در آن فرد عمل یا تصمیمی را اتخاذ میکند بدون اینکه واکنش و عکس العمل طرف مقابل برای او مهم باشد.
دسته بندی بازی ها
بازیها را می توان بر اساس پارامتر های مختلفی دسته بندی کرد.
- همزمان یا متوالی بودن حرکت بازیکنان مثل بازی شطرنج که بازیکنان به نوبت بازی می کنند و یک مزایده که بازیکنان همزمان بازی می کنند.
- بازی های با تعارض منافع یا همکارانه مثل بازی شطرنج که دو بازیکن هیچ همکاری با هم ندارند اما بازیکنان فوتبال در یک تیم با هم همکاری می کنند.
- تعداد دفعات بازی، مثلا یک تعمیرکار از یک مشتری که یکبار به او مراجعه کردن احتمال دارد مبلغ بیشتری مطالبه کند تا مشتری که بارها به او مراجعه کرده.
- تقسیم بندی بازی ها از نظر اطلاعات مثلا در بازی شطرنج دو بازیکن از حالت بازی و پیشینه بازی اطلاعت کاملی دارند اما یک تعمیرکار که اطلاعات بیشتری از مشکل خودرو نسبت به صاحب ماشین دارد انگیزه زیادی برای بزرگ نمایی مشکل خودرو و گرفتن پول داشته باشد.
- ثابت یا متغیر بودن قواعد بازی بطور مثال بازی های ورزشی یک قواعد مشخصی دارند و بازیکنان ملزم به رعایت این قوانین هستند، اما بین والدین و فرزندان، ممکن است قواعدی را تعریف کنند که در شرایط مختلف والدین یا فرزندان آن را تغییر دهند.
موارد استفاده از نظریه بازی ها
توضیح آنچه به صورت بازی بوده و اتفاق افتاده است: بسیاری از وقایع رخ داده و حقایق آشکار شده را می توان از طریق نظریه بازیها تحلیل کرد و ابعاد آن را مورد مورد بررسی قرار داد.
- پیش بینی: از نظریه بازیها میتوان برای پیش بینی نتیجه یک بازی استفاده کرد، حالتی که شکل بازی دارد را می توان از طریق نظریه بازی ها مدلسازی و نتیجه آینده آن را پیش بینی کرد.
- ارائه توصیه: نظریه بازی ها می تواند احتمال وقوع نتایج را محاسبه و توصیه هایی برای وقوع نتایج بهتر ارائه دهد.
نتیجه گیری
نظریه بازی ها یکی از دستاوردهای دانش بشری است که می تواند در بهبود زندگی افراد موثر باشد. بازی عبارت است از: شرایطی که در آن تصمیم هر فرد بر تصمیم فرد دیگری تاثیر بگذارد و تمام افرادی که در آن در آن شرایط قرار دارند به این نکته واقف باشند. لذا همکاری و تعارض می تواند به عنوان یک بازی تلقی شود. نظریه بازی ها علم مطالعه بازی ها ست و می خواهد نشان دهد که وقتی افراد در شرایط یک بازی قرار می گیرند چگونه می توانند تصمیم عاقلانه بگیرند. نظریه بازی ها می خواهد اصول و قواعد تصمیم گیری را در شرایط تعاملی به بازیکنان یک بازی نشان دهد.
از نظریه بازی ها می توان در موارد زیادی استفاده کرد که مهمترین آنها توضیح واقعیت، پیش بینی نتایج و توصیه است و از این طریق می توان راه درست را به بازیکنان یک بازی نشان داد.
سلام و احترام – ببخشید! در مورد ارتباط میان روشهای یادگیری ماشین یا هوش مصنوعی با نظریه بازی ها مطلب می خواستم. ممنون خواهم بود. چون در مورد کاربرد نظریه بازی ها در هوش مصنوعی می خواهم کار کنم.
ارتباط میان روشهای یادگیری ماشین و نظریه بازیها به واسطه اهداف مشترکی که این دو حوزه دارند، بسیار جالب است. هر دو حوزه به دنبال یافتن بهترین تصمیمها یا استراتژیها برای بهینهسازی عملکرد در محیطهایی با تعاملات پیچیده هستند.
پیوندها میان این دو حوزه
بازیهای یادگیری تقویتی (Reinforcement Learning Games): یادگیری تقویتی یکی از روشهای پرکاربرد در یادگیری ماشین است که در آن یک عامل (Agent) در یک محیط عمل میکند و بر اساس بازخورد (پاداش یا تنبیه) یاد میگیرد که بهترین استراتژی یا اقدام چه خواهد بود. این فرایند شباهت زیادی به بازیهای چند نفره در نظریه بازیها دارد، جایی که بازیکنان بر اساس نتیجه اعمال خود و دیگران، استراتژیهای جدیدی انتخاب میکنند.
تعادل نش (Nash Equilibrium): بسیاری از مسائل یادگیری ماشین به دنبال یافتن نقطهای هستند که هیچ عاملی نتواند با تغییر استراتژی خود بهبود بیشتری حاصل کند، که این دقیقا مفهوم تعادل نش در نظریه بازیهاست. در بسیاری از الگوریتمهای یادگیری، از تکنیکهای نظریه بازی برای یافتن چنین تعادلی استفاده میشود.
یادگیری چند عاملی (Multi-Agent Learning): در بسیاری از مسائل دنیای واقعی، چندین عامل (یا سیستم) با هم تعامل دارند و باید به نوعی همکاری یا رقابت کنند. نظریه بازیها به طور طبیعی برای این نوع از تعاملات مناسب است و مدلهای یادگیری چندعاملی از مفاهیم این نظریه بهره میبرند.
کاربردها
مزایدهها (Auctions): در تنظیم مزایدهها و تخصیص منابع، ترکیبی از نظریه بازیها و الگوریتمهای یادگیری ماشین استفاده میشود تا استراتژیهای بهینهای برای شرکتکنندگان و برگزارکنندگان پیدا شود.
شبکههای عصبی و سیستمهای یادگیری خودکار: برخی از مدلهای یادگیری عمیق از مفاهیم نظریه بازیها برای تنظیم وزنها و بهینهسازی استفاده میکنند.
سیستمهای رقابتی مثل بازیهای ویدیویی: مدلسازی رفتار بازیکنان و یادگیری از استراتژیهای آنها با استفاده از هر دو روش نظریه بازیها و یادگیری ماشین انجام میشود.
در مجموع، یادگیری ماشین و نظریه بازیها هر دو به دنبال بهینهسازی تصمیمات در شرایط پیچیده و متعامل هستند و میتوانند به شکلی مؤثر در حل مسائل پیچیده و واقعی مورد استفاده قرار گیرند.
سلام و احترام- سپاس فراوان بابت پاسخ تان! اگر بخواهیم طرح پژوهشی در سطح دکترای ریاضی در مورد” کاربرد نظریه بازی ها در یادگیری ماشین(یا یادگیری عمیق یا در حالت کلان هوش مصنوعی) تعریف کنیم، پیشنهاد شما چیست؟ مراجع مفید و بروز در راین راستا را بیان کنید. ممنونم!
در واقع منظورم از پرسشم این است که نظریه بازی چه مشکلی یا مشکلاتی از یادگیری ماشین را حل می کند که خود آن روشها نمی توانند انجام دهند. در این مورد مثالهای عملی و کاربردی به عنوان مصادیق بیان کنید، ممنون خواهیم بود.
نظریه بازیها در یادگیری ماشین (ML) میتواند در چندین زمینه به بهبود کارایی و حل مشکلاتی که با روشهای سنتی ML قابل حل نیستند، کمک کند. از مهمترین کاربردهای نظریه بازیها در یادگیری ماشین، میتوان به موارد زیر اشاره کرد:
۱. آموزش تقویتی چندعاملی (Multi-agent Reinforcement Learning)
در یادگیری تقویتی سنتی، یک عامل به دنبال یادگیری سیاست بهینه است که بیشترین پاداش را در یک محیط بدست آورد. اما در محیطهای چندعاملی، عوامل مختلف با یکدیگر تعامل دارند و تصمیمگیری یک عامل میتواند روی عملکرد سایرین تأثیر بگذارد. اینجاست که نظریه بازیها میتواند نقش مهمی ایفا کند.
مثال عملی: رباتهایی که در یک محیط مشترک برای انجام وظایف خاص به صورت همکاری یا رقابت عمل میکنند. بهطور مثال، در بازیهای ویدئویی که چندین بازیکن (عاملها) با هم درگیر هستند، میتوان از نظریه بازیها برای مدلسازی تعاملات بازیکنان و یافتن استراتژیهای بهینه استفاده کرد.
۲. رقابتهای تقابلی در یادگیری ماشین تقویتی (Adversarial Learning)
نظریه بازیها میتواند در یادگیری تقابلی که در آن یک مدل تلاش میکند در برابر تقلب و تغییرات در دادهها مقاوم بماند، کمک کند. به عنوان مثال، شبکههای مولد خصمانه (GAN) یک کاربرد مشهور از نظریه بازیها هستند که در آن یک مولد و یک تفکیککننده به رقابت با یکدیگر میپردازند. مولد سعی میکند دادههای واقعی تولید کند و تفکیککننده تلاش میکند بین دادههای واقعی و جعلی تفاوت قائل شود.
مثال عملی: شبکههای مولد خصمانه (GAN) در تولید تصاویر با وضوح بالا یا تغییر سبک تصاویر استفاده میشوند. مثلاً میتوان از آنها برای تولید تصاویر جعلی واقعی یا بهبود کیفیت تصاویر استفاده کرد. کاربرد عملی این روش در هنرهای دیجیتال، پزشکی (تولید تصاویر پزشکی) و بازیهای ویدئویی است.
۳. تعادل Nash در یادگیری و تصمیمگیری
نظریه بازیها میتواند به یافتن نقطه تعادل (تعادل Nash) در مسائل یادگیری کمک کند. این نوع تعادل در محیطهایی که چندین عامل تصمیمگیرنده حضور دارند و تعاملات متقابل آنها نتایج تصمیمگیری را تغییر میدهد، بسیار مفید است.
مثال عملی: در مدیریت شبکههای توزیعشده مثل شبکههای بیسیم، میتوان از تعادل Nash برای بهینهسازی تخصیص منابع استفاده کرد. هر دستگاه در این شبکهها تصمیمگیری میکند که چه مقدار از منابع استفاده کند و تعاملات بین آنها در تصمیمگیری بهینه نقش دارد.
۴. مزایدههای الگوریتمی (Algorithmic Auctions)
در مسائل مزایده و تعیین قیمتها، نظریه بازیها به یافتن بهترین استراتژی برای مشارکتکنندگان در مزایده کمک میکند. الگوریتمهای مزایدهای مبتنی بر نظریه بازیها میتوانند در مسائلی مثل تبلیغات آنلاین و فروش منابع محاسباتی مورد استفاده قرار گیرند.
مثال عملی: سیستمهای تبلیغاتی مانند گوگل اَدز از مزایدههای الگوریتمی برای انتخاب تبلیغات برتر استفاده میکنند. در این سیستمها تبلیغکنندگان برای جایگاههای تبلیغاتی رقابت میکنند و الگوریتم مبتنی بر نظریه بازیها، بر اساس پیشنهادها بهترین تصمیمگیری را انجام میدهد.
۵. مدلسازی همکاری و رقابت در یادگیری تیمی
نظریه بازیها میتواند در مدلسازی شرایطی که عوامل باید به صورت تیمی برای حل یک مسئله با هم همکاری کنند و یا در برخی شرایط با یکدیگر رقابت کنند، کمک کند. این نوع همکاری و رقابت میتواند در یادگیری ماشین به بهبود عملکرد مدلهای پیچیده کمک کند.
مثال عملی: در تیمهای رباتیک که باید با یکدیگر همکاری کنند تا به یک هدف مشترک دست یابند، از نظریه بازیها برای طراحی استراتژیهای بهینه و تقسیم وظایف بین اعضای تیم استفاده میشود.