درس هوش مصنوعی چیست؟ — سر فصل‌های مهم هوش مصنوعی

سر فصل‌های درس هوش مصنوعی

در این مقاله قصد داریم در مورد درس هوش مصنوعی چیست؟ صحبت کنیم. درس هوش مصنوعی به بررسی مفاهیم، الگوریتم‌ها و تکنیک‌های کلیدی در این زمینه می‌پردازد. از جمله مباحث مهم در این درس می‌توان به یادگیری ماشین، شبکه‌های عصبی، پردازش زبان طبیعی و رباتیک اشاره کرد. هدف از این درس، آشنایی دانشجویان با اصول و مبانی هوش مصنوعی و آماده‌سازی آن‌ها برای کاربرد این دانش در حل مسائل واقعی است. برای کسب اطلاعات بیشتر در این زمینه می‌توانید از مجله پی‌استور استفاده کنید.

فهرست مطالب این نوشته پنهان

سر فصل‌های هوش مصنوعی

هوش مصنوعی «AI» حوزه‌ای گسترده و چندوجهی است که شامل مباحث مختلفی از جمله یادگیری ماشین «Machine Learning»، یادگیری عمیق «Deep Learning»، پردازش زبان طبیعی «Natural Language Processing»، بینایی ماشین «Computer Vision»، رباتیک و سیستم‌های خبره می‌شود. این حوزه‌ها به طور فزآینده‌ای در حال هم‌پوشانی و تکامل هستند و کاربردهای متنوعی در علوم مختلف و زندگی روزمره پیدا می‌کنند. در ادامه به سرفصل‌های هوش مصنوعی می‌پردازیم:

تاریخچه هوش مصنوعی

هوش مصنوعی «Artificial Intelligence» تاریخچه‌ای غنی دارد که به اواسط قرن بیستم بازمی‌گردد، زمانی که پیشگامانی مانند آلن تورینگ، جان مک‌کارتی، ماروین مینسکی و کلود شانون، مفاهیم بنیادی مانند شبکه‌های عصبی مصنوعی، یادگیری ماشینی و استدلال نمادین را مورد بررسی قرار دادند. در طول سال‌ها، تحقیقات هوش مصنوعی دوره‌های فراز و نشیب را پشت سر گذاشته است، از جمله زمستان هوش مصنوعی در دهه‌های ۱۹۷۰ و ۱۹۸۰، و احیای بعدی الگوریتم‌های یادگیری ماشینی در دهه ۱۹۹۰. در سال‌های اخیر، الگوریتم‌های یادگیری عمیق به کامپیوترها امکان پردازش و تفسیر داده‌های پیچیده را داده‌اند و منجر به پیشرفت‌های چشمگیری در حوزه‌هایی مانند پردازش زبان طبیعی و بینایی کامپیوتری شده‌اند.

اتحادیه اروپا (EU) نیز اهمیت اخلاق در هوش مصنوعی را تشخیص داده و مهلت ۲۰۲۴ را برای شرکت‌ها تعیین کرده است تا با مقررات جدید هوش مصنوعی مطابقت داشته باشند. در سال ۲۰۲۲، انتشار ChatGPT، یک مدل زبانی بزرگ که توسط OpenAI آموزش داده شده است، پتانسیل عظیم هوش مصنوعی را برای تغییر روش‌های ارتباط و تعامل ما با ماشین‌ها نشان داد. در سال‌های آینده، بسیاری از مدل‌ها مانند مدل‌هایی که توسط OpenAI آموزش داده شده‌اند، در سیستم‌های بیشتری مانند نرم‌افزارهای پردازش متن، موتورهای جستجو و موارد دیگر ادغام خواهند شد.

تصویری در مورد روند تاریخچه هوش مصنوعی

هوش مصنوعی چیست؟

هوش مصنوعی «Artificial Intelligence» معمولاً به عنوان سیستم‌های کامپیوتری تعریف می‌شود که تفکر و قابلیت‌های انسانی مانند یادگیری را شبیه‌سازی می‌کنند. هوش مصنوعی مدرن از دسته‌های مختلفی از سیستم‌ها تشکیل شده است که هر کدام تخصص‌های منحصربه‌فرد خود را دارند. با توجه به انواع متعدد و متنوع کاربردهای هوش مصنوعی، منطقی است که دسته‌های خاص‌تری در طول زمان توسعه یافته‌اند. گسترده‌ترین تقسیم‌بندی هوش مصنوعی، بین هوش مصنوعی محدود (تمام سیستم‌های هوش مصنوعی فعلی) و هوش مصنوعی عمومی (تمام سیستم‌های هوش مصنوعی بالقوه آینده) است.

تصویری در مورد هوش مصنوعی

هوش مصنوعی ضعیف

این ابزارها که با نام هوش مصنوعی «محدود» نیز شناخته می‌شوند، یک عملکرد واحد و اغلب ساده و محدود را انجام می‌دهند که به یک کار روتین کمک می‌کند. نمونه‌ها شامل دستیار دیجیتالی است که می‌تواند مجموعه‌ای از مراحل را خودکار کند و نرم‌افزاری که داده‌ها را برای ارائه توصیه‌ها تجزیه و تحلیل می‌کند. این ابزارها معمولاً به یک فرد نیاز دارند تا کار یا مجموعه‌ای از کارها را تنظیم کند و همچنین به یک فرد نیاز دارند تا بر اساس اطلاعات ارائه شده توسط هوش مصنوعی، اقدامی انجام دهد.

هوش مصنوعی قوی

هوش مصنوعی قوی گاهی اوقات به عنوان هوش مصنوعی «عمومی» شناخته می‌شود. این دسته از هوش مصنوعی در حال حاضر وجود ندارد، زیرا هر ابزار هوش مصنوعی مدرن به نوعی همکاری یا نگهداری انسانی نیاز دارد. با این حال، بسیاری از توسعه‌دهندگان به بهبود قابلیت‌های سیستم‌های خود ادامه می‌دهند تا به سطحی از اثربخشی برسند که به مداخله انسانی کمتری در فرآیند یادگیری ماشینی نیاز داشته باشد.

معرفی عامل های هوشمند

یک عامل هوشمند، یک موجودیت نرم‌افزاری است که به طور خودکار عمل می‌کند و با محیط اطراف خود تعامل دارد. این عامل می‌توانند اطلاعات را جمع‌آوری کنند، وظایف را اجرا کنند و با محیط اطراف خود تعامل داشته باشند. این عامل می‌توانند در زمینه‌های مختلفی از جمله مراقبت‌های بهداشتی مورد استفاده قرار گیرند.

تصویر در مورد عامل های هوشمند که تصویر گویای عنوان است

عامل هوشمند چیست؟

چیزی که یک اثر ایجاد می‌کند یا قادر به تولید اثر است: یک علت فعال یا کارآمد؛ یک وسیله یا ابزار که از طریق آن یک هوش هدایت‌کننده به یک نتیجه می‌رسد؛ کسی که مجاز به عمل کردن به جای دیگری یا برای دیگری است.

در تعریف قبلی عامل هوشمند، استقلال عمل به توانایی عمل کردن بدون مداخله انسانی اشاره دارد. مفهوم سیستم‌های مبتنی بر عامل توسط مک‌کارتی به عنوان سیستم‌هایی توسعه یافت که می‌توانند جزئیات عملیات مناسب کامپیوتری را انجام دهند و در صورت نیاز می‌توانند درخواست و دریافت مشاوره را به زبان انسانی داشته باشند. یک عامل، یک “ربات نرم” خواهد بود که در دنیای کامپیوتر زندگی و کار می‌کند. اصطلاحات عامل، عامل نرم‌افزاری و عامل هوشمند اغلب در سیستم‌های اطلاعاتی فعلی و ادبیات علوم کامپیوتر به جای یکدیگر استفاده می‌شوند. با این حال، شایان ذکر است که همه عامل نیازی به هوشمند بودن ندارند. عامل باید دارای ویژگی‌های زیر باشند:

  • از محیط خود آگاه باشند و به تغییرات آن پاسخگو باشند.
  • به فرصت‌ها در محیط خود واکنش نشان دهند و فعال باشند.
  • در رفتار هدفمند خود مختار باشند.
  • در توانایی خود برای تعامل با سایر عامل در نمایش رفتار هدفمند، همکاری داشته باشند.
  • در توانایی خود برای یادگیری با تجربه سازگار شوند.

ویژگی‌های عامل هوشمند

  • واکنش‌گرا: به تغییرات در محیط پاسخ می‌دهد.
  • فعال (Proactive): به دنبال فرصت‌ها در محیط است.
  • مختار: رفتار هدف‌گرا دارد.
  • همکار: قادر به تعامل با سایر عامل برای رسیدن به اهداف است.
  • انطباقی: قادر به یادگیری و بهبود بر اساس تجربه است.

جست وجوی ناآگاهانه (Uninformed Search)

جست و جوی ناآگاهانه یکی از رویکردهای اساسی در الگوریتم‌های جست و جوی هوش مصنوعی است. این نوع جستجو در آن اطلاعات در مورد مسیر به مقصد یا هزینه حرکت به مقصد وجود ندارد. بنابراین، الگوریتم‌ها مجبور به بررسی تمام گره‌ها می‌شوند و با بررسی گره‌های اطراف، به گره‌های بیشتر دست می‌یابند تا نهایتاً به هدف برسند.

تصویری جذاب در مورد جست وجوی ناآگاهانه

ویژگی‌های جست و جوی ناآگاهانه

  • عدم وجود اطلاعات در مورد مسیر به مقصد
  • عدم وجود اطلاعات در مورد هزینه حرکت به مقصد
  • بررسی تمام گره‌ها به صورت یک‌در‌یک

جستجوها مرتبط با جستجو ناآگاهانه

  1. جست و جوی اول‐سطح (BFS)
  2. جست و جوی اول‐عمق (DFS)
  3. جست و جوی هزینه یکنواخت

۱- جستجو اول سطح (BFS)

جستجوی اول سطح (BFS) یک الگوریتم جستجو است که به صورت سطحی و از گره‌های نزدیک‌تر به گرهٔ شروع، به سمت گره‌های دورتر حرکت می‌کند و تمام گره‌های هم‌سطح را قبل از رفتن به سطح بعدی بررسی می‌کند. این الگوریتم برای گراف‌های ثابت و با ساختار دایره‌ای مناسب است، زیرا در این ساختار، تمام گره‌ها در یک سطح هستند و جستجوی سطحی حداکثر عمق را در یک گام بررسی می‌کند.

تصویر در مورد جستجو اول سطح است که در تصویر روند جستجو دیده می شود.

۲- جستجوی اول عمق (DFS)

جستجوی اول عمق (DFS) یک الگوریتم جستجو است که به صورت عمقی و از یک مسیر خاص تا رسیدن به یک بن‌بست یا هدف پیش می‌رود و سپس به عقب برمی‌گردد تا مسیرهای دیگر را امتحان کند. این الگوریتم برای گراف‌های پیچیده و با ساختار لانه زنبوری مناسب است، زیرا در این ساختار، گره‌ها به صورت لانه زنبوری درآمده و جستجوی عمق در یک مسیر خاص، به سراغ گره‌هایی می‌رود که تا آن موقع به آن‌ها نرسیده است.

تصویری در مورد جستجوی اول عمق است که در تصویر در روند اجرای جستجو نشان داده می‌شود.

۳- جستجوی هزینه یکنواخت (UCS)

جستجوی هزینه یکنواخت (UCS) یک الگوریتم جستجو است که بر اساس هزینهٔ مسیر طی شده از گرهٔ شروع تا گرهٔ فعلی، اولویت‌بندی می‌کند و گره‌ای با کمترین هزینه را برای گسترش انتخاب می‌کند. این الگوریتم برای گراف‌هایی که هزینهٔ سفر بین گره‌ها معلوم است و هدف پیدا کردن مسیر با کمترین هزینه است، مناسب است.

تصویری جذاب در مورد جستجوی هزینه یکنواخت که در تصویر روند اجرای جستجو دیده می‌شود.

جست‌وجوی آگاهانه (Informed Search)

جست‌وجوی آگاهانه به مجموعه روش‌هایی گفته می‌شود که در آن‌ها، برخلاف جست‌وجوهای ناآگاهانه، از اطلاعات مربوط به مسئله برای هدایت فرآیند جست‌وجو استفاده می‌شود. این اطلاعات معمولاً در قالب یک تابع ابتکاری (heuristic function) ارائه می‌شوند که تخمینی از هزینه رسیدن به هدف از یک گره خاص را ارائه می‌دهد. هدف اصلی از استفاده از جست‌وجوی آگاهانه، کاهش فضای جست‌وجو و افزایش سرعت رسیدن به راه‌حل است.

تصویری جذاب از روند اجرای جست‌وجوی آگاهانه

ویژگی جستجوی آگاهانه

  • استفاده از اطلاعات مسئله
  • استفاده از توابع ابتکاری (Heuristics)
  • بهینه‌سازی عملکرد
  • انعطاف‌پذیری

جستجوها مرتبط با جستجو آگاهانه

  1. توابع ابتکاری قابل قبول (admissible ) و سازگار (consistent)
  2. جست‌وجوی اول بهترین حریصانه (search first best greedy)
  3. الگوریتم *A و اثبات بهینگی
  4. خودکارسازی تولید توابع ابتکاری

۱- توابع ابتکاری قابل قبول (Admissible Heuristics) و سازگار (Consistent Heuristics)

توابع ابتکاری قابل قبول، توابعی هستند که هیچ‌گاه هزینه واقعی رسیدن به هدف را بیش از مقدار واقعی تخمین نمی‌زنند. این ویژگی برای تضمین بهینگی الگوریتم‌هایی مانند A* بسیار مهم است. توابع ابتکاری سازگار، علاوه بر قابل قبول بودن، شرط سازگاری را نیز برآورده می‌کنند، به این معنی که تخمین هزینه از یک گره به گره بعدی نباید بیشتر از هزینه واقعی حرکت از آن گره به گره بعدی به اضافه تخمین هزینه از گره بعدی به هدف باشد. این شرط، به جلوگیری از بازگشت به مسیرهای قبلی و بهبود کارایی جست‌وجو کمک می‌کند.

۲- جست‌وجوی اول بهترین حریصانه (Greedy Best-First Search)

جست‌وجوی اول بهترین حریصانه یک الگوریتم جست‌وجو است که همیشه گره‌ای را برای گسترش انتخاب می‌کند که به نظر می‌رسد نزدیک‌ترین گره به هدف است. این الگوریتم تنها از تابع ابتکاری برای ارزیابی گره‌ها استفاده می‌کند و هزینه مسیر طی‌شده تا آن گره را در نظر نمی‌گیرد. اگرچه این روش ممکن است سریع باشد، اما لزوماً به راه‌حل بهینه نمی‌رسد و ممکن است در بهینه‌های محلی گیر کند.

تصویری جذاب از روند اجرای جست‌وجوی اول بهترین حریصانه .

۳- الگوریتم *A و اثبات بهینگی

الگوریتم *A یک الگوریتم جست‌وجو است که با ترکیب هزینه مسیر طی‌شده تا یک گره g(n) و تخمین ابتکاری هزینه باقیمانده تا هدف h(n)، بهترین گره را برای گسترش انتخاب می‌کند. تابع ارزیابی در این الگوریتم به صورت f(n) = g(n) + h(n) تعریف می‌شود. اگر تابع ابتکاری مورد استفاده در A* قابل قبول باشد، الگوریتم تضمین می‌کند که به راه‌حل بهینه می‌رسد. اثبات بهینگی A* بر این اصل استوار است که الگوریتم هیچ‌گاه یک گره را با هزینه f بالاتر از هزینه راه‌حل بهینه گسترش نخواهد داد.

تصویری از الگوریتم A*

۴- خودکارسازی تولید توابع ابتکاری

خودکارسازی تولید توابع ابتکاری به فرآیندی گفته می‌شود که در آن توابع ابتکاری به صورت خودکار و بدون دخالت مستقیم انسان تولید می‌شوند. این کار می‌تواند از طریق روش‌های مختلفی مانند یادگیری ماشین، الگوریتم‌های تکاملی و استفاده از اطلاعات مربوط به ساختار مسئله انجام شود. هدف از خودکارسازی تولید توابع ابتکاری، کاهش زمان و تلاش مورد نیاز برای طراحی توابع ابتکاری مناسب و بهبود عملکرد الگوریتم‌های جست‌وجو است.

جستجوی محلی (Local Search)

جستجوی محلی «Local Search» یک روش فرا ابتکاری «Metaheuristic» برای حل مسائل بهینه‌سازی است که به جای بررسی کل فضای جستجو، فقط همسایگی راه‌حل فعلی را کاوش می‌کند. این روش به طور معمول از یک راه‌حل اولیه آغاز می‌شود و به طور تکراری به راه‌حل‌های همسایه (راه حل‌هایی که با تغییرات کوچکی در راه‌حل فعلی ایجاد می‌شوند) حرکت می‌کند، تا زمانی که راه‌حلی بهتر یا راه‌حلی که شرایط پایانی را برآورده کند، پیدا شود. از آنجایی که فضای جستجو به طور کامل کاوش نمی‌شود، تضمینی برای یافتن راه‌حل بهینه جهانی وجود ندارد، اما جستجوی محلی اغلب راه‌حل‌های خوبی را در زمان محاسباتی معقول پیدا می‌کند، به‌خصوص برای مسائل پیچیده با فضای جستجوی بسیار بزرگ.

تصویری جذاب و عالی از جستجوی محلی.

سه الگوریتم مرتبط با جستجوی محلی عبارتند از:

۱-  الگوریتم تپه نوردی (Hill Climbing)

این الگوریتم ساده‌ترین نوع جستجوی محلی است. در هر مرحله، الگوریتم همسایه‌های راه‌حل فعلی را بررسی می‌کند و به راه‌حلی که مقدار تابع هدف را بهبود می‌بخشد، حرکت می‌کند. این فرایند تا زمانی که به راه‌حلی برسد که هیچ همسایه‌ای با مقدار تابع هدف بهتر نداشته باشد، ادامه می‌یابد. محدودیت اصلی این الگوریتم گیر افتادن در بهینه‌ی محلی «Local Optimum» است. یعنی ممکن است الگوریتم در راه‌حلی گیر کند که بهتر از همسایگانش است، اما از راه‌حل بهینه‌ی جهانی فاصله دارد.

تصویری جذاب از الگوریتم تپه نوردی .

۲- الگوریتم شبیه‌سازی تبرید (Simulated Annealing)

این الگوریتم برای غلبه بر مشکل گیر افتادن در بهینه‌ی محلی، در تپه نوردی استفاده می‌شود. در این روش، الگوریتم با احتمال مشخصی می‌تواند به راه‌حل‌هایی که مقدار تابع هدف را بدتر می‌کنند، نیز حرکت کند. این احتمال با گذشت زمان (یا با کاهش دمای فرضی) کاهش می‌یابد. این امر به الگوریتم اجازه می‌دهد تا از بهینه‌ی محلی فرار کند و به جستجوی راه‌حل‌های بهتر ادامه دهد.

تصویری جذاب الگوریتم شبیه‌سازی تبرید که تصویر گویای روند الگوریتم شبیه‌سازی تبرید است

۳- الگوریتم جستجوی تابو (Tabu Search)

این الگوریتم با معرفی مفهوم «فهرست تابو» سعی در جلوگیری از چرخه‌های تکراری و کاوش مجدد مناطق قبلاً بررسی شده دارد. در هر مرحله، الگوریتم همسایه‌های راه‌حل فعلی را بررسی می‌کند، اما راه‌حل‌هایی که در فهرست تابو قرار دارند را رد می‌کند. فهرست تابو مجموعه‌ای از راه‌حل‌ها یا حرکت‌های ممنوع است که برای مدت زمان مشخصی ممنوع می‌باشند. به این ترتیب، الگوریتم می‌تواند از گیر افتادن در چرخه‌های تکراری جلوگیری کند و کاوش در فضا را بهبود بخشد.

تصویری جذاب و عالی از الگوریتم جستجوی تابو

جستجوی مقابله ای (Adversarial Search)

جستجوی مقابله ای «Adversarial Search» یک رویکرد اساسی در هوش مصنوعی برای حل مشکلات در محیط های رقابتی است که در آن عوامل با اهداف (متضاد) تعامل دارند. هدف از این نوع جستجو انتخاب حرکت استراتژیکی است که سودمندی بازیکن را به حداکثر برساند و در عین حال تأثیر رقابت را برای عامل مقابل به حداقل برساند. نمونه های بارز این نوع جستجو بازی هایی مانند شطرنج، چکرز و گو است. الگوریتم Minimax و هرس آلفا-بتا از جمله الگوریتم هایی هستند که برای پیاده سازی این جستجو مورد استفاده قرار می گیرند.

تصویری جذاب از روند اجرای جستجوی مقابله ای

۱- الگوریتم Minimax

الگوریتم Minimax یک الگوریتم جستجو است که برای تصمیم گیری در بازی های دو نفره با مجموع صفر استفاده می شود که در آن هر بازیکن سعی می کند سود خود را به حداکثر برساند و رقیب خود را به حداقل برساند. این الگوریتم با ایجاد یک درخت جستجو عمل می کند، که در آن هر گره نشان دهنده موقعیت و حرکات احتمالی است. الگوریتم minimax از درختی برای جستجو استفاده می کند و با استفاده از قانون minimax و با در نظر گرفتن بهترین حرکت، ارزش هر گره را در این درخت ارزیابی می کند.

تصویری عالی از روند اجرای الگوریتم Minimax.

۲- الگوریتم هرس آلفا-بتا (Alpha-Beta Pruning)

هرس آلفا-بتا یک تکنیک بهینه سازی است که برای الگوریتم Minimax استفاده می شود. هدف از این تکنیک، کاهش پیچیدگی محاسباتی الگوریتم Minimax است. این تکنیک بر اساس ایده حذف گره هایی که در درخت جستجو، اثری بر تصمیم گیری ندارند، عمل می کند. با استفاده از این تکنیک، می توان عمق جستجو را افزایش داد و تعداد گره هایی که باید بررسی شوند را کاهش داد.

تصویری از روند اجرای الگوریتم هرس آلفا-بتا

فرایند تصمیم مارکوف (Markov Decision Process – MDP)

MDP یک چارچوب ریاضی برای مدل‌سازی تصمیم‌گیری در شرایط تصادفی است که در آن نتایج، هم به اقدامات انجام شده توسط تصمیم‌گیرنده و هم به شانس بستگی دارد. MDPها در زمینه‌های مختلفی از جمله رباتیک، بازی‌ها، اقتصاد و کنترل کاربرد دارند.

یک MDP از اجزای زیر تشکیل شده است:

  • فضای حالت (State Space): مجموعه‌ای از تمام حالت‌های ممکن در محیط. در هر لحظه، سیستم در یکی از این حالت‌ها قرار دارد.
  • فضای عمل (Action Space): مجموعه‌ای از تمام اقداماتی که یک عامل می‌تواند در هر حالت انجام دهد.
  • تابع انتقال (Transition Function): تابعی که مشخص می‌کند بعد از انجام یک عمل در یک حالت، سیستم به چه حالتی خواهد رفت.
  • فاکتور تخفیف (Discount Factor): یک مقدار بین ۰ و ۱ (γ) که اهمیت پاداش‌های آینده را نسبت به پاداش‌های فوری تعیین می‌کند. یک فاکتور تخفیف نزدیک به ۱ به این معنی است که پاداش‌های آینده اهمیت زیادی دارند، در حالی که یک فاکتور تخفیف نزدیک به ۰ به این معنی است که پاداش‌های آینده کمتر مهم هستند.
  • سیاست (Policy): تابعی که یک عمل را برای هر حالت مشخص می‌کند. این سیاست، عامل را راهنمایی می‌کند که در هر حالت چه اقدامی انجام دهد. به طور معمول با π(a∣s) نشان داده می‌شود، که احتمال انجام عمل a را در حالت s نشان می‌دهد. یک سیاست قطعی، برای هر حالت فقط یک عمل را مشخص می‌کند، در حالی که یک سیاست احتمالی، توزیعی از احتمال‌ها را بر روی اعمال در هر حالت تعیین می‌کند.

هدف اصلی در MDP

هدف اصلی در MDP، پیدا کردن بهترین راه برای تصمیم‌گیری در هر موقعیت است، به گونه‌ای که بیشترین پاداش را در درازمدت به دست آوریم. این بهترین راه، به صورت یک “سیاست” نمایش داده می‌شود که به ما می‌گوید در هر موقعیتی چه عملی انجام دهیم.

  • ارزیابی سیاست (Policy Evaluation): این مرحله، مانند بررسی یک برنامه‌ی از پیش تعیین‌شده است. ما یک روش تصمیم‌گیری (سیاست) داریم و می‌خواهیم ببینیم که به‌طور میانگین چه مقدار پاداش با استفاده از این روش به دست می‌آوریم. این کار، با بررسی همه موقعیت‌های ممکن و محاسبه‌ی پاداش‌های مورد انتظار در هر موقعیت، انجام می‌شود.
  • بهبود سیاست (Policy Improvement): پس از ارزیابی یک سیاست، در این مرحله، سعی می‌کنیم تصمیماتمان را بهتر کنیم. ما به هر موقعیت نگاه می‌کنیم و بررسی می‌کنیم که آیا می‌توانیم با انجام عملی متفاوت، پاداش بیشتری به دست آوریم. اگر بتوانیم، سیاست خود را تغییر می‌دهیم تا از این عمل جدید استفاده کنیم.
  • روش تکرار ارزش (Value Iteration): این روش، مانند حدس زدن و اصلاح تدریجی است. ما از یک حدس اولیه برای پاداش هر موقعیت شروع می‌کنیم. سپس، به‌طور مکرر، این حدس‌ها را اصلاح می‌کنیم تا زمانی که به بهترین حدس ممکن برسیم. در هر مرحله، مقدار پاداش هر موقعیت را بر اساس بهترین عملی که می‌توان در آن موقعیت انجام داد، به روز می‌کنیم. وقتی دیگر تغییر قابل توجهی در مقادیر پاداش مشاهده نشد، به جواب نزدیک شده‌ایم.
  • روش تکرار سیاست (Policy Iteration): این روش، مانند یک چرخه بهبود است. ما با یک سیاست اولیه شروع می‌کنیم و به طور مکرر، دو مرحله‌ی زیر را انجام می‌دهیم:
  1. ارزیابی: سیاست فعلی را ارزیابی می‌کنیم (مانند مرحله‌ی ارزیابی سیاست).
  2. بهبود: بر اساس نتایج ارزیابی، سیاست را بهبود می‌دهیم (مانند مرحله‌ی بهبود سیاست).

این چرخه را تا زمانی ادامه می‌دهیم که سیاست ما دیگر تغییر نکند، به این معنی که به سیاست بهینه نزدیک شده‌ایم.

یادگیری تقویتی (Reinforcement Learning)

یادگیری تقویتی روشی است که یک عامل «agent» در یک محیط «environment» یاد می‌گیرد چگونه عمل کند تا پاداش «reward» دریافتی خود را به حداکثر برساند. در این فرآیند، عامل با انجام اقدامات مختلف و دریافت بازخورد (پاداش یا جریمه) از محیط، به‌تدریج استراتژی بهینه را می‌آموزد. هدف اصلی این است که عامل با تکرار و تجربه، سیاستی را پیدا کند که بیشترین سود را در طول زمان به دست آورد.

تصویری جذاب از یادگیری تقویتی.

۱- روش‌های مبتنی بر مدل (Model-Based Methods)

روش‌های مبتنی بر مدل در یادگیری تقویتی، ابتدا یک مدل از محیط یاد می‌گیرند و سپس از این مدل برای برنامه‌ریزی و تصمیم‌گیری استفاده می‌کنند. به این ترتیب، عامل تلاش می‌کند تا یک درک از نحوه عملکرد محیط به دست آورد و با استفاده از این مدل، بهترین سیاست «policy» را برای دستیابی به حداکثر پاداش پیدا کند. این روش‌ها معمولاً به داده‌های کمتری نیاز دارند اما در صورت نادرست بودن مدل، ممکن است عملکرد خوبی نداشته باشند.

۲- یادگیری تفاضل زمانی (Temporal Difference – TD Learning)

یادگیری تفاضل زمانی یک روش یادگیری تقویتی است که مستقیماً از تجربه یاد می‌گیرد و نیازی به مدل محیط ندارد. این روش با به‌روزرسانی تخمین ارزش «value» یک حالت یا جفت حالت-عمل بر اساس تفاوت بین تخمین فعلی و تخمین جدید (بر اساس تجربه)، عمل می‌کند. TD Learning به عامل این امکان را می‌دهد که با دیدن نتایج اقدامات خود، به تدریج ارزش حالت‌ها و اعمال مختلف را یاد بگیرد.

۳- الگوریتم Q-Learning

Q-Learning یک الگوریتم یادگیری تقویتی خارج از سیاست «off-policy» است که هدف آن یادگیری یک تابع کیفیت «Q-function» است. این تابع، مقدار انتظار پاداش انباشته را برای انجام یک عمل خاص در یک حالت خاص نشان می‌دهد. Q-Learning تلاش می‌کند بهترین سیاست را با یادگیری تابع Q بهینه Q*(s, a) پیدا کند. این الگوریتم به عامل کمک می‌کند تا با تخمین ارزش هر عمل در هر حالت، بهترین تصمیم‌ها را بگیرد.

تصویری جذاب از الگوریتم Q-Learning

یادگیری ماشین (Machine Learning)

یادگیری ماشین شاخه‌ای از هوش مصنوعی است که به کامپیوترها اجازه می‌دهد تا از داده‌ها بدون برنامه‌ریزی صریح بیاموزند و عملکرد خود را بهبود بخشند. به جای اینکه برای هر سناریو به طور خاص برنامه‌ریزی شوند، الگوریتم‌های یادگیری ماشین الگوها و روابط را در داده‌ها شناسایی کرده و از این دانش برای پیش‌بینی، تصمیم‌گیری یا طبقه‌بندی داده‌های جدید استفاده می‌کنند. این فرایند با استفاده از الگوریتم‌هایی انجام می‌شود که با افزایش حجم داده‌ها و تجربه، دقت و کارایی خود را ارتقا می‌دهند.

تصویری جذاب از یادگیری ماشین که تصویر قسمت های مختلف یادگیری ماشین و هوش مصنوعی نشان داده میشود.

مدل‌های خطی (Linear Models)

مدل‌های خطی زیرمجموعه‌ای از الگوریتم‌های یادگیری ماشین هستند که رابطه بین متغیرهای ورودی (ویژگی‌ها) و متغیر خروجی را با یک تابع خطی مدل‌سازی می‌کنند. این مدل‌ها فرض می‌کنند که رابطه بین ورودی و خروجی به صورت یک خط مستقیم (در فضای دوبعدی) یا یک صفحه (در فضای چندبعدی) قابل نمایش است. سادگی و تفسیرپذیری این مدل‌ها از مزایای اصلی آن‌هاست، به این معنی که می‌توان به راحتی فهمید که چگونه هر ویژگی بر خروجی تأثیر می‌گذارد. رگرسیون خطی و رگرسیون لجستیک از رایج‌ترین مدل‌های خطی هستند.

تصویر جذاب از مدل‌های خطی

شبکه‌های عصبی (Neural Networks)

شبکه‌های عصبی نیز زیرمجموعه‌ای از الگوریتم‌های یادگیری ماشین هستند، اما برخلاف مدل‌های خطی، قادر به مدل‌سازی روابط پیچیده و غیرخطی بین داده‌ها هستند. آن‌ها از گره‌های متصل به هم (نورون‌ها) تشکیل شده‌اند که در لایه‌های مختلف سازماندهی شده‌اند. هر نورون ورودی‌هایی را از لایه قبل دریافت می‌کند، این ورودی‌ها را با وزن‌ها ترکیب می‌کند و خروجی را به لایه بعدی ارسال می‌کند. این ساختار سلسله مراتبی به شبکه‌های عصبی اجازه می‌دهد تا الگوهای بسیار پیچیده را یاد بگیرند. شبکه‌های عصبی عمیق (Deep Neural Networks) که دارای لایه‌های زیادی هستند، به ویژه در وظایف پیچیده مانند پردازش تصویر و زبان طبیعی، بسیار قدرتمند هستند.

تصویری جذاب از شبکه های عصبی که در تصویری لایه ورودی و لایه نهان و لایه خروجی نشان داده می‌شود.

زمینه‌های کاربردی هوش مصنوعی

به طور کلی، هوش مصنوعی به توانایی ماشین‌ها برای انجام وظایفی اطلاق می‌شود که معمولاً به هوش انسانی نیاز دارند. این وظایف می‌توانند شامل یادگیری، استدلال، حل مسئله، درک زبان طبیعی، و تشخیص الگو باشند. هوش مصنوعی یک حوزه گسترده است که زمینه‌های کاربردی متنوعی را در بر می‌گیرد. در اینجا به سه مورد از مهم‌ترین این زمینه‌ها اشاره می‌کنیم:

۱. پردازش زبان طبیعی (Natural Language Processing – NLP)

پردازش زبان طبیعی شاخه‌ای از هوش مصنوعی است که به کامپیوترها توانایی درک، تفسیر و تولید زبان انسانی را می‌دهد. هدف اصلی NLP، ایجاد سیستم‌هایی است که بتوانند با انسان‌ها به زبان طبیعی ارتباط برقرار کنند. کاربردهای NLP بسیار گسترده هستند و شامل موارد زیر می‌شوند:

  • ترجمه ماشینی: ترجمه خودکار متن از یک زبان به زبان دیگر.
  • تحلیل احساسات: تعیین نگرش یا احساسات موجود در متن (مثلاً مثبت، منفی یا خنثی).
  • چت‌بات‌ها: برنامه‌های کامپیوتری که می‌توانند مکالمات متنی یا صوتی با کاربران داشته باشند.
  • خلاصه‌سازی متن: تولید خلاصه‌های کوتاه و دقیق از متون طولانی.
  • تشخیص صدا: تبدیل گفتار به متن.

تصویری جذاب از پردازش زبان طبیعی.

۲. بینایی ماشین (Computer Vision)

بینایی ماشین حوزه‌ای از هوش مصنوعی است که به کامپیوترها امکان می‌دهد تا تصاویر و ویدئوها را درک و تفسیر کنند. به عبارت دیگر، هدف بینایی ماشین این است که کامپیوترها بتوانند “ببینند” و اطلاعات مفیدی را از تصاویر استخراج کنند، همان‌طور که انسان‌ها با چشمان خود این کار را انجام می‌دهند. برخی از کاربردهای بینایی ماشین عبارتند از:

  • تشخیص چهره: شناسایی و تشخیص چهره افراد در تصاویر یا ویدئوها.
  • تشخیص اشیاء: شناسایی و طبقه‌بندی اشیاء مختلف در تصاویر (مانند اتومبیل، حیوانات، و غیره).
  • خودروهای خودران: استفاده از بینایی ماشین برای هدایت اتومبیل‌ها بدون نیاز به راننده.
  • تشخیص پزشکی: کمک به پزشکان در تشخیص بیماری‌ها از طریق تجزیه و تحلیل تصاویر پزشکی (مانند تصاویر رادیولوژی).
  • کنترل کیفیت: بررسی محصولات در خط تولید برای شناسایی نقص‌ها.

تصویری عالی از بینایی ماشین که در تصویر کاربرد های بینایی ماشین نشان داده می شود.

۳. رباتیک (Robotics)

رباتیک یک حوزه بین‌رشته‌ای است که شامل طراحی، ساخت، بهره‌برداری و کاربرد ربات‌ها می‌شود. ربات‌ها ماشین‌های خودکاری هستند که می‌توانند وظایفی را انجام دهند که معمولاً توسط انسان‌ها انجام می‌شوند. هوش مصنوعی نقش مهمی در رباتیک ایفا می‌کند، زیرا به ربات‌ها امکان می‌دهد تا هوشمندتر و مستقل‌تر عمل کنند. برخی از کاربردهای رباتیک عبارتند از:

  • اتوماسیون صنعتی: استفاده از ربات‌ها برای انجام وظایف تکراری و خطرناک در کارخانه‌ها.
  • جراحی رباتیک: استفاده از ربات‌ها برای انجام جراحی‌های دقیق و کم تهاجمی.
  • اکتشاف فضایی: استفاده از ربات‌ها برای کاوش در سیارات و جمع‌آوری اطلاعات.
  • خدمات درمانی و توانبخشی: استفاده از ربات‌ها برای کمک به افراد دارای معلولیت.
  • عملیات جستجو و نجات: استفاده از ربات‌ها برای جستجو و نجات افراد در مناطق خطرناک.

تصویری جذاب از کاربرد های رباتیک.

سخن آخر

در مجموع، هوش مصنوعی یک حوزه پویا و گسترده است که با پیشرفت‌های خود، تاثیر عمیقی بر جنبه‌های مختلف زندگی ما می‌گذارد. از یادگیری ماشین و پردازش زبان طبیعی گرفته تا بینایی ماشین و رباتیک، این فناوری‌ها در حال تغییر نحوه تعامل ما با جهان هستند. درک اصول اساسی هوش مصنوعی و آشنایی با کاربردهای آن برای متخصصان و عموم مردم حائز اهمیت است تا بتوانیم از این فناوری‌ها به طور موثر استفاده کرده و از مزایای آن‌ها بهره‌مند شویم. با توجه به سرعت بالای نوآوری در این زمینه، یادگیری مداوم و به‌روزرسانی دانش ضروری است تا بتوانیم از تحولات آینده هوش مصنوعی درک درستی داشته باشیم و در این مسیر پیشرفت کنیم.


سوالات متداول


تفاوت بین هوش مصنوعی ضعیف و قوی چیست؟

هوش مصنوعی ضعیف (Narrow AI) برای انجام یک وظیفه خاص طراحی شده است، در حالی که هوش مصنوعی قوی (General AI) توانایی انجام هر کار فکری که یک انسان می‌تواند را دارد.

کاربرد اصلی هوش مصنوعی در پزشکی چیست؟

هوش مصنوعی در پزشکی برای تشخیص بیماری‌ها، توسعه داروها، تحلیل تصاویر پزشکی و ارائه مراقبت‌های بهداشتی شخصی‌سازی شده کاربرد دارد.

پردازش زبان طبیعی (NLP) چیست؟

پردازش زبان طبیعی شاخه‌ای از هوش مصنوعی است که به کامپیوترها امکان می‌دهد زبان انسانی را درک، تفسیر و تولید کنند.

شبکه عصبی (Neural Network) چیست؟

شبکه عصبی یک مدل محاسباتی است که از ساختار مغز انسان الهام گرفته شده و از لایه‌های متعددی از گره‌های متصل به هم (نورون‌ها) برای پردازش اطلاعات استفاده می‌کند

یادگیری ماشین (ML) چیست؟

یادگیری ماشین زیرمجموعه‌ای از هوش مصنوعی است که به کامپیوترها اجازه می‌دهد تا از داده‌ها بدون برنامه‌ریزی صریح بیاموزند و الگوها را شناسایی کرده و بر اساس آن‌ها پیش‌بینی کنند.

بینایی ماشین (Computer Vision) چیست؟

بینایی ماشین حوزه‌ای از هوش مصنوعی است که به کامپیوترها امکان می‌دهد تصاویر و ویدئوها را درک و تفسیر کنند.

نگرانی‌های اخلاقی مرتبط با هوش مصنوعی کدامند؟

نگرانی‌های اخلاقی مرتبط با هوش مصنوعی شامل سوگیری الگوریتمی، حفظ حریم خصوصی، تأثیر بر اشتغال و مسئولیت‌پذیری در تصمیم‌گیری‌های خودکار است.

میزان رضایتمندی
لطفاً میزان رضایت خودتان را از این مطلب با دادن امتیاز اعلام کنید.
[ امتیاز میانگین 3 از 2 نفر ]
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع و مراجع:
maryville sciencedirect مجله پی‌استور

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا