رباتی که با دقت بی‌نظیر «جنگا» بازی می‌کند

یک روش جدید مبتنی بر هوش مصنوعی که در دانشگاه کالیفرنیا برکلی (UC Berkeley) توسعه یافته است، متشکل از ترکیبی از یادگیری تقویتی و آموزش انسانی برای کمک به ربات‌ها برای تسلط سریع و کارآمد بر وظایف است.

به گزارش ایسنا، محققان دانشگاه کالیفرنیا در برکلی روش جدیدی را برای آموزش به ربات‌ها ایجاد کرده‌اند که به آنها کمک می‌کند مهارت‌هایی مانند بازی کردن جنگا یا چیدن آن را با سرعت و دقت به دست آورند. این روش جدید با ترکیب ترکیبی از هوش مصنوعی (AI)، یادگیری تقویتی و راهنمایی انسان، به ربات‌ها اجازه می‌دهد تنها در چند ساعت از یک مبتدی به یک متخصص تبدیل شوند.

به نقل از آی‌ای، گروه آزمایشگاه هوش مصنوعی و یادگیری رباتیک سرگی لوین (Sergey Levine)، یک روش یادگیری جدید برای کمک به ربات‌ها ایجاد کردند که باعث می‌شود ربات‌ها اصول یک کار را یاد بگیرند و سپس با تمرین در دنیای واقعی در آن بهبود پیدا کنند. همانطور که انسان‌ها از طریق آزمون و خطا یاد می‌گیرند، روش یادگیری تقویتی، ربات را قادر می‌سازد تا از حسگرها و دوربین‌ها بازخورد بگیرد تا بفهمد کجاها خوب عمل می‌کند و نقاطی که در آنها شکست می‌خورد را بشناسد.

این روش جدید آموزش ربات همچنین شامل راهنمایی‌های انسانی برای اصلاح بیشتر مهارت‌های یک ربات در هنگام انجام یک کار است. با استفاده از این روش، مربی انسانی می‌تواند از یک ماوس مخصوص برای اصلاح حرکات ربات در صورت انجام کار اشتباه استفاده کند.

این ورودی به حافظه ربات وارد می‌شود تا به اصلاح مدل آن برای تکمیل یک کار کمک کند. با استفاده از این داده‌ها و موفقیت‌ها و شکست‌های آن، روش جدید یادگیری هوش مصنوعی به طور چشمگیری سرعت یادگیری و دقت ربات را در انجام یک کار بهبود می‌بخشد.

تبدیل شدن به یک استاد در عرض چند ساعت

جیانلان لو (Jianlan Luo) که بخشی از تیم تحقیقاتی است، با بیان این که این ربات به مداخله انسانی کمتری نیاز دارد و از تجربه آموزش می‌بیند، اضافه کرد: شاید برای ۳۰ درصد اول کار نیاز باشد که از ربات مراقبت کنیم؛ اما به تدریج می‌توانیم توجه کمتری به آن داشته باشیم.

این تیم برای آزمایش روش یادگیری جدید خود، سیستم رباتیک خود را تحت وظایف مختلف نامرتبطی قرار دادند. اولین مورد برداشتن مهره‌های بازی «جنگا» بود که شامل استفاده از یک طناب کوتاه برای «ضربه زدن» به بلوک‌های جنگا می‌شد.

سایر وظایف عبارتند از چرخاندن تخم مرغ در ماهیتابه، انتقال یک جسم از یک بازو به بازوی دیگر، مونتاژ مادربرد از ابتدا، مونتاژ داشبورد ماشین و تعویض تسمه تایم موتور.

این وظایف به دلیل تفاوت قابل توجهی بین مهارت و کارکرد انتخاب شدند و تیم بر این باورند که آنها اکثر وظایف اصلی را که می‌توان انتظار داشت یک ربات در دنیای واقعی انجام دهد را پوشش دادند.

از میان کارهایی که ربات انجام داد، تعویض تسمه تایم بسیار دشوار بود. با توجه به ماهیت کار و مواد درگیر، ربات باید واکنش نشان می‌داد و متغیرهای زیادی را پیش‌بینی می‌کرد که در هر بار انجام کار متفاوت بود.

یادگیری تقویتی بسیار مهم است

برداشتن با یک ضربه مهره‌های جنگا یکی دیگر از تلاش‌های جالب برای تیم بود، زیرا مدل‌سازی فیزیک درگیر در انجام آن بسیار دشوار است. این کار برای همه به جز ماهرترین بازیکنان سخت است و برای ربات این کار یک چالش واقعی بود.

در این مورد، آموزش در دنیای واقعی بسیار مهم بود تا ربات بتواند از طریق تجربه به جای آموزش صرفا شبیه‌سازی شده، یاد بگیرد. با این حال، پس از استفاده از روش جدید یادگیری، ربات می‌تواند این کار را با موفقیت ۱۰۰ درصد به خوبی انجام دهد.

این تیم همچنین با ایجاد حرکات در طول کار، وظایف ربات را سخت‌تر کردند. این شامل حرکت مادربرد در حین مونتاژ برای وادار کردن ربات به واکنش سریع در یک محیط پویا و غیرقابل پیش‌بینی بود.

با وجود همه اینها، ربات می‌تواند تمام وظایف را با دقت ۱۰۰ درصد و سریعتر از آموزش سنتی انجام دهد. با حرکت رو به جلو، محققان اکنون امیدوارند زمان آموزش را کاهش دهند.

آنها همچنین قصد دارند تحقیقات خود را منبع باز کنند تا به سایر دانشمندان کمک کنند تا پروژه‌های خود را اصلاح کنند و بر اساس آنها بسازند.

انتهای پیام

  • دوشنبه/ ۱۵ بهمن ۱۴۰۳ / ۱۴:۰۶
  • دسته‌بندی: فناوری
  • کد خبر: 1403111511037
  • خبرنگار : 71654

برچسب‌ها