این رباط با تماشای ویدیوهای یوتیوب آشپزی می کند

بانکی دات آی آر: مرکز DARPA وزارت دفاع امریکا موفق شد زبان ریاضی پیشرفته‌ای را توسعه دهد که اجازه می‌دهد ربات‌ها با تماشای ویدیوهای یوتیوب، آموزش ببینند.

به گزارش ۱پزشک، در اولین نمونه، محققانی از دانشگاه مریلند یک ربات را طوری برنامه‌نویسی کردند که به طور خودآموز با مشاهده ویدیوی آموزشی آشپزی انسان روی یوتیوب، یاد بگیرد از ابزارهای آشپزخانه استفاده کند. این خبر را هم DARPA منتشر و تایید کرده است و هم به صورت یک مقاله پژوهشی در کنفرانس «هوش مصنوعی پیشرفته» آستین تگزاس چاپ شد. رهبری تیم برنامه‌نویسی این ربات را Yiannis Aloimonos از دانشمندان علوم کامپیوتر برعهده دارد. وی چندین تغییر در ربات‌ انسان‌نمای Baxter داده و یک جفت ماژول پردازش اطلاعات CNN بدان افزوده است. ماژول‌های Convolutional Neural Networks برای سیستم‌های شناسایی صدا روی اسمارت‌فون‌ها و سیستم‌های شناسایی دیداری در امنیت بیومتریک طراحی شده‌اند.

این ربات خروجی پروژه‌ای است که سال‌های پیش کلید زده شده است. آژانس پروژه‌های تحقیقاتی پیشرفته وزارت دفاع آمریکا یا همان DARPA در سال ۲۰۱۱ بود که اعلام کرد ردیف بودجه‌ای تصویب شده است تا برای تحقیق و توسعه یک زبان ریاضی برای ترکیب اطلاعات ویدیوهای هواپیماهای بدون سرنشین، ره‌گیری‌های اسمارت‌فون‌ها، رادارها و دیگر تجهیزات در دسترس دیگر برای سنجش جهان خارج صرف شود. در آن زمان، اطلاعات بیشتری درباره این پروژه منتشر نشد و بیشتر شبیه یک هدف درازمدت جلوه می‌کرد. در پس‌زمینه این پروژه، ساخت یک مدل ریاضی بود که به سنسورهای پیشرفته اجازه بدهد با تماشای تصاویر و ویدیو یا شنیدن صدا، هر چیز مهمی را استخراج و اطلاعات بی‌اهمیت را فیلتر کنند. ملاک اهمیت اطلاعات نیز فهم انسانی است. یعنی این سنسورها همانند ذهن یک انسان بتوانند اطلاعات و چیزهای بااهمیت را کشف و درک و ذخیره کنند و اطلاعات و چیزهای بی‌اهمیت را دور بریزند یا توجه‌ نکنند. در سال ۲۰۱۱، سنسورها فقط سیگنال‌هایی که دریافت می‌کردند را پردازش کرده و از فهم بااهمیت بودن یا نبودن آن‌ها عاجز بودند. این پروژه با نام MSEE یا Mathematics of Sensing, Exploitation, and Execution شناخته می‌شود.

رضا قنادان، مدیر برنامه بخش علوم دفاعی DARPA درباره این پروژه می‌گوید: «برنامه MSEE در ابتدا روی سنسورهایی متمرکز شده است که بتوانند چیزهایی که می‌بینند را سنجش و درک کنند و فراتر از شناخت و شناسایی اشیاء پیش بروند. در گام بعدی، ربات‌ها نشانه‌های بصری را پردازش و با استفاده از ماژول‌های زبان ریاضی اکشن‌هایی را که اتفاق افتاده است ترجمه می‌کنند.» قنادان تاکید می‌کند در حال توسعه الگوریتمی هستیم که بتواند به طور موثر اشیاء و اکشن‌ها را شناسایی و بتواند کشف کند کدام‌یک پراهمیت و کدام‌یک بی‌اهمیت است. وی می‌گوید باید به جایی برسیم که ربات‌ها و ماشین‌ها نه تنها توانایی یادگیری بلکه توانایی یادگیری خودکار بدون دخالت سوپروایزر یا نیمه سوپروایزر را داشته باشند.

کورنلیا فرمولر از دانشگاه مریلند نیز می‌گوید: «ما به دنبال ساخت فناوری هستیم که ربات‌ها بتوانند با انسان‌ها تعامل برقرار کنند. ربات‌ها نیاز دارند چیزهایی را درک کنند که انسان می‌داند. ربات‌ها باید اکشن‌های انسان را متوجه شوند و آن‌ها را به صورت بلادرنگ پیگیری کنند.»

رباتی که توانست حرکات درون فیلم یوتیوب را تقلید کند یا به نوعی آموزش ببیند، نیاز به هیچ‌گونه راهبری و کمک انسان یا افزودن برنامه‌ای ندارد و این نکته بسیار مهمی است. ربات‌های باکستر بدون نیاز به نرم‌افزار یا سخت‌افزار اضافی، می‌توانند رفتار انسان یا ربات‌های دیگر اطرافشان را تجزیه و تحلیل و تقلید کنند (مانند تلویزیون) و خیلی ساده‌تر آموزش ببینند چگونه باید یک کار را به خوبی انجام دهند. مزیت این پروژه و استفاده از ربات‌های باکستر در این است که فرآیند پیچیده و سخت برنامه‌نویسی و کدزنی برای آموزش یک ربات آسان شده و از نظر هزینه‌ای نیز بسیار ارزان‌قیمت خواهد بود. اکنون، ربات‌ها می‌توانند بسیار سریع‌تر آموزش ببینند و دانش خود را با دیگر ربات‌ها به اشتراک بگذارند. این ربات‌ها پیش‌درآمدی برای ساخت ربات‌های هوشمند خودکار است که می‌توانند یک انبار یا محیط صنعتی را به طور کامل مدیریت کنند و انسان دیگر دخالتی نکند.

به اشتراک بگذارید
فریناز مختاری
فریناز مختاری
مقاله‌ها: 35586

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *