بانکی دات آی آر: مرکز DARPA وزارت دفاع امریکا موفق شد زبان ریاضی پیشرفتهای را توسعه دهد که اجازه میدهد رباتها با تماشای ویدیوهای یوتیوب، آموزش ببینند.
به گزارش ۱پزشک، در اولین نمونه، محققانی از دانشگاه مریلند یک ربات را طوری برنامهنویسی کردند که به طور خودآموز با مشاهده ویدیوی آموزشی آشپزی انسان روی یوتیوب، یاد بگیرد از ابزارهای آشپزخانه استفاده کند. این خبر را هم DARPA منتشر و تایید کرده است و هم به صورت یک مقاله پژوهشی در کنفرانس «هوش مصنوعی پیشرفته» آستین تگزاس چاپ شد. رهبری تیم برنامهنویسی این ربات را Yiannis Aloimonos از دانشمندان علوم کامپیوتر برعهده دارد. وی چندین تغییر در ربات انساننمای Baxter داده و یک جفت ماژول پردازش اطلاعات CNN بدان افزوده است. ماژولهای Convolutional Neural Networks برای سیستمهای شناسایی صدا روی اسمارتفونها و سیستمهای شناسایی دیداری در امنیت بیومتریک طراحی شدهاند.
این ربات خروجی پروژهای است که سالهای پیش کلید زده شده است. آژانس پروژههای تحقیقاتی پیشرفته وزارت دفاع آمریکا یا همان DARPA در سال ۲۰۱۱ بود که اعلام کرد ردیف بودجهای تصویب شده است تا برای تحقیق و توسعه یک زبان ریاضی برای ترکیب اطلاعات ویدیوهای هواپیماهای بدون سرنشین، رهگیریهای اسمارتفونها، رادارها و دیگر تجهیزات در دسترس دیگر برای سنجش جهان خارج صرف شود. در آن زمان، اطلاعات بیشتری درباره این پروژه منتشر نشد و بیشتر شبیه یک هدف درازمدت جلوه میکرد. در پسزمینه این پروژه، ساخت یک مدل ریاضی بود که به سنسورهای پیشرفته اجازه بدهد با تماشای تصاویر و ویدیو یا شنیدن صدا، هر چیز مهمی را استخراج و اطلاعات بیاهمیت را فیلتر کنند. ملاک اهمیت اطلاعات نیز فهم انسانی است. یعنی این سنسورها همانند ذهن یک انسان بتوانند اطلاعات و چیزهای بااهمیت را کشف و درک و ذخیره کنند و اطلاعات و چیزهای بیاهمیت را دور بریزند یا توجه نکنند. در سال ۲۰۱۱، سنسورها فقط سیگنالهایی که دریافت میکردند را پردازش کرده و از فهم بااهمیت بودن یا نبودن آنها عاجز بودند. این پروژه با نام MSEE یا Mathematics of Sensing, Exploitation, and Execution شناخته میشود.
رضا قنادان، مدیر برنامه بخش علوم دفاعی DARPA درباره این پروژه میگوید: «برنامه MSEE در ابتدا روی سنسورهایی متمرکز شده است که بتوانند چیزهایی که میبینند را سنجش و درک کنند و فراتر از شناخت و شناسایی اشیاء پیش بروند. در گام بعدی، رباتها نشانههای بصری را پردازش و با استفاده از ماژولهای زبان ریاضی اکشنهایی را که اتفاق افتاده است ترجمه میکنند.» قنادان تاکید میکند در حال توسعه الگوریتمی هستیم که بتواند به طور موثر اشیاء و اکشنها را شناسایی و بتواند کشف کند کدامیک پراهمیت و کدامیک بیاهمیت است. وی میگوید باید به جایی برسیم که رباتها و ماشینها نه تنها توانایی یادگیری بلکه توانایی یادگیری خودکار بدون دخالت سوپروایزر یا نیمه سوپروایزر را داشته باشند.
کورنلیا فرمولر از دانشگاه مریلند نیز میگوید: «ما به دنبال ساخت فناوری هستیم که رباتها بتوانند با انسانها تعامل برقرار کنند. رباتها نیاز دارند چیزهایی را درک کنند که انسان میداند. رباتها باید اکشنهای انسان را متوجه شوند و آنها را به صورت بلادرنگ پیگیری کنند.»
رباتی که توانست حرکات درون فیلم یوتیوب را تقلید کند یا به نوعی آموزش ببیند، نیاز به هیچگونه راهبری و کمک انسان یا افزودن برنامهای ندارد و این نکته بسیار مهمی است. رباتهای باکستر بدون نیاز به نرمافزار یا سختافزار اضافی، میتوانند رفتار انسان یا رباتهای دیگر اطرافشان را تجزیه و تحلیل و تقلید کنند (مانند تلویزیون) و خیلی سادهتر آموزش ببینند چگونه باید یک کار را به خوبی انجام دهند. مزیت این پروژه و استفاده از رباتهای باکستر در این است که فرآیند پیچیده و سخت برنامهنویسی و کدزنی برای آموزش یک ربات آسان شده و از نظر هزینهای نیز بسیار ارزانقیمت خواهد بود. اکنون، رباتها میتوانند بسیار سریعتر آموزش ببینند و دانش خود را با دیگر رباتها به اشتراک بگذارند. این رباتها پیشدرآمدی برای ساخت رباتهای هوشمند خودکار است که میتوانند یک انبار یا محیط صنعتی را به طور کامل مدیریت کنند و انسان دیگر دخالتی نکند.