شرکت رباتیک 1X که مورد حمایت OpenAI قرار دارد، اخیراً ویدیویی از رباتهای خدماتی چرخدار خود منتشر کرده است که به شکلی یکپارچه وظایف محوله را یکی پس از دیگری انجام میدهند. ربات های Eve با استفاده از رابط زبان طبیعی کنترل میشوند که توسط صدا فعال میشوند.شرکت Halodi Robotics در سال 2014 با هدف توسعه رباتهای عمومی برای همکاری با انسانها در محیط کار تأسیس شد. این شرکت که در اصل در نروژ مستقر بود، در سال 2019 یک مرکز عملیاتی دوم در کالیفرنیا راهاندازی کرد و در همان زمان بود که اولین نمونه اولیه ربات چرخدار انسانینمای خود به نام Eve را معرفی کرد.
بیشتر بخوانید:
- ربات انساننمای تسلا کارهای واقعیتری انجام میدهد [+ لینک ویدئو]
- رونمایی از ربات میکرو جراحی جدید سونی که میتواند دانه ذرت را بخیه بزند [+ویدئو]
- ربات صخرهنورد با چنگکهای الهامگرفته از طبیعت، دیوارهای ناهموار را فتح میکند
همکاری 1X و OpenAI: ربات های Eve به کمک زبان طبیعی بهینهسازی شدند
در سال 2022، Halodi نام خود را به 1X تغییر داد و با OpenAI همکاری کرد تا رباتیک و هوش مصنوعی را ترکیب کند و پایهگذاری یادگیری تجسمی را امکانپذیر سازد. با وجود اینکه این شرکت یک مدل دوپای دیگر و دستهای شبیه به انسان را نیز در دست توسعه دارد، تمرکز اصلی فعلی آنها بر روی آموزش Eve برای استفاده در محیطهای کاری است. جایی که این رباتها میتوانند زبان طبیعی و فضای فیزیکی را درک کرده و وظایف واقعی را انجام دهند.
1X اکنون گزارش داده که یک رابط زبان طبیعی ایجاد کرده که به اپراتورها امکان میدهد تا با استفاده از دستورات صوتی، چندین ربات انساننما را کنترل کنند. رباتها سپس مجموعهای از اقدامات آموخته شده را برای انجام وظایف پیچیده به یکدیگر متصل میکنند.
در ماه مارس، این شرکت اعلام کرد، توانسته است یک مدل خودکار را توسعه دهد که تعداد زیادی از وظایف را در یک مدل AI رفتاری واحد مانند خارج کردن اقلام از یک کیف خرید، تصمیمگیری درباره محل قرار دادن آنها، پاک کردن لکهها و تا کردن پیراهنها انجام میدهد.
شرکت 1X در حال توسعه رباتهای هوشمندی است که بتوانند چندین وظیفه را انجام دهند. یکی از مشکلاتی که در این راه وجود دارد، این است که اگر بخواهند رفتار یک وظیفه خاص را در یک مدل هوش مصنوعی چند وظیفهای بهبود بخشند، ممکن است به طور ناخواسته رفتارهای دیگر وظایف در همان مدل تحت تأثیر قرار گیرد و دچار مشکل شوند.
راهحل سنتی برای حل این مشکل، افزایش تعداد پارامترهای مدل هوش مصنوعی است. با افزایش پارامترها، مدل میتواند به طور دقیقتری وظایف مختلف را مدیریت کند. اما این کار به دو مشکل اصلی منجر میشود:
1. افزایش زمان آموزش: با افزایش تعداد پارامترها، زمان لازم برای آموزش مدل نیز افزایش مییابد.
2. کندی توسعه: پیچیدگی بیشتر مدل منجر به کندی فرآیند توسعه میشود.
شرکت 1X به جای استفاده از راهحل سنتی، یک راهحل جدید و نوآورانه برای عملکرد بهتر ربات های Eve را ارائه کرده است:
1. استفاده از رابط زبان طبیعی کنترلشونده توسط صدا: این رابط به اپراتورها اجازه میدهد تا با استفاده از دستورات صوتی، چندین مدل کوچکتر و تکوظیفهای را به هم متصل کنند.
2. مدلهای کوچک و بهینه: به جای داشتن یک مدل بزرگ و پیچیده، چندین مدل کوچک وجود دارد که هر کدام برای یک وظیفه خاص بهینه شدهاند.
3. اتصال وظایف کوتاهمدت به وظایف بلندمدت: این مدلهای کوچکتر میتوانند وظایف کوتاهمدت را انجام دهند و سپس به هم متصل شوند تا وظایف بلندمدت و پیچیدهتر را به طور یکپارچه انجام دهند.
اریک جانگ از شرکت 1X در یک پست نوشت: “هدایت رباتها با این رابط زبان سطح بالا یک تجربه کاربری جدید برای جمعآوری دادهها ارائه میدهد. به جای استفاده از واقعیت مجازی برای کنترل یک ربات، اپراتور میتواند چندین ربات را با زبان سطح بالا هدایت کرده و اجازه دهد سیاستهای سطح پایین، اقدامات سطح پایین را برای تحقق اهداف سطح بالا اجرا کنند. به دلیل اینکه اقدامات سطح بالا به ندرت ارسال میشوند، اپراتورها میتوانند حتی رباتها را از راه دور کنترل کنند.”
ربات های Eve خودکار عمل میکنند
شرکت 1X اعلام کرده که ربات های Eve در ویدیو کاملاً خودکار هستند و همه اقدامات آنها توسط یک شبکه عصبی کنترل میشود. هیچگونه گرافیک کامپیوتری، یا “برش، افزایش سرعت ویدیو، یا پخش از پیش تعیین شده مسیر” در ویدیو وجود ندارد. گام بعدی، ادغام مدلهای زبان-بینایی مانند GPT-4، VILA و Gemini Vision در سیستم است.
بیشتر بخوانید:
- کارخانه تولید رباتهای انسان نما را دیدهاید؛ تماشا کنید
- ربات انسان نما فوق سریع S1 شما را با حرکات دقیقش شگفتزده خواهد کرد [+ویدئو]
منبع: newatlas