پیشنهاد سردبیر

روش‌های دور زدن قوانین هوش مصنوعی نامحدود است!

بنیامین اصغرزاده

9 ماه قبل

۰ نظر

روش‌های دور زدن قوانین هوش مصنوعی نامحدود است!

روش‌های دور زدن قوانین هوش مصنوعی نامحدود است و این یعنی به سادگی می‌توان ابزارهای هوش مصنوعی را مجبور به کنار زدن قوانین کرد!

طبق مطالعات انجام شده، مدل‌های زبانی بزرگی که ChatGPT، Bard و Anthropic’s Claude بر اساس آنها طراحی شده‌ و توسعه داده می‌شوند به طور گسترده توسط شرکت‌های فناوری مورد تعدیل قرار می‌گیرد. ساختار امنیتی این مدل‌ها علاوه‌بر این که وسعت زیادی دارد به گونه‌ای ساخته شده که این اطمینان حاصل شود از آنها در خلق و تولید برنامه‌ها و ابزارهای آسیب‌‌زا مانند آموزش نحوه ساخت بمب یا نوشتن مطالبی با محوریت نفرت‌پراکنی استفاده نمی‌شود. با این وجود گویا این دیوارهای امنیتی خیلی هم مستحکم نیستند!

بیشتر بخوانید: همکاری ناسا و IBM برای ساخت یک هوش مصنوعی متخصص علوم زمین

روش‌های دور زدن قوانین هوش مصنوعی

پیرو گزارشی که روز پنجشنبه توسط محققان دانشگاه کارنگلی ملون در پیتسبرگ و مرکز ایمنی A.I در سان‌فرانسیسکو منتشر شده، راه و روش‌هایی برای دور زدن این ساختار ایمنی یافت شده است. محققان دریافته‌اند که می‌توانند از روش‌های مختلفی که از آنها برای توسعه فناوری متن‌باز بهره برده‌اند برای هدف قرار دادن سیستم‌های هوش مصنوعی جریان اصلی و بسته استفاده کنند.

این مقاله نشان می‌دهد که حملات خشونت‌آمیزی که به‌صورت خودکار انجام می‌پذیرد، عمدتا با اضافه کردن کاراکترها به انتهای سوالات کاربر اتفاق می‌افتد که می‌تواند در جهت غلبه بر قوانین ایمنی و تاثیرگذاری بر چت‌بات‌ها در راستای تولید محتوای مضر، اطلاعات نادرست و نفرت‌پراکنی مورد استفاده قرار گیرد.

این روش‌های دور زنی سیستم امنیتی مدل‌های زبانی، به صورت خودکار طراحی شده است و ممکن است موجب انجام حملات مشابه تقریبا نامحدودی شود.

محققان در انتهای این تحقیق، روش‌های دور زدن سیستم امنیتی مدل‌های زبانی را در اختیار OpenAI، Google و Anthropic قرار دادند.

یکی از سخنگویان گوگل در رابطه با این موضوع به Insider گفت: «در حالی که این یک مشکل در سرتاسر LLM‌ها است، ما حفاظ امنیتی مهمی را در Bard ایجاد کرده‌ایم که در طول زمان این موضوع بهبود خواهد یافت.»

نمایندگان آنتروپیک نیز پیرامون این مساله اظهار کردند که در حال آزمایش راه‌هایی برای تقویت ساختار حفاظتی مدل‌های پایه هستند تا آنها را بی‌ضررتر کنند با وجود این که لایه‌های دفاعی اضافی را نیز بررسی می‌کنیم.

نمایندگان OpenAI اما نسبت به این موضوع فعلا پاسخی ارائه نداده‌اند. زمانی که برخی از کاربران، روش‌های تضعیف دستورالعمل ChatGPT و Bing را پیدا کردند و محتواهای تعدیل نشده را وارد این مدل‌ها کردند اقدامشان سریعا توسط پشتیبانی و شرکت سازنده اصلاح و پیشگیری شد.

در نهایت، گفته شده است که معلوم نیست شرکت‌های سازنده این مدل‌های زبانی بتوانند از تکرار این رفتارها جلوگیری کنند یا نه. این سوالی است که نحوه تعدیل سیستم‌های هوش مصنوعی و همچنین ساختار ایمنی انتشار محتوای مدل‌های زبانی شرکت‌های مطرح حوزه فناوری را به چالش می‌کشد.

بیشتر بخوانید:

نظر شما درباره روش‌های دور زدن قوانین هوش مصنوعی چیست؟ دیدگاه خود را در بخش کامنت‌ها با تکراتو در میان بگذارید و اخبار تکنولوژی را با ما دنبال کنید.

ارسال برای دوستان در: واتساپ | تلگرام | توییتر

مطالب مشابه

ساعت پخش سریال پژمان از شبکه آی فیلم [+ ساعت پخش تکرار و خلاصه داستان]

مقایسه گلکسی A35 با ردمی نوت 13 پرو ؛ رقابت نزدیک دو میان‌رده

معرفی بهترین بازی های قدیمی کامپیوتر ؛ معرفی 20 عنوان نوستالژیک و جذاب

لیست قیمت گوشی سامسونگ امروز 8 اردیبهشت 1403 [اقتصادی، میان‌رده و پرچمدار]

بالا بردن سرعت لپ تاپ ؛ ترفندهای کاربردی برای لپ‌تاپ‌های ویندوزی و مک‌بوک

روش‌های دور زدن قوانین هوش مصنوعی نامحدود است!

روش‌های دور زدن قوانین هوش مصنوعی

تمرین گفتاری گوگل (Speaking Practice) شما را از داشتن معلم زبان بی‌نیاز می‌کند

ربات هوش مصنوعی چری به زودی به ایران می‌رسد [+ ویدئو]

ویژگی عجیب هوش مصنوعی پرچمدار جدید هواوی ، لباس کاربران را حذف می‌کند؛ تماشا کنید

ارزش سهام گوگل از مرز 2 تریلیون دلار گذشت

هشدار گوگل، بین هوش مصنوعی و کاربر می‌تواند روابط عاطفی شکل بگیرد

هوش مصنوعی جمنای حالا از اندروید‌ پایین‌تر از 12 هم پشتیبانی می‌کند

مانیتور گیمینگ لنوو با نام Lecoo Space Fox 27 Predator معرفی شد

کوالکام تراشه اسنپدراگون ایکس پلاس خود را با سریع ترین NPU دنیا برای لپ تاپ ها معرفی کرد

چت‌بات GPT به گوشی هوشمند ناتینگ فون 1 اضافه می‌شود

تعبیر خواب با هوش مصنوعی ؛ از هوش مصنوعی Dreamore چه می‌دانید؟

گلکسی بادز اکنون از Samsung Music پشتیبانی می‌کند

سنت‌شکنی سامسونگ؛ عرضه شارژر دوپورتی USB PD سامسونگ با توان 50 وات

با اجاره کد ملی خود برای خرید خودرو کسب ...

واکنش‌های جهانی به رونمایی از اولین پردا...

امکان ردیابی استارلینک در ایران ؛ در صور...

شرایط رفع فیلتر بلبل جان اعلام شد؛ اعلام...

گستردگی مرزهای هخامنشیان فراتر از چیزی ب...

مرحله سوم طرح بزرگ فروش خودرو وزارت صمت ...

فیلترینگ دائمی اینستاگرام و واتساپ ؛ زمس...

سندباد سامانه حمل و نقل آنلاین ؛ رقیب جد...

ساعت پخش سریال پژمان از شبکه آی فیلم [+ ساعت پخش تکرار و خلاصه داستان]

مقایسه گلکسی A35 با ردمی نوت 13 پرو ؛ رقابت نزدیک دو میان‌رده

معرفی بهترین بازی های قدیمی کامپیوتر ؛ معرفی 20 عنوان نوستالژیک و جذاب

لیست قیمت گوشی سامسونگ امروز 8 اردیبهشت 1403 [اقتصادی، میان‌رده و پرچمدار]

بالا بردن سرعت لپ تاپ ؛ ترفندهای کاربردی برای لپ‌تاپ‌های ویندوزی و مک‌بوک

روش‌های دور زدن قوانین هوش مصنوعی نامحدود است!

روش‌های دور زدن قوانین هوش مصنوعی

اپراتور هوش مصنوعی تشکیل خواهد شد؛ ایران از نظر دانش هوش مصنوعی در چه رتبه‌ای است؟

ویژگی عجیب هوش مصنوعی پرچمدار جدید هواوی ، لباس کاربران را حذف می‌کند؛ تماشا کنید

ارزش سهام گوگل از مرز 2 تریلیون دلار گذشت

جمینای ویژگی خلاصه نویسی ایمیل ها را به کاربران اندرویدی ارائه می‌دهد

هوش مصنوعی جمنای حالا از اندروید‌ پایین‌تر از 12 هم پشتیبانی می‌کند

بهترین بازی های کامپیوتر از نظر هوش مصنوعی ؛ معرفی برترین عناوین ژانرهای مختلف

تعبیر خواب با هوش مصنوعی ؛ از هوش مصنوعی Dreamore چه می‌دانید؟

هوش مصنوعی ادوبی می‌تواند ویدئوی تار را HD کند؛ [+ویدئو]

مایکروسافت از Phi-3 مینی کوچکترین مدل هوش مصنوعی خود که روی گوشی‌های هوشمند قابل اجراست، رونمایی کرد

آمریکا اولین خلبان هوش مصنوعی را در یک نبرد هوایی مقابل انسان قرار داد [+ویدئو]

تمرین گفتاری گوگل (Speaking Practice) شما را از داشتن معلم زبان بی‌نیاز می‌کند

ربات هوش مصنوعی چری به زودی به ایران می‌رسد [+ ویدئو]

ویژگی عجیب هوش مصنوعی پرچمدار جدید هواوی ، لباس کاربران را حذف می‌کند؛ تماشا کنید

ارزش سهام گوگل از مرز 2 تریلیون دلار گذشت

هشدار گوگل، بین هوش مصنوعی و کاربر می‌تواند روابط عاطفی شکل بگیرد

هوش مصنوعی جمنای حالا از اندروید‌ پایین‌تر از 12 هم پشتیبانی می‌کند

مانیتور گیمینگ لنوو با نام Lecoo Space Fox 27 Predator معرفی شد

کوالکام تراشه اسنپدراگون ایکس پلاس خود را با سریع ترین NPU دنیا برای لپ تاپ ها معرفی کرد

چت‌بات GPT به گوشی هوشمند ناتینگ فون 1 اضافه می‌شود

تعبیر خواب با هوش مصنوعی ؛ از هوش مصنوعی Dreamore چه می‌دانید؟

گلکسی بادز اکنون از Samsung Music پشتیبانی می‌کند

سنت‌شکنی سامسونگ؛ عرضه شارژر دوپورتی USB PD سامسونگ با توان 50 وات