فناوری جدید در تشخیص متن‌های تولیدی چت بات‌ها

واترمارک‌ دیجیتال؛ گامی به سوی تشخیص متون هوش مصنوعی

با توجه به گسترش روزافزون استفاده از هوش مصنوعی در تولید محتوا، نگرانی‌هایی درباره تشخیص متون واقعی از متون تولیدشده توسط ماشین به وجود آمده است. یکی از روش‌های پیشنهادی برای حل این مشکل، استفاده از واترمارک‌های دیجیتال است که می‌تواند به تشخیص و شناسایی محتوای مصنوعی کمک کند.

به گزارش ایسنا، هوش مصنوعی با مدل‌های زبانی پیشرفته‌ای که به کار می‌گیرد، قادر است متونی شبیه به نوشته‌های انسان تولید کند. این مدل‌های زبانی که به «مدل‌های زبانی بزرگ» یا LLM ها معروف هستند، در برنامه‌های مختلفی از جمله چت‌بات‌ها، نوشتن خودکار و تولید محتوا به کار می‌روند.

با وجود مزایای این فناوری‌ها، شناسایی متون تولیدشده توسط ماشین و نسبت دادن آن‌ها به منابع معتبر همواره یک چالش بوده است. این امر باعث شده تا نگرانی‌هایی درباره دقت و اعتبار این متون در میان کارشناسان و کاربران مطرح شود.

از آنجا که تفاوت ظاهری میان متون انسانی و مصنوعی کمتر شده است، نیاز به روش‌هایی برای تشخیص این دو بیشتر از قبل احساس می‌شود. روش‌های مختلفی برای حل این مشکل پیشنهاد شده است، اما اغلب این روش‌ها به دلیل تأثیر منفی بر کیفیت متن یا نیاز به توان محاسباتی بالا، در مقیاس‌های بزرگ کاربردی نیستند. به همین دلیل، پژوهشگران به دنبال راه‌حل‌هایی هستند که هم کیفیت متن را حفظ کند و هم در تشخیص متون مصنوعی مؤثر باشد.

در این زمینه، گروهی از پژوهشگران به سرپرستی «سومانث داتاتری» و «پوشمیت کهولی» از Google DeepMind سیستمی به نام SynthID-Text را توسعه داده‌اند. این سیستم با استفاده از یک الگوریتم نمونه‌گیری پیشرفته، واترمارک‌هایی را به طور نامحسوس به متون تولیدشده توسط هوش مصنوعی اضافه می‌کند.

این واترمارک‌ها در واقع امضاهای دیجیتالی هستند که می‌توانند با کمک نرم‌افزارهای خاص شناسایی شوند. این ابزار به گونه‌ای طراحی شده که دو مسیر متفاوت برای واترمارک‌گذاری ارائه می‌دهد: مسیری که کمی کیفیت متن را تغییر می‌دهد و مسیری که بدون تأثیر بر کیفیت، امضا را اضافه می‌کند.

در روش کار این پژوهش، الگوریتم نمونه‌گیری به گونه‌ای عمل می‌کند که انتخاب کلمات توسط هوش مصنوعی به شکلی تنظیم می‌شود که یک علامت خاص و قابل شناسایی در متن باقی بگذارد. این علامت با چشم انسان قابل مشاهده نیست، اما توسط نرم‌افزارهای تشخیص واترمارک به راحتی قابل ردیابی است. از این روش می‌توان برای شناسایی هرگونه متنی که توسط مدل‌های هوش مصنوعی تولید شده استفاده کرد.

نتایج این پژوهش که در نشریه معتبر Nature منتشر شده اند، نشان می‌دهند که سیستم SynthID-Text در مقایسه با روش‌های موجود، عملکرد بهتری در تشخیص متون تولیدشده توسط هوش مصنوعی دارد.

همچنین، بررسی کیفیت متون واترمارک‌گذاری‌شده نشان داده است که در حالت غیرتغییری (non-distortionary)، کیفیت متن حفظ می‌شود و تغییری در آن احساس نمی‌شود. از دیگر نتایج این پژوهش می‌توان به این نکته اشاره کرد که این واترمارک‌ها تأثیر چندانی بر میزان توان محاسباتی مورد نیاز برای اجرای مدل‌ها ندارند.

علاوه بر این، پژوهشگران تاکید دارند که اگرچه این واترمارک‌ها ممکن است با تغییرات جزئی در متن از بین بروند، اما این ابزار می‌تواند به عنوان گامی مهم در جهت افزایش شفافیت و مسئولیت‌پذیری در استفاده از مدل‌های زبانی هوش مصنوعی مورد استفاده قرار گیرد. این امر به ویژه در مواردی که متن‌های تولیدشده باید از اعتبار بالایی برخوردار باشند، اهمیت دارد.

در انتها بایستی اشاره کرد که این پژوهش، قدمی مهم در جهت افزایش امنیت و شفافیت استفاده از هوش مصنوعی در فرایندهای تولید محتوا محسوب می‌شود.

انتهای پیام

پنجشنبه/ ۳ آبان ۱۴۰۳ / ۰۹:۵۴
دسته‌بندی: پژوهش
کد خبر: 1403080301978
خبرنگار : 30163