به گزارش مجله خبری نگار/برنا؛ این محصول حاصل چندین سال همکاری با دانشگاهها و صنعت است و هدف آن ارائه یک استاندارد است که هر کسی بتواند تعیین کند که آیا یک هوشمصنوعی متن باز است یا خیر.
شاید شما هم بپرسید که چرا توافق نظر در مورد یک تعریف برای هوشمصنوعی متن باز مهم است. یکی از انگیزههای بزرگ، هماهنگ کردن سیاستگذاران و توسعهدهندگان هوشمصنوعی است.
استفانو مافولی، معاون اجرایی OSI در این خصوص گفت: نهادهای نظارتی در حال حاضر به این حوزه توجه دارند و نهادهایی مانند کمیسیون اروپا به دنبال اعطای شناسایی ویژه به متن باز هستند. ما بهطور صریح با مجموعهای متنوع از ذینفعان و جوامع ارتباط برقرار کردیم نه تنها افراد معمول در فناوری. ما حتی سعی کردیم با سازمانهایی که بیشتر با نهادهای نظارتی صحبت میکنند، ارتباط برقرار کنیم تا بازخورد اولیه آنها را دریافت کنیم.
برای اینکه یک مدل هوشمصنوعی تحت OSAID به عنوان متن باز در نظر گرفته شود، باید اطلاعات کافی درباره طراحی آن ارائه دهد بهطوریکه یک شخص بتواند آن را بهطور "معنایی" بازسازی کند. این مدل همچنین باید هرگونه جزئیات مرتبط درباره دادههای آموزشی خود را افشا کند، از جمله منبع، نحوه پردازش دادهها و چگونگی بهدست آوردن یا مجوز گرفتن آنها.
مافولی در ادامه افزود: یک هوشمصنوعی متن باز مدلی است که به شما اجازه میدهد بهطور کامل درک کنید که چگونه ساخته شده است. این بدان معناست که شما به تمام اجزا دسترسی دارید، مانند کد کامل استفاده شده برای آموزش و فیلتر کردن دادهها.
گفتنی است که بسیاری از استارتاپها و شرکتهای بزرگ فناوری، بهویژه متا، از اصطلاح "متن باز" برای توصیف استراتژیهای انتشار مدلهای هوشمصنوعی خود استفاده کردهاند، اما تعداد کمی از آنها معیارهای OSAID را برآورده میکنند. به عنوان مثال، متا از پلتفرمهایی که بیش از ۷۰۰ میلیون کاربر فعال ماهانه دارند، میخواهد که برای استفاده از مدلهای Llama مجوز ویژهای درخواست کنند.
مافولی به صورت علنی از تصمیم متا برای نامیدن مدلهایش به عنوان "متن باز" انتقاد کرده است. پس از بحثهایی با OSI، گوگل و مایکروسافت موافقت کردند که استفاده از این اصطلاح را برای مدلهایی که کاملا متن باز نیستند، کنار بگذارند، اما متا این کار را نکرد.
یک مطالعه در ماه اوت گذشته توسط محققان بنیاد سیگنال، موسسه غیرانتفاعی AI Now و دانشگاه کارنگی ملون نشان داد که بسیاری از مدلهای "متن باز" در واقع تنها به نام متن باز هستند. دادههای مورد نیاز برای آموزش این مدلها مخفی نگه داشته میشود، قدرت محاسباتی لازم برای اجرای آنها فراتر از دسترس بسیاری از توسعهدهندگان است و تکنیکهای تنظیم دقیق آنها به طرز ترسناکی پیچیده است.