به گزارش مجله خبری نگار/همشهری آنلاین،یادگیری ماشینی یکی از مهمترین فناوریهای هوش مصنوعی است. این فناوری به ماشین اجازه میدهد تا بر الگوریتم خاصی از یادگیری کار کند؛ بدون اینکه به طور واضح دستورالعملهای تعریف شده را به آنها ارائه دهد. برنامه مبتنی بر هوش مصنوعی یادگیری ماشین برای تصمیمگیری با توانایی تشخیص روابط با دادههای موجود طراحی شده است.
تکنیک خودسازی
خودسازی تکنیکی برای بهبود عملکرد عوامل یادگیری تقویتی است. به طور شهودی، عوامل یاد میگیرند که عملکرد خود را با بازیکردن در برابر خودشان بهبود بخشند.
همه شاخههای هوش مصنوعی بر یک ایده اصلی متکی هستند: تقلید از هوش انسانی، استفاده از قوانین، منطق یا رویکرد مبتنی بر دانش. ML با یادگیری الگوها از دادهها فراتر میرود و DL از طریق یک شبکه عصبی مصنوعی که مغز انسان را تقلید میکند، یاد میگیرد.
مشکل هوش مصنوعی با تفکر انسان
هوش مصنوعی مشکل بزرگی با حقیقت و درستی دارد و به نظر میرسد تفکر انسان بخش بزرگی از این مشکل است. در حال حاضر نسل جدیدی از هوش مصنوعی شروع به اتخاذ رویکرد آزمایشی کرده است که میتواند یادگیری ماشینی را از انسانها دور کند.
AlphaGo شرکت Deepmind پیشرفت خوبی در توسعه هوش مصنوعی دارد. چون یکی از اولین هوش مصنوعیهای بازی بود که هیچ دستورالعمل انسانی را دریافت نکرد و قوانینی را هم نخواند.
تلاش برای یادگیری
در عوض، از تکنیکی به نام یادگیری تقویتی خودبازی (RL) برای ایجاد درک خود از بازی استفاده کرد. آزمون و خطای محض در میلیونها، حتی میلیاردها بازی مجازی، شروع کموبیش تصادفی با کشیدن اهرمهای موجود، و تلاش برای یادگیری از نتایج دارد.
در این مرحله، Deepmind مدل مشابهی از AlphaZero را در دنیای شطرنج راهاندازی کرد، جایی که مدلهایی مانند Deep Blue که روی تفکر انسان، دانش و مجموعه قوانین آموزشدیده بودند، از دهه ۹۰ استاد بزرگهای انسانی را شکست داده بودند.
آلفا زیرو ۱۰۰ مسابقه را مقابل قهرمان فعلی هوش مصنوعی، Stockfish انجام داد که ۲۸ بازی را برد و بقیه را بهتساوی کشاند.
ترمز هوش مصنوعی در مقابل تفکر انسان
Deepmind شروع به تسلط بر این بازیها - و شوجی، Dota ۲، Starcraft II و بسیاری دیگر کرد؛ هنگامی که این ایده را کنار گذاشت که تقلید از انسان بهترین راه برای بهدستآوردن یک نتیجه خوب است.
در واقع به ذهنهای الکترونیکی این آزادی داده شد تا با شرایط خاص خود با موضوعات تعامل داشته باشند، با نقاط قوت شناختیشان بازی کنند و درک اساسی خود را از آنچه کار میکند و چه چیزی مفید است بسازند
AlphaZero مانند مگنوس کارلسن شطرنج نمیداند و روشهای کاربردی استادان بزرگ را مطالعه نکرده است. او فقط شطرنجبازی کرده است. اما نتیجه آن بهتر از هر مدلی است که توسط انسانها آموزشدادهشده است. اما اگر یک عامل یادگیری تقویتی پیشرفته در طرف دیگر وجود داشته باشد. هیچ انسان و هیچ مدلی که بر اساس تفکر انسانی آموزشدیده باشد، شانسی در بازی شطرنج نخواهد داشت.
جدا شدن از تفکر بشری
ChatGPT و هوش مصنوعیهای دیگر مدل زبان بزرگ (LLM)، مانند هوش مصنوعیهای اولیه شطرنج، بر دانش بشری بهاندازه موجود آموزشدیده و خیلی خوب شدهاند.
اما نگرانیهایی هم وجود دارد در مورد اینکه آیا آنها هرگز به هوش عمومی مصنوعی دست خواهند یافت یا نه. به گزارش سایت Humanoids، LLMها در زبان تخصص دارند؛ نه در درست یا غلطگرفتن حقایق.
زبان مجموعهای از مناطق خاکستری عجیبوغریب است که بهندرت پاسخی ۱۰۰ درصد درست یا غلط وجود دارد؛ بنابراین LLMها معمولاً با استفاده از یادگیری تقویتی با بازخورد انسانی آموزش میبینند. یعنی انسانها انتخاب میکنند کدام پاسخ به نوع پاسخی که میخواستند نزدیکتر باشد. اما حقایق، امتحانات و کدنویسی یک شرط وجود دارد؛ اینکه موضوع را درست فهمیدی یا نه؛ و اینجاست که مدل جدید o ۱ شروع به جدا شدن از تفکر بشری و ارائه رویکرد دیوانهوار موثر AlphaGo نتیجه درست کرده است.
کودک o ۱ وارد یادگیری تقویتی میشود
o ۱ از بسیاری جهات، تقریباً مشابه نسخههای قبلی خود است؛ با این تفاوت که OpenAI قبل از شروع به پاسخدادن به یک درخواست، «زمان فکری» را ایجاد کرده است. در طول این زمان تفکر، o ۱ یک «زنجیره فکر» ایجاد میکند که در آن راه خود را از طریق یک مشکل در نظر میگیرد و استدلال میکند؛ و اینجاست که رویکرد RL وارد میشود. o ۱، برخلاف مدلهای قبلی که بیشتر شبیه پیشرفتهترین سیستمهای تکمیل خودکار جهان بودند، واقعاً اهمیت میدهد که همه چیز را درست انجام دهد.
توصیف حقیقت در دنیای فیزیکی
o ۱ هنوز باتوجهبه زبان انسان آموزشدیده است. این با حقیقت بسیار متفاوت است. در واقع زبان یک بازنمایی خام و کم وضوح از واقعیت است. مثلاً میتوان درباره یک بیسکویت چیزهایی زیادی گفت و آن را توصیف کرد. اما تا زمانی که طعم آن را نچشیده باشی نمیتوانی درک درستی از آن داشته باشی؛ چیزی که در مورد هوش مصنوعی وجود دارد.
مسیر هوش مصنوعی بهسوی حقیقت نهایی
هوش مصنوعی رویکردی عجیب به سبک آلفاگو برای درک جهان در پیش خواهد گرفته است. آنها واقعیت را بررسی و نتایج را مشاهده میکنند، و تئوریهای خودشان را به زبان خودشان دارند. در مورد اینکه چه چیزی کار میکند، چه چیزی خوب نیست، و چرا به وجود میآید.
آنها مانند انسانها یا حیوانات به واقعیت نزدیک نمیشوند و از روش علمی مانند روش ما استفاده نمیکنند یا چیزها را به رشتههایی مانند فیزیک و شیمی تقسیم نمیکنند. همچنین همان آزمایشهایی را انجام نمیدهند که به انسانها کمک میکند بر مواد و نیروها و منابع انرژی اطراف خود تسلط یابند و بر جهان تسلط پیدا کنند.
آنها عجیبترین کارهایی را که میتوانید به آنها فکر کنید، انجام میدهند، و با انجام این کارها، دانش جدیدی را ایجاد و کشف میکنند که انسانها هرگز نمیتوانستند آنها را با هم جمع کنند.