به گزارش مجله خبری نگار،محققان MIT چارچوب کاملا جدید و یکپارچهای را برای پیش بینی ویژگیهای مولکولی و سنتز مولکولهای جدید به طور همزمان، توسعه داده اند که بسیار کارآمدتر از رویکردهای موجود عمل میکند.
آموزش یک مدل یادگیری ماشینی برای پیش بینی خواص بیولوژیکی یا مکانیکی یک مولکول، نیازمند میلیونها ساختار مولکولی برچسب گذاری شده است. به دلیل هزینههای کشف مولکولها و چالشهای برچسب گذاری مولکولها به صورت دستی، کار با مجموعه دادههای آموزشی بزرگ، اغلب بسیار پیچیده است و این مسئله، کارایی رویکردهای یادگیری ماشینی را محدود میکند.
در مقابل، سیستم جدید ایجاد شده توسط محققان MIT قادر است خواص مولکولی را به طور موثر و تنها با استفاده از مجموعه کوچکی از دادهها پیش بینی کند. قوانین این سیستم با بررسی شباهتهای بین ساختارهای مولکولی، به سیستم کمک میکنند تا مولکولهای جدیدی تولید کرده و خواص آنها را به شیوهای کارآمدتر پیش بینی کند.
در مدلهای یادگیری ماشینی، برای دستیابی به نتایج مطلوب، دانشمندان به مجموعه دادههای آموزشی با میلیونها مولکول نیاز دارند که دارای خواص مشابه با مولکولهایی میباشند که به دنبال کشف آنها هستند. به گزارش سیناپرس، محققان ناچارند، از مدلهایی استفاده کنند که از قبل روی مجموعه دادههای بزرگ آموزش داده شده اند که به عملکرد ضعیف این مدلها بر مجموعه دادههای کوچک میانجامد.
دانشمندان، در این مطالعه، روش کاملا متفاوتی را در پیش گرفته اند؛ تیم تحقیقاتی برای پیش بینی خواص مولکول ها، از گرامر مولکولی استفاده کرد. گرامر مولکولی، مجموعهای از قوانین است که نحوه تولید مولکولها یا پلیمرها را با ترکیبی از اتم ها، تعیین میکند.
پژوهشگران اظهار داشتند: هدف اصلی ما از این پروژه استفاده از برخی روشهای مبتنی بر داده، برای سرعت بخشیدن به کشف مولکولهای جدید بود. این نمایش مولکولی مبتنی بر دستور زبان، بسیار قدرتمند است و ما در تلاش برای شناسایی کاربردهای دیگر آن، فراتر از شیمی یا علم مواد هستیم.