در این گوشه: ابزار پیشبینی عملکرد آنزیم پیشرفته … Brawler بیوانفورماتیک… ابزار اصلی جستجوی همترازی محلی برای پروتئینها… BLASTp! و در این گوشه: رقیب … In Silico Kid… یادداشت آنزیمی با قابلیت یادگیری متضاد… تمیز!
نه به قهرمان و نه به رقیب نباید گفته می شد که یک مبارزه تمیز داشته باشند. هر دو به عنوان ابزار هوش مصنوعی (AI) آموزش دیده بودند که می توانستند عملکرد آنزیم ها را بر اساس توالی اسید آمینه آنها پیش بینی کنند. هر دو نشان داده بودند که حتی اگر مسابقه ای شامل آنزیم های مطالعه نشده یا ناشناخته باشد، می توانند مسافت را طی کنند.
بنابراین، نتیجه چه شد؟ با تصمیم… پاک! از نظر دقت، قابلیت اطمینان و حساسیت امتیازات بالایی را به خود اختصاص داد. CLEAN، به گفته سازندگانش در دانشگاه ایلینویز Urbana-Champaign، وعده داده است که تحقیقات در زمینه ژنومیک، شیمی، مواد صنعتی، پزشکی، داروسازی و غیره را پیش ببرد.
دکتر Huimin Zhao، استاد مهندسی شیمی و بیومولکولی دانشگاه ایلینویز Urbana-Champaign می گوید: «درست مانند ChatGPT از داده های زبان نوشتاری برای ایجاد متن پیش بینی کننده استفاده می کند، ما نیز از زبان پروتئین ها برای پیش بینی فعالیت آنها استفاده می کنیم. تقریباً هر محققی هنگام کار با یک توالی پروتئین جدید، میخواهد فورا بداند که پروتئین چه کار میکند. علاوه بر این، هنگام ساخت مواد شیمیایی برای هر کاربرد – زیست شناسی، پزشکی، صنعتی – این ابزار به محققان کمک می کند تا به سرعت آنزیم های مناسب مورد نیاز برای سنتز مواد شیمیایی و مواد را شناسایی کنند.
ژائو تیم تحقیقاتی را رهبری کرد که CLEAN را توسعه دادند و عملکرد آن را ارزیابی کردند. نتایج تیم در مجله ظاهر شد علوم پایهدر مقاله ای با عنوان “پیش بینی عملکرد آنزیم با استفاده از یادگیری متضاد”.
نویسندگان مقاله نوشتند: «ما یک الگوریتم یادگیری ماشینی به نام CLEAN (یادگیری آنزیمی با قابلیت یادگیری متضاد) ارائه می کنیم تا اعداد کمیسیون آنزیم را به آنزیم ها با دقت، قابلیت اطمینان و حساسیت بهتر در مقایسه با ابزار پیشرفته BLASTp اختصاص دهیم. . چارچوب یادگیری متضاد CLEAN را قادر میسازد تا با اطمینان (i) آنزیمهایی را که مورد مطالعه قرار نگرفتهاند، حاشیهنویسی کند، (۲) آنزیمهای نشاندار اشتباه را تصحیح کند، و (iii) آنزیمهای بینظیر را با دو یا چند عدد EC شناسایی کند – عملکردهایی که ما بهطور سیستماتیک در آزمایشهای سیلیکونی و آزمایشگاهی نشان میدهیم. ”
ژائو، یکی از اعضای مؤسسه زیست شناسی ژنومیک کارل آر ووز در ایلینویز، گفت: با پیشرفت در ژنومیکس، آنزیم های زیادی شناسایی و توالی یابی شده اند، اما دانشمندان اطلاعات کمی در مورد آنچه آنزیم ها انجام می دهند یا ندارند.
سایر ابزارهای محاسباتی سعی در پیش بینی عملکرد آنزیم دارند. معمولاً، آنها تلاش میکنند تا با مقایسه یک توالی مورد بررسی با کاتالوگ آنزیمهای شناخته شده و یافتن توالیهای مشابه، یک شماره کمیسیون آنزیمی – یک کد شناسایی که نشان میدهد آنزیم چه نوع واکنشی را کاتالیز میکند – اختصاص دهند. به گفته ژائو، با این حال، این ابزارها با آنزیم های کمتر مطالعه شده یا مشخص نشده، یا با آنزیم هایی که چندین کار را انجام می دهند، به خوبی کار نمی کنند.
ما اولین کسی نیستیم که از ابزارهای هوش مصنوعی برای پیشبینی اعداد کمیسیون آنزیم استفاده میکنیم، اما اولین کسی هستیم که از این الگوریتم جدید یادگیری عمیق به نام یادگیری متضاد برای پیشبینی عملکرد آنزیم استفاده میکنیم. ما متوجه شدیم که این الگوریتم بسیار بهتر از ابزارهای هوش مصنوعی که توسط دیگران استفاده می شود کار می کند. ما نمی توانیم تضمین کنیم که محصول همه به درستی پیش بینی می شود، اما می توانیم دقت بالاتری نسبت به دو یا سه روش دیگر داشته باشیم.
محققان ابزار خود را به صورت تجربی با آزمایشهای محاسباتی و آزمایشگاهی تأیید کردند. آنها دریافتند که این ابزار نه تنها میتواند عملکرد آنزیمهایی که قبلا مشخص نشده بودند را پیشبینی کند، بلکه آنزیمهایی را که توسط نرمافزار پیشرو برچسبگذاری نشده بودند، تصحیح کرد و آنزیمهایی را با دو یا چند عملکرد به درستی شناسایی کرد.
گروه ژائو CLEAN را به صورت آنلاین برای سایر محققانی که به دنبال توصیف یک آنزیم یا تعیین اینکه آیا یک آنزیم میتواند واکنش مورد نظر را کاتالیز کند، در دسترس قرار میدهد.
ژائو گفت: “ما امیدواریم که این ابزار به طور گسترده توسط جامعه تحقیقاتی گسترده مورد استفاده قرار گیرد.” با رابط وب، محققان فقط می توانند دنباله را در یک جعبه جستجو، مانند یک موتور جستجو، وارد کنند و نتایج را ببینند.
ژائو گفت که این گروه قصد دارد هوش مصنوعی پشت CLEAN را برای مشخص کردن سایر پروتئینها، مانند پروتئینهای اتصال، گسترش دهد. این تیم همچنین امیدوار است که الگوریتمهای یادگیری ماشینی را بیشتر توسعه دهد تا کاربر بتواند واکنش دلخواه را جستجو کند و هوش مصنوعی به یک آنزیم مناسب برای این کار اشاره کند.
پروتئینهای اتصال نامشخص زیادی مانند گیرندهها و فاکتورهای رونویسی وجود دارد. ما همچنین می خواهیم عملکرد آنها را نیز پیش بینی کنیم. ما میخواهیم عملکرد همه پروتئینها را پیشبینی کنیم تا بتوانیم تمام پروتئینهای یک سلول را بشناسیم و کل سلول را برای کاربردهای بیوتکنولوژی یا بیوپزشکی بهتر مطالعه یا مهندسی کنیم.»