یکی از ابزارهای هوش مصنوعی یکی دیگر را در مسابقه پیش‌بینی آنزیم بهتر می‌کند

در این گوشه: ابزار پیش‌بینی عملکرد آنزیم پیشرفته … Brawler بیوانفورماتیک… ابزار اصلی جستجوی هم‌ترازی محلی برای پروتئین‌ها… BLASTp! و در این گوشه: رقیب … In Silico Kid… یادداشت آنزیمی با قابلیت یادگیری متضاد… تمیز!

نه به قهرمان و نه به رقیب نباید گفته می شد که یک مبارزه تمیز داشته باشند. هر دو به عنوان ابزار هوش مصنوعی (AI) آموزش دیده بودند که می توانستند عملکرد آنزیم ها را بر اساس توالی اسید آمینه آنها پیش بینی کنند. هر دو نشان داده بودند که حتی اگر مسابقه ای شامل آنزیم های مطالعه نشده یا ناشناخته باشد، می توانند مسافت را طی کنند.

بنابراین، نتیجه چه شد؟ با تصمیم… پاک! از نظر دقت، قابلیت اطمینان و حساسیت امتیازات بالایی را به خود اختصاص داد. CLEAN، به گفته سازندگانش در دانشگاه ایلینویز Urbana-Champaign، وعده داده است که تحقیقات در زمینه ژنومیک، شیمی، مواد صنعتی، پزشکی، داروسازی و غیره را پیش ببرد.

دکتر Huimin Zhao، استاد مهندسی شیمی و بیومولکولی دانشگاه ایلینویز Urbana-Champaign می گوید: «درست مانند ChatGPT از داده های زبان نوشتاری برای ایجاد متن پیش بینی کننده استفاده می کند، ما نیز از زبان پروتئین ها برای پیش بینی فعالیت آنها استفاده می کنیم. تقریباً هر محققی هنگام کار با یک توالی پروتئین جدید، می‌خواهد فورا بداند که پروتئین چه کار می‌کند. علاوه بر این، هنگام ساخت مواد شیمیایی برای هر کاربرد – زیست شناسی، پزشکی، صنعتی – این ابزار به محققان کمک می کند تا به سرعت آنزیم های مناسب مورد نیاز برای سنتز مواد شیمیایی و مواد را شناسایی کنند.

ژائو تیم تحقیقاتی را رهبری کرد که CLEAN را توسعه دادند و عملکرد آن را ارزیابی کردند. نتایج تیم در مجله ظاهر شد علوم پایهدر مقاله ای با عنوان “پیش بینی عملکرد آنزیم با استفاده از یادگیری متضاد”.

نویسندگان مقاله نوشتند: «ما یک الگوریتم یادگیری ماشینی به نام CLEAN (یادگیری آنزیمی با قابلیت یادگیری متضاد) ارائه می کنیم تا اعداد کمیسیون آنزیم را به آنزیم ها با دقت، قابلیت اطمینان و حساسیت بهتر در مقایسه با ابزار پیشرفته BLASTp اختصاص دهیم. . چارچوب یادگیری متضاد CLEAN را قادر می‌سازد تا با اطمینان (i) آنزیم‌هایی را که مورد مطالعه قرار نگرفته‌اند، حاشیه‌نویسی کند، (۲) آنزیم‌های نشان‌دار اشتباه را تصحیح کند، و (iii) آنزیم‌های بی‌نظیر را با دو یا چند عدد EC شناسایی کند – عملکردهایی که ما به‌طور سیستماتیک در آزمایش‌های سیلیکونی و آزمایشگاهی نشان می‌دهیم. ”

ژائو، یکی از اعضای مؤسسه زیست شناسی ژنومیک کارل آر ووز در ایلینویز، گفت: با پیشرفت در ژنومیکس، آنزیم های زیادی شناسایی و توالی یابی شده اند، اما دانشمندان اطلاعات کمی در مورد آنچه آنزیم ها انجام می دهند یا ندارند.

سایر ابزارهای محاسباتی سعی در پیش بینی عملکرد آنزیم دارند. معمولاً، آنها تلاش می‌کنند تا با مقایسه یک توالی مورد بررسی با کاتالوگ آنزیم‌های شناخته شده و یافتن توالی‌های مشابه، یک شماره کمیسیون آنزیمی – یک کد شناسایی که نشان می‌دهد آنزیم چه نوع واکنشی را کاتالیز می‌کند – اختصاص دهند. به گفته ژائو، با این حال، این ابزارها با آنزیم های کمتر مطالعه شده یا مشخص نشده، یا با آنزیم هایی که چندین کار را انجام می دهند، به خوبی کار نمی کنند.

ما اولین کسی نیستیم که از ابزارهای هوش مصنوعی برای پیش‌بینی اعداد کمیسیون آنزیم استفاده می‌کنیم، اما اولین کسی هستیم که از این الگوریتم جدید یادگیری عمیق به نام یادگیری متضاد برای پیش‌بینی عملکرد آنزیم استفاده می‌کنیم. ما متوجه شدیم که این الگوریتم بسیار بهتر از ابزارهای هوش مصنوعی که توسط دیگران استفاده می شود کار می کند. ما نمی توانیم تضمین کنیم که محصول همه به درستی پیش بینی می شود، اما می توانیم دقت بالاتری نسبت به دو یا سه روش دیگر داشته باشیم.

محققان ابزار خود را به صورت تجربی با آزمایش‌های محاسباتی و آزمایشگاهی تأیید کردند. آنها دریافتند که این ابزار نه تنها می‌تواند عملکرد آنزیم‌هایی که قبلا مشخص نشده بودند را پیش‌بینی کند، بلکه آنزیم‌هایی را که توسط نرم‌افزار پیشرو برچسب‌گذاری نشده بودند، تصحیح کرد و آنزیم‌هایی را با دو یا چند عملکرد به درستی شناسایی کرد.

گروه ژائو CLEAN را به صورت آنلاین برای سایر محققانی که به دنبال توصیف یک آنزیم یا تعیین اینکه آیا یک آنزیم می‌تواند واکنش مورد نظر را کاتالیز کند، در دسترس قرار می‌دهد.

ژائو گفت: “ما امیدواریم که این ابزار به طور گسترده توسط جامعه تحقیقاتی گسترده مورد استفاده قرار گیرد.” با رابط وب، محققان فقط می توانند دنباله را در یک جعبه جستجو، مانند یک موتور جستجو، وارد کنند و نتایج را ببینند.

ژائو گفت که این گروه قصد دارد هوش مصنوعی پشت CLEAN را برای مشخص کردن سایر پروتئین‌ها، مانند پروتئین‌های اتصال، گسترش دهد. این تیم همچنین امیدوار است که الگوریتم‌های یادگیری ماشینی را بیشتر توسعه دهد تا کاربر بتواند واکنش دلخواه را جستجو کند و هوش مصنوعی به یک آنزیم مناسب برای این کار اشاره کند.

پروتئین‌های اتصال نامشخص زیادی مانند گیرنده‌ها و فاکتورهای رونویسی وجود دارد. ما همچنین می خواهیم عملکرد آنها را نیز پیش بینی کنیم. ما می‌خواهیم عملکرد همه پروتئین‌ها را پیش‌بینی کنیم تا بتوانیم تمام پروتئین‌های یک سلول را بشناسیم و کل سلول را برای کاربردهای بیوتکنولوژی یا بیوپزشکی بهتر مطالعه یا مهندسی کنیم.»