هوش مصنوعی "الفبت" تمام پروتئین‌های شناخته شده را ترسیم کرد

امید به درمان همه بیماری‌ها به دست هوش مصنوعی

پایگاه داده ساختار پروتئین شرکت "الفبت" موسوم به "آلفا فولد" اکنون شامل بیش از ۲۰۰ میلیون پروتئین شناخته شده است که امیدها را برای درمان انواع بیماری‌ها زنده نگه می‌دارد.

به گزارش ایسنا و به نقل از نیو اطلس، سال گذشته، هوش مصنوعی شرکت "الفبت"(Alphabet) به نام "دیپ‌مایند"(DeepMind)، یک پایگاه داده منبع‌باز از ساختارهای سه‌بعدی صدها هزار پروتئین از جمله تمام ۲۰ هزار پروتئین شناخته شده در بدن انسان منتشر کرد. اکنون این پایگاه داده موسوم به "آلفا فولد" به ۲۰۰ میلیون نمونه گسترش یافته است که تقریباً می‌توان گفت تمام پروتئین‌های شناخته شده در دنیای علم را شامل می‌شود.

پروتئین‌ها عامل فعالیت سلول‌های زنده هستند که تعداد بی‌شماری از فرآیندهای بیولوژیکی حیاتی در راه حیات را انجام می‌دهند. آنها از زنجیره‌ای از اسیدهای آمینه تشکیل شده‌اند که به شکل‌های سه‌بعدی پیچیده می‌شوند که عملکرد آنها را دیکته می‌کند. ترسیم ساختار پروتئین‌ها برای درک اینکه چه کاری انجام می‌دهند، چگونه کار می‌کنند و اینکه چگونه ممکن است چیزی اشتباه پیش برود، مهم است. شناخت و ترسیم پروتئین‌ها برای تحقیق در مورد همه چیز، از داروها و درمان‌های جدید گرفته تا بهبود محصولات کشاورزی و حفاظت از حیوانات، کلیدی است.

اما محاسبه ساختار دقیق یک پروتئین بر اساس اسیدهای آمینه تشکیل دهنده‌ آن دشوار است. پی بردن به این موضوع معمولاً به مقدار زیادی قدرت محاسباتی و ساعات کار سرسام‌آور انسانی نیاز دارد، در حالی که این وضعیت به «مشکل تاخوردگی پروتئین» معروف شده است. به این ترتیب، پیشرفت در این حوزه در طول دهه‌های اخیر نسبتاً کند بوده است.

اکنون می‌توان گفت این مشکل تا زمانی مشکل بود که شرکت "الفبت" که شرکت مادر "گوگل" است، هنوز هوش مصنوعی قدرتمند خود موسوم به "دیپ مایند" را روی این مشکل تنظیم نکرده بود. این سیستم که در ابتدا با ۱۰۰ هزار ساختار پروتئینی شناخته شده آموزش دیده بود، توانایی پیش‌بینی ساختار میلیون‌ها پروتئین دیگر را توسعه داد که تعیین و ترسیم هر یک از آنها به‌جای ماه‌ها یا سال‌ها، تنها چند دقیقه یا چند ثانیه زمان می‌برد.

در ژوئیه ۲۰۲۱ اولین پایگاه داده ساختار پروتئین "آلفا فولد" برای عموم منتشر شد. این پایگاه داده در ابتدا حاوی بیش از ۳۵۰ هزار ساختار پروتئینی بود که حدود ۹۸.۵ درصد از پروتئین‌های انسانی و همچنین پروتئین‌های موجود در مگس‌های میوه، موش‌ها، مخمرها و باکتری‌های "ای.کولی"(E.coli) را شامل می‌شد. بعدها به حدود یک میلیون ساختار پروتئینی از ۱۰ هزار گونه جانوری، گیاه، باکتری، قارچ و سایر موجودات گسترش یافت.

حالا ظرف یک سال پس از آن رویداد، بیش از ۵۰۰ هزار دانشمند از سراسر جهان برای کمک گرفتن در تحقیقات خود به این پایگاه داده دسترسی پیدا کرده‌اند.

اکنون "دیپ مایند" یک به‌روزرسانی بزرگ جدید برای پایگاه داده خود منتشر کرده است که در حال حاضر شامل حدود ۲۱۴ میلیون ساختار از یک میلیون گونه است. این عدد یعنی تقریباً تمام پروتئین‌هایی را که در حال حاضر برای علم شناخته شده است، پوشش می‌دهد و برای تحقیق در مورد درمان بیماری‌ها، واکسن‌ها، پایداری، مقاومت آنتی‌بیوتیکی و حتی آلودگی پلاستیکی موهبت بزرگی را ارائه می‌دهد.

"اریک توپول"، مدیر مؤسسه تحقیقاتی "اسکریپس" می‌گوید: "آلفا فولد" قبلاً اکتشافات عظیمی از جمله شکستن ساختار مجتمع منافذ هسته‌ای را تسریع و فعال کرده است و با افزودن این ساختارهای جدید که تقریباً کل جهان پروتئین‌ها را روشن می‌کند، می‌توانیم انتظار داشته باشیم که اسرار بیولوژیکی بیشتری هر روز رمزگشایی شود.

گفتنی است که کل پایگاه داده ساختارهای پروتئین، متشکل از بیش از ۲۵ ترابایت داده را می‌توان از مجموعه داده‌های عمومی Google Cloud دانلود کرد.

انتهای پیام

  • جمعه/ ۷ مرداد ۱۴۰۱ / ۱۳:۵۴
  • دسته‌بندی: فناوری
  • کد خبر: 1401050705303
  • خبرنگار : 71589