محدودیت های AlphaFold: دانش آموزان دبیرستانی نقص های هوش مصنوعی در چالش بیوانفورماتیک را آشکار می کنند
دانشمندان Skoltech Bio AlphaFold، برنامه هوش مصنوعی را که مشکل اصلی بیوانفورماتیک ساختاری را با پیشبینی ساختارهای پروتئینی حل میکرد، در چالش دیگری در این زمینه آزمایش کردند. این تیم از AlphaFold خواست تا تأثیر جهشهای منفرد بر پایداری پروتئین را پیشبینی کند و نتایج با یافتههای تجربی در تضاد بود و نشان میداد که هوش مصنوعی درمان بیوانفورماتیک ساختاری نیست. نویسندگان همچنین ادعاهای برخی از علاقه مندان به AlphaFold را رد کردند که این برنامه بر فیزیک نهایی پروتئین تسلط دارد و باید فراتر از وظیفه ای که برای آن طراحی شده بود کار کند. این یافته ها در یک مطالعه PLOS One گزارش شد .
دانشمندان Skoltech Bio AlphaFold را برای پیشبینی تأثیر جهشهای منفرد بر پایداری پروتئین آزمایش کردند و پیشبینیهای برنامه هوش مصنوعی با یافتههای تجربی در تضاد بود و ادعاهایی مبنی بر تسلط بر فیزیک پروتئین نهایی را رد کرد.
یک کمپ آموزشی بیوانفورماتیک برای دانشآموزان دبیرستانی در Skoltech به محلی برای برگزاری آخرین فصل از رقابت در حال انجام بین انسان و هوش مصنوعی در علم تبدیل شد. پس از حل یک مشکل کلیدی 50 ساله بیوانفورماتیک ساختاری، برنامه پیشرفتکننده هوش مصنوعی AlphaFold برای چالش دیگری که محققان در این زمینه با آن روبرو هستند، قابل اجرا نیست. این یافته در یک مطالعه PLOS One گزارش شده است، که نویسندگان آن ادعاهای برخی از علاقه مندان به AlphaFold را رد می کنند که می گویند هوش مصنوعی DeepMind بر فیزیک نهایی پروتئین تسلط دارد و همه و همه بیوانفورماتیک ساختاری است.
بیوانفورماتیک ساختاری شاخهای از علم است که ساختار پروتئینها، RNA ، DNA و برهمکنشهای آنها با مولکولهای دیگر را بررسی میکند. این یافتهها مبنایی برای کشف دارو و ایجاد پروتئینهایی با خواص هیجانانگیز، مانند کاتالیزور واکنشهایی که در دنیای طبیعی دیده نمیشوند، فراهم میکند.
از نظر تاریخی، مشکل اصلی بیوانفورماتیک ساختاری پیشبینی ساختارهای پروتئینی بود. یعنی، با توجه به یک توالی دلخواه از اسیدهای آمینه که یک پروتئین را تشکیل میدهند، چگونه میتوانید به طور قابل اعتماد محاسبه کنید که آن پروتئین در بدن چه شکل سهبعدی به خود میگیرد – و بنابراین چگونه عمل میکند.
پوستر پروژه بازی با AlphaFold2 در دانشکده زیست شناسی مولکولی و نظری که توسط Skoltech آنلاین در سال 2021 برگزار شد. اعتبار: Dmitry Ivankov/Skoltech
پس از 50 سال، این مشکل توسط AlfaFold، یک برنامه هوش مصنوعی که توسط DeepMind گوگل ایجاد شده بود، حل شد، که پیشینیان آن قبلاً با دستیابی به عملکرد فوق بشری در شطرنج، بازی go و بازی ویدیویی StarCraft II سرفصل خبرها بودند.
این دستاورد نقطه عطف منجر به گمانه زنی هایی شد مبنی بر اینکه شبکه عصبی باید به نوعی فیزیک اساسی پروتئین ها را درونی کرده باشد و باید فراتر از وظیفه ای که برای آن طراحی شده بود کار کند. برخی از افراد، حتی در جامعه بیوانفورماتیک ساختاری، انتظار داشتند که هوش مصنوعی به زودی پاسخ های قطعی به سؤالات باقی مانده آن رشته را بدهد و آن را به تاریخ علم بسپارد.
ما تصمیم گرفتیم این مشکل را حل کنیم و AlphaFold را روی یکی دیگر از وظایف اصلی بیوانفورماتیک ساختاری قرار دهیم: پیشبینی تأثیر جهشهای منفرد بر پایداری پروتئین. این بدان معناست که شما یک پروتئین شناخته شده خاص را انتخاب می کنید و دقیقاً یک جهش را معرفی می کنید، کوچکترین تغییر ممکن. و شما می خواهید بدانید که آیا جهش حاصل پایدارتر است یا کمتر و تا چه حد. محقق اصلی این مطالعه، استادیار دیمیتری ایوانکوف از Skoltech Bio، اظهار داشت که AlphaFold به وضوح قادر به انجام این کار نبود، همانطور که پیشبینیهای آن در تضاد با یافتههای تجربی شناخته شده است.
در پاسخ به سوالی درباره نقش دانشآموزان دبیرستانی که در این پروژه شرکت میکنند، محقق گفت که آنها درگیر پردازش دادههای جهش، نوشتن اسکریپتهایی برای مدیریت نتایج پیشبینی، تجسم ساختارهای مشخصشده توسط AlphaFold، و اساساً فریب دادن با نسخه آنلاین آن هستند. هوش مصنوعی
ایوانکوف تاکید کرد که سازندگان AlphaFold هرگز ادعا نکردند که هوش مصنوعی علاوه بر پیشبینی ساختارهای پروتئینی بر اساس توالیهای اسید آمینه آنها، برای کارهای دیگر نیز قابل استفاده است. اما برخی از علاقه مندان به یادگیری ماشینی به سرعت پایان بیوانفورماتیک ساختاری را پیشگویی کردند. بنابراین ما فکر کردیم که این ایده خوبی است که ادامه دهیم و بررسی کنیم، و اکنون میدانیم که نمیتواند تأثیر جهشهای منفرد را پیشبینی کند.»
در سطح عملی، پیشبینی اینکه چگونه جهشهای منفرد بر پایداری پروتئین تأثیر میگذارند، برای غربال کردن بسیاری از جهشهای ممکن برای تعیین اینکه کدام یک ممکن است مفید باشند، مفید است. برای مثال، اگر میخواهید یک افزودنی پروتئینی برای مواد شوینده لباسشویی مقاوم در دمای بالاتر بسازید تا بتواند چربیها، نشاسته، الیاف یا سایر پروتئینها را در آب داغتر تجزیه کند، مفید است. همچنین، پروتئینهای شیرین شناخته شدهاند که میتوانند روزی به جای شکر استفاده شوند، مشروط بر اینکه بتوانند گرمای یک فنجان قهوه یا چای را تحمل کنند.
در سطحی اساسیتر، یافتههای این مطالعه نشان میدهد که هوش مصنوعی امروزی هیچ راهحلی ندارد، و در حالی که ممکن است در حل یک مشکل بسیار موفق باشد، مشکلات دیگر از جمله دهها یا چند چالش بزرگ در بیوانفورماتیک ساختاری باقی ماندهاند. از جمله پیشبینی ساختار کمپلکسهایی که از پروتئینها و مولکولهای کوچک یا DNA یا RNA تشکیل شدهاند، تعیین چگونگی تأثیر جهشها بر انرژی اتصال پروتئینها با مولکولهای دیگر، و طراحی پروتئینهایی با توالیهای اسید آمینه که به آنها ویژگیهای دلخواه را میبخشد، مانند توانایی کاتالیز کردن واکنش های غیرممکن، که به عنوان عنصری از یک “کارخانه مولکولی” کوچک عمل می کند.
نویسندگان این مطالعه در PLOS One علاوه بر یادآوری اینکه حتی پس از AlphaFold، دانشمندان رشته خود یک یا دو کار برای انجام دادن دارند، این بحث را بررسی میکنند که موفقیت برنامه هوش مصنوعی ناشی از «یادگرفتن فیزیک» است. مخالف فقط درونی کردن کلیت ساختارهای پروتئینی شناخته شده برای بشریت و دستکاری هوشمندانه آنها. ظاهراً اینطور نیست، زیرا با دانستن فیزیک مربوطه، مقایسه دو ساختار بسیار مشابه اما نه یکسان از نظر پایداری باید نسبتاً آسان باشد، اما این دقیقاً کاری است که AlphaFold انجام نداده است.
این نکته توسط دو شرط قبلی در مورد “دانش” هوش مصنوعی از فیزیک پشتیبانی می شود. ابتدا، AlphaFold برخی از ساختارها را با گروههای جانبی آویزان پیشبینی میکند که نشان میدهد یون روی به آنها متصل است. با این حال، ورودی برنامه محدود به توالی اسید آمینه پروتئین است، بنابراین تنها دلیل وجود «روی نامرئی» این است که هوش مصنوعی بر روی ساختارهای پروتئینی مشابه متصل به این یون آموزش دیده است. بدون روی، جهت گیری گروه جانبی پیش بینی شده با فیزیک در تضاد است. دوم، AlphaFold میتواند یک ساختار پروتئین منفرد را پیشبینی کند که شبیه به یک مارپیچ به نظر میرسد و در واقع دقیق است – به شرطی که با دو زنجیره دیگر در هم آمیخته باشد. بدون آنها، پیش بینی از نظر فیزیکی نادرست است. بنابراین به جای تکیه بر فیزیک، برنامه باید به سادگی شکلی را که از یک ساختار ترکیبی جدا شده است، بازتولید کند.
جالب اینجاست که این تحقیق از یک پروژه «بازیگوشانه» که شامل شرکت کنندگان دانشکده زیست شناسی مولکولی و نظری بود، نشأت گرفت. ما آن را «بازیهای با آلفا فولد» نامیدیم. لحظه ای که AlphaFold به طور آشکار در دسترس قرار گرفت، آزمایشگاه ما آن را روی ابررایانه Zhores نصب کرد. یکی از بازی ها شامل مقایسه اثرات جهش شناخته شده با آنچه AlphaFold برای پروتئین های اصلی و جهش یافته پیش بینی می کند. این منجر به مطالعهای شد که در آن دانشآموزان دبیرستانی این شانس را داشتند که به طور همزمان یک ابر رایانه و هوش مصنوعی پیشرفته را تجربه کنند.
مطالعه گزارش شده در این داستان توسط دانشمندان Skoltech، همکارانشان از مؤسسه علم و فناوری اتریش و مؤسسه علم و فناوری اوکیناوا، ژاپن و دانش آموزان دبیرستانی که در حال حاضر در دانشگاه فدرال اورال و دوستی مردم تحصیل می کنند، انجام شده است. دانشگاه روسیه و کالج جهانی متحد آرماند هامر غرب آمریکا.
دیدگاهتان را بنویسید