از EVO 1 تا EVO 2: چگونه NVIDIA در حال تعریف مجدد تحقیقات ژنومی و نوآوری های بیولوژیکی محور AI است


دنیایی را تصور کنید که بتوانیم رفتار زندگی را فقط با تجزیه و تحلیل دنباله ای از حروف پیش بینی کنیم. این داستان علمی تخیلی یا دنیای جادویی نیست ، بلکه دنیای واقعی است که دانشمندان سالها در تلاش برای دستیابی به این هدف هستند. این توالی ها ، که از چهار نوکلئوتید (A ، T ، C و G) تشکیل شده اند ، حاوی دستورالعمل های اساسی برای زندگی روی زمین ، از کوچکترین میکروب تا بزرگترین پستانداران هستند. رمزگشایی این توالی ها پتانسیل باز کردن فرآیندهای بیولوژیکی پیچیده را دارد ، زمینه هایی مانند پزشکی شخصی و پایداری محیط زیست را تغییر می دهد.

با این حال ، با وجود این پتانسیل عظیم ، رمزگشایی حتی ساده ترین ژنوم میکروبی یک کار بسیار پیچیده است. این ژنوم ها از میلیون ها جفت پایه DNA تشکیل شده اند که تعامل بین DNA ، RNA و پروتئین ها را تنظیم می کنند – سه عنصر اصلی در جزم مرکزی زیست شناسی مولکولی. این پیچیدگی در چندین سطح وجود دارد ، از مولکول های فردی تا کل ژنوم ، ایجاد زمینه وسیعی از اطلاعات ژنتیکی که در طول میلیاردها سال تکامل یافته است.

ابزارهای محاسباتی سنتی برای رسیدگی به پیچیدگی توالی های بیولوژیکی تلاش کرده اند. اما با ظهور AI مولد ، اکنون می توان بیش از تریلیون ها سکانس را مقیاس کرد و روابط پیچیده را در بین توالی نشانه ها درک کرد. محققان موسسه ARC ، دانشگاه استنفورد و Nvidia با تکیه بر این پیشرفت ، در ساخت سیستم هوش مصنوعی کار می کنند که می تواند توالی های بیولوژیکی مانند مدل های بزرگ زبان را درک کند ، متن انسانی را درک می کند. اکنون ، آنها با ایجاد مدلی که هم ماهیت مولتی مدال جزم مرکزی و هم پیچیدگی های تکامل را ضبط می کند ، پیشرفت پیشگامانه ای ایجاد کرده اند. این نوآوری می تواند منجر به پیش بینی و طراحی توالی های بیولوژیکی جدید ، از مولکول های فردی تا کل ژنوم شود. در این مقاله ، ما چگونگی عملکرد این فناوری ، کاربردهای بالقوه آن ، چالش های پیش روی آن و آینده مدل سازی ژنومی را بررسی خواهیم کرد.

EVO 1: یک مدل پیشگام در مدل سازی ژنومی

این تحقیق در اواخر سال 2024 هنگامی که Nvidia و همکارانش معرفی کردند ، مورد توجه قرار گرفت EVO 1، یک مدل پیشگامانه برای تجزیه و تحلیل و تولید توالی های بیولوژیکی در سراسر DNA ، RNA و پروتئین ها. این مدل که بر روی 2.7 میلیون ژنوم پروکاریوتی و فاژ ، در مجموع 300 میلیارد نشانه نوکلئوتید آموزش دیده است ، این مدل بر ادغام دگم مرکزی زیست شناسی مولکولی متمرکز شده است ، و الگوی جریان اطلاعات ژنتیکی از DNA به RNA به پروتئین ها است. معماری Tripedhyena آن ، یک مدل ترکیبی با استفاده از فیلترهای حلقوی و دروازه ها ، به طور موثری زمینه های طولانی تا 131.072 توکن را کنترل می کند. این طرح به EVO 1 اجازه می دهد تا تغییرات توالی کوچک را به اثرات گسترده سیستم و در سطح ارگانیسم پیوند دهد ، و شکاف بین زیست شناسی مولکولی و ژنومیک تکاملی را ایجاد کند.

EVO 1 اولین قدم در مدل سازی محاسباتی تکامل بیولوژیکی بود. این با موفقیت فعل و انفعالات مولکولی و تغییرات ژنتیکی را با تجزیه و تحلیل الگوهای تکاملی در توالی ژنتیکی پیش بینی کرد. با این حال ، همانطور که دانشمندان قصد داشتند آن را در ژنوم های پیچیده تر یوکاریوتی استفاده کنند ، محدودیت های مدل مشخص شد. EVO 1 با وضوح تک نوکلئوتید در توالی های طولانی DNA تلاش کرد و برای ژنوم های بزرگتر از نظر محاسباتی گران بود. این چالش ها منجر به نیاز به یک مدل پیشرفته تر می شود که قادر به ادغام داده های بیولوژیکی در مقیاس های مختلف باشد.

EVO 2: یک مدل اساسی برای مدل سازی ژنومی

محققان با تکیه بر دروس آموخته شده از EVO-1 ، راه اندازی کردند EVO 2 در فوریه 2025 ، پیشبرد زمینه مدل سازی توالی بیولوژیکی. آموزش دیده در یک جفت پایه DNA 9.3 تریلیون DNA ، این مدل آموخته است که عواقب عملکردی تنوع ژنتیکی را در تمام حوزه های زندگی ، از جمله باکتری ها ، Archaea ، گیاهان ، قارچ ها و حیوانات درک و پیش بینی کند. با بیش از 40 میلیارد پارامتر ، مدل EVO-2 می تواند طول توالی بی سابقه ای را تا 1 میلیون جفت پایه داشته باشد ، چیزی که مدل های قبلی از جمله EVO-1 نتوانستند مدیریت کنند.

آنچه EVO 2 را از پیشینیان خود جدا می کند ، توانایی آن در مدل سازی نه تنها توالی DNA بلکه تعامل بین DNA ، RNA و پروتئین ها است – کل جزم مرکزی زیست شناسی مولکولی. این به EVO 2 اجازه می دهد تا تأثیر جهش های ژنتیکی را به طور دقیق پیش بینی کند ، از کوچکترین تغییرات نوکلئوتید تا تغییرات ساختاری بزرگتر ، به روش هایی که قبلاً غیرممکن بودند.

یکی از ویژگی های اصلی EVO 2 قابلیت پیش بینی صفر قوی آن است که باعث می شود اثرات عملکردی جهش ها را بدون نیاز به تنظیم دقیق کار خاص پیش بینی کند. به عنوان مثال ، با تجزیه و تحلیل توالی DNA به تنهایی ، انواع BRCA1 از نظر بالینی قابل توجه ، یک عامل مهم در تحقیقات سرطان پستان را طبقه بندی می کند.

کاربردهای بالقوه در علوم زیست مولکولی

قابلیت های EVO 2 مرزهای جدیدی را در ژنومیک ، زیست شناسی مولکولی و بیوتکنولوژی باز می کند. برخی از امیدوار کننده ترین برنامه ها عبارتند از:

  • مراقبت های بهداشتی و کشف مواد مخدر: EVO 2 می تواند پیش بینی کند که کدام یک از انواع ژن با بیماری های خاص همراه است و به توسعه روشهای درمانی هدفمند کمک می کند. به عنوان مثال ، در تست ها با انواع ژن مرتبط با سرطان پستان BRCA1 ، EVO 2 بیش از 90 ٪ دقت را در پیش بینی اینکه جهش ها خوش خیم در مقابل بالقوه بیماری زا هستند ، به دست آورد. چنین بینش هایی می تواند باعث پیشرفت داروهای جدید و درمان های شخصی شود. ​
  • زیست شناسی مصنوعی و مهندسی ژنتیک: توانایی EVO 2 در تولید کل ژنوم ، راه های جدیدی را در طراحی ارگانیسم های مصنوعی با صفات مورد نظر باز می کند. محققان می توانند از EVO 2 برای مهندسی ژنهای با عملکردهای خاص ، پیشبرد توسعه سوخت های زیستی ، مواد شیمیایی سازگار با محیط زیست و روشهای درمانی جدید استفاده کنند.
  • بیوتکنولوژی کشاورزی: می توان از آن برای طراحی محصولات زراعی اصلاح شده ژنتیکی با صفات بهبود یافته مانند مقاومت در برابر خشکسالی یا مقاومت به آفات استفاده کرد و به امنیت غذایی جهانی و پایداری کشاورزی کمک کرد.
  • علوم زیست محیطی: EVO 2 را می توان برای طراحی سوخت های زیستی یا پروتئین های مهندس که آلاینده های محیطی مانند روغن یا پلاستیک را تجزیه می کنند ، استفاده کند و به تلاش های پایداری کمک کند.

چالش ها و مسیرهای آینده

با وجود قابلیت های چشمگیر ، EVO 2 با چالش هایی روبرو است. یکی از موانع مهم پیچیدگی محاسباتی است که در آموزش و اجرای مدل نقش دارد. با داشتن یک پنجره متن از 1 میلیون جفت پایه و 40 میلیارد پارامتر ، EVO 2 برای عملکرد مؤثر به منابع محاسباتی قابل توجهی نیاز دارد. این امر باعث می شود تیم های تحقیقاتی کوچکتر بتوانند از پتانسیل های خود بدون دسترسی به زیرساخت های محاسباتی با کارایی بالا ، به طور کامل استفاده کنند.

علاوه بر این ، در حالی که EVO 2 در پیش بینی اثرات جهش ژنتیکی برتری دارد ، هنوز هم باید در مورد نحوه استفاده از آن برای طراحی سیستم های بیولوژیکی جدید از ابتدا بیاموزید. تولید توالی های بیولوژیکی واقع بینانه تنها اولین قدم است. چالش واقعی در درک نحوه استفاده از این قدرت برای ایجاد سیستم های بیولوژیکی کاربردی و پایدار نهفته است.

دسترسی و دموکراتیک سازی هوش مصنوعی در ژنومیک

یکی از جالب ترین جنبه های EVO 2 آن است منبع باز در دسترس بودن برای دموکراتیک کردن دسترسی به ابزارهای پیشرفته مدل سازی ژنومی ، NVIDIA پارامترهای مدل ، کد آموزش و مجموعه داده ها را در دسترس عموم قرار داده است. این رویکرد دسترسی آزاد به محققان از سراسر جهان اجازه می دهد تا توانایی های EVO 2 را کشف و گسترش دهند و نوآوری را در جامعه علمی تسریع کنند.

خط پایین

EVO 2 پیشرفت قابل توجهی در مدل سازی ژنومی ، با استفاده از AI برای رمزگشایی زبان ژنتیکی پیچیده زندگی است. توانایی آن در مدل سازی توالی های DNA و تعامل آنها با RNA و پروتئین ها امکانات جدیدی را در مراقبت های بهداشتی ، کشف مواد مخدر ، زیست شناسی مصنوعی و علوم محیط زیست باز می کند. EVO 2 می تواند جهش های ژنتیکی را پیش بینی کرده و توالی های بیولوژیکی جدیدی را طراحی کرده و پتانسیل تحول آمیز را برای پزشکی شخصی و راه حل های پایدار ارائه دهد. با این حال ، پیچیدگی محاسباتی آن چالش هایی را به ویژه برای تیم های تحقیقاتی کوچکتر نشان می دهد. Nvidia با ساختن منبع باز EVO 2 ، محققان را قادر می سازد تا توانایی های خود را کشف و گسترش دهند و نوآوری را در ژنومیک و بیوتکنولوژی انجام دهند. از آنجا که فناوری همچنان در حال تکامل است ، این پتانسیل را دارد که آینده علوم بیولوژیکی و پایداری محیط زیست را تغییر شکل دهد.



منبع:unite.ai

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *