دیروز Nvidia با عجله از یک هاتفیکس بحرانی برای جلوگیری از انتشار قبلی راننده که باعث زنگ هشدار در سراسر AI و جوامع بازی شده بود ، با ایجاد سیستم برای گزارش به دروغ دمای GPU ایمن – حتی اگر تقاضای خنک کننده بی سر و صدا به سمت سطح بالقوه بحرانی صعود کند.
در مقام رسمی Nvidia پست در اطراف نسخه Hotfix ، اگرچه تنها در لیست اصلاحات اعلام شده سوم است ، موضوع به عنوان “ذکر شده است”برنامه های نظارت بر GPU ممکن است گزارش دمای GPU را پس از بیدار شدن رایانه از خواب متوقف کندبشر
اندکی پس از درایور آماده بازی آسیب دیده 576.02 چرخانده شد ، الف نخ پین شده در Sub-Reddit انتشار پایدار ، با عنوان برای ذخیره GPU خود بخوانید!، به منبعی برای مسائل مربوط به حکایات و به روزرسانی های گزارش شده توسط کاربر در مورد درایور جدید تبدیل شد. از این موارد و سایر گزارش ها در سراسر وب ، می توان برخی از مشکلات ظهور مشکلات ظهور را ایجاد کرد.
به نظر می رسد اولین گزارش Reddit از این اشکال است اتفاق افتاد اواخر جمعه بعد از ظهر UTC ، در Subreddit Zephyrusg14 ، جایی که کاربر Fricy81 استناد کرد پست در انجمن های Nvidia (بایگانی شده):

یک کاربر در انجمن های NVIDIA پس از بروزرسانی 576.02 مشکلات را پیدا می کند. منبع: https://www.nvidia.com/en-us/geforce/forums/game-round-ddrivers/13/563010/geforce-grd-57602-feedback-thread-41625/3524072/
کاربر در انجمن های NVIDIA گزارش داد که پس از نصب به روزرسانی درایور ، ابزارهایی مانند MSI Afterburner و مانیتورهای درون بازی مانند One In فراخوان وظیفه (که به طور کلی به خوانش های سیستم بومی دسترسی پیدا می کند ، به همان اندازه که پانل GPU Task Manager در ویندوز انجام می دهد) به روزرسانی خوانش دمای GPU را متوقف کرد و در دمای 35-36 درجه سانتیگراد یخ زد.
کاربر اظهار داشت: راه اندازی مجدد نرم افزار مانیتورینگ هیچ تاثیری ندارد و فقط یک راه اندازی مجدد سیستم کامل باعث بازگرداندن خوانش های دقیق می شود. ابزارهایی مانند برنامه مانیتورینگ خود Hwinfo و Nvidia همچنان به درستی دما گزارش می دهند. کاربر تأکید کرد که این مسئله در هنگام استفاده عادی رخ داده است ، نه فقط پس از بیدار شدن سیستم از خواب.
بازخورد کاربر در انجمن های مختلف ، اختلال کلی در رفتار منحنی فن طبیعی و تغییر در تنظیم حرارتی هسته را برجسته می کند ، و در نتیجه واحدهای پردازش گرافیکی در دماهای غیر منتظره بالایی قرار می گیرند ، و به طرز هشدار بیش از حد تحت آنچه که معمولاً بارهای عملیاتی استاندارد در نظر گرفته می شوند ، در این نظر:
“من می توانم بگویم چیزی خاموش بود. هوای خارج احتمالاً در حدود 55 درجه فارنهایت / 12 درجه سانتیگراد بود ، اما من در اتاقم زنده می پختم. پنجره من باز بود ، اما با این حال من نمی توانستم تفاوت را حس کنم. همه طرفداران در حداکثر کار می کردند و دما در ابتدا خوب 68 درجه سانتیگراد تا 72 درجه سانتیگراد پس از مدتی بازی می کرد.
“در ابتدا ، این طبیعی به نظر می رسید – تا صبح روز بعد ، وقتی فهمیدم که این افراد بیکار نیستند ، و طرفداران هنوز هم بودند [kicking]بشر
“من بعد از اصلاح چند کار ، او بیش از حد AI Overclocking انجام داده بودم ، بنابراین مطمئن نبودم که آیا این مقادیر خیلی زیاد زیاد شده است. این اتفاق قبل از نصب ASUS AI Suite 3 یک بار اتفاق افتاده است – تنظیمات BIOS حتی به دلیل آن به درستی کار نمی کند.
“به هر حال ، من جلو رفتم و فعلاً به یک راننده بزرگتر برگشتم.”
زیر مطلوب
آزادی رسمی PDF برای به روزرسانی درایور 576.02 برخی از سرنخ ها در مورد تغییراتی که ممکن است در موضوعات جدید نقش داشته باشد ، ارائه می دهد. در بخش 5.5 ، Nvidia اذعان می کند که دمای GPU می تواند به طور نادرست در Nvidia گزارش شود بهینه سیستم ها ، به طور خاص در هنگام اجرای برنامه ، درجه صفر را نشان می دهند.

بخش 5.5 از یادداشت های رسمی 576.02 به روزرسانی به مسائل مربوط به نظارت بر دما می پردازد که به نظر می رسد تعداد گسترده تری از سیستم ها را نسبت به سیستم Optimus تحت تأثیر قرار داده است. منبع: https://us.download.nvidia.com/windows/576.02/576.02-win11-win10-release-notes.pdf
در انتشار آمده است:
5.5 دمای GPU به طور نادرست در سیستم های Optimus گزارش شده است
شماره 5.5.1
در سیستم های Optimus ، ابزارهای گزارش دما مانند Speccy یا GPU-Z گزارش می دهند که در صورت عدم کاربرد ، دمای GPU NVIDIA صفر است.
5.5.2 توضیح
در سیستم های Optimus ، هنگامی که از GPU NVIDIA استفاده نمی شود ، در حالت کم مصرف قرار می گیرد. این باعث می شود ابزارهای گزارش دما مقادیر نادرست را برگردانند. بیدار شدن از GPU برای پرس و جو دما منجر به اندازه گیری های بی معنی می شود زیرا در نتیجه دمای GPU تغییر می کند.
این ابزارها دمای دقیق را فقط در هنگام بیدار شدن از GPU گزارش می کنند.
NVIDIA Optimus یک فناوری سوئیچینگ GPU است که بر اساس تقاضای برنامه ، بین گرافیک های یکپارچه و گسسته ، به منظور تعادل خودکار عملکرد و مصرف برق ، طراحی شده برای حفظ عمر باتری و کاهش مصرف برق است. برای کارهایی مانند بازی یا پخش ویدیوی HD ، Optimus برای عملکرد بهتر GPU گسسته را فعال می کند. در حین فعالیتهای سبک تر مانند مرور وب ، به گرافیک یکپارچه (پردازنده) برمی گردد.
به نظر می رسد که این بروزرسانی رفتاری را که قبلاً به سیستم های Optimus محدود شده بود ، گسترش داده است و به GPU آسیب دیده اجازه می دهد در حالی که بیکار است ، حتی اگر در یک سیستم Optimus میزبانی نشود ، وارد یک حالت کم قدرت شود ، به نوبه خود گزارش دما را در ابزارهای شخص ثالث مختل می کند.
تنظیم خطر
در بیشتر سناریوها ، عادلانه است که بگوییم کارت گرافیک VBIOS احتمالاً از آسیب دیدگی GPU دائمی جلوگیری می کرد. VBIOS محدودیت های حرارتی و برق را در سطح سیستم عامل ، به طور مستقل از درایور اعمال می کند.
بنابراین حتی اگر یک راننده باعث ایجاد رفتار نادرست فن یا درجه حرارت نادرست شود ، VBIO ها هنوز هم باید عملکرد را گاز بگیرند ، فعالیت فن را تقویت کنند ، یا در غیر این صورت GPU را خاموش کنند تا از خرابی سخت افزار جلوگیری شود.
این بدان معنا نیست که خطر بی اهمیت بوده است – دمای بالا پایدار می تواند عملکرد را با گذشت زمان تخریب کند یا استرس اجزای مجاور؛ علاوه بر این ، یک درک مشترک وجود ندارد که یک درایور به روز شده باعث ایجاد مشکلی شود (به ویژه در سیستم هایی که رانندگان “سکوت” را به روز می کنند) ، مسئله ای از این طبیعت می تواند بخش بزرگی از کاربران آسیب دیده را گمراه کند ، که ممکن است با استفاده از اصلاحات غیر متجاوز ، اقدامات درمانی را برای مشکلات غیر موجود انجام دهند ، یا حتی به طور بالقوه باعث ایجاد آسیب به سیستم های خود شوند.
رفتار ناشایست ناشی از بروزرسانی 576.02 به ویژه برای کسانی که درگیر گردش کار هوش مصنوعی بودند ، نگران کننده بود ، جایی که سخت افزار با کارایی بالا به طور معمول برای مدت زمان طولانی به محدوده حرارتی آن منتقل می شود.
درایور مشکل ساز 576.02 پس از آزادی در اواسط آوریل ، با وجود اولیه ، الهام بخش شکایات گسترده تری بود گزارش که برخی از بهبود عملکرد مفید را ارائه می دهد. علی رغم تهیه فایکس و میزان اختلال در 576.02 به نظر می رسد ، در زمان نوشتن آن باقی مانده است برای بارگیری در دسترس است* در سایت Nvidia.
پس از گل
از نظر نتیجه از بروزرسانی معیوب ، انواع بی شماری از آسیب ها و یا ناراحتی گزارش شده است: کاربر Frankie_T9000 گزارش شده اینکه GPU وی به دلیل ایجاد گرما در زیر بروزرسانی گسل ، روی بوت سقوط کرد و فقط پس از تحمل تثبیت تثبیت شد. او اظهار داشتبه نظر می رسد که به طور دائم آسیب دیده است ، اما نیاز به بازپرداخت ASAP دارد (من چهارشنبه پدهای آینده دارم) گمان می کنم که خمیر حرارتی قدیمی بیشتر از طریق گرما بیشتر شده است ، بنابراین من لنت های جدید خمیر را قرار می دهم.‘
دیروز کاربر دیگری در همان موضوع بیان شده: “من از یک منحنی فن سفارشی wit msi afterburner استفاده می کنم ، و این نشان می دهد که دمای GPU من به طور مداوم در دمای 27 درجه سانتیگراد است ، بنابراین طرفداران روشن نشدند ، که منجر به بیش از حد مسائل شد. من فکر کردم این مسئله من است اما بعد از نصب درایور قبلی همه دوباره خوب کار کردند. همچنین ، تمایلات به درستی در TaskManager نمایش داده می شود.
اگرچه NVIDIA (همانطور که در هر نسخه HotFix به طور مداوم بیان می شود) اغلب برای بازی های ویدئویی یا سیستم عامل های خاص ، خطای داغ را فراهم می کند ، اما خطر آسیب گرما به GPU برای پزشکان AI بیشتر از ویدیویی ها است ، زیرا فرآیندهای یادگیری ماشین فشرده مانند آموزش یا استنتاج پایدار GPU GPU تحت بار بلند مدت مداوم -رویدادی که احتمالاً فقط به صورت دوره ای در یک بازی ایجاد می شود ، که ممکن است “سنبله” را برای استفاده زیاد برای یک نبرد رئیس یا یک بخش نقشه مخصوصاً خواستار انجام دهد ، اما در غیر این صورت به عنوان سازش بین بهره برداری GPU و ثبات سیستم طراحی شده است.
* بایگانی: https://archive.ph/ylvr1
اولین بار منتشر شد سه شنبه ، 22 آوریل 2025