همکاری جدید تحقیقاتی بین اسرائیل و ژاپن ادعا می کند که سیستم های تشخیص عابر پیاده دارای ضعف های ذاتی هستند و به افراد آگاه اجازه می دهد تا با پیمایش مسیرهای با دقت برنامه ریزی شده از طریق مناطقی که شبکه های نظارتی کمترین موثر هستند ، از سیستم های تشخیص چهره خودداری کنند.
با کمک فیلم های در دسترس عموم از توکیو ، نیویورک و سانفرانسیسکو ، محققان با استفاده از محبوب ترین سیستم های تشخیص شیء که احتمالاً در شبکه های عمومی مورد استفاده قرار می گیرند ، یک روش خودکار برای محاسبه چنین مسیرهایی تهیه کردند.
با این روش ، تولید امکان پذیر است نقشه های گرمای اعتماد به نفس آن مناطق مشخص شده در داخل دوربین که در آن احتمالاً عابران پیاده به احتمال زیاد به تشخیص مثبت صورت ارائه می دهند:
از نظر تئوری ، چنین روشی می تواند در یک برنامه آگاه از مکان ، یا نوع دیگری از سکوی دیگر برای انتشار مسیرهای کمترین “دوستانه” از A تا B در هر مکان محاسبه شده ، نقش داشته باشد.
مقاله جدید چنین روشی را با عنوان ارائه می دهد تکنیک تقویت حریم خصوصی مبتنی بر مکان (L-PET) ؛ همچنین یک اندازه متقابل با عنوان پیشنهاد می کند آستانه تطبیقی مبتنی بر مکان (L-BAT) ، که اساساً دقیقاً همان روالها را اجرا می کند ، اما سپس از اطلاعات برای تقویت و بهبود اقدامات نظارت استفاده می کند ، به جای اینکه راه هایی برای جلوگیری از شناخت داشته باشد. و در بسیاری از موارد ، چنین پیشرفت هایی بدون سرمایه گذاری بیشتر در زیرساخت های نظارت امکان پذیر نخواهد بود.
بنابراین این مقاله یک جنگ بالقوه فن آوری در مورد تشدید بین کسانی را که به دنبال بهینه سازی مسیرهای خود هستند ، برای جلوگیری از تشخیص و توانایی سیستم های نظارتی در استفاده کامل از فن آوری های تشخیص چهره تنظیم می کند.
روشهای قبلی برای خنثی کردن تشخیص کمتر از این است ، و مرکز آن را متمرکز کنید رویکردهای مخالف، مانند حملات TNT، و استفاده از الگوهای چاپی برای سردرگمی الگوریتم تشخیص.
محققان در پشت مقاله جدید مشاهده می کنند که رویکرد آنها نیاز به آماده سازی کمتری دارد ، بدون نیاز به ابداع وسایل پوشیدنی مخالف (به تصویر بالا مراجعه کنید).
در کاغذ عنوان شده است یک روش تقویت حریم خصوصی برای فرار از تشخیص توسط دوربین های فیلمبرداری خیابانی بدون استفاده از لوازم جانبی مخالف، و از پنج محقق در سراسر دانشگاه بن گوریون Negev و Fujitsu Limited آمده است.
روش و آزمایشات
مطابق با آثار قبلی مانند ماسک مخالفبا مشهودبا تکه های مخالفو محققان تصور می كنند كه “مهاجم” عابر پیاده می داند كه از سیستم تشخیص شیء در شبکه نظارت استفاده می شود. این در واقع یک فرض غیر منطقی نیست ، به دلیل اتخاذ گسترده سیستم های منبع باز پیشرفته مانند YOLO در سیستم های نظارتی از امثال سیسکو وت فراوانی (در حال حاضر نیروی محرک اصلی در توسعه یولو).
این مقاله همچنین فرض می کند که عابر پیاده به یک جریان مستقیم در اینترنت که در مکان هایی که باید محاسبه شود دسترسی دارد ، که باز هم ، یک است فرض معقول در بیشتر مکانهایی که احتمالاً شدت پوشش دارند.
علاوه بر این ، عابر پیاده نیاز به دسترسی به روش پیشنهادی و خود صحنه دارد (یعنی گذرگاه ها و مسیرهایی که یک مسیر “ایمن” در آن ایجاد می شود).
برای توسعه L-PET ، نویسندگان تأثیر زاویه عابر پیاده در رابطه با دوربین را ارزیابی کردند. تأثیر ارتفاع دوربین ؛ تأثیر فاصله ؛ و تأثیر زمان روز. برای به دست آوردن حقیقت زمینی ، آنها از شخصی در زاویه های 0 درجه ، 45 درجه ، 90 درجه ، 135 درجه ، 180 درجه ، 225 درجه ، 270 درجه و 315 درجه عکس می گرفتند.
آنها این تغییرات را در سه ارتفاع دوربین مختلف (0.6 متر ، 1.8 متر ، 2.4 متر) و با شرایط روشنایی متنوع (شرایط صبح ، بعد از ظهر ، شب و “آزمایشگاه”) تکرار کردند.
تغذیه این فیلم به R-CNN سریعتر وت yolov3 ردیاب های شیء ، آنها دریافتند که اعتماد به نفس جسم به حادثه زاویه عابر پیاده ، فاصله عابر پیاده ، ارتفاع دوربین و شرایط آب و هوا/روشنایی*بستگی دارد.
سپس نویسندگان طیف گسترده تری از ردیاب های شی را در همان سناریو آزمایش کردند: R-CNN سریعتر. yolov3 ؛ SSD؛ انتشار؛ وت rtmdetبشر
نویسندگان اظهار داشتند:
“ما دریافتیم که هر پنج معماری ردیاب شیء تحت تأثیر موقعیت عابر پیاده و نور محیط قرار دارند. علاوه بر این ، ما دریافتیم که برای سه مورد از پنج مدل (YOLOV3 ، SSD و RTMDET) این اثر در تمام سطح نور محیط ادامه دارد.
برای گسترش دامنه ، محققان از فیلم های گرفته شده از دوربین های ترافیکی در دسترس عمومی در سه مکان استفاده کردند: عبور Shibuya در توکیو ، برادوی در نیویورک و منطقه کاسترو در سانفرانسیسکو.
هر مکان بین پنج تا شش ضبط ، تقریباً چهار ساعت فیلم در هر ضبط. برای تجزیه و تحلیل عملکرد تشخیص ، یک قاب هر دو ثانیه استخراج شد و با استفاده از یک ردیاب سریعتر R-CNN شیء پردازش شد. برای هر پیکسل در فریم های به دست آمده ، این روش اطمینان متوسط اعتماد جعبه های محدود کننده “شخص” را که در آن پیکسل وجود دارد ، تخمین زده است.
“ما دریافتیم که در هر سه مکان ، اعتماد به نفس ردیاب شیء بسته به موقعیت افراد در قاب متفاوت است. به عنوان مثال ، در فیلم های عبور از Shibuya ، مناطق بزرگی از اعتماد به نفس کم دورتر از دوربین و همچنین نزدیکتر به دوربین وجود دارد ، جایی که یک قطب تا حدی مبهم است که عابران پیاده را مبهم می کند.
روش L-PET اساساً این روش است ، که مسلماً برای دستیابی به مسیری از طریق یک منطقه شهری که حداقل احتمالاً منجر به شناسایی موفقیت آمیز عابر پیاده می شود ، “سلاح” شده است.
در مقابل ، L-BAT همان رویه را دنبال می کند ، با این تفاوت که نمرات موجود در سیستم تشخیص را به روز می کند ، یک حلقه بازخورد ایجاد می کند که برای جلوگیری از رویکرد L-PET طراحی شده و “مناطق کور” سیستم را مؤثرتر می کند.
(از نظر عملی ، با این حال ، بهبود پوشش بر اساس مپ برزیهای گرمازدگی به بیش از ارتقاء دوربین نشسته در موقعیت مورد انتظار نیاز دارد ؛ بر اساس معیارهای آزمایش ، از جمله مکان ، نیاز به نصب دوربین های اضافی برای پوشش غفلت دارد مناطق-بنابراین می توان ادعا کرد که روش L-PET این “جنگ سرد” خاص را به یک سناریوی بسیار گران قیمت تبدیل می کند)
با تبدیل نمایش ماتریس مبتنی بر پیکسل به a نمایش نمودار مناسب برای کار ، محققان سازگار شدند الگوریتم Dijkstra برای محاسبه مسیرهای بهینه برای حرکت عابران پیاده از طریق مناطقی با کاهش نظارت.
به جای پیدا کردن کوتاهترین مسیر ، الگوریتم برای به حداقل رساندن اعتماد به نفس تشخیص ، اصلاح شد و مناطق اعتماد به نفس بالا را به عنوان مناطقی با “هزینه” بالاتر درمان کرد. این سازگاری به الگوریتم اجازه می دهد مسیرهای عبور از نقاط کور یا مناطق کم تشخیص را شناسایی کند ، و به طور موثری عابران را در طول مسیرها با کاهش دید در سیستم های نظارت هدایت کند.
محققان تأثیر سیستم L-BAT در تشخیص عابر پیاده را با یک مجموعه داده ساخته شده از ضبط های چهار ساعته فوق از ترافیک عابر پیاده عمومی ارزیابی کردند. برای جمع آوری مجموعه ، هر دو ثانیه با استفاده از یک ردیاب شی SSD یک قاب پردازش می شد.
از هر فریم ، یک جعبه محدود کننده حاوی یک فرد شناسایی شده به عنوان یک نمونه مثبت انتخاب شد و یک منطقه تصادفی دیگر که هیچ یک از افراد شناسایی شده به عنوان یک نمونه منفی استفاده نشده است. این نمونه های دوقلوی یک مجموعه داده برای ارزیابی دو مدل R-CNN سریعتر-یکی با L-BAT اعمال شده و دیگری بدون.
عملکرد مدل ها با بررسی چگونگی مشخص کردن آنها نمونه های مثبت و منفی ارزیابی شد: یک جعبه محدود کننده با هم همپوشانی یک نمونه مثبت ، یک مثبت واقعی در نظر گرفته شد ، در حالی که یک جعبه محدود کننده با همپوشانی یک نمونه منفی ، دارای یک مثبت کاذب بود.
معیارهای مورد استفاده برای تعیین قابلیت اطمینان تشخیص L-BAT بودند منطقه زیر منحنی (AUC) ؛ نرخ مثبت واقعی (TPR) ؛ نرخ مثبت کاذب (FPR) ؛ و متوسط اعتماد به نفس مثبت واقعی. محققان ادعا می کنند که استفاده از L-BAT باعث افزایش اعتماد به نفس در ضمن حفظ نرخ مثبت واقعی بالا (البته با افزایش اندک در مثبت کاذب) می شود.
در پایان ، نویسندگان خاطرنشان می کنند که این رویکرد محدودیت هایی دارد. یکی این است که نقشه های گرمای حاصل از روش آنها مخصوص زمان خاصی از روز است. اگرچه آنها در مورد آن توضیح نمی دهند ، اما این نشان می دهد که یک رویکرد بیشتر و چند لایه برای زمان روز در استقرار انعطاف پذیر مورد نیاز است.
آنها همچنین مشاهده می كنند كه نقشه های گرما به معماری های مختلف مدل منتقل نمی شوند و به یك مدل خاص ردیاب شیء گره خورده اند. از آنجا که کار پیشنهادی اساساً اثبات مفهومی است ، احتمالاً معماری های Adroit می توانند برای اصلاح این بدهی فنی نیز توسعه یابد.
پایان
هر روش حمله جدیدی که برای آن راه حل “پرداخت دوربین های نظارت جدید” از مزیت آن برخوردار است ، زیرا گسترش شبکه های دوربین مدنی در مناطق بسیار گسترده می تواند باشد از نظر سیاسی چالش برانگیز، و همچنین نمایندگی یک هزینه مدنی قابل توجه که معمولاً به یک دستورالعمل رای دهنده نیاز دارد.
شاید بزرگترین سؤالی که توسط کار مطرح شده است این باشد “آیا سیستم های نظارت بر منبع بسته از چارچوب های SOTA منبع باز مانند Yolo استفاده می کنند؟”بشر البته این امر غیرممکن است ، زیرا سازندگان سیستم های اختصاصی که بسیاری از شبکه های دوربین دولتی و مدنی (حداقل در ایالات متحده) را قدرت می دهند ، استدلال می کنند که افشای چنین استفاده ممکن است آنها را برای حمله باز کند.
با این وجود ، مهاجرت IT و کد اختصاصی دولت به کد منبع جهانی و منبع باز نشان می دهد که هرکسی که مشاجره نویسندگان را آزمایش می کند (برای مثال) Yolo ممکن است بلافاصله به جکپات برخورد کند.
* من معمولاً نتایج جدول مربوط به آنها را در هنگام تهیه مقاله درج می کنم ، اما در این حالت پیچیدگی جداول کاغذ باعث می شود که آنها به خواننده گاه به گاه بی پروا باشند و بنابراین خلاصه ای مفیدتر است.
اولین بار منتشر شد سه شنبه ، 28 ژانویه 2025