نمایش خبر

    print

بینایی ماشین یا Machine vision چیست و چه مفاهیمی دارد؟

بینایی ماشین یا Machine Vision (MV) فناوری و روش های مورد استفاده جهت ارائه تحلیل مبتنی بر تصویر، در کاربردهای معمولاً صنعتی از قبیل بازرسی خودکار، کنترل فرایند و هدایت ربات است.

 

بینایی ماشین به فناوری ها، محصولات نرم افزاری و سخت افزاری، سیستم های مجتمع، عملیات، روش ها و مهارت های زیادی اشاره میکند. بینایی ماشین به عنوان یک زمینه مهندسی سامانه ها، میتواند متمایز از بینایی کامپیوتر که شکلی از علوم کامپیوتر است در نظر گرفته شود. این رشته سعی در یکپارچه سازی فناوری های موجود به روش های جدید و استفاده از آنها در حل مسائل جهان واقعی دارد. این عبارت برای عملکردهای فوق در محیط های اوتوماسیون صنعتی رایج تر است اما برای توصیف همین عملکردها در چارچوب های دیگر مثل امینیت و هدایت وسیله نقلیه نیز استفاده میشود.

فرآیند کلی بینایی ماشین شامل طرح ریزی جزیی ملزومات و پروژه، و سپس ساخت راه حل است. در زمان اجرا (runtime)، این فرایند با تصویر برداری آغاز میشود و با تحلیل خودکار تصویر و استخراج اطلاعات لازم ادامه پیدا میکند.

تعریف بینایی ماشین یا Machine vision

تعاریف عبارت “بینایی ماشین” متفاوت هستند اما همگی شامل فناوری و روش های مصرفی جهت استخراج خودکار اطلاعات از تصویر هستند، برخلاف پردازش تصویر که خروجی آن یک تصویر دیگر است. اطلاعات استخراج شده میتواند یک سیگنال ساده بخش خوب/بخش بد، یا مجموعه ای پیچیده تر از داده ها مثل هویت، موقعیت و جهت گیری هر شیء در تصویر باشد. این اطلاعات را میتوان برای کاربردهایی از قبیل بازرسی خودکار و هدایت فرایند و ربات در صنعت، و نظارت امینتی و هدایت وسیله نقلیه استفاده کرد. این رشته فناوری های متعدد، محصولات سخت افزاری و نرم افزاری، سیستم های مجتمع، فعالیت ها، روش ها و مهارت هایی یکپارچه را دربر میگیرد. بینایی ماشین عملاً تنها عبارتی است که برای توصیف این عملکردها در کاربردهای اتوماسیون صنعتی استفاده میشود؛ این عبارت برای توصیف همین کاربردها در سایر محیط ها مثل محیط های امنیتی، فراگیری کمتری دارد. بینایی ماشین به عنوان یک زمینه از مهندسی سامانه ها، میتواند متمایز از بینایی کامپیوتر در نظر گرفته شود که شکلی از علوم کامپیوتر است؛ بینایی ماشین سعی در یکپارچه سازی فناوری های موجود به روش های جدید و استفاده از آنها جهت حل مسائل جهان واقعی دارد بطوری که نیازهای اتوماسیون صنعتی و زمینه های کاربردی مشابه آن برآورده شوند. این عبارت همچنین به معنایی وسیع تر توسط نمایش های تجاری و گروه های تجاری مثل انجمن تصویربرداری خودکار (Automated Imaging Association) و انجمن بینایی ماشین اروپا (European Machine Vision Association) استفاده میشود. تعریف وسیع تر همچنین شامل محصولات و کاربردهایی است که اغلب با پردازش تصویر مرتبط میشوند. اولویت های  مصرفی برای بینایی ماشین، بارزسی خودکار و هدایت صنعتی فرایند/ربات است. لغتنامه بینایی ماشین را ملاحظه کنید.

جورسازی و بازرسی خودکار مبتنی بر تصویربرداری

اولویت های مصرفی برای بینایی ماشین، بازرسی خودکار مبتنی بر تصویربرداری، جورسازی و هدایت ربات است؛ در این بخش مورد اول را به “بازرسی خودکار” کوتاه میکنیم. فرایند کلی شامل طرح ریزی جزیی ملزومات و پروژه و سپس ساختن یک راه حل است. این بخش، فرایند فنی رخ داده طی بهره برداری از راه حل را تشریح میکند.

روش ها و توالی عملیات

اولین گام در توالی بازرسی خودکار عملیات، دستیابی به تصویر است، که معمولاً با دوربین، لنز و نورپردازی انجام میشود که برای ایجاد تفکیک مورد نیاز پردازش های آتی طراحی میشود. سپس برنامه ها و بسته های نرم افزاری MV توسعه داده شده در آنها از انواع تکنیک های پردازش تصویر دیجیتال جهت استخراج اطلاعات لازم استفاده میکنند و اغلب بر اساس اطلاعات استخراجی، تصمیم گیری میکنند (مثل عبور/عدم عبور).

تجهیزات

اجزای یک سیستم بازرسی خودکار معمولاً شامل نورپردازی، دوربین یا یک تصویربردار دیگر، یک پردازشگر، نرم افزار و دستگاه خروجی است.

تصویربرداری

دستگاه تصویربرداری (مثلاً دوربین) میتواند هم از واحد پردازش اصلی مجزا باشد و هم با آن ترکیب شده باشد که در این صورت به این ترکیب یک دوربین هوشمند یا حسگر هوشمند گفته میشود. هنگامی که مجزا باشند، میتوان اتصال را به یک سخت افزار میانجی تخصصی، یک ابزار پردازشی سفارشی، یا یک فریم گربر (framegrabber) درون کامپیوتری که از یک رابط آنالوگ یا دیجیتالی استاندارد استفاده میکند، برقرار کرد (مثل Camera Link و CoaXPress). پیاده سازی های MV همچنین از دوربین های دیجیتالی که (بدون فریم گربر) از طریق رابط های Firewire، USB یا Gigabit Ethernet قادر به اتصال مستقیم به کامپیوتر هستند، استفاده میکنند.

درحالیکه تصویربرداری معمولی (2 بعدی با نور مرئی) در MV بیشترین استفاده را دارد، گزینه های دیگر شامل تصویربرداری چندطیفی، تصویربرداری فراطیفی، تصویربرداری باندهای مختلف فروسرخ، تصویربرداری اسکن خطی، تصویربرداری سه بعدی رویه ها و تصویربرداری اشعه ایکس است. تفکیک های کلیدی در تصویربرداری نور مرئی دو بعدی عبارت اند از تک رنگی و چندرنگی، سرعت فریم، رزولوشن، و اینکه آیا فرایند تصویربرداری در سراسر تصویر همزمان است یا خیر، که آن را برای فرایندهای حرکتی سازگار میکند.

گرچه اکثر کاربردهای بینایی ماشین با استفاده از تصویربرداری دو بعدی انجام میشود، اما کاربردهایی که از تصویربرداری سه بعدی استفاده میکنند نیز در صنعت جایگاه خود را بدست آورده اند. متداول ترین روش برای تصویربرداری سه بعدی، مثلث بندی مبتنی بر اسکن است که از حرکت محصول یا تصویر طی فرایند تصویربرداری بهره میگیرد. یک لیزر به سطوح شیء تابیده میشود و از زاویه ای متفاوت به آن نگریسته میشود. در بینایی ماشین این عمل با یک حرکت اسکن کننده، با حرکت دادن شیئ یا حرکت دادن دوربین و سیستم تصویربرداری، انجام میشود. توسط دوربین از زاویه ای متفاوت به خط نگریسته میشود؛ انحرافات خط نمایانگر تغییرات شیء است. خطوطی که از اسکن های مختلف بدست میاید در یک نگاشت عمقی یا اَبر نقطه گردآوری میشوند.

بینایی استریواسکوپی (برجسته بین) در حالت های خاصی که ویژگی هایی منحصر به فرد در دید هر جفت دوبین وجود داشته باشد استفاده میشود. سایر روش های سه بعدی مورد استفاده در بینایی ماشین بر مشبک (grid) و مدت پرواز مبتنی هستند. یک روش، سیستم های آرایه ای مشبک است که از سیستم نوری ساختاریافته شبه تصادفی استفاده میکنند که در مایکروسافت کینکت حدود سال 2012 استفاده شد.

پردازش تصویر

پس از بدست آمدن تصویر، آن را پردازش میکنند. عموماً از چند مرحله پردازش در توالی ای که به نتیجه مطلوب میرسد، بهره گرفته میشود. یک توالی عادی ممکن است با ابزاری مثل فیلترها شروع شود که تصویر را اصلاح میکنند، در ادامه استخراج اشیاء، سپس استخراج (مثلاً اندازه گیری یا خواندن کدها) داده از این اشیاء، و در نهایت انتقال این داده ها یا مقایسه آنها با مقادیر هدف جهت ارائه و مخابره نتایج “عبور/عدم عبور”. روش های پردازش تصویر بینایی ماشین شامل این موارد است:

  • دوختن/ثبت کردن: ترکیب تصاویر دو بعدی یا سه بعدی مجاور.
  • فیلترینگ (مثلاً فیلترینگ مورفولوژی یا ریخت شناسی)
  •  آستانه گزینی: آستانه گزینی با تعیین یا مقرر کردن یک مقدار خاکستری آغاز میشود که برای گام های بعدی مفید خواهد بود. این مقدار سپس برای جداسازی قطعه هایی از تصویر استفاده میشود، و گاهی اوقات برای تبدیل هر قطعه از تصویر به سیاه و سفید معمولی بسته به اینکه پایین تر یا بالاتر از مقدار خاکستری باشد.
  • شمارش پیکسل: تعداد پیکسل های روشن یا خاموش را میشمارد.
  • بخش بندی: افراز یک تصویر دیجیتال به چند بخش جهت ساده سازی و یا تغییر نمایش تصویر به چیزی معنادارتر که تحلیل آن ساده تر باشد.
  • شناسایی لبه: پیدا کرده لبه های اشیاء.
  • تحلیل رنگ: شناسایی بخش ها، محصولات و آیتم ها با استفاده از رنگ، ارزیابی کیفت توسط رنگ و منزوی کردن ویژگی ها با استفاده از رنگ.
  • شناسایی و استخراج حباب: بازرسی تصویر برای یافتن حباب (ناحیه) هایی از پیکسل های متصل (مثلاً یک حفره سیاه در شیئی خاکستری) به عنوان نواحی مهم تصویر.
  • پردازش تور عصبی/یادگیری عمیق / یادگیری ماشین: تصمیم گیری وزندار و خودآموز چند متغیره. این موضوعات از حدود سال 2018 گسترش وسیعی پیدا کرده است و استفاده از یادگیری عمیق و یادگیری ماشین توانایی های بینایی ماشین را افزایش داده است.
  • الگوشناسی: الگوشناسی که شامل تطابق نمونه (template matching) است، الگوهای خاص را پیدا میکند، تطابق میدهد و یا میشمارد. این کار ممکن است شامل موقعیت شیئی باشد که دَوَران یافته، توسط شیئی دیگر بطور ناقص پنهان شده، یا اندازه متغیر داشته باشد.
  • خواندن بارکد، ماتریس داده و “بارکد دو بعدی”.
  • شناسایی حروف نوری: خواندن خودکار متنونی از قبیل شماره سریال.
  • اندازه شناسی/مترولوژی: اندازه گیری ابعاد اشیاء (مثلاً به پیکسل، اینچ یا میلیمتر).
  • مقایسه با مقادیر هدف جهت تعیین نتیجه “عبور یا عدم عبود” یا “برو یا نرو”. برای مثال، در تصدیق کد یا بارکد، مقدار خوانده شده با مقدار هدفِ ذخیره شده مقایسه میشود. برای اندازه گیری، یک اندازه با مقدار مناسب و خطای قابل قبول آن مقایسه میشود. در تصدیق کدهای الفبایی-عددی، مقدار OCR’d با مقدار مناسب هدف مقایسه میشود. در بازرسی آسیب، اندازه آسیب دیدگی ممکن است با مقادیر بیشینه مجاز توسط استانداردهای کیفی مقایسه شود.

خروجی ها

یک خروجی متداول از سیستم های بازرسی خودکار، تصمیم عبور/عدم عبور است. این تصمیمات ممکن است به نوبه خود مکانیزم هایی را فعال کنند که آیتم های عبور نشده را رد کند یا زنگ خطر را به صدا در آورد. سایر خروجی های معمول شامل موقعیت شیء و اطلاعات جهت گیری برای سیستم های هدایت ربات است. به علاوه، انواع خروجی شامل داده های اندازه گیری عددی، داده های خوانده شده از کدها و کاراکترها، تعداد و طبقه بندی اشیاء، نمایش فرایند یا نتایج، تصاویر ذخیره شده، هشدار از سیستم های MV خودکار نظارت به مکان و سیگنال های کنترل فرایند است. این موارد همچنین شامل رابط کاربری، رابط یکپارچه سازی سیستم های چند مولفه ای و تعویض داده خودکار میباشد.

هدایت ربات برمبنای تصویربرداری

بینایی ماشین معمولاً اطلاعات مکانی و جهتی را به ربات ارائه میکند تا ربات بتواند بطور مناسبی محصول را بلند کند. این توانایی همچنین برای هدایت حرکاتی که از ربات ساده تر است استفاده میشود، مثل کنترلگر حرکتی 1 یا 2 محوری. فرایند کلی شامل طرح ریزی جزئی ملزومات و پروژه، و سپس ساختن یک راه حل است. این بخش، فرایند فنی رخ داده طی بهره برداری از راه حل را تشریح میکند. بسیاری از مراحل این فرایند با مراحل بازرسی خودکار یکی هستند، جز اینکه اینجا تمرکز بر ارائه اطلاعات مکانی و جهتی به عنوان نتیجه است.

بازار جهانی بینایی ماشین

انتظار میرود بازار جهانی بینایی ماشین تا پایان سال 2022 به 15.46 میلیارد دلار امریکا با نرخ رشد مرکب سالانه %8.18 در بازه پیش بینی 2017 تا 2022  برسد. بازار بینایی ماشین در تمام ناحیه ها رشدی مثبت دارد. افزایش سالانه زمینه های کاربردی و پیشرفت فناوری و یکپارچه سازی، بازار را در مقیاسی جهانی هدایت میکنند. آسیا و اقیانوسیه بازار جهانی را با بیش از %30 سهم کل بازار در سیطره دارند و بعد از آن اروپا به علت تقاضای زیاد صنایع اتومبیل و بهداشت دومین بازار بزرگ است. امریکای شمالی سومین بازار بزرگ است.

 



اشتراک گذاری خبر در شبکه های اجتماعی
rating
  نظرات

نظری وجود ندارد.