چگونه از Google Vision API استفاده کنیم؟

بینایی کامپیوتر (Computer Vision) یا بینایی ماشین، یکی از شاخه های علوم کامپیوتر است که شامل روش های دستیابی به تصاویر و سپس پردازش، تحلیل و در نهایت درک آن ها توسط کامپیوتر ها می شود. یکی از راه هایی که می توانید از این تکنولوژی استفاده کنید و کد شما قادر به دیدن باشد، Google Vision API است.

رابط کاربری Google Vision، در واقع کد شما را به قابلیت تشخیص تصویر Google وصل می کند. ممکن است فکر کنید که این کار مثل یک درخواست REST API به image.google.com است. اما کار این api خیلی بیشتر از نشان دادن تصاویر مشابه هست.

Google Vision می تواند تشخیص دهد که فلان عکس مربوط به یک گربه است یا انسان، همچنین می تواند قسمت های مختلف صورت شما و حتی حالت آن (خوشحال یا غمگین) را تشخیص دهد.

راه اندازی و تنظیم Google Vision API

برای استفاده از GVA باید در Google Compute Engine ثبت نام کنید. GCE رایگان است اما برای ثبت نام نیاز به کارت اعتباری دارید. در آن جا می توانید پروژه خود را مشخص کنید و سپس از منوی سمت چپ یک API Key برای خود بگیرید.

در اینجا ما از از یک API key ساده که می توانیم از ابزار خط فرمان curl نیز استفاده کنیم، بهره ببریم.

کلید ایجاد شده را در یک فایل متنی یا هر جای دیگری ذخیره کنید (از این پس با عنوان YOUR_KEY از آن استفاده می شود) و API را در پروژه خود فعال کنید. (مانند تصاویر زیر):

 

 

 

پروژه خود را در صفحه بعد انتخاب کنید:

 

حالا شما آماده هستید! متن زیر را در فایلی به نام google_vision.json قرار دهید:

این درخواست JSON به GVA می گوید که کدام تصویر را برای آنالیز و کدام ویژگی های تشخیص را فعال کنید.

حالا از curl استفاده کنید تا درخواست خود را برای GVA ارسال کنیم:

بعد از ایجاد رکوئست، GVA متنی شبیه به متن زیر را به عنوان response یا پاسخ برای ما ارسال می کند:

اگر به نتایج نگاه کنید، چیزی شبیه به متن زیر خواهید دید:

گوگل می داند که شما عکس یک گربه را به آن داده اید.

حالا یک حیوان بزرگتر را انتخاب می کنیم. یک عکس فیل به همراه سوار آن را به GVA می دهیم.

نتایج شامل مکان هایی از صورت انسان است:

گوگل به اندازه ویژگی های خود صورت، در ارزیابی احساسات عالی نیست:

همچنین GVA چیز های دیگری را در رابطه با عکس اعلام کرده است:

Google Vision API

Google Vision API

کاربرد GVA

اینکه شما در زمینه امنیت یا هر شغل دیگری فعالیت می کنید، قادر به تشخیص بودن این که چه چیزی درون عکس است، می تواند مفید باشد. اینکه بخواهید بدانید گربه شما از چه نژادی است یا مشتری شما چه کسی است، GVA می تواند به شما کمک کند. توجه داشته باشید که شرایط و قوانین گوگل فقط این اجازه را به API می دهد تا در برنامه ها و محاسبات شخصی مورد استفاده قرار گیرد. با این وجود اگر شما یک برنامه جستجوگر دارید یا اینکه می خواهید تصاویر ارسال شده توسط کاربران را بررسی کنید، GVA می تواند همان چیزی باشد که شما به آن نیاز دارید.

 

QR:  چگونه از Google Vision API استفاده کنیم؟
به اشتراک بگذارید