حمیدرضا واعظی، دانشمند ارشد داده در شرکت متا؛ ارزیابی مسیر راه کامپیوتر ویژن

حمیدرضا واعظی، دانشمند ارشد داده در شرکت متا؛ ارزیابی مسیر راه کامپیوتر ویژن

«تحول بینایی کامپیوتری در صنعت در یک دهه گذشته» یکی دیگر از موضوعاتی بود که در دومین همایش تجربه‌محور هوش مصنوعی در صنعت مطرح شد. حمیدرضا واعظی، دانشمند ارشد داده در شرکت متا، صحبت‌های خود را با این محوریت شروع کرد که هیچ وقت برای ورود به حوزه بینایی کامپیوتری دیر نیست.

او در خصوص تغییرات بینایی کامپیوتری در صنعت در دهه گذشته گفت: در ابتدای امر باید در مورد کامپیوتر ویژن توضیح دهیم که قسمت مهمی از هوش مصنوعی است. کامپیوتر ویژن سه کار اصلی انجام م‌یدهد: در مرحله اول باید ببینیم عکس چیست؛ سپس ببینیم تصویر کجا است؛ بعد هم باید ببینیم اشیایی که دنبال آن هستیم کجای تصویر وجود دارد.

او با اشاره به اینکه سابقه کامپیوتر ویژن به سال ۱۹۵۶ برمی‌گردد، گفت: سه سال بعد، این موضوع به‌صورت جدی‌تر بررسی شد. سال ۱۹۷۴ اولین محصول مربوط به کامیپوتر ویژن که توانایی تشخیص تصاویر را داشت، طراحی شد و این ماجرا از سال ۱۹۵۶ تا به امروز فراز و فرودهای بسیاری را تجربه کرد و اکنون به جایگاه کنونی رسیده است.

واعظی گفت: در کامیپوتر ویژن image net بسیار مهم است. در سال ۲۰۱۰ و ۲۰۱۱ خطا حدود ۲۸ درصد بود و از سال ۲۰۱۲ که شروع بحث ماست، به ۱۶درصد خطا رسیدیم. این اتفاق بزرگی بود. همین روند تکرار شد و سال بعد خطا کمتر شد. این اتفاق (کاهش خطاها)، اتفاق بسیار خوبی است که می‌تواند زمینه‌ساز تحولات مختلف شود.

او با اشاره به تجربه شخصی خود در شرکت اپل (در سال ۲۰۱۳ و ۲۰۱۴ در گروه مپ اپل تصمیم بر آن شد که از عکس‌های هواپیمایی 3D شفافی ساخته شود) گفت: ما در آن زمان تقریباً همه چیز را چک کردیم و سیستم ما کامل کار می‌کرد؛ شاید در آن سال ۶۰ درصد کار را درست انجام دادیم و همان ۶۰ درصد پنج میلیون دلار عایدی به شرکت داد. اما سال ۲۰۱۴ و در کمتر از  شش ماه، مجبور شدیم تک‌تک مدل‌های شناسایی تصاویر را عوض کنیم.

واعظی در خصوص افزایش اقبال‌ها به کار ماشین لرنینگ در طول زمان توضیح داد: در سال ۲۰۱۳ تنها صد نفر در اپل کار ماشین لرنینگ می‌کردند. سال بعد از آن، اتفاقی که افتاد این بود که از ۱۰۰ نفر به ۴۰۰ نفر رسیدیم و سال ۲۰۱۵ این عدد برای ما از ۱۰۰۰ نفر گذشته بود.

به‌گفته واعظی، تداوم این روند می‌تواند تا سال ۲۰۵۰ ما را به جایی برساند که همه مردم کره زمین برای اپل کار ماشین لرنینگ می‌کنند. او گفت: همچنین نکته جالب دیگر آن است که در سال ۲۰۱۵ و ۲۰۱۶ تعداد افرادی که در کنفرانس‌ها شرکت می‌کردند افزایش یافت. برای مثال سال ۲۰۱۷ که من در مایکروسافت بودم، ۲۵۰ نفر از شرکت ما در کنفرانس‌ها بودند. اما صنعت ناگهان فهمید که این روش جواب می‌دهد و شروع به سرمایه‌گذاری در این حوزه کرد.

او در ادامه، به بحث اهمیت پلتفرم و نیز تغییر پلتفرم‌ها در طول زمان پرداخت و اظهار کرد: یکی از اولین پلتفرم‌ها theano بود که در سال ۲۰۰۷ از آن استفاده می‌شد. در سال ۲۰۱۴ caffe را داشتیم که سختی‌های خاص خودش را داشت. در سال ۲۰۱۵ tensor flow بود و سپس tycho مورد استفاده قرار گرفت.

واعظی با اشاره به اهمیت فیس آی‌دی در این روند گفت: در سال ۲۰۱۷ مساله مهم فیس آی‌دی بود. فیس آی‌دی مهم است چون کامپیوتر ویژن خود را به جایی رساند که بگوید من در مسایل بسیار دقیق هستم.

کارشناس ارشد داده در شرکت متا همچنین تاکید کرد: دیتا نیز در این روند حایز اهمیت است و اگر کار مهمی قرار است انجام شود، دیتا نقش مهمی دارد. مدل‌ها هر لحظه نیاز به تکمیل دیتا و داده‌های خود دارند.

او همچنین به موضوع AI as a service (هوش مصنوعی در نقش خدمات) اشاره کرد و گفت: این مسئله برای ما جذاب است چون لازم نیست همه چیز را از اول انجام دهید و با کمک این  سیستم، بخشی از کار برای شما انجام شده است.

واعظی در ادامه به مسئله کیفیت دوربین (camera quality) پرداخت و اضافه کرد: امروز هنوز وقتی موبایل جدیدی داریم هنوز کیفیت دوربین مهم است و هوش مصنوعی کمک زیادی به کیفیت دوربین کرده است. در سال ۲۰۱۲ فقط یک مدل ماشین لرنینگ داشتیم که فقط می‌گفت تصویری که می‌بینید چیست؛ اما امروز که در مورد کیفیت دوربین صحبت می‌کنیم، پیشرفت زیادی در این حوزه شاهد هستیم؛ مثلاً نویز کمتر شده. تمام این پیشرفت از مدل‌های مختلف هوش مصنوعی نشئت می‌گیرد.

او همچنین در این نشست به ماشین‌های خودران و اهمیت هوش مصنوعی در این محصولات اشاره کرد و توضیح داد: مدت‌هاست که روی مسئله ماشین‌های خودران کار می‌شود. همچنان شاهد پیشرفت زیادی در این حوزه نیستیم. وقتی ماشین‌های خودران تبدیل به تاکسی اینترنتی شد، پیشرفت خوبی را شاهد بودیم.

او گفت: مدل‌های AI باید در حوزه نژاد، جنسیت و… بالانس باشند. هوش مصنوعی در سال‌های گذشته به‌شدت مورد بحث قرار گرفته‌ و قرار است که در سال‌های آینده دقیق‌تر شوند. وظیفه ما این است که تکنولوژی را جلو ببریم و راه را برای آن باز کنیم. هوش مصنوعی می‌تواند در آینده برای شما بازی را عوض کند. برای آغاز کامپیوتر ویژن دیر نیست؛ باید خود را به‌روز نگه داریم چون دو سال دیگر با امروز متفاوت است. ما تنها ده سال است به این مسئله وارد شده‌ایم و قطعاً در آینده در حوزه کامپیوتر ویژن‌ها اتفاقات جالبی را شاهد خواهیم بود.