«تحول بینایی کامپیوتری در صنعت در یک دهه گذشته» یکی دیگر از موضوعاتی بود که در دومین همایش تجربهمحور هوش مصنوعی در صنعت مطرح شد. حمیدرضا واعظی، دانشمند ارشد داده در شرکت متا، صحبتهای خود را با این محوریت شروع کرد که هیچ وقت برای ورود به حوزه بینایی کامپیوتری دیر نیست.
او در خصوص تغییرات بینایی کامپیوتری در صنعت در دهه گذشته گفت: در ابتدای امر باید در مورد کامپیوتر ویژن توضیح دهیم که قسمت مهمی از هوش مصنوعی است. کامپیوتر ویژن سه کار اصلی انجام میدهد: در مرحله اول باید ببینیم عکس چیست؛ سپس ببینیم تصویر کجا است؛ بعد هم باید ببینیم اشیایی که دنبال آن هستیم کجای تصویر وجود دارد.
او با اشاره به اینکه سابقه کامپیوتر ویژن به سال ۱۹۵۶ برمیگردد، گفت: سه سال بعد، این موضوع بهصورت جدیتر بررسی شد. سال ۱۹۷۴ اولین محصول مربوط به کامیپوتر ویژن که توانایی تشخیص تصاویر را داشت، طراحی شد و این ماجرا از سال ۱۹۵۶ تا به امروز فراز و فرودهای بسیاری را تجربه کرد و اکنون به جایگاه کنونی رسیده است.
واعظی گفت: در کامیپوتر ویژن image net بسیار مهم است. در سال ۲۰۱۰ و ۲۰۱۱ خطا حدود ۲۸ درصد بود و از سال ۲۰۱۲ که شروع بحث ماست، به ۱۶درصد خطا رسیدیم. این اتفاق بزرگی بود. همین روند تکرار شد و سال بعد خطا کمتر شد. این اتفاق (کاهش خطاها)، اتفاق بسیار خوبی است که میتواند زمینهساز تحولات مختلف شود.
او با اشاره به تجربه شخصی خود در شرکت اپل (در سال ۲۰۱۳ و ۲۰۱۴ در گروه مپ اپل تصمیم بر آن شد که از عکسهای هواپیمایی 3D شفافی ساخته شود) گفت: ما در آن زمان تقریباً همه چیز را چک کردیم و سیستم ما کامل کار میکرد؛ شاید در آن سال ۶۰ درصد کار را درست انجام دادیم و همان ۶۰ درصد پنج میلیون دلار عایدی به شرکت داد. اما سال ۲۰۱۴ و در کمتر از شش ماه، مجبور شدیم تکتک مدلهای شناسایی تصاویر را عوض کنیم.
واعظی در خصوص افزایش اقبالها به کار ماشین لرنینگ در طول زمان توضیح داد: در سال ۲۰۱۳ تنها صد نفر در اپل کار ماشین لرنینگ میکردند. سال بعد از آن، اتفاقی که افتاد این بود که از ۱۰۰ نفر به ۴۰۰ نفر رسیدیم و سال ۲۰۱۵ این عدد برای ما از ۱۰۰۰ نفر گذشته بود.
بهگفته واعظی، تداوم این روند میتواند تا سال ۲۰۵۰ ما را به جایی برساند که همه مردم کره زمین برای اپل کار ماشین لرنینگ میکنند. او گفت: همچنین نکته جالب دیگر آن است که در سال ۲۰۱۵ و ۲۰۱۶ تعداد افرادی که در کنفرانسها شرکت میکردند افزایش یافت. برای مثال سال ۲۰۱۷ که من در مایکروسافت بودم، ۲۵۰ نفر از شرکت ما در کنفرانسها بودند. اما صنعت ناگهان فهمید که این روش جواب میدهد و شروع به سرمایهگذاری در این حوزه کرد.
او در ادامه، به بحث اهمیت پلتفرم و نیز تغییر پلتفرمها در طول زمان پرداخت و اظهار کرد: یکی از اولین پلتفرمها theano بود که در سال ۲۰۰۷ از آن استفاده میشد. در سال ۲۰۱۴ caffe را داشتیم که سختیهای خاص خودش را داشت. در سال ۲۰۱۵ tensor flow بود و سپس tycho مورد استفاده قرار گرفت.
واعظی با اشاره به اهمیت فیس آیدی در این روند گفت: در سال ۲۰۱۷ مساله مهم فیس آیدی بود. فیس آیدی مهم است چون کامپیوتر ویژن خود را به جایی رساند که بگوید من در مسایل بسیار دقیق هستم.
کارشناس ارشد داده در شرکت متا همچنین تاکید کرد: دیتا نیز در این روند حایز اهمیت است و اگر کار مهمی قرار است انجام شود، دیتا نقش مهمی دارد. مدلها هر لحظه نیاز به تکمیل دیتا و دادههای خود دارند.
او همچنین به موضوع AI as a service (هوش مصنوعی در نقش خدمات) اشاره کرد و گفت: این مسئله برای ما جذاب است چون لازم نیست همه چیز را از اول انجام دهید و با کمک این سیستم، بخشی از کار برای شما انجام شده است.
واعظی در ادامه به مسئله کیفیت دوربین (camera quality) پرداخت و اضافه کرد: امروز هنوز وقتی موبایل جدیدی داریم هنوز کیفیت دوربین مهم است و هوش مصنوعی کمک زیادی به کیفیت دوربین کرده است. در سال ۲۰۱۲ فقط یک مدل ماشین لرنینگ داشتیم که فقط میگفت تصویری که میبینید چیست؛ اما امروز که در مورد کیفیت دوربین صحبت میکنیم، پیشرفت زیادی در این حوزه شاهد هستیم؛ مثلاً نویز کمتر شده. تمام این پیشرفت از مدلهای مختلف هوش مصنوعی نشئت میگیرد.
او همچنین در این نشست به ماشینهای خودران و اهمیت هوش مصنوعی در این محصولات اشاره کرد و توضیح داد: مدتهاست که روی مسئله ماشینهای خودران کار میشود. همچنان شاهد پیشرفت زیادی در این حوزه نیستیم. وقتی ماشینهای خودران تبدیل به تاکسی اینترنتی شد، پیشرفت خوبی را شاهد بودیم.
او گفت: مدلهای AI باید در حوزه نژاد، جنسیت و… بالانس باشند. هوش مصنوعی در سالهای گذشته بهشدت مورد بحث قرار گرفته و قرار است که در سالهای آینده دقیقتر شوند. وظیفه ما این است که تکنولوژی را جلو ببریم و راه را برای آن باز کنیم. هوش مصنوعی میتواند در آینده برای شما بازی را عوض کند. برای آغاز کامپیوتر ویژن دیر نیست؛ باید خود را بهروز نگه داریم چون دو سال دیگر با امروز متفاوت است. ما تنها ده سال است به این مسئله وارد شدهایم و قطعاً در آینده در حوزه کامپیوتر ویژنها اتفاقات جالبی را شاهد خواهیم بود.