علی زارع‌زاده، راهبر تیم داده و هوش مصنوعی کارگزاری مفید: چت‌جی‌پی‌تی استدلال می‌کند

علی زارع‌زاده، راهبر تیم داده و هوش مصنوعی کارگزاری مفید: چت‌جی‌پی‌تی استدلال می‌کند

علی زارع‌زاده، راهبر تیم داده و هوش مصنوعی کارگزاری مفید، در دومین همایش تحربه‌محور هوش مصنوعی در صنعت درباره مدل‌های زبانی بزرگ صحبت کرد. او با اشاره به طراحی چت بات پشتیبانی مشتریان مفید، به‌ کمک اطلاعات موجود در بانک داده‌های این مجموعه، گفت: نسخه دموی این چت بات در نمایشگاه صنعت مالی ۱۴۰۲ ارائه شد و از مدل نهایی آن تا پایان تابستان رونمایی می‌شود. به‌گفته او، به‌کمک این فناوری تا ۵۰ درصد سوالات مشتریان کارگزاری بدون صرف زمان اضافی، به‌سرعت و آسان پاسخ داده می‌شود.

او با بیان تجربه‌های شخصی خود در استفاده از ChatGPT توضیح داد: روزهای ابتدایی که ChatGPT آمده بود و من از آن استفاده می‌کردم، راستش برایم چیز خیلی عجیبی نبود. تنها نکته‌ای که مرا به استفاده از این مدل زبانی جذب می‌کرد قابلیت چت‌کردن با آن بود چرا که مدل‌های قبلی فقط جمله‌ها را کامل می‌کردند، اما ChatGPT با کاربر مکالمه می‌کرد و قابلیت پاسخ دادن به سوالات رو داشت.

زارع‌زاده در ادامه بحث گفت: اما مدل زبانی چیست؟ یک تابع احتمالی هست که با گرفتن یک جمله یا مجموعه‌ای از کلمات، محتمل‌ترین کلمه بعد را تولید می‌کند. او در پاسخ به این سؤال که مدل زبانی چطور کار می‌کند، گفت: مدل‌ زبانی یک پیکره متنی بزرگ از شما دریافت می‌کنند. سپس در فرآیند آموزش مدل، هر بار یک جمله را بر می‌دارید و یک کلمه‌اش را حذف می‌کنید و از مدل میخواهید آن را حدس بزند و بسته به خطای حدس‌اش وزن‌های آن به‌روز می‌شود و  این کار را برای جملات دیگر هم تکرار میکنید و سپس کم‌کم با صرف چند ده میلیون دلار، مدل شما روی کل پیکره متنی آموزش می‌بیند.

او افزود: راستش من هم اوایل فکر می‌کردم که ChatGPT همان JPEG وب است (یعنی نسخه فشرده شده اطلاعات کل اینترنت). اما کم‌کم دیدم که قدرت استدلال هم دارد. برایم سؤال شد که یک مدل زبانی چطور می‌تواند استدلال کند؟ بر این باورم که این استدلال را هم به صورت آماری از دیتا یاد گرفته‌اند به طوری که احتمال تولید جمله با استدلال درست برایشان بسیار قوی‌تر است.

راهبر تیم داده و هوش مصنوعی کارگزاری مفید با اشاره به تاریخچه هوش مصنوعی، گفت: مدل‌های اولیه سیمبلیک بودند که نتایج خوبی نگرفتند و می‌توان گفت به این دلیل، اولین زمستان هوش مصنوعی از راه رسید.

بعد اما کم‌کم مدل‌های آماری آمدند و از روی دیتا به‌کمک توابع ساده نتیجه را بهتر کردند. در این مدل‌ها نیاز بود که برای استخراج ویژگی مناسب از دیتا سرمایه انسانی هم کمک‌دهنده باشد و در مرحله بعد، مدل‌های یادگیری‌ عمیق آمدند که بسیار پیشرفته بود و حالا در دوره foundation مدل هستیم که مدل‌هایی که تحول ایجاد کردند و استدلال‌کردن را هم به‌خوبی بلدند.

او ادامه داد: از ChatGPT 4 آزمون‌های حرفه‌ای گرفته شده که نتایج آن خیره کننده بوده است. قدرت استدلال این بات‌ها در مسیر افزایش است و مثل خود ما که با دیدن و شنیدن اجداد خود در مسیر توسعه قرار گرفته‌ایم، این مدل‌ها هم می‌توانند به‌زودی در این مسیر قرار بگیرند. همان‌طور که در فرایند تکامل، نورون‌های مغزی‌ ما به‌روزرسانی شده است، این اتفاق برای مدل‌ها و ماشین‌ها هم رقم خواهد خورد؛ مثل یادگیری زبان توسط بچه‌هایی که تازه به دنیا آمده‌اند.

زارع زاده در پایان با اشاره به اثرات توسعه ChatGPT گفت: امکانات جدیدی که آمده باعث شده که مدل‌هایی که روی داده‌های بدون ساختار آموزش می‌بینند راحت‌تر در دسترس همگان قرار بگیرند. در کمتر از چند سال آینده، برنامه‌نویسی به کمک این ابزارها بسیار آسان‌تر خواهد شد. می‌توان کد زدن را به بات سپرد و سرمایه انسانی کارهای مهم‌تر و توسعه‌محورتر را انجام خواهد داد. این مدل‌ها امکانات را برای همه در دسترس می‌کند و به‌نوعی می‌تواند تحقق منجر به تحقق عدالت شود.

او همچنین در توضیح خطرات و ریسک‌ها گفت: خطر از بین رفتن بشریت یا شغل‌ها و غیره با توسعه روزافزون این مدل‌ها وجود دارد که به‌نظر می‌رسد باید برای توسعه آن‌ها قانون‌گذاری شود.