علی زارعزاده، راهبر تیم داده و هوش مصنوعی کارگزاری مفید، در دومین همایش تحربهمحور هوش مصنوعی در صنعت درباره مدلهای زبانی بزرگ صحبت کرد. او با اشاره به طراحی چت بات پشتیبانی مشتریان مفید، به کمک اطلاعات موجود در بانک دادههای این مجموعه، گفت: نسخه دموی این چت بات در نمایشگاه صنعت مالی ۱۴۰۲ ارائه شد و از مدل نهایی آن تا پایان تابستان رونمایی میشود. بهگفته او، بهکمک این فناوری تا ۵۰ درصد سوالات مشتریان کارگزاری بدون صرف زمان اضافی، بهسرعت و آسان پاسخ داده میشود.
او با بیان تجربههای شخصی خود در استفاده از ChatGPT توضیح داد: روزهای ابتدایی که ChatGPT آمده بود و من از آن استفاده میکردم، راستش برایم چیز خیلی عجیبی نبود. تنها نکتهای که مرا به استفاده از این مدل زبانی جذب میکرد قابلیت چتکردن با آن بود چرا که مدلهای قبلی فقط جملهها را کامل میکردند، اما ChatGPT با کاربر مکالمه میکرد و قابلیت پاسخ دادن به سوالات رو داشت.
زارعزاده در ادامه بحث گفت: اما مدل زبانی چیست؟ یک تابع احتمالی هست که با گرفتن یک جمله یا مجموعهای از کلمات، محتملترین کلمه بعد را تولید میکند. او در پاسخ به این سؤال که مدل زبانی چطور کار میکند، گفت: مدل زبانی یک پیکره متنی بزرگ از شما دریافت میکنند. سپس در فرآیند آموزش مدل، هر بار یک جمله را بر میدارید و یک کلمهاش را حذف میکنید و از مدل میخواهید آن را حدس بزند و بسته به خطای حدساش وزنهای آن بهروز میشود و این کار را برای جملات دیگر هم تکرار میکنید و سپس کمکم با صرف چند ده میلیون دلار، مدل شما روی کل پیکره متنی آموزش میبیند.
او افزود: راستش من هم اوایل فکر میکردم که ChatGPT همان JPEG وب است (یعنی نسخه فشرده شده اطلاعات کل اینترنت). اما کمکم دیدم که قدرت استدلال هم دارد. برایم سؤال شد که یک مدل زبانی چطور میتواند استدلال کند؟ بر این باورم که این استدلال را هم به صورت آماری از دیتا یاد گرفتهاند به طوری که احتمال تولید جمله با استدلال درست برایشان بسیار قویتر است.
راهبر تیم داده و هوش مصنوعی کارگزاری مفید با اشاره به تاریخچه هوش مصنوعی، گفت: مدلهای اولیه سیمبلیک بودند که نتایج خوبی نگرفتند و میتوان گفت به این دلیل، اولین زمستان هوش مصنوعی از راه رسید.
بعد اما کمکم مدلهای آماری آمدند و از روی دیتا بهکمک توابع ساده نتیجه را بهتر کردند. در این مدلها نیاز بود که برای استخراج ویژگی مناسب از دیتا سرمایه انسانی هم کمکدهنده باشد و در مرحله بعد، مدلهای یادگیری عمیق آمدند که بسیار پیشرفته بود و حالا در دوره foundation مدل هستیم که مدلهایی که تحول ایجاد کردند و استدلالکردن را هم بهخوبی بلدند.
او ادامه داد: از ChatGPT 4 آزمونهای حرفهای گرفته شده که نتایج آن خیره کننده بوده است. قدرت استدلال این باتها در مسیر افزایش است و مثل خود ما که با دیدن و شنیدن اجداد خود در مسیر توسعه قرار گرفتهایم، این مدلها هم میتوانند بهزودی در این مسیر قرار بگیرند. همانطور که در فرایند تکامل، نورونهای مغزی ما بهروزرسانی شده است، این اتفاق برای مدلها و ماشینها هم رقم خواهد خورد؛ مثل یادگیری زبان توسط بچههایی که تازه به دنیا آمدهاند.
زارع زاده در پایان با اشاره به اثرات توسعه ChatGPT گفت: امکانات جدیدی که آمده باعث شده که مدلهایی که روی دادههای بدون ساختار آموزش میبینند راحتتر در دسترس همگان قرار بگیرند. در کمتر از چند سال آینده، برنامهنویسی به کمک این ابزارها بسیار آسانتر خواهد شد. میتوان کد زدن را به بات سپرد و سرمایه انسانی کارهای مهمتر و توسعهمحورتر را انجام خواهد داد. این مدلها امکانات را برای همه در دسترس میکند و بهنوعی میتواند تحقق منجر به تحقق عدالت شود.
او همچنین در توضیح خطرات و ریسکها گفت: خطر از بین رفتن بشریت یا شغلها و غیره با توسعه روزافزون این مدلها وجود دارد که بهنظر میرسد باید برای توسعه آنها قانونگذاری شود.