سکوی پردازش زبان فارسی عامیانه بهره برداری شد

مجازیستهمگام با طراحی و توسعه سامانه ذکاوت (ذائقه‌سنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت.

از آن‌جایی که متن‌های منتشرشده در پیام‌رسان/ شبکه‌های اجتماعی به صورت عامیانه بوده و پردازش زبان فارسی یکی از ارکان پایه‌ای تحلیل محتوای متنی محسوب می‌شود، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاوره‌ای) توسط پروژه « طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی» توسعه داده شد و طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است.

لیلا ربیعی، مجری این پروژه و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT:

  • این سکو شامل ابزارهای تشخیص موجودیت‌های نامدار (NER)، نرمال‌ساز فارسی(Normalizer)، برچسب‌زن ادات سخن(POSTagger) و چانکر (chunker) است که به صورت API قابلیت ارائه خدمات را خواهد داشت. پیکره‌ای شامل ۵۰۰ هزار توکن فارسی از متون عامیانه شبکه‌های اجتماعی جهت توسعه ابزارهای برچسب‌زن ادات سخن و چانکر، توسط تیم زبان‌شناسی برچسب‌گذاری شده است.

پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاه‌های مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی می‌کند.

/مهر به نقل از پژوهشگاه ارتباطات و فناوری اطلاعات/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

جایزه همراه اول