هوش مصنوعی جدید فیس بوک بدون نیاز به رونویسی گفتار را تشخیص می‌دهد

مجازیست–به گفته فیس بوک، سیستم جدید آن‌ها می‌تواند شکل فعلی این فناوری را که به ورودی‌های متن-به-گفتار متکی است، متحول کند. زمانبرترین پروسه در شرایط موجود گوش دادن به صحبت‌ها و تبدیل آن‌ها به نوشتار است. این فرآیند باید برای هر زبان تکرار شود. ولی سیستم جدید فیس بوک به‌طور مستقیم از خود گفتارهای صوتی تعلیم می‌بیند و بدون نیاز به نوشتار سعی می‌کند متوجه حرف‌ها شود.

مدل جدید فیس بوک اساسا مبتنی بر یک چرخه بازخوردی میان «شبکه‌های زایای دشمن‌گونه» (GAN) کار می‌کند که از یک «زایا» و یک «تفکیک‌کننده» تشکیل شده است. زایا نمونه‌هایی از الگوهای گفتاری را ارائه می‌کند که ممکن است کاملا بی‌معنا به نظر برسند. ولی در ادامه این داده‌ها به تفکیک‌کننده ارائه می‌شوند تا شبیه نوعی مترجم عمل کند.

در عین حال، فیس بوک متون اضافه‌ای را که توسط انسان‌ها نوشته شده به سیستم می‌دهد تا در استخراج تفاوت‌های میان نتایج کامپیوتری و واقعی به زایا کمک کند. این فرآیند این قدر ادامه پیدا می‌کند تا خروجی زایا شبیه متن واقعی شود.

فیس بوک می‌گوید این راهکار به آن‌ها اجازه داده تا بدون هیچ گونه داده‌ حاشیه‌نویسی‌شده بتوانند سیستمی برای تشخیص گفتار بسازند. این شرکت همین حالا آزمایش مدل جدید خود را که با نام Wav2vec-U شناخته می‌شود روی زبان‌های سواحلی، قرقیزی و تاتار کریمه‌ای آغاز کرده است. این زبان‌ها تاکنون ابزار باکیفیتی برای تشخیص گفتار نداشته‌اند.

آزمایش‌های فیس بوک از کاهش ۶۳ درصدی خطاها خبر داده. این شرکت می‌گوید دستاورد آن‌ها می‌تواند تشخیص گفتار را برای زبان‌ها و لهجه‌های بیشتری در سراسر دنیا ممکن کند. بیش از ۷۶ درصد از ۲.۸۵ میلیارد کاربر ماهانه فیس بوک در خارج از آمریکا و اروپا هستند. بنابراین دستیابی به قابلیت ترجمه خودکار برای ایجاد ارتباط موثرتر میان تمامی مردم دنیا امری ضروری به حساب می‌آید.

/دیجیاتو/

هوش مصنوعی جدید فیس بوک بدون نیاز به رونویسی گفتار را تشخیص می‌دهد

دیدگاهتان را بنویسید لغو پاسخ