دیجی لند | اخبار دنیای دیجیتال اخبار دیجیتال | اخبار فن آوری

پیشرفت‌های بی‌مانند مایکروسافت در سیستم مبدل گفتار به نوشتار – کلیک

اگر علاقه مند به جهان نرم افزارها هستید ممکن است جالب باشد بدانید که :

به نوشته خبرگزاری ها – با استناد به گزارش‌های مایکروسافت، سیستم گفتار به نوشتار این تولیدکننده با ۵٫۱ درصد خطا، برابر با درصد خطای انسانی است.

سال قبلی درصد خطای این سیستم ماشینی، ۵٫۹ بود که در مقایسه با بازنویسی دستی، بازهم بالا بود. در بازنویسی دستی، مردم قادر اند یک متن را چند بار گوش دهند و سپس متن‌های شنیده شده را بازنویسی کنند.

در آزمونی که مایکروسافت انجام داد، ۲۴۰۰ رابطه تلفنی با لهجه آمریکایی و غیر آمریکایی ضبط شد. بعد از آن، سیستم ماشینی این تولیدکننده، شروع به مبدل مکالمات به متون نوشتاری کرد.

برخلاف سال قبلی که آزمون مایکروسافت در حیطه مکالمات خانوادگی انجام گرفته بود، امسال، در حیطه‌های متفاوتی مانند سیاست، ورزش و دیگر موضوعات دیگر و با لحنی رسمی انجام گرفت. ممکن است دوست داشته باشید که بدانید، درصد خطا در حیطه موضوعات خانوادگی چه برای انسان و چه برای سیستم‌های ماشینی، بسیار زیاد است.

به گفته یکی از مهندسان فنی این برنامه: «ما از نمونه CNN-BLSTM که بنا شده بر شبکه عصبی پیچیده بهمراه حافظه کوتاه و بلندمدت است، استفاده کردیم تا نمونه صوتی خود را پیشرفت دهیم. غیر از این، نمونه شناسایی زبان گسترش پیدا کرد تا این ماشین، لغت‌های صحبت را پیش‌بینی کند و از این طریق، بتواند گفتار را با مسئله مطرح در صحبت، انطباق دهد».

به‌رغم پیشرفتی که مایکروسافت در سیستم گفتار به نوشتار خود یافته، این سیستم هنوز نمی‌تواند تمامی مکالمات مردم را با لهجه‌ها و سبک‌های مختلف گفتمان، تشخیص دهد و حتی در محیط‌های پر سروصدا نیز کار نمی‌کند.

با اینکه مایکروسافت تا حدودی در مبدل گفتار به نوشتار موفق بوده با اینحال بازهم راهی طولانی در پیش دارد تا بتواند سیستمی دیزاین کند که تمام متون گفتاری را بفهمد و به نوشتار مبدل کند.

اگر این خبردرباره نرم افزارها جالب است آنرا برای دوستان خود به اشتراک بگذارید.

لینک