تبدیل متن به صدای فارسی

وضعیت: در حال توسعه

متن به صدا یک فناوری رایانه ای است که در آن تلاش می شود تا صدایی شبیه به صدای انسان تولید شود. این فناوری کاربرد های فراوانی دارد که از جمله آن ها می توان به دستیار صوتی، رابط صوتی (مثلا در مسیریاب ماشین)، فناوری های کمکی برای نابینایان و افرادی که توانایی صحبت ندارند، و ... برخی از گمانه زنان پیشبینی می کنند که در آینده بیشتر ارتباط ما با رایانه ها به جای صفحه های لمسی یا صفحه کلید و ماوس، با رابط صوتی انجام خواهد شد که این مساله، اهمیت فناوری متن به صدا را نشان می دهد.

امروزه برای ساخت یک موتور متن به صدا از یادگیری ماشینی استفاده می شود. در یادگیری ماشینی یک مجموعه داده عظیم صوت و متن که توسط یک گوینده با یک میکروفون خوب و بدون اکو و نویز و ریورب و امثالهم ضبط شده است، به رایانه داده می شود و رایانه اصطلاحا از روی این داده ها «یاد می گیرد» که چگونه باید متن را به صدا تبدیل کند.

خوشبختانه مقالات علمی و الگوریتم های یادگیری ماشینی این حوزه (تبدیل متن به صدا) به صورت داده عمومی منتشر شده اند به طوری که می توانید آن ها را بدون هیچ هزینه از اینترنت دریافت کنید و فرآیند یادگیری را روی رایانه خانگی تان اجرا کنید.

با این حال هیچ مجموعه داده عمومی به زبان فارسی وجود ندارد. صرفا دو یا سه پروژه فارسی وجود دارد که از این روش مدرن استفاده کرده اند که همگی انحصاری هستند و توسعه دهندگان و کاربران نمی توانند به هر شکلی از آن استفاده کنند. یک موتور تولید گفتار عمومی علاوه بر این که به رایگان و با دسترسی کامل در دسترس کاربران قرار می گیرد، می تواند در نرم افزار های عمومی دیگر مثل مرورگر موزیلا فایرفاکس، سیستم عامل اندروید، صفحه خوان اورکا (مخصوص نابینایان) و هر نرم افزار عمومی و انحصاری که توسعه دهندگان آن مایل باشند استفاده کرد.

ما در این پروژه قصد داریم این خلا در زبان فارسی را پر کنیم. در زبان های دیگر، دیتاست های عمومی توسط داوطلبان اهدا شده اند. مثلا در زبان انگلیسی دیتاست ال جی اسپیچ از چند کتاب صوتی جمع آوری شده است و در زبان آلمانی، یک داوطلب یک مجموعه داده جمع آوری کرده است. خروجی آموزش دیده لارینکس (یک موتور هوش مصنوعی که شاخه ای از موتور هوش مصنوعی mozilla tts است) را روی دیتاست های عمومی زبان های مختلف را در این لینک مشاهده کنید.

اگر شما سخنگوی یک کتاب صوتی هستید که می توانید آن را اهدا کنید، یا داوطلب ضبط یک دیتاست به زبان فارسی هستید، لطفا با ما تماس بگیرید.