Индикатор (доля созданной библиотеки подпрограмм, в %):
Факт – 74%.
План на конец 2018 года – 74%.
Разработан нейросетевой алгоритм распознавания слитной татарской речи.
Разработан алгоритм автоматического изменения характеристик аудиосигнала для увеличения объема обучающих данных, а также устойчивости системы к изменениям настроек чувствительности используемых микрофонов.
Успешное применение разработанного алгоритма позволило искусственно увеличить объем речевых обучающих данных в 35 раз.
Обучение акустических моделей на дополненном речевом корпусе способно придать системе распознавания речи дополнительную устойчивость при изменении скорости диктовки и громкости аудиосигнала.
Составлен план по дополнительному расширению корпуса звучащей речи за счет искусственного добавления шума, что позволит системе распознавания устойчивее работать в более сложных акустических условиях.
Ответственный – Хусаинов А.Ф.