Введение - часть 3
§ Исследование методов ввода, обработки и анализа звуковых сигналов при помощи компьютера.
§ Изучение специфики речевых сигналов, определение их характерных свойств и построение на основе этих знаний модели распознавания и синтеза речи
§ Решение проблем, возникающих при практическом применении нейросетевых алгоритмов;
§ Формулировка общих принципов построения самообучающихся систем и их применение на примере системы автоматического распознавания и синтеза речи
§ Построение инструментальной базы на персональном компьютере для проведения вышеперечисленных исследований.
§ создание полной поддерживающей документации для возможности использования системы другими исследователями.
Для решения этих задач была разработана интегрированная система, программно реализованная в среде Windows на IBM-совместимом персональном компьютере; была достигнута открытость всех алгоритмов (т.е. возможность управления и контроля над всеми процессами в ходе обучения и работы). Для построения удобного пользовательского интерфейса использовалась среда разработки Borland C++ Builder 4.0. Параллельно с разработкой системы были созданы следующие инструментальные средства:
§ Инструмент для спектрального анализа речи, как записанной в файлы, так и в реальном времени
§ Инструмент для синтеза звуков речи вручную, основанный на формантно-голосовой модели
§ Инструмент для визуализации процессов обучения и распознавания в используемой нейросетевой модели
§ Инструмент для записи звука в файлы на жестком диске
Сама система представляет собой программно смоделированную нейросеть, вспомогательные процедуры по вводу, обработке и выводу сигналов, и процедуры визуализации работы всех алгоритмов.Имеется возможность выбрать конфигурацию будущей системы, для каждой конфигурации создается отдельный проект с возможностью сохранения на диск и восстановления.