Для MVP сервиса потокового синтеза речи (TTS), предназначенного для корректировки произношения и интонации, требуется мужчина-диктор для записи обучающих фраз. Важно: нам не нужен профессионально поставленный голос. Напротив, требуется естественный, «обычный» человеческий голос с правильной и разборчивой речью. Сразу уточним, что записи не будут использоваться в финальном продукте — они необходимы исключительно для обучения модели. Объем работы составляет около 4400 фраз, что соответствует примерно 5,5 часам чистого аудио. Процесс записи можно распределить на несколько недель: рекомендуемая нагрузка — 2–3 часа в день, чтобы избежать перенапряжения голосовых связок. Мы предоставим все необходимое программное обеспечение. Со стороны исполнителя потребуется наличие качественного микрофона или гарнитуры (не обязательно профессионального уровня, но обеспечивающего хорошее качество записи).