PersonaPlex — это исследовательский проект и одновременно открытая модель для голосового общения, построенная вокруг идеи естественного диалога. В основе системы лежит принцип полнодуплексного взаимодействия.
Речь идет о схеме, когда нейросеть может воспринимать речь пользователя и генерировать ответ без ожидания паузы между репликами. Это позволяет корректно реагировать на перебивание, поддерживать короткие подтверждающие реплики и сохранять плавность разговора.
Модель PersonaPlex-7B содержит около 7 млрд параметров и объединяет в себе обработку аудио, понимание смысла сказанного и генерацию речи.
Пример диалога с PersonaPlex. Данные: Nvidia.В отличие от классической схемы «распознавание речи — языковая модель — синтез речи», здесь используется единая архитектура. Как отмечают разработчики Nvidia, такой подход снижает задержки и делает диалог более живым.
Одной из ключевых особенностей PersonaPlex является управление ролью и голосом.
Пользователь может задать поведение модели с помощью текстового описания. Например, попросить ее вести себя как дружелюбный консультант или спокойный преподаватель. Дополнительно можно выбрать голос, определяющий тембр и манеру речи.
В текущей версии доступно 16 готовых голосовых профилей, отличающихся по стилю и подаче.
Обучение модели проводилось на сочетании реальных разговоров и синтетических диалогов. Записи позволили сохранить естественные интонации и ритм речи, а синтетические данные расширили набор ролей и сценариев.
Такой подход помог избежать путаницы между стилями и добиться устойчивого поведения модели даже при смене роли, согласно заявлению компании.
Принцип работы PersonaPlex с одновременной обработкой аудио и текста. Данные: Nvidia.
PersonaPlex можно бесплатно скачать и запустить локально, без подписки и облачных ограничений, при условии принятия лицензии Nvidia. Это делает проект интересным не только для исследователей, но и для разработчиков, которые хотят экспериментировать с голосовыми интерфейсами.
Проверка совместимости оборудования перед установкой PersonaPlex. Данные: Sonu Sahani.
Страница модели PersonaPlex-7B на платформе Hugging Face. Данные: HuggingFace.
Настройка роли и голосового профиля в интерфейсе PersonaPlex. Данные: Sonu Sahani.


