Каждый текст, сгенерированный «скиллбейсом» система отправляет на синтез, таким образом происходит общение нейросети с клиентом в режиме реального времени.

Выбор и настройка голоса

На текущий момент наша технология поддерживает один единственный голос. Это голос молодой девушки возрастом от 20 до 25 лет. Текущий голос — лучшее, что мы смогли для вас обучить. Тембр речи, ее динамика, интонации, высота на текущий момент не поддаются корректировкам с вашей стороны.
Занимайтесь обработкой лидов, мы возьмем на себя все технические наукоемкие вопросы.
В планах платформы есть добавление новых голосов, их донастройка и кастомизация. Следите за обновлениями в телеграм-канале платформы: @sasha_platform

Настройка ударений

Саша по-умолчанию может не знать специфику произношения некоторых слов. Это нормально, вы можете с этим работать. Для корректировки ударений пришлите вашему личному менеджеру название вашей организации и форматированный список слов, в произношении которых Саша делает ошибки. Каждое слово должно быть написано с большой буквой на ударной гласной. Пример:
[
  "полипропилЕн",
  "пропилЕн",
  "кОльца",
  "лоткИ",
  "проЕкт",
  "перезвонИт",
  "этиленвинилацетАт",
  "полиолефИновый",
  "эластомЕр",
  "полиметилметакрилАт",
  "полиолефИн",
  "поливинилхлорИд",
  "полиэтилЕн",
  "металлоцЕновый"
]
В течение дня изменения будут внесены и вы сможете протестировать обновленную версию синтеза речи.

Настройка заполнителей

Как только собеседник заканчивает свою мысль — Саша произносит частицы-заполнители. Они необходимы в целях создания временного пространства для генерации осмысленного ответа. Такой способ коммуникации идентичен тому, как строит диалог живой человек. Сейчас в арсенале нейросети 5 разных вариаций звуков-заполнителей. Все они не подлежат кастомизации, удалению, добавлению или форматированию.
За время работы мы тестировали безграничное количество вариантов работы заполнителей. И без них, и с ними, и длиннее и короче.Текущий вариант лучшее, чего мы смогли достичь. Пользуйтесь из коробки.

Настройка перебиваний

В рамках системы реализован функционал перебиваний нейросети собеседником. В нем лежит две механики:
  • Классическое перебивание. Саша замолкает в случае, когда клиент настойчиво ее перебивает.
  • Когнитивное перебивание. Саша замолкает в случае, когда сама посчитает, что сказанное клиентом сильно влияет на ход диалога и ей бессмысленно договаривать начатое.
Логика перебиваний статична и не подлежит корректировке с вашей стороны. Как и в случае почти со всеми пунктами раздела «Настройка голоса» — из коробки доступно все лучшее, чего мы смогли достичь. Пользуйтесь и не парьтесь.

Настройка произношения

Нередко бывает, что Саша скомканно произносит сокращения, цифры или имена собственные. Нейросеть дословно озвучивает текст, который она сгенерировала в рамках текстового ответа. А генерируемый текст управляется посредством скиллбейса Для управления произношением некоторых слов – напишите их в скиллбейсе ровно также, как вы их произносите. Например:
Плохое произношениеХорошее произношение
Honda CRVХонда Си Эр Ви
19Девятнадцать
II-21/1И-И двадцать один дробь один