Каждый текст, сгенерированный «скиллбейсом» система отправляет на синтез, таким образом происходит общение нейросети с клиентом в режиме реального времени.

Выбор и настройка голоса

На текущий момент наша технология поддерживает один единственный голос. Это голос молодой девушки возрастом от 20 до 25 лет.

Текущий голос — лучшее, что мы смогли для вас обучить. Тембр речи, ее динамика, интонации, высота на текущий момент не поддаются корректировкам с вашей стороны.

Занимайтесь обработкой лидов, мы возьмем на себя все технические наукоемкие вопросы.

В планах платформы есть добавление новых голосов, их донастройка и кастомизация. Следите за обновлениями в телеграм-канале платформы:

@sasha_platform

Настройка ударений

Саша по-умолчанию может не знать специфику произношения некоторых слов. Это нормально, вы можете с этим работать.

Для корректировки ударений пришлите вашему личному менеджеру название вашей организации и форматированный список слов, в произношении которых Саша делает ошибки. Каждое слово должно быть написано с большой буквой на ударной гласной.

Пример:

[
  "полипропилЕн",
  "пропилЕн",
  "кОльца",
  "лоткИ",
  "проЕкт",
  "перезвонИт",
  "этиленвинилацетАт",
  "полиолефИновый",
  "эластомЕр",
  "полиметилметакрилАт",
  "полиолефИн",
  "поливинилхлорИд",
  "полиэтилЕн",
  "металлоцЕновый"
]

В течение дня изменения будут внесены и вы сможете протестировать обновленную версию синтеза речи.

Настройка заполнителей

Как только собеседник заканчивает свою мысль — Саша произносит частицы-заполнители. Они необходимы в целях создания временного пространства для генерации осмысленного ответа.

Такой способ коммуникации идентичен тому, как строит диалог живой человек.

Сейчас в арсенале нейросети 5 разных вариаций звуков-заполнителей. Все они не подлежат кастомизации, удалению, добавлению или форматированию.

За время работы мы тестировали безграничное количество вариантов работы заполнителей. И без них, и с ними, и длиннее и короче.

Текущий вариант лучшее, чего мы смогли достичь. Пользуйтесь из коробки.

Настройка перебиваний

В рамках системы реализован функционал перебиваний нейросети собеседником. В нем лежит две механики:

  • Классическое перебивание. Саша замолкает в случае, когда клиент настойчиво ее перебивает.
  • Когнитивное перебивание. Саша замолкает в случае, когда сама посчитает, что сказанное клиентом сильно влияет на ход диалога и ей бессмысленно договаривать начатое.

Логика перебиваний статична и не подлежит корректировке с вашей стороны. Как и в случае почти со всеми пунктами раздела «Настройка голоса» — из коробки доступно все лучшее, чего мы смогли достичь.

Пользуйтесь и не парьтесь.

Настройка произношения

Нередко бывает, что Саша скомканно произносит сокращения, цифры или имена собственные.

Нейросеть дословно озвучивает текст, который она сгенерировала в рамках текстового ответа. А генерируемый текст управляется посредством скиллбейса

Для управления произношением некоторых слов – напишите их в скиллбейсе ровно также, как вы их произносите.

Например:

Плохое произношениеХорошее произношение
Honda CRVХонда Си Эр Ви
19Девятнадцать
II-21/1И-И двадцать один дробь один