Что такое Умный дом — это система домашних устройств, связанных между собой и выполняющих действия по команде человека или даже без его участия, по расписанию или сигналу от датчика.
Некоторые умные дома управляются через приложения и голосом через умные колонки, другие — с помощью отдельных устройств.
Задачи тоже могут быть разными: повысить комфорт, сэкономить время или обеспечить безопасность..
СБЕР
Голос вашего бизнеса: Сбер запускает сервис речевых технологий SmartSpeech - «Умный Дом и решения»
- Каролина
- 14-мая-2021, 11:48
- 0 комментариев
- 945 просмотров
Голос вашего бизнеса: Сбер запускает сервис речевых технологий SmartSpeech
14 мая 2021. SmartSpeech можно использовать на сайтах, в приложениях или умных устройствах для озвучивания контента и команд, а также синтеза и распознавания речи для создания интерактивного голосового меню и автоответчика.
Сбер запускает SmartSpeech — новый сервис, который позволит бизнесу без специального оборудования подключать речевые технологии, например, в интерактивном голосовом меню (IVR), автоответчике, чатах, телемаркетинговых кампаниях или в голосовых интерфейсах взаимодействия. До конца года доступ к сервису, разработанному командой SberDevices, будет бесплатным.
SmartSpeech можно использовать на сайтах, в приложениях или умных устройствах для озвучивания контента и команд или голосового ввода. Также используемые в сервисе технологии синтеза и распознавания речи применяются для создания IVR (интерактивного голосового меню) и автоответчика — это оптимизирует работу кол-центров. Сервис сам распознаёт и синтезирует речь, а также способен использовать «подсказки», помогающие максимально точно понимать пользователя в зависимости от конкретной ситуации. SmartSpeech используется и в самом Сбербанке, например, он является основой в семействе виртуальных ассистентов Салют. Он же позволяет узнать баланс банковской карты по номеру 900 в любое время суток без ожидания оператора.
Одна из задач бизнеса, которая может быть решена с применением SmartSpeech, — быстро, эффективно и малозатратно решить вопрос, с которым обращается клиент. Звонящий говорит, какая услуга ему нужна, и либо сразу попадает на нужного оператора, либо получает ответ от робота. Уникальные модели распознавания тишины и шума, способность определять конец высказывания и эмоции собеседника позволяют сделать взаимодействие с роботом живым и эмпатичным, а обучение акустических моделей на большом объёме данных помогает качественно распознавать речь даже во время телефонного разговора.
Заранее записывать «живую» речь не придётся: достаточно загрузить текст, и робот сам прочтёт его вслух. Сервис уже предлагает несколько голосов, а их библиотека продолжает расширяться, позволяя выбирать из всё большего количества тонов, тембров и настроений звучания, подходящих конкретному бизнесу на 100%. При этом SmartSpeech генерирует максимально естественную речь: собственная модель расстановки ударений помогает значительно уменьшить количество фонетических ошибок в синтезе, с её помощью легко озвучивается даже сложный текст — цифры, адреса, названия.
В SmartSpeech используются самые последние наработки в сфере Deep Learning. Нейросети обучаются на огромных объёмах данных с использованием мощностей суперкомпьютера «Кристофари» от Сбера. Сервисы написаны на языке программирования C++, а нейросети используют GPU для сверхбыстрой работы. В распознавании речи используются сверхточные архитектуры, такие как Jasper, QuartzNet и другие.
Чтобы добиться качественного синтеза речи, команда SberDevices модифицировала архитектуру Tacotron 2, внедрив в неё контроль за частотой основного тона речи, паузами, а также изменяя интонацию в зависимости от темы текста. Для этого используется информация, полученная из модели BERT, которую предварительно обучили русскому языку на большом количестве текстов, благодаря чему синтез речи звучит сложно отличимо от речи реального человека.
Речевые технологии, лежащие в основе сервиса SmartSpeech, сейчас активно внедряются в кол-центрах и службах поддержки, а их использование стоит в разы меньше, чем работа оператора или диктора. Например, многие компании автоматизируют работу со звонками, записывая готовые реплики, но работу, которую сейчас выполняет человек, можно отдать сервису, функционирующему на основе речевых технологий. Таким же образом компании могут озвучивать тексты сайтов и приложений или добавить опцию голосового ввода, что значительно ускоряет взаимодействие пользователя с ресурсом и даёт ему возможность пользоваться тем или иным сервисом даже за рулём
Денис ФилипповCTO SberDevices
Компаниям, желающим протестировать SmartSpeech, предоставляется программный интерфейс (API) для подключения и использования речевых сервисов в своих продуктах. API использует протоколы HTTP и gRPC, поэтому код можно очень быстро встроить практически в любую систему. Использование HTTP REST и gRPC API удобно, когда у бизнеса есть собственная интеграция, например собственный клиент для телефонной платформы. Если же необходимо сделать интеграцию TTS API для сайта или приложения, то HTTP — самый простой и быстрый вариант выполнения этой задачи.
Для подключения необходимо лишь оставить заявку на сайте: https://sberdevices.ru/smartspeech/.
Другие пресс-релизы
15 июня 2023
•Пресс-релизЧисло проданных умных устройств Sber с ассистентом Салют превысило 1,5 млн
Число проданных умных устройств Sber с ассистентом Салют превысило полтора миллиона.
6 июня 2023
•Пресс-релизSberDevices и ГК Softline заключили соглашение о стратегическом сотрудничестве
В рамках партнерства ГК Softline и SberDevices предлагают рынку флагманские B2B-решения вендора: сервис видеоконференций SberJazz, корпоративный мессенджер Dialog, платформу речевых сервисов SaluteSpeech и конструктор для создания чат-ботов SaluteBot.
23 мая 2023
•Пресс-релизSberDevices получили награду за проект «Построение импортонезависимой аналитической платформы» на Data Award 2023
18 мая состоялось официальное объявление итогов и награждение лауреатов Премии Data Award 2023, учрежденной издательством «Открытые системы» и порталом об ИТ-менеджменте «Директор информационной службы». В номинации «За реализацию антикризисного проекта» победителем был признан проект SberDevices «Построение импортонезависимой аналитической платформы».
Голос вашего бизнеса: Сбер запускает сервис речевых технологий SmartSpeech 14 мая 2021. SmartSpeech можно использовать на сайтах, в приложениях или умных устройствах для озвучивания контента и команд, а также синтеза и распознавания речи для создания интерактивного голосового меню и автоответчика. Сбер запускает SmartSpeech — новый сервис, который позволит бизнесу без специального оборудования подключать речевые технологии, например, в интерактивном голосовом меню (IVR), автоответчике, чатах, телемаркетинговых кампаниях или в голосовых интерфейсах взаимодействия. До конца года доступ к сервису, разработанному командой SberDevices, будет бесплатным. SmartSpeech можно использовать на сайтах, в приложениях или умных устройствах для озвучивания контента и команд или голосового ввода. Также используемые в сервисе технологии синтеза и распознавания речи применяются для создания IVR (интерактивного голосового меню) и автоответчика — это оптимизирует работу кол-центров. Сервис сам распознаёт и синтезирует речь, а также способен использовать «подсказки», помогающие максимально точно понимать пользователя в зависимости от конкретной ситуации. SmartSpeech используется и в самом Сбербанке, например, он является основой в семействе виртуальных ассистентов Салют. Он же позволяет узнать баланс банковской карты по номеру 900 в любое время суток без ожидания оператора. Одна из задач бизнеса, которая может быть решена с применением SmartSpeech, — быстро, эффективно и малозатратно решить вопрос, с которым обращается клиент. Звонящий говорит, какая услуга ему нужна, и либо сразу попадает на нужного оператора, либо получает ответ от робота. Уникальные модели распознавания тишины и шума, способность определять конец высказывания и эмоции собеседника позволяют сделать взаимодействие с роботом живым и эмпатичным, а обучение акустических моделей на большом объёме данных помогает качественно распознавать речь даже во время телефонного разговора. Заранее записывать «живую» речь не придётся: достаточно загрузить текст, и робот сам прочтёт его вслух. Сервис уже предлагает несколько голосов, а их библиотека продолжает расширяться, позволяя выбирать из всё большего количества тонов, тембров и настроений звучания, подходящих конкретному бизнесу на 100%. При этом SmartSpeech генерирует максимально естественную речь: собственная модель расстановки ударений помогает значительно уменьшить количество фонетических ошибок в синтезе, с её помощью легко озвучивается даже сложный текст — цифры, адреса, названия. В SmartSpeech используются самые последние наработки в сфере Deep Learning. Нейросети обучаются на огромных объёмах данных с использованием мощностей суперкомпьютера «Кристофари» от Сбера. Сервисы написаны на языке программирования C , а нейросети используют GPU для сверхбыстрой работы. В распознавании речи используются сверхточные архитектуры, такие как Jasper, QuartzNet и другие. Чтобы добиться качественного синтеза речи, команда SberDevices модифицировала архитектуру Tacotron 2, внедрив в неё контроль за частотой основного тона речи, паузами, а также изменяя интонацию в зависимости от темы текста. Для этого используется информация, полученная из модели BERT, которую предварительно обучили русскому языку на большом количестве текстов, благодаря чему синтез речи звучит сложно отличимо от речи реального человека. Речевые технологии, лежащие в основе сервиса SmartSpeech, сейчас активно внедряются в кол-центрах и службах поддержки, а их использование стоит в разы меньше, чем работа оператора или диктора. Например, многие компании автоматизируют работу со звонками, записывая готовые реплики, но работу, которую сейчас выполняет человек, можно отдать сервису, функционирующему на основе речевых технологий. Таким же образом компании могут озвучивать тексты сайтов и приложений или добавить опцию голосового ввода, что значительно ускоряет взаимодействие пользователя с ресурсом и даёт ему возможность пользоваться тем или иным сервисом даже за рулёмДенис ФилипповCTO SberDevices Компаниям, желающим протестировать SmartSpeech, предоставляется программный интерфейс (API) для подключения и использования речевых сервисов в своих продуктах. API использует протоколы HTTP и gRPC, поэтому код можно очень быстро встроить практически в любую систему. Использование HTTP REST и gRPC API удобно, когда у бизнеса есть собственная интеграция, например собственный клиент для телефонной платформы. Если же необходимо сделать интеграцию TTS API для сайта или приложения, то HTTP — самый простой и быстрый вариант выполнения этой задачи. Для подключения необходимо лишь оставить заявку на сайте: https://sberdevices.ru/smartspeech/.Другие пресс-релизы 15 июня 2023•Пресс-релизЧисло проданных умных устройств Sber с ассистентом Салют превысило 1,5 млнЧисло проданных умных устройств Sber с ассистентом Салют превысило полтора миллиона. 6 июня 2023•Пресс-релизSberDevices и ГК Softline заключили соглашение о стратегическом сотрудничествеВ рамках партнерства ГК Softline и SberDevices предлагают рынку флагманские B2B-решения вендора: сервис видеоконференций SberJazz, корпоративный мессенджер Dialog, платформу речевых сервисов SaluteSpeech и конструктор для создания чат-ботов SaluteBot. 23 мая 2023•Пресс-релизSberDevices получили награду за проект «Построение импортонезависимой аналитической платформы» на Data Award 202318 мая состоялось официальное объявление итогов и награждение лауреатов Премии Data Award 2023, учрежденной издательством «Открытые системы» и порталом об ИТ-менеджменте «Директор информационной службы». В номинации «За реализацию антикризисного проекта» победителем был признан проект SberDevices «Построение импортонезависимой аналитической платформы».