Языковая модель от Сбера и SberDevices стала лучшей в мире по пониманию текстов на русском языке - «Умный Дом и решения» » Умный Дом и решения
Языковая модель от Сбера и SberDevices стала лучшей в мире по пониманию текстов на русском языке - «Умный Дом и решения»
Что такое Умный дом — это система домашних устройств, связанных между собой и выполняющих действия по команде человека или даже без его участия, по расписанию или сигналу от датчика. Некоторые умные дома управляются через приложения и голосом через умные колонки, другие — с помощью отдельных устройств. Задачи тоже могут быть разными: повысить комфорт, сэкономить время или обеспечить безопасность..

СБЕР

Языковая модель от Сбера и SberDevices стала лучшей в мире по пониманию текстов на русском языке - «Умный Дом и решения»

  • Калерия
  • 09-фев-2023, 11:32
  • 0 комментариев
  • 2 213 просмотров

Языковая модель от Сбера и SberDevices стала лучшей в мире по пониманию текстов на русском языке


Языковая модель от Сбера и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5) стала лучшей в мире по пониманию текста в соответствии с результатами тестов главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку. Она превзошла другие представленные на лидерборде модели для русского языка с существенным отрывом, несмотря на больший размер многих моделей-конкурентов.

Сбер давно работает с трансформерными моделями — ещё в 2019 году были обучены русскоязычные модели ruBERT и ruGPT-2, а в 2020 году при помощи суперкомпьютера Christofari была создана ruGPT-3. Эта модель существует в разных вариантах, и самый большой из них насчитывает 13 млрд параметров.

В отличие от моделей семейства GPT, состоящих только из декодирующих блоков трансформера, модель FRED-T5 содержит также кодирующие блоки, что позволяет ей гораздо эффективнее решать различные задачи в области обработки естественного языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются исследователи данных, работающие с русскоязычными нейросетями.

Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 миллиарда параметров и 24 слоя. Модель обучалась на задачах восстановления случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Это заняло шесть недель и потребовало использования обучающей выборки, содержавшей около 300 ГБ текста. В среде специалистов по автоматической обработке естественного языка эту задачу называют MoD (Mixture of Denoisers). Этот подход был предложен ранее командой из Google в модели UL2. Наши исследователи реализовали этот подход с рядом существенных изменений, основанных на результатах собственных исследований.

Ведущие исследовательские центры в области машинного обучения в последние годы создают всё более и более крупные нейронные языковые модели. Количество параметров самых больших монолитных нейросетей уже перевалило за 500 миллиардов и продолжает расти. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более огромных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при том же количестве параметров интеллектуально превосходят своих предшественников. Хорошим примером этого эффекта является нейросеть FRED-T5, которая при сравнительно скромном по нынешним меркам числе параметров стала лидером в понимании русского языка.

Сергей Марковдиректор Управления экспериментальных систем машинного обучения SberDevicesДругие пресс-релизы
15 июня 2023Пресс-релизЧисло проданных умных устройств Sber с ассистентом Салют превысило 1,5 млн

Число проданных умных устройств Sber с ассистентом Салют превысило полтора миллиона.

6 июня 2023Пресс-релизSberDevices и ГК Softline заключили соглашение о стратегическом сотрудничестве

В рамках партнерства ГК Softline и SberDevices предлагают рынку флагманские B2B-решения вендора: сервис видеоконференций SberJazz, корпоративный мессенджер Dialog, платформу речевых сервисов SaluteSpeech и конструктор для создания чат-ботов SaluteBot.

23 мая 2023Пресс-релизSberDevices получили награду за проект «Построение импортонезависимой аналитической платформы» на Data Award 2023

18 мая состоялось официальное объявление итогов и награждение лауреатов Премии Data Award 2023, учрежденной издательством «Открытые системы» и порталом об ИТ-менеджменте «Директор информационной службы». В номинации «За реализацию антикризисного проекта» победителем был признан проект SberDevices «Построение импортонезависимой аналитической платформы».

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Языковая модель от Сбера и SberDevices стала лучшей в мире по пониманию текстов на русском языке Языковая модель от Сбера и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5) стала лучшей в мире по пониманию текста в соответствии с результатами тестов главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку. Она превзошла другие представленные на лидерборде модели для русского языка с существенным отрывом, несмотря на больший размер многих моделей-конкурентов. Сбер давно работает с трансформерными моделями — ещё в 2019 году были обучены русскоязычные модели ruBERT и ruGPT-2, а в 2020 году при помощи суперкомпьютера Christofari была создана ruGPT-3. Эта модель существует в разных вариантах, и самый большой из них насчитывает 13 млрд параметров. В отличие от моделей семейства GPT, состоящих только из декодирующих блоков трансформера, модель FRED-T5 содержит также кодирующие блоки, что позволяет ей гораздо эффективнее решать различные задачи в области обработки естественного языка. Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются исследователи данных, работающие с русскоязычными нейросетями. Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 миллиарда параметров и 24 слоя. Модель обучалась на задачах восстановления случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Это заняло шесть недель и потребовало использования обучающей выборки, содержавшей около 300 ГБ текста. В среде специалистов по автоматической обработке естественного языка эту задачу называют MoD (Mixture of Denoisers). Этот подход был предложен ранее командой из Google в модели UL2. Наши исследователи реализовали этот подход с рядом существенных изменений, основанных на результатах собственных исследований. Ведущие исследовательские центры в области машинного обучения в последние годы создают всё более и более крупные нейронные языковые модели. Количество параметров самых больших монолитных нейросетей уже перевалило за 500 миллиардов и продолжает расти. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более огромных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при том же количестве параметров интеллектуально превосходят своих предшественников. Хорошим примером этого эффекта является нейросеть FRED-T5, которая при сравнительно скромном по нынешним меркам числе параметров стала лидером в понимании русского языка.Сергей Марковдиректор Управления экспериментальных систем машинного обучения SberDevicesДругие пресс-релизы 15 июня 2023•Пресс-релизЧисло проданных умных устройств Sber с ассистентом Салют превысило 1,5 млнЧисло проданных умных устройств Sber с ассистентом Салют превысило полтора миллиона. 6 июня 2023•Пресс-релизSberDevices и ГК Softline заключили соглашение о стратегическом сотрудничествеВ рамках партнерства ГК Softline и SberDevices предлагают рынку флагманские B2B-решения вендора: сервис видеоконференций SberJazz, корпоративный мессенджер Dialog, платформу речевых сервисов SaluteSpeech и конструктор для создания чат-ботов SaluteBot. 23 мая 2023•Пресс-релизSberDevices получили награду за проект «Построение импортонезависимой аналитической платформы» на Data Award 202318 мая состоялось официальное объявление итогов и награждение лауреатов Премии Data Award 2023, учрежденной издательством «Открытые системы» и порталом об ИТ-менеджменте «Директор информационной службы». В номинации «За реализацию антикризисного проекта» победителем был признан проект SberDevices «Построение импортонезависимой аналитической платформы».


Комментарии (0)
img
Языковая модель от Сбера и SberDevices стала лучшей в мире по пониманию текстов на русском языке - «Умный Дом и решения»

Языковая модель от Сбера и SberDevices стала лучшей в мире по пониманию текстов на русском языке Языковая модель от Сбера и SberDevices FRED-T5

Категории сайта
Разное

Производитель и новинки производства

Это не только возможность управлять лампочкой со смартфона, а слаженная, незаметная для Вас, работа всех систем дома как инструментов в оркестре.

       89a39215
img
Производитель / Новинки / Умные Решения
Xthings представила первую 4K-камеру с поддержкой Matter 1.5 - «Умный Дом и решения»

Только недавно Альянс по стандартам связи (CSA) представил спецификацию Matter 1.5 с поддержкой камер наблюдения, а компания Xthings уже

img
Яндекс / Новинки / Смарт.ТВ / Умные Решения
Яндекс показала четыре гаджета для умного дома - «Умный Дом и решения»

Яндекс презентовала четыре новых устройства: ИК-пульт, карниз для штор, термоголовка для радиатора и ночник. Умный ИК-пульт Яндекс Это...[/h]

img
Производитель / Смарт.ТВ / Новинки / Aqara / Умный Дом и решения / Умные Решения
Aqara выпустила умный замок, который работает по Wi-Fi без хаба - «Умный Дом и решения»

Компания Aqara выпустила новую модель умного замка — Smart Lock B50. Модель работает по Wi-Fi, ее можно использовать без хаба. Характеристики Smart

img
Новинки / Aqara / Умный Дом и решения / Производитель / Умные Решения
Aqara добавляет поддержку Siri и AirPlay в свою панель для управления домом - «Умный Дом и решения»

Aqara объявила о начале поэтапного развёртывания новых возможностей для панели Panel Hub S1 Plus. Устройство скоро получит поддержку AirPlay и

img
Новинки / Яндекс / Умный Дом и решения / Производитель / Умные Решения
Обзор второй версии инфракрасного пульта Яндекс - «Умный Дом и решения»

Компания Яндекс представила недавно линейку новых устройств для умного дома, в числе которых был и ИК-пульт. Это не новое устройство, а обновлённое.

img
Zigbee / Производитель / Смарт.ТВ / Умный Дом и решения / Яндекс / Новинки / Умные Решения
Умный карниз и другие новинки умного дома от Яндекса - «Умный Дом и решения»

Компания «Яндекс» представила линейку новых устройств для умного дома, управляемых через виртуального помощника «Алиса». В обновлённый ассортимент

Top.Mail.Ru