Уступают только человеку: языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке - «Умный Дом и решения» » Умный Дом и решения
Уступают только человеку: языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке - «Умный Дом и решения»
Что такое Умный дом — это система домашних устройств, связанных между собой и выполняющих действия по команде человека или даже без его участия, по расписанию или сигналу от датчика. Некоторые умные дома управляются через приложения и голосом через умные колонки, другие — с помощью отдельных устройств. Задачи тоже могут быть разными: повысить комфорт, сэкономить время или обеспечить безопасность..

СБЕР

Уступают только человеку: языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке - «Умный Дом и решения»

  • Eddington
  • 25-авг-2021, 11:43
  • 0 комментариев
  • 2 182 просмотров

Уступают только человеку: языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке

25 августа 2021. SberDevices успешно обучили языковую модель ruBERT, развили её до ruRoBERT. Обучение проходило три недели на суперкомпьютере «Кристофари».


Разработанная SberDevices текстовая модель ruRoberta-large finetune стала лучшей по пониманию текста в соответствии с оценкой главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку. Также в шестёрку лидеров вошло ещё четыре модели от SberDevices: ruT5-large-finetune, ruBert-large finetune, ruT5-base-finetune, ruBert-base finetune.

Успешно обучив языковую модель ruBERT, в Сбере стали развивать её более продвинутую версию — ruRoBERTa. Архитектурно это тот же BERT, обученный на большом корпусе текста, только на задачу восстановления маскированных токенов, на большом батч-сайзе и с токенизатором BBPE от нейросети ruGPT-3. Обучение модели на суперкомпьютере «Кристофари» заняло три недели, итоговый датасет (250 Гб текста) был похож на тот, что использовался для ruGPT-3, однако из него был удалён английский и часть «грязного» Common Crawl.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются все исследователи данных, работающие с русскоязычными нейросетями.

Оценка общего понимания языка начинается в рейтинге с набора тестов, отражающих различные языковые явления — диагностического датасета. Он отражает лингвистические феномены языка и показывает, насколько модель ruRoberta-large finetune понимает те или иные его особенности. Высокий скор (LiDiRus) говорит о том, что модель не просто запомнила задания или угадывает результат, а выучивает особенности и осваивает разнообразие феноменов русского языка.

Каждая модель также оценивается посредством различных заданий, среди которых DaNetQA — набор вопросов на здравый смысл и знание, с ответом «да» или «нет», RCB (Russian Commitment Bank) — классификация наличия причинно-следственных связей между текстом и гипотезой из него, PARus (Plausible Alternatives for Russian) — целеполагание, выбор из альтернативных вариантов на основе здравого смысла и другие.

Лучшие специалисты Сбера несколько лет занимаются совершенствованием нейросетей для русского языка. Для их объективной оценки существует лидерборд Russian SuperGLUE, который чётко показывает прогресс в данной работе. Наша конечная цель — создание надёжных интеллектуальных систем для решения разноплановых задач на русском языке, которые могут стать предшественниками сильного искусственного интеллекта отечественной сборки

Давид РафаловскийИсполнительный вице-президент Сбербанка, CTO Сбера, руководитель блока «Технологии»Другие пресс-релизы
15 июня 2023Пресс-релизЧисло проданных умных устройств Sber с ассистентом Салют превысило 1,5 млн

Число проданных умных устройств Sber с ассистентом Салют превысило полтора миллиона.

6 июня 2023Пресс-релизSberDevices и ГК Softline заключили соглашение о стратегическом сотрудничестве

В рамках партнерства ГК Softline и SberDevices предлагают рынку флагманские B2B-решения вендора: сервис видеоконференций SberJazz, корпоративный мессенджер Dialog, платформу речевых сервисов SaluteSpeech и конструктор для создания чат-ботов SaluteBot.

23 мая 2023Пресс-релизSberDevices получили награду за проект «Построение импортонезависимой аналитической платформы» на Data Award 2023

18 мая состоялось официальное объявление итогов и награждение лауреатов Премии Data Award 2023, учрежденной издательством «Открытые системы» и порталом об ИТ-менеджменте «Директор информационной службы». В номинации «За реализацию антикризисного проекта» победителем был признан проект SberDevices «Построение импортонезависимой аналитической платформы».

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Уступают только человеку: языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке 25 августа 2021. SberDevices успешно обучили языковую модель ruBERT, развили её до ruRoBERT. Обучение проходило три недели на суперкомпьютере «Кристофари». Разработанная SberDevices текстовая модель ruRoberta-large finetune стала лучшей по пониманию текста в соответствии с оценкой главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку. Также в шестёрку лидеров вошло ещё четыре модели от SberDevices: ruT5-large-finetune, ruBert-large finetune, ruT5-base-finetune, ruBert-base finetune. Успешно обучив языковую модель ruBERT, в Сбере стали развивать её более продвинутую версию — ruRoBERTa. Архитектурно это тот же BERT, обученный на большом корпусе текста, только на задачу восстановления маскированных токенов, на большом батч-сайзе и с токенизатором BBPE от нейросети ruGPT-3. Обучение модели на суперкомпьютере «Кристофари» заняло три недели, итоговый датасет (250 Гб текста) был похож на тот, что использовался для ruGPT-3, однако из него был удалён английский и часть «грязного» Common Crawl. Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются все исследователи данных, работающие с русскоязычными нейросетями. Оценка общего понимания языка начинается в рейтинге с набора тестов, отражающих различные языковые явления — диагностического датасета. Он отражает лингвистические феномены языка и показывает, насколько модель ruRoberta-large finetune понимает те или иные его особенности. Высокий скор (LiDiRus) говорит о том, что модель не просто запомнила задания или угадывает результат, а выучивает особенности и осваивает разнообразие феноменов русского языка. Каждая модель также оценивается посредством различных заданий, среди которых DaNetQA — набор вопросов на здравый смысл и знание, с ответом «да» или «нет», RCB (Russian Commitment Bank) — классификация наличия причинно-следственных связей между текстом и гипотезой из него, PARus (Plausible Alternatives for Russian) — целеполагание, выбор из альтернативных вариантов на основе здравого смысла и другие. Лучшие специалисты Сбера несколько лет занимаются совершенствованием нейросетей для русского языка. Для их объективной оценки существует лидерборд Russian SuperGLUE, который чётко показывает прогресс в данной работе. Наша конечная цель — создание надёжных интеллектуальных систем для решения разноплановых задач на русском языке, которые могут стать предшественниками сильного искусственного интеллекта отечественной сборкиДавид РафаловскийИсполнительный вице-президент Сбербанка, CTO Сбера, руководитель блока «Технологии»Другие пресс-релизы 15 июня 2023•Пресс-релизЧисло проданных умных устройств Sber с ассистентом Салют превысило 1,5 млнЧисло проданных умных устройств Sber с ассистентом Салют превысило полтора миллиона. 6 июня 2023•Пресс-релизSberDevices и ГК Softline заключили соглашение о стратегическом сотрудничествеВ рамках партнерства ГК Softline и SberDevices предлагают рынку флагманские B2B-решения вендора: сервис видеоконференций SberJazz, корпоративный мессенджер Dialog, платформу речевых сервисов SaluteSpeech и конструктор для создания чат-ботов SaluteBot. 23 мая 2023•Пресс-релизSberDevices получили награду за проект «Построение импортонезависимой аналитической платформы» на Data Award 202318 мая состоялось официальное объявление итогов и награждение лауреатов Премии Data Award 2023, учрежденной издательством «Открытые системы» и порталом об ИТ-менеджменте «Директор информационной службы». В номинации «За реализацию антикризисного проекта» победителем был признан проект SberDevices «Построение импортонезависимой аналитической платформы».


Комментарии (0)
img
Обзор управляемого замка Danalock V3 - «Умный Дом и решения»

Что такое Danalock Сегодня устанавливал на дверь замок Danalock V3, расскажу про свои впечатления. Задача состояла в том, чтобы можно было удалённо

Категории сайта
Разное

Производитель и новинки производства

Это не только возможность управлять лампочкой со смартфона, а слаженная, незаметная для Вас, работа всех систем дома как инструментов в оркестре.

       89a39215
img
Aqara / Производитель / Новинки / Умные Решения
Aqara представила пять новых гаджетов для умного дома на выставке CES 2026 - «Умный Дом и решения»

Компания Aqara анонсировала пять новых продуктов для умного дома с поддержкой Matter. Это позволяет интегрировать гаджеты в популярные платформы

img
Умный Дом и решения / Новинки / Zigbee / Смарт.ТВ / Бренд / Умные Решения
С Новым 2026 годом, умные дома и их ещё более умные хозяева! - «Умный Дом и решения»

Друзья, вот и подошёл к концу ещё один год апдейтов, прошивок, автоматизаций и бесконечных «а почему оно не сработало в 03:17 ночи». Мы все прожили

img
Шлюз - Центр умного дома / Смарт.ТВ / Производитель / Умные Решения
Huawei выпустила хаб HarmonyOS с Wi-Fi и Bluetooth Mesh - «Умный Дом и решения»

Huawei представила новый хаб для управления Bluetooth-устройствами - HarmonyOS Smart Home Bluetooth Gateway Lite. ...[/h]

img
Новинки / Sprut.hub / Умные Решения
5 января представим крупное обновление Spruthub 2.0 - «Умный Дом и решения»

5 января 2026 года пройдет Новогодний стрим Spruthub. На нем увидите: ▶ масштабное обновление Spruthub 2.0 для всех актуальных хабов ▶ планы команды

  • Dunce
  • 5-01-2026, 16:30
  • 41
img
Xiaomi / Производитель / Умные Решения
Xiaomi выпустила очиститель воздуха с 13-слойной системой фильтрации - «Умный Дом и решения»

Xiaomi выпустила новый очиститель воздуха Mijia Air Purifier 6 Pro с улучшенной системой фильтрации и повышенной производительностью. Основные

img
Xiaomi / Производитель / Новинки / Умные Решения
Xiaomi выпустила мощный кондиционер, который охлаждает дом всего за 5 минут - «Умный Дом и решения»

Компания Xiaomi представила новый центральный кондиционер Mijia Central Air Conditioner Pro Dual Air Wheel. Это - одна из самых продвинутых систем

Top.Mail.Ru