Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке - «Умный Дом и решения» » Умный Дом и решения
Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке - «Умный Дом и решения»
Что такое Умный дом — это система домашних устройств, связанных между собой и выполняющих действия по команде человека или даже без его участия, по расписанию или сигналу от датчика. Некоторые умные дома управляются через приложения и голосом через умные колонки, другие — с помощью отдельных устройств. Задачи тоже могут быть разными: повысить комфорт, сэкономить время или обеспечить безопасность..

СБЕР

Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке - «Умный Дом и решения»

  • Marshman
  • 20-июл-2023, 11:30
  • 0 комментариев
  • 2 280 просмотров

Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке


Сбер открыл доступ к нейросетевой модели ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самой большой из семейства многоязычных моделей Сбера.

ruGPT-3.5

Внутри GigaChat находится целый ансамбль моделей — NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3,5 13B) — новая версия нейросети ruGPT-3 13B.

Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3,5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли:  юридические документы, часть The Stack (открытый сет с кодом) от коллаборации исследователей BigCode и корпуса новостных текстов. Финальный чекпоинт модели — это базовый претрейн для дальнейших экспериментов.

В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

mGPT

Также в открытом доступе опубликована многоязычная модель mGPT-13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Сбер, как ведущая технологическая компания, выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами.

Андрей Белевцевстарший вице-президент, CTO, руководитель блока «Технологии» Сбербанка
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке Сбер открыл доступ к нейросетевой модели ruGPT-3.5 13B . Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самой большой из семейства многоязычных моделей Сбера . ruGPT-3.5 Внутри GigaChat находится целый ансамбль моделей — NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3,5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3,5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли: юридические документы, часть The Stack (открытый сет с кодом) от коллаборации исследователей BigCode и корпуса новостных текстов. Финальный чекпоинт модели — это базовый претрейн для дальнейших экспериментов. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI. mGPT Также в открытом доступе опубликована многоязычная модель mGPT -13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников. Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей. Сбер, как ведущая технологическая компания, выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами.Андрей Белевцевстарший вице-президент, CTO, руководитель блока «Технологии» Сбербанка


Комментарии (0)
img
Щиты ABB Comfort Line (префикс моделей CA, U и B) - «Умный Дом и решения»

Появление на российском рынке щитов ComfortLine уже далеко не новость, но сейчас (февраль 2021) начали пропадать из наличия щиты ABB серий AT и U,

Категории сайта
Разное

Производитель и новинки производства

Это не только возможность управлять лампочкой со смартфона, а слаженная, незаметная для Вас, работа всех систем дома как инструментов в оркестре.

       89a39215
img
Производитель / Новинки / Умные Решения
Xthings представила первую 4K-камеру с поддержкой Matter 1.5 - «Умный Дом и решения»

Только недавно Альянс по стандартам связи (CSA) представил спецификацию Matter 1.5 с поддержкой камер наблюдения, а компания Xthings уже

img
Яндекс / Новинки / Смарт.ТВ / Умные Решения
Яндекс показала четыре гаджета для умного дома - «Умный Дом и решения»

Яндекс презентовала четыре новых устройства: ИК-пульт, карниз для штор, термоголовка для радиатора и ночник. Умный ИК-пульт Яндекс Это...[/h]

img
Производитель / Смарт.ТВ / Новинки / Aqara / Умный Дом и решения / Умные Решения
Aqara выпустила умный замок, который работает по Wi-Fi без хаба - «Умный Дом и решения»

Компания Aqara выпустила новую модель умного замка — Smart Lock B50. Модель работает по Wi-Fi, ее можно использовать без хаба. Характеристики Smart

img
Новинки / Aqara / Умный Дом и решения / Производитель / Умные Решения
Aqara добавляет поддержку Siri и AirPlay в свою панель для управления домом - «Умный Дом и решения»

Aqara объявила о начале поэтапного развёртывания новых возможностей для панели Panel Hub S1 Plus. Устройство скоро получит поддержку AirPlay и

img
Новинки / Яндекс / Умный Дом и решения / Производитель / Умные Решения
Обзор второй версии инфракрасного пульта Яндекс - «Умный Дом и решения»

Компания Яндекс представила недавно линейку новых устройств для умного дома, в числе которых был и ИК-пульт. Это не новое устройство, а обновлённое.

img
Zigbee / Производитель / Смарт.ТВ / Умный Дом и решения / Яндекс / Новинки / Умные Решения
Умный карниз и другие новинки умного дома от Яндекса - «Умный Дом и решения»

Компания «Яндекс» представила линейку новых устройств для умного дома, управляемых через виртуального помощника «Алиса». В обновлённый ассортимент

Top.Mail.Ru