Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке - «Умный Дом и решения» » Умный Дом и решения
Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке - «Умный Дом и решения»
Что такое Умный дом — это система домашних устройств, связанных между собой и выполняющих действия по команде человека или даже без его участия, по расписанию или сигналу от датчика. Некоторые умные дома управляются через приложения и голосом через умные колонки, другие — с помощью отдельных устройств. Задачи тоже могут быть разными: повысить комфорт, сэкономить время или обеспечить безопасность..

СБЕР

Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке - «Умный Дом и решения»

  • Marshman
  • 20-июл-2023, 11:30
  • 0 комментариев
  • 2 156 просмотров

Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке


Сбер открыл доступ к нейросетевой модели ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самой большой из семейства многоязычных моделей Сбера.

ruGPT-3.5

Внутри GigaChat находится целый ансамбль моделей — NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3,5 13B) — новая версия нейросети ruGPT-3 13B.

Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3,5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли:  юридические документы, часть The Stack (открытый сет с кодом) от коллаборации исследователей BigCode и корпуса новостных текстов. Финальный чекпоинт модели — это базовый претрейн для дальнейших экспериментов.

В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

mGPT

Также в открытом доступе опубликована многоязычная модель mGPT-13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Сбер, как ведущая технологическая компания, выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами.

Андрей Белевцевстарший вице-президент, CTO, руководитель блока «Технологии» Сбербанка
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Открыт доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке Сбер открыл доступ к нейросетевой модели ruGPT-3.5 13B . Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самой большой из семейства многоязычных моделей Сбера . ruGPT-3.5 Внутри GigaChat находится целый ансамбль моделей — NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3,5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3,5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли: юридические документы, часть The Stack (открытый сет с кодом) от коллаборации исследователей BigCode и корпуса новостных текстов. Финальный чекпоинт модели — это базовый претрейн для дальнейших экспериментов. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI. mGPT Также в открытом доступе опубликована многоязычная модель mGPT -13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников. Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей. Сбер, как ведущая технологическая компания, выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами.Андрей Белевцевстарший вице-президент, CTO, руководитель блока «Технологии» Сбербанка


Комментарии (0)
img
Wirenboard: входы-выходы и скрипты - «Умный Дом и решения»

Итак, перейдём на следующую ступень сложности и познакомимся, во-первых, с взаимодействием входов и выходов модулей реле, во-вторых, со скриптами.

Категории сайта
Разное

Производитель и новинки производства

Это не только возможность управлять лампочкой со смартфона, а слаженная, незаметная для Вас, работа всех систем дома как инструментов в оркестре.

       89a39215
img
Новинки / Производитель / Умные Решения
Apple покупает разработчика нейросетей, чтобы улучшить собственный ИИ - «Умный Дом и решения»

Компания Apple находится на финальной стадии переговоров о привлечении специалистов из стартапа Prompt AI, который занимается разработкой решений в

img
Смарт.ТВ / Производитель / Новинки / Умные Решения
Компания Sharp выпустила 4K-телевизоры с поддержкой Apple HomeKit и AirPlay - «Умный Дом и решения»

Компания Sharp представила новую линейку телевизоров — Sharp AQUOS QLED 4K Ultra HD Smart Xumo. Доступны устройства с диагональю 50, 55, 65, 75 и 85

img
Новинки / Производитель / Умные Решения
Baseus представила уличную камеру наблюдения с двумя независимыми модулями слежения - «Умный Дом и решения»

Компания Baseus анонсировала умную систему видеонаблюдения Security X1 Pro Outdoor Dual Camera. По словам производителя, это первая в мире уличная

img
Новинки / Смарт.ТВ / Умные Решения
SwitchBot представила трекер безопасности с поддержкой службы «Локатор» от Apple - «Умный Дом и решения»

SwitchBot выпустила брелок-трекер Safety Alarm, который одновременно является средством личной безопасности и ключом от умного дома. Сигнализация

img
Производитель / Новинки / Умные Решения
ZTE представила умную камеру с ночным видением и искусственным интеллектом - «Умный Дом и решения»

Компания ZTE выпустила новую камеру наблюдения — Xiaoxing Kankan SC41. Устройство оснащено системой интеллектуального распознавания, ночным режимом

img
Смарт.ТВ / Умный Дом и решения / Производитель / Xiaomi / Умные Решения
Xiaomi представила умный дверной замок с двумя камерами и распознаванием вен ладони - «Умный Дом и решения»

Компания Xiaomi выпустила новый умный замок Smart Door Lock 4 Pro Dual Camera Edition. Модель стала улучшенной версией Smart Door Lock 4 Pro,

Top.Mail.Ru