Не верифицирован

«Сбер» представил обновленную языковую модель в нейросети GigaChat

181

 

Во время проведения международной конференции AI Journey, которая прошла с 22 по 24 ноября в Москве, специалисты банка «Сбер» представили планы по обновлению своего сервиса GigaChat. Речь идет о внедрении новой языковой модели, которая содержит 29 млрд параметров.

 

Андрей Белевцев, старший вице-президент, руководитель блока «Технологии» в Сбербанке, заявил, что обновление нейросетевой модели – это сложный и обширный процесс, в котором задействованы сотни сотрудников банка. Он также отметил, что специально для GigaChat был создан и разрабатывается уникальный набор данных, который помогает улучшить качество ответов в различных сферах.

 

После завершения работы над новой версией GigaChat разработчики провели детальное сравнение с текущей версией и пришли к следующим выводам: качество суммаризации, рерайтинга, редактирования текстов и ответов на вопросы значительно улучшилось, общий рост качества составил 23%. Новая модель также справляется на 25% лучше предыдущей версии в обработке фактологии. Кроме того, разработчики подчеркнули, что по результатам внутренней оценки в бенчмарке MMLU (Massive Multitask Language Understanding) модель новой версии GigaChat превзошла самый популярный сегодня открытый аналог LLaMA 2 34B.

 

Разработчики также объявили о доступности новой версии программного интерфейса (API) для двух категорий пользователей: бизнес-клиентов банка «Сбер» и представителей научного сообщества, которые могут использовать его для своих исследований. 

Материалы по теме: