VK выложила в открытый доступ модель RuModernBERT для обработки естественного русского языка. Модель понимает длинные тексты целиком, без разбиения на…

VK выложила в открытый доступ модель RuModernBERT для обработки естественного русского языка. Модель понимает длинные тексты целиком, без разбиения на фрагменты и работает локально. Инженеры могут использовать ее для задач в области обработки текста, в том числе для извлечения информации, анализа тональности, поиска и ранжирования в приложениях и сервисах. RuModernBERT была обучена на 2 триллионах токенов данных на русском, английском языках и коде с максимальной длиной контекста до 8,192 токенов. https://clck.ru/3NJ4sV Yandex B2B Tech открыл доступ к самой большой языковой модели в облаке — Qwen3-235B-A22B-Instruct-2507. Модель удерживает большой объем контекста, качественно решает логические задачи и работает с кодом. Qwen3-235B-A22B-Instruct-2507 можно применять для создания ИИ-агентов в различных сферах бизнеса, также модель поддерживает 119 языков и диалектов и обладает широкой базой знаний. https://clck.ru/3NJ5QA Математики из НИУ ВШЭ разработали новую архитектуру нейронных сетей GLGENN, которая позволяет системам ИИ «видеть» симметрию при обработке данных и сохранять ее с минимальными затратами вычислительных ресурсов. В перспективе разработка позволит ускорить и упростить анализ данных в физике, биологии и инженерии. GLGENN работает быстрее и эффективнее за счет меньшего числа обучаемых параметров, что делает ее более доступной для практического применения. https://clck.ru/3NJ5dr

1 фото

Рубрики: Информационные технологии и Телеком