Рубрик
Подборка вебинаров августа по ML 🗓️ 📌 22 августа, 16:00 Как сократить расходы на инференс LLM? Кейс компании «Актион» Вместе с коллегами из Compressa и «Актион» обсудим способы оптимизации open-source LLM-моделей на своем сервере и преимущества использования облака для инференса LLM. Сравним производительность LLM и стоимость токенов до и после оптимизации. Разберем кейс «Актион» и Compressa по обработке 100 000+ генераций в день всего на одной GPU-карте и узнаем, как удалось сократить расходы на инференс LLM. Присоединиться онлайн → https://slc.tl/tfr2c 📌 29 августа, 16:00 Production ML: как настроить GPU-ноды в кластерах Kubernetes? На практическом вебинаре покажем особенности работы с кластерами Kubernetes c GPU, настройку драйверов на GPU-нодах и масштабирование нагрузки в продакшене ML-сервисов. Обсудим практические кейсы использования GPU-нод в кластерах Kubernetes от клиентов Selectel. Присоединиться онлайн → https://slc.tl/tahzo
1 фото
Подборка вебинаров августа по ML 22 августа, 16:00 Как сократить расходы на инференс LLM? Кейс компании «Актион»
Рубрики
Информационные технологии и Телеком