Рубрик
⚡️ Новая открытая модель MiniCPM-o 2.6 OpenBMB представила MiniCPM-o 2.6 — мультимодальную модель с 8 миллиардами параметров. В ее основе – Qwen2.5-7B. 🧠 Модель умеет обрабатывать тексты, изображения, и аудио, используя: — SigLip-400M для анализа изображений, — Whisper-300M для обработки речи, — ChatTTS-200M для синтеза голоса. 🔥 Производительность MiniCPM-o 2.6 демонстрирует результаты выше GPT-4o, Gemini 1.5 Pro и Claude 3.5 Sonnet в задачах анализа одиночных изображений. Кроме того, она превосходит GPT-4o-202408 и Claude 3.5 Sonnet в обработке потоковых данных. 🎙 Другие возможности модели: — Диалоги в реальном времени на английском и китайском, — Клонирование голоса, — Поддержка более 30 языков, — Совместимость со смартфонами и iPad, — Интеграция с популярными фреймворками: llama.cpp, vLLM, Gradio. 📂 Доступность Веса: https://huggingface.co/openbmb/MiniCPM-o-2_6 Демо: https://minicpm-omni-webdemo-us.modelbest.cn/) MiniCPM-o 2.6 🔥 Еще раз убеждаемся в мощности Qwen2.5. Кстати, именно на ее базе была создана Cotype Nano. #MTSAI_LLM
1 видео
Видео от MTS AI
Рубрики
Информационные технологии и Телеком