⚡️ Новая открытая модель MiniCPM-o 2.6
OpenBMB представила MiniCPM-o 2.6 — мультимодальную модель с 8 миллиардами параметров. В ее основе – Qwen2.5-7B.
🧠 Модель умеет обрабатывать тексты, изображения, и аудио, используя:
— SigLip-400M для анализа изображений,
— Whisper-300M для обработки речи,
— ChatTTS-200M для синтеза голоса.
🔥 Производительность
MiniCPM-o 2.6 демонстрирует результаты выше GPT-4o, Gemini 1.5 Pro и Claude 3.5 Sonnet в задачах анализа одиночных изображений. Кроме того, она превосходит GPT-4o-202408 и Claude 3.5 Sonnet в обработке потоковых данных.
🎙 Другие возможности модели:
— Диалоги в реальном времени на английском и китайском,
— Клонирование голоса,
— Поддержка более 30 языков,
— Совместимость со смартфонами и iPad,
— Интеграция с популярными фреймворками: llama.cpp, vLLM, Gradio.
📂 Доступность
Веса: https://huggingface.co/openbmb/MiniCPM-o-2_6
Демо: https://minicpm-omni-webdemo-us.modelbest.cn/) MiniCPM-o 2.6
🔥 Еще раз убеждаемся в мощности Qwen2.5. Кстати, именно на ее базе была создана Cotype Nano.
#MTSAI_LLM