Рубрикподписаться:
👁‍🗨 Как мы прокачали пайплайн обучения моделей Cotype На днях вышла в свет наша новая и самая мощная модель в семействе Cotype – Cotype Pro 2. В процессе ее разработки мы применили усовершенствованный подход к оценке языковых моделей. Его мы выработали в рамках исследования по автоматизированному сравнению LLM методом Side-by-Side – с применением LLM-оценщиков. Об этом наша новая статья на Хабре: https://vk.cc/cKrrWl Рассказываем: ▪ Как мы трансформировали метод Side-by-Side и что придумали, чтобы повысить корреляцию результатов LLM-оценщика с результатами оценки экспертов. ▪ Какие известные LLM, которых мы использовали в качестве судей, оказались наиболее близки к человеческим суждениям. ▪ Как можно нивелировать влияние позиционного сдвига с помощью нехитрого изменения в промт. А ещё — выложили лидерборд на HuggingFace, где можно сравнить коммерческие и open-source LLM. #MTSAI_Хабр #LLM #Cotype
Рубрики
Информационные технологии и Телеком