Центр искусственного интеллекта Т-Банка представил свою новейшую разработку — большую языковую модель T-lite, которая предназначена для решения бизнес-задач на русском языке. Как сообщает Hi-Tech Mail.ru, модель была анонсирована на первой конференции Т-Банка по машинному обучению Turbo ML Conf.
Модель T-lite, имеющая 8 миллиардов параметров, показала выдающиеся результаты на индустриальных и внутренних бенчмарках, превосходя зарубежные аналоги, такие как Chat-GPT 3.5 и Llama-3-8B-Instruct. Особенностью модели является ее высокая эффективность: она была создана с использованием всего 3% вычислительных ресурсов, обычно требуемых для подобных моделей.
T-lite является мощным инструментом для создания LLM-приложений, которые могут использоваться без передачи данных третьим лицам. Модель позволяет разрабатывать ассистентов поддержки, интеллектуальные поисковые системы и инструменты для анализа и обобщения больших объемов текста. Благодаря своей эффективности, T-lite обеспечивает качество, сопоставимое с моделями размером 20 миллиардов параметров, оставаясь при этом экономически выгодной.
T-lite входит в семейство языковых моделей Gen-T, разработанных Т-Банком для решения специализированных задач. Эти модели отличаются высокой адаптивностью и оптимальным соотношением мощности и качества. Разработка собственного семейства языковых моделей стала необходимостью, так как существующие решения не покрывают всех задач и не являются оптимальными для компании.