Что лучше: Llama 3 или C4AI Command R+? Личное мнение
Какую модель использовать — Llama 3 или C4AI Command R+ — зависит от ваших задач и условий дальнейшего применения сгенерированного текста.
Llama 3 — это модели с открытой (опенсорсной) лицензией, лучше всего справляющиеся с общением в чате, ответами на простые вопросы и написанием коротких историй. Созданный с их помощью контент можно использовать как для творческих, так и для коммерческих проектов. Одна из них спокойно запустится на большинстве современных компьютеров (8B), другая (70B) — требовательна к ресурсам и с ней лучше работать онлайн.
Модели Llama 3 прямо сейчас начинают дорабатываться сообществом, поэтому в будущем пригодятся для самых разных целей, в том числе для творческого письма, кодирования или взаимодействия с крупными документами. Однако на момент написания статьи что 8B, что 70B сильно ограничены цензурой и небольшим контекстным окном, поэтому их не стоит использовать для написания NSFW, работы с обширными базами данных или генерации сюжета в новеллах.
У C4AI Command R+ ограниченная лицензия. Созданный с её помощью контент можно использовать исключительно в некоммерческих проектах. Модель может генерировать длинные истории, шутки, откровенный контент, фэнтези рассказы, то есть прекрасно подходит для чего угодно, особенно для личного творчества, фанфиков или постов для социальных сетей.
К сожалению, LLM (104B) не получится использовать на большей части компьютеров из-за огромного размера файлов, требований к RAM, VRAM и свободному месту на диске, поэтому работа с ней требует стабильного подключения к сети.
Языковая модель от Cohere не может дорабатываться сообществом, однако, у неё практически полностью отсутствует цензура, поэтому в ней можно генерировать хоть боевую фантастику, хоть стендап или любовные романы. К тому же, с таким размером контекстного окна нейросеть идеально подходит для улучшения многостраничных работ, анализа информации или поиска ошибок в тексте.
Несмотря на проблемные условия использования, лицензионное соглашение сильнее ограничивает разработчиков игр, онлайн-сервисов или приложений, чем работников креативной индустрии.
Чтобы использовать модель или генерацию в своих разработках, придётся существенно потратиться. Хотя это касается вообще всех, не представляю, как в Cohere планируют отслеживать образцы генераций (простых постов, не кода!) в небольших коммерческих продуктах, если этот самый текст будет сильно переписываться, не говоря уже о работах фикрайтеров, копирайтеров или писателей, опубликованных на русском языке.
Что лучше: Llama 3 или C4AI Command R+?
- Для коммерческих проектов (например, игр и приложений), запуска на локальных машинах, коротких чатов, быстрого тестирования гипотез и идей лучше подходит Llama 3. Причём модель 8B стоит использовать для генерации простого контента на устройствах потребительского сегмента (оффлайн, с 6-8 и более ГБ VRAM), а 70B — для создания сложных постов (онлайн);
- Для личных некоммерческих проектов, творчества, фанфиков, анализа данных, извлечения информации из лонгридов, работы с документами, эротики, остросоциальных сюжетов, триллеров, NSFW, RP и ERP лучше всего подходит Command R+. Эта модель — то, что нужно для экспериментов, нестандартных задач с множеством попыток генерации, долгих чатов и мозгового штурма. Учитывайте, что модель не подходит для коммерческих проектов из-за ограниченной лицензии!
Где можно запустить обе модели и сравнить их возможности?
Чтобы самостоятельно изучить базовые возможности обеих языковых моделей (только генерацию текста, без работы с документами), попробуйте запустить их на HuggingChat или LMSYS Chatbot Arena.
Дополнительно рекомендую заглянуть в эту статью. Здесь есть сравнение моделей лоб в лоб, перечисление плюсов и минусов, а также другие сведения, которые помогут вам сделать выбор.
Надеюсь, моя статья поможет вам разобраться в теме и понять, когда и в каких случаях стоит использовать модели 8B, 70B и 104B. Удачных экспериментов!
Понравилась статья?
Поддержите автора репостом, комментарием, подпиской на Telegram и другие страницы!