Разное

Что лучше: Llama 3 или C4AI Command R+? Личное мнение

Какую модель использовать — Llama 3 или C4AI Command R+ — зависит от ваших задач и условий дальнейшего применения сгенерированного текста.

Llama 3 — это модели с открытой (опенсорсной) лицензией, лучше всего справляющиеся с общением в чате, ответами на простые вопросы и написанием коротких историй. Созданный с их помощью контент можно использовать как для творческих, так и для коммерческих проектов. Одна из них спокойно запустится на большинстве современных компьютеров (8B), другая (70B) — требовательна к ресурсам и с ней лучше работать онлайн.

Модели Llama 3 прямо сейчас начинают дорабатываться сообществом, поэтому в будущем пригодятся для самых разных целей, в том числе для творческого письма, кодирования или взаимодействия с крупными документами. Однако на момент написания статьи что 8B, что 70B сильно ограничены цензурой и небольшим контекстным окном, поэтому их не стоит использовать для написания NSFW, работы с обширными базами данных или генерации сюжета в новеллах.
Возможности LLaMa 3 и C4AI Command R Plus в генерации мрачных остросюжетных рассказов про кофе в стиле Эдгара Аллана По

У C4AI Command R+ ограниченная лицензия. Созданный с её помощью контент можно использовать исключительно в некоммерческих проектах. Модель может генерировать длинные истории, шутки, откровенный контент, фэнтези рассказы, то есть прекрасно подходит для чего угодно, особенно для личного творчества, фанфиков или постов для социальных сетей.

Llama 3 70b шутит намного хуже, чем C4AI Comman R+. Нейросеть от Cohere также лучше генерирует творческий контент, например, фэнтези, фантастику, RP и NSFW
К сожалению, LLM (104B) не получится использовать на большей части компьютеров из-за огромного размера файлов, требований к RAM, VRAM и свободному месту на диске, поэтому работа с ней требует стабильного подключения к сети.

Языковая модель от Cohere не может дорабатываться сообществом, однако, у неё практически полностью отсутствует цензура, поэтому в ней можно генерировать хоть боевую фантастику, хоть стендап или любовные романы. К тому же, с таким размером контекстного окна нейросеть идеально подходит для улучшения многостраничных работ, анализа информации или поиска ошибок в тексте.

Шутки про кофе и некромантов, сгенерированные с помощью LLM Cohere Command R+

Несмотря на проблемные условия использования, лицензионное соглашение сильнее ограничивает разработчиков игр, онлайн-сервисов или приложений, чем работников креативной индустрии.

Чтобы использовать модель или генерацию в своих разработках, придётся существенно потратиться. Хотя это касается вообще всех, не представляю, как в Cohere планируют отслеживать образцы генераций (простых постов, не кода!) в небольших коммерческих продуктах, если этот самый текст будет сильно переписываться, не говоря уже о работах фикрайтеров, копирайтеров или писателей, опубликованных на русском языке.

Что лучше: Llama 3 или C4AI Command R+?

  • Для коммерческих проектов (например, игр и приложений), запуска на локальных машинах, коротких чатов, быстрого тестирования гипотез и идей лучше подходит Llama 3. Причём модель 8B стоит использовать для генерации простого контента на устройствах потребительского сегмента (оффлайн, с 6-8 и более ГБ VRAM), а 70B — для создания сложных постов (онлайн);
  • Для личных некоммерческих проектов, творчества, фанфиков, анализа данных, извлечения информации из лонгридов, работы с документами, эротики, остросоциальных сюжетов, триллеров, NSFW, RP и ERP лучше всего подходит Command R+. Эта модель — то, что нужно для экспериментов, нестандартных задач с множеством попыток генерации, долгих чатов и мозгового штурма. Учитывайте, что модель не подходит для коммерческих проектов из-за ограниченной лицензии!

Где можно запустить обе модели и сравнить их возможности?

Чтобы самостоятельно изучить базовые возможности обеих языковых моделей (только генерацию текста, без работы с документами), попробуйте запустить их на HuggingChat или LMSYS Chatbot Arena.

Дополнительно рекомендую заглянуть в эту статью. Здесь есть сравнение моделей лоб в лоб, перечисление плюсов и минусов, а также другие сведения, которые помогут вам сделать выбор.

Надеюсь, моя статья поможет вам разобраться в теме и понять, когда и в каких случаях стоит использовать модели 8B, 70B и 104B. Удачных экспериментов!

Понравилась статья?

Поддержите автора репостом, комментарием, подпиской на Telegram и другие страницы!

Профессиональный фотограф из Приморского края. Работаю в Находке, Владивостоке и Золотой Долине. Пишу статьи о фото и гик-культуре, в том числе про аниме, игры, путешествия и генеративные нейросети. Фотографии выкладываю на рабочей странице (https://olegmorozfoto.ru/) и в Telegram (https://t.me/tengy_photos). Всегда рад новым читателям, подписчикам и клиентам! ✨❤️

Оставить комментарий