Задача
Запустить комплекс , состоящийи из следующих частей:
1. Чат с ИИ
2. Кодовый агент для работы с проектами в консоли
3. Кодовый агент для работы в PyCharm
Требования к компонентам
Программа для работы с моделями LLM
- Бесплатность
- Запуск GGUF моделей LLM* с Hugging Face
- Доступ к модели в режиме чата
- Доступ к модели по протоколу OpenAI API
- Многопользовательский режим (несколько одновременных сессий)
- Большое кол-во параметров LLM при запуске
Предполагаемый кандидат:
1. text-generation-webui - не удачно
2. llama-server - удачно
Кодовый агент для работы с проектами в консоли
- Бесплатность
- Работа по протоколу OpenAI API
- Возможность настройки на разные OpenAI серверы
Предполагаемый кандидат: Codex - удачно
Кодовый агент для работы в PyCharm
- Бесплатность
- Работа по протоколу OpenAI API
- Возможность настройки на разные OpenAI серверы
Предполагаемый кандидат:
1. плагин Continue - не удачно
2. плагин ProxyAI - удачно
Статьи по теме:
1. Внедряем AI Code Assistant в разработку бесплатно и без вендорлока — Инструкция
*Модели LLM
Jetson Orin NX 16 GB способен работать с моделями до 13B параметров, на это и будем равнятся.
Статьи по теме:
1. Всё, что я узнал о запуске локальных языковых моделей
2. How To Calculate GPU VRAM Requirements for Local LLMs (Advanced Guide)
3. Выбор моделей LLM