
академия бизнес решений · Пермь · 18 июн.
Аккредитованная IT-компания «Академия Бизнес Решений» разрабатывает интеллектуального агента, продукт использует передовые AI-технологии.
Технологический стек:
AI стек: Qwen3.6-35B-A3B, Qwen3-Embedding-4B-Q4_K_M, Whisper
Backend (для ML): Python 3, FastAPI (для обертки моделей), Docker
Инструменты: HuggingFace, PyTorch
Требования:
Опыт коммерческой разработки в ML/AI от 2 лет.
Глубокое понимание архитектуры RAG (Retrieval-Augmented Generation).
Опыт работы с LLM (Qwen, LLaMA, Gemma или аналоги) — интеграция, дообучение, инференс.
Опыт работы с векторными БД (Qdrant, Milvus, Pinecone или аналоги) — обязательно.
Опыт работы с Embedding-моделями (Qwen-Embedding, Sentence-BERT или аналоги).
Понимание работы Reranker'ов (Qwen-Reranker, Cohere или аналоги).
Опыт работы с распознаванием речи (Whisper) — будет плюсом.
Уверенное владение Python, опыт работы с PyTorch / HuggingFace Transformers.
Навыки оптимизации инференса моделей (vLLM, ONNX, quantization).
Понимание принципов работы с Docker.
Будет плюсом:
Опыт дообучения LLM под задачи (fine-tuning, LoRA, QLoRA).
Опыт работы с Prometheus / Grafana для мониторинга ML-сервисов.
Публикации или open-source проекты в области NLP.
Обязанности:
Разработка и улучшение RAG-пайплайна для продукта.
Настройка и дообучение моделей Qwen3.6 для задач составления, проверки и анализа.
Работа с Qdrant для построения семантического поиска.
Интеграция Whisper для голосового ввода данных.
Оптимизация скорости и точности поиска (индексация, кэширование, реранжирование).
Разработка ML-сервисов и их оберток (FastAPI) для интеграции в бэкенд.
Исследование новых AI-подходов и внедрение их в продукт.
Взаимодействие с бэкенд-командой для интеграции ML-компонентов.
Условия: