Ищем Middle ML Engineer для работы с аудио: в основном с задачами распознавания (STT – Speech-To-Text) и синтеза речи (TTS – Text-To-Speech).
Основные требования:
- Коммерческий опыт от 2+ лет.
- Продвинутые знания Python.
- Опыт работы с библиотеками: Pandas, scikit-learn, PyTorch, Nemo.
- Уверенное владение SQL для извлечения и обработки данных
- Уверенные знания в области ML и DL, включая архитектуры нейросетей для работы с аудио (RNN, Transformer и др.).
- Опыт работы с задачами обработки аудиосигналов: ASR (Automatic Speech Recognition), TTS (Text-to-Speech), VAD (Voice Activity Detection).
- Навыки работы с большими данными.
- Знание инструментов контейнеризации Docker.
- Знания Linux, bash
- Опыт работы с REST API и gRPC
Желательные навыки:
- Опыт работы с CUDA, ONNX, TensorRT для оптимизации моделей.
- Опыт работы с системами кластерных вычислений (Kubernetes).
- Опыт работы с LLM
Личностные качества:
- Умение работать в команде и разбираться в чужом коде.
- Способность разрабатывать и внедрять новые подходы в области аудио.
- Ответственность за результат и готовность к сложным задачам.
Условия:
- Развитие и карьерный рост;
- Возможность стать частью профессиональной дружной команды Kaspi;
- Офис в центре города (г. Алматы, Абая 26а);
- Обучение, тренинги и курсы за счет компании;
- Бесплатный тренажерный зал в офисе;
- Языковые курсы;
- Электронная библиотека - Kaspi Books и доступное приложение к нему;
- Chill-зона - уютный дворик, workout-площадка, также удобные скамейки и качели, для полной релаксации :)
- Отсутствие дресс-кода.