Data Scientist (NLP/LLM)

Город:
Краснодар
Занятость:
Полная занятость
Компания "Иннотехнум, Группа компаний"
Задачи, которые предстоит решать:- Моделирование при помощи классических алгоритмов, моделирование в области задач NLP, работа с данными:
- Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей.
- Построение решений на базе LLM моделей \ разработка промптов
- Суммаризация, генерация на основе обращений клиентов
- Определение тональности информации по клиенту \ выделение негатива по клиенту с помощью LLM
- Построение RAG сервиса базы знаний по финансовому анализу и работе с залогами.
- Высшее образование (IT, техническое, математическое).
- Уверенное владение Python, SQL, PySpark
- Понимание инструментов разработчика (типизация, логирование, тестирование)
- Хорошие знания в области теории вероятностей, математической статистики, алгоритмов машинного обучения ML \ DL (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.)
- Знания в области NLP алгоритмов, понимание деталей работы трансформеров, LLM.
- Опыт тюнинга моделей на различные задачи NLP.
- Опыт работы с библиотекой transformers, будет плюсом опыт работы с unsloth, peft, trl
- Желателен опыт работы с Langchain
- Желателен опыт вывода ML/NLP моделей в production
- Опыт в system design сервисов с спользованием трансформеров и LLM будет плюсом
- Опыт чтения и разбора научных статьей.
02 Июля
Краснодар
до 60 000 руб.
Компания "Горбунов Илья Николаевич" Data Acquisition специализируется на проектах с применением алгоритмов машинного обучения. В нашей команде...
02 Июля
Краснодар
Компания "Открытые решения" «Открытые решения» специализируются на заказной разработке веб-сервисов и мобильных приложений. Мы работаем с...
05 Июля
Middle Python Developer (AI & Data Science)
Краснодар
до 102 000 руб.
Компания "МФК Саммит" О компании "ИТ-Центр" (входит в Summit Group) — лидер в разработке решений для финансового сектора с 2011 года....
05 Июля
Краснодар
от 250 000 до 370 000 руб.
Компания "Линсофтверпродакшн" «Lean Software Production» — глобальная ИТ-компания , которая занимается созданием ПО и формированием выделенных...
07 Июля
Краснодар
Компания "Тинькофф" В Т‑Банк большое и продвинутое хранилище данных: это 8000 объектов, 800 ТБ в Greenplum и 110 ТБ в Clickhouse. С данными...
Вакансия размещена в отрасли