Игорь Нехаевспециалист по анализу данных и машинному обучению
Задачи на практику
Знакомство с поставкой задачи, изучение основ построения ИИ-Агентов;
Изучение документов домена и формирование базовой онтологии домена в соответствии с поставленной задачей;
Парсинг релевантных домену документов и извлечение знаний на основе разработанной онтологии с использованием LLM;
Построение базы знаний (векторной базы, графа знаний) домена с использованием извлеченных из документов знаний;
Программирование ИИ-Агента для поиска ответа на запрос пользователя, сформулированного на естественном языке с использованием базы знаний.
Требования
SQL, Python, Linear Algebra
Разобраться как через API работать с LLM (например DeepSeek, LLama), как осуществлять запросы к LLM и формировать эмбеддинги текстов, как строить GraphRAG;
Разобраться как конструируются векторные базы знаний. Установить и поработать с Weaviate;
Разобраться как строится модель представления знаний в формате RDF (RDFS, OWL);
Разобраться с тем, как в графовой БД хранятся знания в формате RDF, и как делать запросы к ней на языке SparQL;
Установить СУБД graphDB и поработать с ней с использованием тестовых баз знаний;
Разобраться что такое ИИ-агент и чем он отличается от просто ИИ, под капотом которой LLM.
Изучить основы работы с фреймворком FastAPI в Python