Логотип "Монета"

Конструирование и применение графа знаний

Наставник: Игорь Нехаев
Игорь Нехаевспециалист по анализу данных и машинному обучению

Задачи на практику

  • Знакомство с поставкой задачи, изучение основ построения ИИ-Агентов;
  • Изучение документов домена и формирование базовой онтологии домена в соответствии с поставленной задачей;
  • Парсинг релевантных домену документов и извлечение знаний на основе разработанной онтологии с использованием LLM;
  • Построение базы знаний (векторной базы, графа знаний) домена с использованием извлеченных из документов знаний;
  • Программирование ИИ-Агента для поиска ответа на запрос пользователя, сформулированного на естественном языке с использованием базы знаний.

Требования

  • SQL, Python, Linear Algebra
  • Разобраться как через API работать с LLM (например DeepSeek, LLama), как осуществлять запросы к LLM и формировать эмбеддинги текстов, как строить GraphRAG;
  • Разобраться как конструируются векторные базы знаний. Установить и поработать с Weaviate;
  • Разобраться как строится модель представления знаний в формате RDF (RDFS, OWL);
  • Разобраться с тем, как в графовой БД хранятся знания в формате RDF, и как делать запросы к ней на языке SparQL;
  • Установить СУБД graphDB и поработать с ней с использованием тестовых баз знаний;
  • Разобраться что такое ИИ-агент и чем он отличается от просто ИИ, под капотом которой LLM.
  • Изучить основы работы с фреймворком FastAPI в Python

Что изучить до практики

Рассмотрите другие направления практики