SEDAR-NLI

Natural Language Interface for SEDAR based on a multi-agent LLM system.

This repository contains the code for our CIKM 2025 paper on a multi-agent natural language interface (NLI) for semantic data lakes. The system enables users to interact with the SEDAR data lake platform using plain language, making advanced data management, discovery, and analytics accessible to non-technical users.

Our approach integrates large language models (LLMs) in a modular, multi-agent architecture. By combining retrieval-augmented generation (RAG) and dynamic tool-calling, the system translates user queries into structured API calls to execute complex workflows over the data lake.

Main features:

Multi-agent orchestration for complex query decomposition and execution
Retrieval-augmented generation for relevant API/tool selection
Automatic tool-calling for seamless backend integration
Evaluation framework for correctness and robustness
We performed finetuning on a dedicated dataset specifically tailored for this system.

The repository includes code, datasets, and evaluation scripts.

Repository Structure

Main Code

main.py: Entry point for the system without chainlit chat.
chainlit_chat: Entry point for the system with the Chainlit interface.
agent_graph/: Multi-agent orchestration logic.
agents/: Agent implementations.
models/: Model configuration and management.
sedarapi/: API integration with the SEDAR data lake.
prompts/: Prompt templates and compression logic.
tools/: Tool definitions for agent actions.
utils/: Utility functions.

Evaluation

evaluation/: Contains all evaluation code.
- evaluation/evaluation.py: Script for running quantitative evaluation.
- evaluation/queries_similarity/: Semantic variations of queries.
  - Purpose: Tests how well the system handles phrasing differences and interprets reworded queries consistently.
  - llms/: Contains results for different LLMs.
  - queries/: Contains the queries used for evaluation.

Finetuning

finetuning/: All code for finetuning.
- finetuning/dataset.jsonl: Main dataset in ShareGPT format.
- finetuning/data/: Sample datasets used in the datalake for finetuning.
- finetuning/langsmith_chat_loader.py: Loads LLM runs from LangSmith and creates datasets for finetuning.

Data

data/: Sample data used for evaluation (e.g., CSVs, JSON files).

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
agent_graph		agent_graph
agents		agents
cache		cache
data		data
evaluation		evaluation
finetuning		finetuning
models		models
prompts		prompts
public		public
sedarapi		sedarapi
states		states
tools		tools
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
chainlit_chat.py		chainlit_chat.py
consts.py		consts.py
main.py		main.py
requirements.txt		requirements.txt
reset_datalake.py		reset_datalake.py
sedar_api_example.py		sedar_api_example.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SEDAR-NLI

Repository Structure

Main Code

Evaluation

Finetuning

Data

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

hsnr-data-science/SEDAR-NLI

Folders and files

Latest commit

History

Repository files navigation

SEDAR-NLI

Repository Structure

Main Code

Evaluation

Finetuning

Data

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages