Release v0.1 · PabloCabaleiro/pondera

Schemas: CaseSpec, RubricCriterion/Rubric, RunResult, Judgment.
Judge: PydanticAIJudge (typed JSON result, model-agnostic).
API: evaluate_case(...) (sync wrapper calling async core).
CLI: pondera run <cases_dir> --runner ... --artifacts ....
Pytest helper: load_cases(), run_case(); sample test file using parametrize.
Artifacts: answer.md, judgment.json, summary.md, meta.json.
Docs: README, YAML schema reference, quickstart examples.
Tests: Adding basic tests.

Provide feedback

No results found