#

reasoning-language-models

Here are 45 public repositories matching this topic...

reasoning-survey / Awesome-Reasoning-Foundation-Models

✨✨Latest Papers and Benchmarks in Reasoning with Foundation Models

reasoning multimodal foundation-models llm reasoning-agent llm-reasoning reasoning-language-models

Updated Apr 25, 2025

mims-harvard / TxAgent

TxAgent: An AI Agent for Therapeutic Reasoning Across a Universe of Tools

agents precision-medicine tool-use therapeutics reasoning-agent reasoning-language-models

Updated Apr 21, 2025
Python

dvlab-research / Seg-Zero

Project Page For "Seg-Zero: Reasoning-Chain Guided Segmentation via Cognitive Reinforcement"

reinforcement-learning segmentation multimodal multimodel-large-language-model reasoning-language-models

Updated Jun 11, 2025
Python

LightChen233 / Awesome-Long-Chain-of-Thought-Reasoning

Latest Advances on Long Chain-of-Thought Reasoning

agent reinforcement-learning rl long thinking reasoning r1 o3 o1 system-2 chain-of-thought openai-o1 reasoning-language-models deepseek-r1 long-chain-of-thought

Updated May 29, 2025

krystalan / DRT

Deep Reasoning Translation (DRT) Project

reinforcement-learning machine-translation large-language-models reasoning-language-models literature-translation

Updated May 27, 2025

dvlab-research / VisionReasoner

The official implement of "VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning"

reinforcement-learning segmentation object-detection multimodal counting-objects visual-perception multimodal-large-language-models reasoning-language-models

Updated May 30, 2025
Python

a-m-team / a-m-models

a-m-team's exploration in large language modeling

llm reasoning-language-models

Updated May 29, 2025

mims-harvard / ToolUniverse

ToolUniverse is a collection of biomedical tools designed for AI agents

agents precision-medicine tool-use therapeutics reasoning-agent reasoning-language-models

Updated Jun 7, 2025
Python

codelion / pts

Pivotal Token Search

Updated May 17, 2025
Python

yihedeng9 / OpenVLThinker

OpenVLThinker: An Early Exploration to Vision-Language Reasoning via Iterative Self-Improvement

rl vision-language-model reasoning-language-models grpo

Updated May 19, 2025
Python

Wild-Cooperation-Hub / Awesome-MLLM-Reasoning-Benchmarks

A Comprehensive Survey on Evaluating Reasoning Capabilities in Multimodal Large Language Models.

reasoning multimodal multimodal-large-language-models multimodal-reasoning reasoning-language-models mllm-reasoning multimodal-reasoning-benchmarks

Updated Mar 18, 2025

spcl / x1

Official Implementation of "Reasoning Language Models: A Blueprint"

lrm rlm large-language-models llm large-reasoning-models reasoning-language-models reasoning-llms mcts-for-llms

Updated Feb 10, 2025
Python

SalesforceAIResearch / MAS-Zero

Designing Multi-Agent Systems with Zero Supervision

multi-agent-systems large-language-models self-evolving inference-time-compute reasoning-language-models zero-supervision

Updated Jun 6, 2025
Python

The-FinAI / Fino1

This is the repo of developing reasoning models in the specific domain of financial, aim to enhance models capabilities in handling financial reasoning tasks.

llamas financial-modeling llms deepseek gpt-4o reasoning-language-models

Updated May 16, 2025
Jupyter Notebook

DolbyUUU / Logic-RL-Lite

Lightweight replication study of DeepSeek-R1-Zero. Interesting findings include "No Aha Moment", "Longer CoT ≠ Accuracy", and "Language Mixing in Instruct Models".

reinforcement-learning fine-tuning post-training llm deepseek gpt-o1 reasoning-language-models reasoning-models deepseek-r1

Updated Apr 1, 2025
Python

DolbyUUU / DeepEnlighten

Pure RL to post-train base models for social reasoning capabilities. Lightweight replication of DeepSeek-R1-Zero with Social IQa dataset.

reinforcement-learning fine-tuning post-training llm deepseek gpt-o1 reasoning-language-models reasoning-models deepseek-r1

Updated Mar 16, 2025
Python

MozerWang / AMPO

[arxiv: 2505.02156] Adaptive Thinking via Mode Policy Optimization for Social Language Agents

agent large-language-models reasoning-agent llm-reasoning reasoning-language-models long-cot

Updated May 20, 2025
Python

zihao-ai / unthinking_vulnerability

To Think or Not to Think: Exploring the Unthinking Vulnerability in Large Reasoning Models

ai-agents backdoor-attacks qwq large-language-models chain-of-thought deepseek reasoning-language-models deepseek-r1

Updated May 21, 2025
Python

Wu-Zongyu / CharmBench

A preview-version of one novel multimodal reasoning benchmark CharmBench.

deep-learning multimodal large-language-models multimodal-large-language-models reasoning-language-models

Updated Jun 1, 2025
Jupyter Notebook

linhaowei1 / kumo

☁️ KUMO: Generative Evaluation of Complex Reasoning in Large Language Models

benchmark reasoning llm reasoning-language-models

Updated Jun 4, 2025
Jupyter Notebook

Improve this page

Add a description, image, and links to the reasoning-language-models topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the reasoning-language-models topic, visit your repo's landing page and select "manage topics."