Retrieval-of-Thought: Efficient Reasoning via Reusing Thoughts

📰 ArXiv cs.AI

Retrieval-of-Thought (RoT) reuses prior reasoning steps to improve inference-time efficiency in large reasoning models

advanced Published 2 Apr 2026

Action Steps

Organize prior reasoning steps into a thought graph with sequential and semantic edges
Enable fast retrieval of query-relevant nodes from the thought graph
Recombine retrieved nodes to guide new problem-solving
Integrate RoT into large reasoning models to improve inference-time efficiency

Who Needs to Know This

AI researchers and engineers on a team can benefit from RoT as it enables fast retrieval and flexible recombination of prior reasoning steps, improving model efficiency and reducing latency

Key Insight

💡 Reusing prior reasoning steps can significantly improve inference-time efficiency in large reasoning models