Beyond Masks: Efficient, Flexible Diffusion Language Models via Deletion-Insertion Processes

📰 ArXiv cs.AI

Deletion-Insertion Diffusion language models (DID) improve efficiency and flexibility in language modeling by replacing token masking with deletion and insertion processes

advanced Published 26 Mar 2026

Action Steps

Formulate token deletion and insertion as discrete diffusion processes
Replace masking and unmasking processes with deletion and insertion in current language models
Evaluate the efficiency and flexibility of Deletion-Insertion Diffusion language models
Apply DID to various NLP tasks, such as text generation and language translation

Who Needs to Know This

Natural Language Processing (NLP) researchers and AI engineers on a team can benefit from this approach as it enhances the performance of language models, and product managers can consider its applications in text generation and language understanding tasks

Key Insight

💡 Replacing token masking with deletion and insertion processes can improve the computational efficiency and generation flexibility of language models