Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty

This repository contains the code for Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty.

Installation

Create a conda environment with the required dependencies:

conda env create -f requirements.yaml
conda activate dentropy

Quick Start

Basic Usage

Run sampling experiments with different methods:

# Random
python main.py sampling=random

# Best-of-N sampling
python main.py sampling=bon

# SMC sampling
python main.py sampling=smc

# Greedy sampling
python main.py sampling=greedy

Sampling Methods

Random

Usage:

python main.py sampling=random \
  sampling.steps=128 \
  sampling.num_sample_batches=16 \
  seed=42

Parameters:

sampling.steps: Number of diffusion steps (default: 128)
sampling.num_sample_batches: Number of runs to execute (default: 8)

Best-of-N

Usage:

python main.py sampling=bon \
  sampling.num_particles=8 \
  sampling.steps=128 \
  seed=42

Parameters:

sampling.num_particles: Number of samples to generate (N) (default: 8)
sampling.steps: Diffusion steps (default: 128)
sampling.num_sample_batches: Number of runs (default: 8)

Sequential Monte Carlo

Usage:

python main.py sampling=smc \
  smc.num_particles=8 \
  smc.resample_interval=50 \
  smc.lambda_weight=5.0 \
  seed=42

Parameters:

smc.num_particles: Number of particles to maintain (default: 8)
smc.resample_interval: Steps between resampling (default: 50)
smc.lambda_weight: Temperature parameter for potential function (default: 5.0)
smc.potential_type: Potential function type, 'max' or 'mean' (default: 'max')

Greedy

Usage:

python main.py sampling=greedy \
  greedy.num_candidates=8 \
  greedy.beam_size=1 \
  seed=42

Parameters:

greedy.num_candidates: Number of candidates per beam at each step (default: 8)
greedy.beam_size: Number of beams to maintain (default: 1)
- beam_size=1: Pure greedy search
- beam_size>1: Beam search

Release Progress

✅ Implementation of Denoising Entropy
✅ Implementation of Best-of-N and SMC
✅ Evaluation on MDLM
❌ Evaluation on LLaDA

Acknowledgements

This repository is built upon: MDLM

Citation

@article{chen2025optimizing,
  title={Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty},
  author={Chen, Ziyu and Jiang, Xinbei and Sun, Peng and Lin, Tao},
  journal={arXiv preprint arXiv:2512.21336},
  year={2025}
}

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
configs		configs
models		models
samplers		samplers
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
dataloader.py		dataloader.py
diffusion.py		diffusion.py
main.py		main.py
noise_schedule.py		noise_schedule.py
requirements.yaml		requirements.yaml
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty

Installation

Quick Start

Basic Usage

Sampling Methods

Random

Best-of-N

Sequential Monte Carlo

Greedy

Release Progress

Acknowledgements

Citation

About

Uh oh!

Releases

Packages

Languages

License

LINs-lab/DenoisingEntropy

Folders and files

Latest commit

History

Repository files navigation

Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty

Installation

Quick Start

Basic Usage

Sampling Methods

Random

Best-of-N

Sequential Monte Carlo

Greedy

Release Progress

Acknowledgements

Citation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages