ONE BIT

Here's the main idea: We take the backprop-free Evolution Guided General Optimization via Low-rank Learning (EGGROLL) algorithm, the architecture from Tiny Recursive Model, we add a pruning/sparsity objective between blocks of neurons, and we keep the precision of the model in 1 bit (values in {-1, 1}), to maximize inference speed and minimize bandwidth costs.

Some benchmarks to try:

MNIST CIFAR Sudoku ARC-AGI

uv run python main.py --optimizer eggroll --epochs 30 --es-steps-per-epoch 1 --population 4096 --population-batch 4096 --group-size 128 --sigma 1.0 --es-lr 1.0 --sigma-schedule linear --es-lr-schedule linear --sigma-floor 0.0 --es-lr-floor 0.0 --fitness-baseline per_prompt --fitness-shaping zscore

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.ipynb_checkpoints		.ipynb_checkpoints
.prompt		.prompt
.torch_ext_cache/bitpack_ext		.torch_ext_cache/bitpack_ext
.gitignore		.gitignore
.python-version		.python-version
AGENTS.md		AGENTS.md
README.md		README.md
eggroll.ipynb		eggroll.ipynb
eggroll_grid.csv		eggroll_grid.csv
eggroll_grid_focused.csv		eggroll_grid_focused.csv
eggroll_grid_tight.csv		eggroll_grid_tight.csv
eggroll_run.txt		eggroll_run.txt
grid_search.py		grid_search.py
main.py		main.py
pyproject.toml		pyproject.toml
sgd_run.txt		sgd_run.txt
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

ONE BIT

About

Uh oh!

Releases

Packages

Languages

Andrewp2/one_bit

Folders and files

Latest commit

History

Repository files navigation

ONE BIT

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages