Astera-org · adamimos · Sep 4, 2025 · Sep 4, 2025 · Sep 4, 2025 · Sep 4, 2025
diff --git a/pyproject.toml b/pyproject.toml
@@ -26,12 +26,13 @@ dependencies = [
     "orbax-checkpoint",
     "pandas",
     "penzai",
+    "plotly",
     "treescope",
 ]
 
 [project.optional-dependencies]
 aws = ["boto3"]
-cuda = ["jax[cuda12_pip]"]
+cuda = ["jax[cuda12]"]
 dev = ["jaxtyping", "nbqa", "pyright", "pytest", "pytest-cov", "ruff"]
 mac = ["jax-metal"]
 pytorch = ["torch"]

diff --git a/simplexity/configs/generative_process/config.py b/simplexity/configs/generative_process/config.py
@@ -1,5 +1,5 @@
 from dataclasses import dataclass
-from typing import Literal
+from typing import Any, Literal
 
 ProcessName = Literal[
     "days_of_week",
@@ -11,11 +11,14 @@
     "rrxor",
     "tom_quantum",
     "zero_one_random",
+    "factored_generator",
 ]
 
 ProcessBuilder = Literal[
     "simplexity.generative_processes.builder.build_generalized_hidden_markov_model",
     "simplexity.generative_processes.builder.build_hidden_markov_model",
+    "simplexity.generative_processes.builder.build_factored_generator",
+    "simplexity.generative_processes.builder.build_factored_hmm_generator",
 ]
 ProcessType = ProcessName
 
@@ -113,6 +116,23 @@ class ZeroOneRandomConfig(ProcessInstanceConfig):
     p: float
 
 
+@dataclass
+class FactoredGeneratorConfig(ProcessInstanceConfig):
+    """Configuration for factored generator with flexible components."""
+
+    # _target_: build_factored_generator
+    component_specs: list[dict[str, Any]]
+    component_types: list[str] | None = None  # ["hmm", "ghmm", ...] or None for all GHMM
+
+
+@dataclass
+class FactoredHmmGeneratorConfig(ProcessInstanceConfig):
+    """Configuration for factored generator with all HMM components."""
+
+    # _target_: build_factored_hmm_generator
+    component_specs: list[dict[str, Any]]
+
+
 @dataclass
 class Config:
     """Base configuration for predictive models."""

diff --git a/simplexity/configs/persistence/config.py b/simplexity/configs/persistence/config.py
@@ -32,8 +32,9 @@ class LocalPenzaiPersisterConfig(PersistenceInstanceConfig):
 class S3PersisterConfig(PersistenceInstanceConfig):
     """Configuration for S3 persister."""
 
-    filename: str
+    prefix: str
     model_framework: str
+    config_filename: str = "config.ini"
 
 
 @dataclass

diff --git a/simplexity/configs/persistence/s3_persister.yaml b/simplexity/configs/persistence/s3_persister.yaml
@@ -2,5 +2,5 @@ name: s3_persister
 
 instance:
   _target_: simplexity.persistence.s3_persister.S3Persister.from_config
-  filename: "config.ini"
+  prefix: "models"
   model_framework: "equinox"
diff --git a/simplexity/evaluation/evaluate_model.py b/simplexity/evaluation/evaluate_model.py
@@ -7,7 +7,7 @@
 from simplexity.configs.evaluation.config import Config
 from simplexity.evaluation.metric_functions import METRIC_FUNCTIONS
 from simplexity.generative_processes.generative_process import GenerativeProcess
-from simplexity.generative_processes.generator import generate_data_batch
+from simplexity.generative_processes.generator import batch_state, generate_data_batch
 from simplexity.logging.logger import Logger
 from simplexity.predictive_models.predictive_model import PredictiveModel
 
@@ -36,7 +36,7 @@ def evaluate(
     key = jax.random.PRNGKey(cfg.seed)
 
     gen_state = data_generator.initial_state
-    gen_states = jnp.repeat(gen_state[None, :], cfg.batch_size, axis=0)
+    gen_states = batch_state(gen_state, cfg.batch_size)
     metrics = defaultdict(lambda: jnp.array(0.0))
 
     for step in range(1, cfg.num_steps + 1):

diff --git a/simplexity/evaluation/evaluate_pytorch_model.py b/simplexity/evaluation/evaluate_pytorch_model.py
@@ -59,7 +59,10 @@ def evaluate(
     key = jax.random.PRNGKey(cfg.seed)
 
     gen_state = data_generator.initial_state
-    gen_states = jnp.repeat(gen_state[None, :], cfg.batch_size, axis=0)
+    gen_states = jax.tree_util.tree_map(
+        lambda s: jnp.repeat(s[None, ...], cfg.batch_size, axis=0),
+        gen_state,
+    )
     metrics = defaultdict(lambda: jnp.array(0.0))
 
     for step in range(1, cfg.num_steps + 1):

diff --git a/simplexity/generative_processes/builder.py b/simplexity/generative_processes/builder.py
@@ -5,6 +5,7 @@
 import jax
 import jax.numpy as jnp
 
+from simplexity.generative_processes.factored_generator import FactoredGenerativeProcess
 from simplexity.generative_processes.generalized_hidden_markov_model import GeneralizedHiddenMarkovModel
 from simplexity.generative_processes.hidden_markov_model import HiddenMarkovModel
 from simplexity.generative_processes.transition_matrices import (
@@ -113,3 +114,80 @@ def build_nonergodic_hidden_markov_model(
         initial_state = jnp.zeros((num_states,), dtype=composite_transition_matrix.dtype)
         initial_state = initial_state.at[num_states - 1].set(1)
     return HiddenMarkovModel(composite_transition_matrix, initial_state)
+
+
+def build_factored_generator(
+    component_specs: Sequence[dict[str, Any]],
+    component_types: Sequence[str] | None = None,
+    _process_name: str | None = None,  # For Hydra compatibility, ignored
+    **_kwargs,  # For Hydra compatibility, ignored
+) -> FactoredGenerativeProcess:
+    """Build a factored generator from component specifications.
+
+    Args:
+        component_specs: List of component spec dicts with 'process_name' and other kwargs
+        component_types: List of component types ("hmm" or "ghmm"). If None, defaults to "ghmm"
+        process_name: Ignored, for Hydra config compatibility
+        **kwargs: Ignored additional args, for Hydra config compatibility
+
+    Returns:
+        FactoredGenerativeProcess with the specified components
+
+    Example:
+        # Create factored generator with 2 coin HMMs
+        factored_gen = build_factored_generator([
+            {"process_name": "zero_one_random", "p": 0.7},
+            {"process_name": "zero_one_random", "p": 0.3}
+        ])
+
+        # Mix HMM and GHMM components
+        factored_gen = build_factored_generator([
+            {"process_name": "zero_one_random", "p": 0.8},
+            {"process_name": "days_of_week"}
+        ], component_types=["hmm", "ghmm"])
+    """
+    if component_types is None:
+        component_types = ["ghmm"] * len(component_specs)
+
+    if len(component_specs) != len(component_types):
+        raise ValueError("component_specs and component_types must have the same length")
+
+    components = []
+    for component_spec, component_type in zip(component_specs, component_types, strict=True):
+        # Extract process_name and remaining kwargs
+        spec_copy = component_spec.copy()
+        process_name = spec_copy.pop("process_name")
+        kwargs = spec_copy
+
+        if component_type == "hmm":
+            component = build_hidden_markov_model(process_name, **kwargs)
+        elif component_type == "ghmm":
+            component = build_generalized_hidden_markov_model(process_name, **kwargs)
+        else:
+            raise ValueError(f"Unknown component type: {component_type}. Must be 'hmm' or 'ghmm'")
+        components.append(component)
+
+    return FactoredGenerativeProcess(components)
+
+
+def build_factored_hmm_generator(
+    component_specs: Sequence[dict[str, Any]],
+    _process_name: str | None = None,  # For Hydra compatibility, ignored
+    **_kwargs,  # For Hydra compatibility, ignored
+) -> FactoredGenerativeProcess:
+    """Build a factored generator with all HMM components.
+
+    Convenience function for the common case of all components being HMMs.
+
+    Args:
+        component_specs: List of component spec dicts with 'process_name' and other kwargs
+        process_name: Ignored, for Hydra config compatibility
+        **kwargs: Ignored additional args, for Hydra config compatibility
+
+    Example:
+        factored_gen = build_factored_hmm_generator([
+            {"process_name": "zero_one_random", "p": 0.7},
+            {"process_name": "zero_one_random", "p": 0.4}
+        ])
+    """
+    return build_factored_generator(component_specs, component_types=["hmm"] * len(component_specs))