Fix convergence of sac, multiple torch compile on the same model caused divergence

2025-03-31 13:54:21 +00:00 · 2025-03-31 13:54:21 +00:00 · 026ad463a9
parent 8494634d48
commit 026ad463a9
3 changed files with 1 additions and 5 deletions
--- a/lerobot/common/policies/sac/modeling_sac.py
+++ b/lerobot/common/policies/sac/modeling_sac.py
@ -112,7 +112,6 @@ class SACPolicy(
        self.critic_ensemble = torch.compile(self.critic_ensemble)
        self.critic_target = torch.compile(self.critic_target)
        self.actor = Policy(
            encoder=encoder_actor,
            network=MLP(input_dim=encoder_actor.output_dim, **asdict(config.actor_network_kwargs)),
--- a/lerobot/scripts/server/actor_server.py
+++ b/lerobot/scripts/server/actor_server.py
@ -231,7 +231,6 @@ def act_with_policy(
        cfg=cfg.policy,
        env_cfg=cfg.env,
    )
    policy = torch.compile(policy)
    assert isinstance(policy, nn.Module)
    obs, info = online_env.reset()
--- a/lerobot/scripts/server/learner_server.py
+++ b/lerobot/scripts/server/learner_server.py
@ -285,9 +285,7 @@ def add_actor_information_and_train(
        # ds_meta=cfg.dataset,
        env_cfg=cfg.env,
    )
-
+ 
    # compile policy
    policy = torch.compile(policy)
    assert isinstance(policy, nn.Module)
    policy.train()