Nov05/20240322_reinforcement learning_neural network soft update.md

## 20240322_reinforcement learning_neural network soft update.md

      
    Raw
  

              20240322_reinforcement learning_neural network soft update.md
            
          
    "deeprl/agent/DDPG_agent.py"

trg = trg*(1-τ) + src*τ
τ is stored in self.config.target_network_mix

    def soft_update(self, target, source):
        ## trg = trg*(1-τ) + src*τ
        ## τ is stored in self.config.target_network_mix
        for target_param, source_param in zip(target.parameters(), source.parameters()):
            target_param.detach_()
            target_param.copy_(target_param * (1.0 - self.config.target_network_mix) +
                               source_param * self.config.target_network_mix)