xpag.agents.rljax_agents.algorithm.td3.TD3#

class TD3(num_agent_steps, observation_dim, action_dim, seed, max_grad_norm=None, gamma=0.99, nstep=1, num_critics=2, buffer_size=1000000, use_per=False, batch_size=256, start_steps=10000, update_interval=1, tau=0.005, fn_actor=None, fn_critic=None, lr_actor=0.001, lr_critic=0.001, units_actor=(256, 256), units_critic=(256, 256), d2rl=False, std=0.1, std_target=0.2, clip_noise=0.5, update_interval_policy=2)#

Bases: DDPG

Methods

`calculate_value`	rtype: `Array`
`explore`
`get_key_list`
`get_mask`
`is_update`
`load_params`
`save_params`
`select_action`
`step`
`update`

Attributes

`kwargs_actor`
`kwargs_critic`
`name`