Class EpsilonGreedyExploration<T>

Epsilon-greedy exploration: with probability epsilon, select random action.

public class EpsilonGreedyExploration<T> : ExplorationStrategyBase<T>, IExplorationStrategy<T>

Inheritance: object

ExplorationStrategyBase<T>

EpsilonGreedyExploration<T>

Inherited Members: ExplorationStrategyBase<T>.NumOps

ExplorationStrategyBase<T>.BoxMullerSample(Random)

ExplorationStrategyBase<T>.ClampAction(Vector<T>, double, double)

ExplorationStrategyBase<T>.ValidateActionSize(int, int, string)

object.Equals(object)

object.Equals(object, object)

object.GetHashCode()

object.GetType()

object.MemberwiseClone()

object.ReferenceEquals(object, object)

object.ToString()

Constructors

public EpsilonGreedyExploration(double epsilonStart = 1, double epsilonEnd = 0.01, double epsilonDecay = 0.995)

public double CurrentEpsilon { get; }

Modifies or replaces the policy's action for exploration.

public override Vector<T> GetExplorationAction(Vector<T> state, Vector<T> policyAction, int actionSpaceSize, Random random)

Resets internal state (e.g., for new episodes or training sessions).

public override void Reset()

Updates internal parameters (e.g., epsilon decay, noise reduction). Called after each training step.

public override void Update()