Format .jl files (#82)

github-actions[bot] · web-flow · commit 39159f4fef67 · 2020-09-01T18:24:25.000+08:00
Co-authored-by: github-actions[bot] &lt;41898282+github-actions[bot]@users.noreply.github.com&gt;
diff --git a/src/algorithms/policy_gradient/ddpg.jl b/src/algorithms/policy_gradient/ddpg.jl
@@ -88,7 +88,8 @@ function DDPGPolicy(;
         act_noise,
         step,
         rng,
-        0.f0,0.f0,
+        0.f0,
+        0.f0,
     )
 end
 
@@ -138,7 +139,7 @@ function RLBase.update!(p::DDPGPolicy, traj::CircularCompactSARTSATrajectory)
     gs1 = gradient(Flux.params(C)) do
         q = C(vcat(s, a)) |> vec
         loss = mean((y .- q) .^ 2)
-        ignore() do 
+        ignore() do
             p.critic_loss = loss
         end
         loss
@@ -148,7 +149,7 @@ function RLBase.update!(p::DDPGPolicy, traj::CircularCompactSARTSATrajectory)
 
     gs2 = gradient(Flux.params(A)) do
         loss = -mean(C(vcat(s, A(s))))
-        ignore() do 
+        ignore() do
             p.actor_loss = loss
         end
         loss
diff --git a/src/experiments/rl_envs.jl b/src/experiments/rl_envs.jl
@@ -511,7 +511,7 @@ function RLCore.Experiment(
     N_ENV = 16
     UPDATE_FREQ = 10
     env = MultiThreadEnv([
-        CartPoleEnv(; T = Float32, rng = MersenneTwister(hash(seed + i))) for i = 1:N_ENV
+        CartPoleEnv(; T = Float32, rng = MersenneTwister(hash(seed + i))) for i in 1:N_ENV
     ])
     ns, na = length(get_state(env[1])), length(get_actions(env[1]))
     RLBase.reset!(env, is_force = true)
@@ -599,7 +599,7 @@ function RLCore.Experiment(
     N_ENV = 16
     UPDATE_FREQ = 10
     env = MultiThreadEnv([
-        CartPoleEnv(; T = Float32, rng = MersenneTwister(hash(seed + i))) for i = 1:N_ENV
+        CartPoleEnv(; T = Float32, rng = MersenneTwister(hash(seed + i))) for i in 1:N_ENV
     ])
     ns, na = length(get_state(env[1])), length(get_actions(env[1]))
     RLBase.reset!(env, is_force = true)
@@ -800,7 +800,7 @@ function RLCore.Experiment(
     N_ENV = 8
     UPDATE_FREQ = 16
     env = MultiThreadEnv([
-        CartPoleEnv(; T = Float32, rng = MersenneTwister(hash(seed + i))) for i = 1:N_ENV
+        CartPoleEnv(; T = Float32, rng = MersenneTwister(hash(seed + i))) for i in 1:N_ENV
     ])
     ns, na = length(get_state(env[1])), length(get_actions(env[1]))
     RLBase.reset!(env, is_force = true)
diff --git a/test/runtests.jl b/test/runtests.jl
@@ -17,7 +17,7 @@ using Random
                     Val(method),
                     Val(:CartPole),
                     nothing;
-                    save_dir=joinpath(dir, "CartPole", string(method)),
+                    save_dir = joinpath(dir, "CartPole", string(method)),
                 ))
                 @info "stats for $method" avg_reward = mean(res.hook[1].rewards) avg_fps =
                     1 / mean(res.hook[2].times)
@@ -29,22 +29,32 @@ using Random
                     Val(method),
                     Val(:MountainCar),
                     nothing;
-                    save_dir=joinpath(dir, "MountainCar", string(method)),
+                    save_dir = joinpath(dir, "MountainCar", string(method)),
                 ))
                 @info "stats for $method" avg_reward = mean(res.hook[1].rewards) avg_fps =
                     1 / mean(res.hook[2].times)
             end
 
             for method in (:A2C, :A2CGAE, :PPO)
-                res = run(Experiment(Val(:JuliaRL), Val(method), Val(:CartPole), nothing;
-                    save_dir=joinpath(dir, "CartPole", string(method)),))
+                res = run(Experiment(
+                    Val(:JuliaRL),
+                    Val(method),
+                    Val(:CartPole),
+                    nothing;
+                    save_dir = joinpath(dir, "CartPole", string(method)),
+                ))
                 @info "stats for $method" avg_reward =
                     mean(Iterators.flatten(res.hook[1].rewards))
             end
 
             for method in (:DDPG, :SAC)
-                res = run(Experiment(Val(:JuliaRL), Val(method), Val(:Pendulum), nothing;
-                    save_dir=joinpath(dir, "Pendulum", string(method)),))
+                res = run(Experiment(
+                    Val(:JuliaRL),
+                    Val(method),
+                    Val(:Pendulum),
+                    nothing;
+                    save_dir = joinpath(dir, "Pendulum", string(method)),
+                ))
                 @info "stats for $method" avg_reward =
                     mean(Iterators.flatten(res.hook[1].rewards))
             end