Archive

2024⁵

September¹

Model-based RL with latent variable models

September 22, 2024 · 22 min · Trung H. Nguyen

May¹

Graph generation with predefined chromatic number

May 19, 2024 · 2 min · Trung H. Nguyen

April²

Variational Autoencoder

April 30, 2024 · 5 min · Trung H. Nguyen

Graph Representation Learning

April 16, 2024 · 9 min · Trung H. Nguyen

January¹

MuZero

January 2, 2024 · 6 min · Trung H. Nguyen

2023⁶

October¹

AlphaGo, AlphaGo Zero, AlphaZero

October 17, 2023 · 11 min · Trung H. Nguyen

May²

Multi-agent Deep Deterministic Policy Gradient

May 25, 2023 · 5 min · Trung H. Nguyen

GAN

May 1, 2023 · 9 min · Trung H. Nguyen

February²

Read-through: Probabilistic Graphical Models - Learning

February 19, 2023 · 16 min · Trung H. Nguyen

Read-through: Probabilistic Graphical Models - Inference

February 2, 2023 · 27 min · Trung H. Nguyen

January¹

Categorical Reparameterization with Gumbel-Softmax & Concrete Distribution

January 2, 2023 · 9 min · Trung H. Nguyen

2022¹⁹

December³

Maximum Entropy Reinforcement Learning via Soft Q-learning & Soft Actor-Critic

December 27, 2022 · 11 min · Trung H. Nguyen

Read-through: Probabilistic Graphical Models - Representation

December 10, 2022 · 44 min · Trung H. Nguyen

Deterministic Policy Gradients

December 2, 2022 · 12 min · Trung H. Nguyen

November²

Trust Region Policy Optimization

November 23, 2022 · 12 min · Trung H. Nguyen

Deep Q-learning

November 18, 2022 · 8 min · Trung H. Nguyen

October²

Natural Evolution Strategies

October 7, 2022 · 10 min · Trung H. Nguyen

Policy Gradient

October 6, 2022 · 4 min · Trung H. Nguyen

September¹

CMA Evolution Strategy

September 14, 2022 · 8 min · Trung H. Nguyen

August²

Read-through: Measure theory - the Lebesgue integral

August 21, 2022 · 10 min · Trung H. Nguyen

Linear Models

August 13, 2022 · 32 min · Trung H. Nguyen

July¹

Read-through: Measure theory - Lebesgue measure

July 3, 2022 · 22 min · Trung H. Nguyen

June¹

Read-through: Measure theory - Elementary measure, Jordan measure & the Riemann integral

June 16, 2022 · 29 min · Trung H. Nguyen

May³

Likelihood Ratio Policy Gradient via Importance Sampling

May 25, 2022 · 5 min · Trung H. Nguyen

Planning & Learning

May 19, 2022 · 7 min · Trung H. Nguyen

Policy Gradient Theorem

May 4, 2022 · 8 min · Trung H. Nguyen

April¹

The Exponential Family, Generalized Linear Models

April 4, 2022 · 14 min · Trung H. Nguyen

March¹

Eligible Traces

March 13, 2022 · 25 min · Trung H. Nguyen

February¹

Value Function Approximation

February 11, 2022 · 21 min · Trung H. Nguyen

January¹

Temporal-Difference Learning

January 31, 2022 · 21 min · Trung H. Nguyen

2021¹⁰

November¹

Gaussian Distribution & Gaussian Network Models

November 22, 2021 · 15 min · Trung H. Nguyen

September²

Power Series

September 21, 2021 · 15 min · Trung H. Nguyen

Infinite Series of Constants

September 6, 2021 · 20 min · Trung H. Nguyen

August¹

Monte Carlo Methods in Reinforcement Learning

August 21, 2021 · 20 min · Trung H. Nguyen

July³

Solving MDPs with Dynamic Programming

July 25, 2021 · 9 min · Trung H. Nguyen

Optimal Policy Existence

July 10, 2021 · 7 min · Trung H. Nguyen

Measures

July 3, 2021 · 9 min · Trung H. Nguyen

June³

Markov Decision Processes, Bellman equations

June 27, 2021 · 5 min · Trung H. Nguyen

Markov Chain

June 19, 2021 · 4 min · Trung H. Nguyen

My very first post

June 5, 2021 · 1 min · Trung H. Nguyen

2024 5

September 1

Model-based RL with latent variable models

May 1

Graph generation with predefined chromatic number

April 2

Variational Autoencoder

Graph Representation Learning

January 1

MuZero

2023 6

October 1

AlphaGo, AlphaGo Zero, AlphaZero

May 2

Multi-agent Deep Deterministic Policy Gradient

GAN

February 2

Read-through: Probabilistic Graphical Models - Learning

Read-through: Probabilistic Graphical Models - Inference

January 1

Categorical Reparameterization with Gumbel-Softmax & Concrete Distribution

2022 19

December 3

Maximum Entropy Reinforcement Learning via Soft Q-learning & Soft Actor-Critic

Read-through: Probabilistic Graphical Models - Representation

Deterministic Policy Gradients

November 2

Trust Region Policy Optimization

Deep Q-learning

October 2

Natural Evolution Strategies

Policy Gradient

September 1

CMA Evolution Strategy

August 2

Read-through: Measure theory - the Lebesgue integral

Linear Models

July 1

Read-through: Measure theory - Lebesgue measure

June 1

Read-through: Measure theory - Elementary measure, Jordan measure & the Riemann integral

May 3

Likelihood Ratio Policy Gradient via Importance Sampling

Planning & Learning

Policy Gradient Theorem

April 1

The Exponential Family, Generalized Linear Models

March 1

Eligible Traces

February 1

Value Function Approximation

January 1

Temporal-Difference Learning

2021 10

November 1

Gaussian Distribution & Gaussian Network Models

September 2

Power Series

Infinite Series of Constants

August 1

Monte Carlo Methods in Reinforcement Learning

July 3

Solving MDPs with Dynamic Programming

Optimal Policy Existence

Measures

June 3

Markov Decision Processes, Bellman equations

Markov Chain

My very first post

2024⁵

September¹

May¹

April²

January¹

2023⁶

October¹

May²

February²

January¹

2022¹⁹

December³

November²

October²

September¹

August²

July¹

June¹

May³

April¹

March¹

February¹

January¹

2021¹⁰

November¹

September²

August¹

July³

June³