set transformer_engine=true in gpt3/mcore base config by erhoo82 · Pull Request #305 · NVIDIA/NeMo-Framework-Launcher

erhoo82 · 2024-04-30T18:26:26Z

At mcore_gpt=true, transformer_engine=true should be the default value for performance regardless.

transformer_engine=true uses Transformer Engine modules in a Mcore/TransformerLayer, and this is the requirement for using fp8 training.

Signed-off-by: Sangkug Lym <slym@nvidia.com>

dimapihtar

set transformer_engine=true in gpt3/mcore base config

d135891

Signed-off-by: Sangkug Lym <slym@nvidia.com>

ericharper requested a review from dimapihtar April 30, 2024 21:25

Merge branch 'main' into te_enable

24c96a6

dimapihtar suggested changes May 1, 2024

View reviewed changes

Provide feedback