Pergunta de entrevista da empresa TikTok

Why LLM uses Layer Normalization not Batch Normalization