3.2.1 GPT-1的模型结构