感谢各位大佬的博客分享,我在你们这里学到了许多,下面我就将结合大佬们的分享来总结一下我的学习内容。下面我们先介绍seq2seq,attention,然后进入正题,transformer。一、seq2seq模型1. 1 seq2seq模型简介 所谓Seq2Seq(Sequence to Sequence), 就是一种能够根据给定的序列,通过特定的方法生成另一个序列的方法。 举个简单的例子,当我们使用机器翻译时:输入(Hello) --->输出(你好)。再比如在人机对话中,我们问机器:“你是谁?”,机器会返回答案“我是某某某”。机器翻译、人机对话、聊天机器人等等,