拯救Transformer推理能力!DeepMind新研究TransNAR:给模型嵌入「算法推理大脑」|模态|预训练|神经网络|deepmind
新智元报道编辑:乔杨 好困【新智元导读】DeepMind最近发表的一篇论文提出用混合架构的方法解决Transformer模型的推理缺陷。将Transformer的NLU技能与基于GNN的神经算法推理器(NAR)的强大算法推理能力相结合,可以实现更加泛化、稳健、准确的LLM推理。如今的NLP领域,已然是Transformer架构的天下。从Bert到GPT,再到Llama、Claude,LLM模型使用Transformer已经是再正常不过的事情。Transformer的「大一统」局面正是由于其简单...