NLP baseline paper，你读過了吗

发表于 2020-08-14 | 分类于 NLP

字数统计 893

第一部分 NLP baseline

NLP综述
Efficient Estimation of Word Representation in Vector Space arxiv原文 ICLR2013，词向量扛鼎之作
GloVe: Global Vectors for Word Representation stanfordNLP原文 EMNLP2014，最著名的词向量训练模型之一
Compositional character models for open vocabulary word representation arxiv原文 EMNLP2015，第一篇介绍字符嵌入
Convolutional Neural Network for Sentence Classification arxiv原文 EMNLP2014，CNN文本分类扛鼎之作
Character-level Convolutional Networks for TextClassification arxiv原文 NIPS2015，第一篇字符级别的文本分类
Bag of Tricks for Efficient Text Classification arxiv原文 EACL2017，细粒度文本分类模型
Sequence to Sequence Learning with Neural Networks arxiv原文 NIPS2014，深度LSTM做神经枳器翻译
Neural Machine Translation by Jointly Learning to Align and Translate arxiv原文 ICLR2015，第一篇提出注意力机制的论文
Hierarchical Attention Networks forDocument Classification ACL原文 NAACL2016，HanAttention用于文本分类
SGM: Sequence Generation Model for Multi-label Classification arxiv原文 Coling2018，第一篇使用序列生成做多标签文本分类的论文

以下未完成

第二部分 NLP细分专题

Part1预训练模型

预训练模型综述
transformer–预训练模型的基石
transformer-xl–文本生成任务经典模型
elmo–经典动态词向量，预训练模型三巨头之一
GPT–文本生成任务上的巨人
bert–预训练模型最耀眼的那颗星
ulmfit–少量样本训练的预训练模型
alber–轻量级bert的代表之作
mass–包含gpt和bert的预训练模型
xlnet–自回归预训练模型代表之作
electra–轻量级新生代预训练模型

Part2文本匹配

文本匹配综述
DSSM–第一篇深度学习领域文本匹配文章
SiamseNet–利用孪生网络计算文本相似度
Compare-Aggreaget–多角度提取文本特征，利用CNN特征融合
ESIM–最流行、经典的文本匹配模型，优秀的baseline
BiMPM–多诵道、多角度匹配，充分挖掘文本特征
CSRAN–扩展CAFE算法、多层注意力交互的深层模型
DMAN-模型加入了迁移学习和强化学习技巧
DRCN–融合DenseNet和注意力机制的深度网络模型
DRr．Net–模型通过对重点内容的反复阅读来提升对文本的理解
MT-DNN–基于多任务的联合训练模型

Part3图神经网络

图神经网络综述
Node2vec–平衡同质性和结构性
LINE–1阶+2阶相似度
SDNE–多层自编码器
metapath2vec–异构图网络
TransE–知识图谱奠基
GCN–开山之作
GAT–attention机制
MPNN–空域卷积消息传递框架
GGNN–门控图神经网络
GraphSAGE–归纳式字习框架

Part4信息抽取

信息抽取综述
BiLSTM-CRF–深度学习应用NER的经典模型
Lattice-LSTM–融合字词向量的中文NER
FALT-Transformer应用NER
CNN-LSTM-CRF–加入分词任务的联合训练NER
PretrainedEmbeddings–基于字符语言模型的NER
End-to-EndRelationExtraction–关系抽取经典论文
Few-ShotRelationClassification–基于小样本的领域自适应关系分类
BERT-based Relation learning–基于Bert实现关系抽取
Adaptive SCaling–解决正负例不平衡的系数检测问题
Nugget Proposal Networks–解决信息抽取中的分词依赖问题
Cost-sensitive Regularization–解决事件检测中的易混淆类别问题
Anchor-Region Networks–解决命名实体识别中的嵌套实体问题
参考
- [1] name

0%