人工智能 - QIN (Page 3)

从 R-Drop 到 KL 散度

2022年2月24日 8 min read 人工智能

在《R-Drop: Regularized Dropout for Neural Networks》引入了一种一致性的训练策略来规范化 dropout，称为 R-Drop。

浅析 Text and Code Embeddings by Contrastive Pre-Training

2022年2月21日 5 min read 人工智能

文本向量是在很多应用和文本相似度、语义搜索上有很大的应用。之前的工作通常是根据不同的应用来选择数据集定制模型架构。《Text and Code Embeddings by Contrastive Pre-Training》中展示无监督的对比学习可以获得更好的文本向量，并且在这个方法下得到的文本向量在 linear-probe 分类上达到了 SOTA（state-of-the-art），也有着很好的语义搜索能力，甚至可以与 fine-tuned 后的模型比较。

NLP 文本数据增强综述

2022年2月20日 13 min read 人工智能

与计算机视觉中使用图像进行数据增强不同，NLP中文本数据增强是非常罕见的。本篇文章将整理目前比较主流的文本数据增强办法。