主成分分析原理(PCA)
题外话 最近在做句向量任务,使用BERT池化得到句向量,那么句向量能不能降维,这样计算速度会明显提升。于是看到苏剑林等人的工作 Whitening Sentence Representations for Better Seman… 阅读更多 »主成分分析原理(PCA)
题外话 最近在做句向量任务,使用BERT池化得到句向量,那么句向量能不能降维,这样计算速度会明显提升。于是看到苏剑林等人的工作 Whitening Sentence Representations for Better Seman… 阅读更多 »主成分分析原理(PCA)
本文将整理常用的Loss函数,包括BinaryCrossentropy、CategoricalCrossentropy、SparseCategoricalCrossentropy、KLDivergence、Focal Loss、C… 阅读更多 »常用的Loss函数深入理解
在关键词抽取算法中详细介绍了TF-IDF算法,从信息论的角度看就是词频越高,包含的信息量越大的词就是越重要的词,根据这个算法可以从预料中计算出词的权重,在推理的过程中只需要分词,查字典即可得到关键词重要程度排序,从而实现关键词抽取… 阅读更多 »KeyBERT关键词抽取
关键词的抽取在很多场景下都会使用。对于文本抽取关键词,通过几个关键词可以简要的概括文本的含义。比如论文都会有摘要,下面都会有大约5关键词来描述摘要的内容。抽取关键词的核心问题是如何量化词的重要性。解决了这个问题,只要对文档中的词进… 阅读更多 »关键词抽取算法
关系抽取是实体识别的下游任务,通常是先做完实体识别,然后在判断两个实体的关系,这种做法被称作流水线方法(pipline)。之后兴起了joint model的思路,联合抽取的方案,一个模型完成实体识别和关系抽取,并且很多论文都有验证… 阅读更多 »基于bert的一种关系抽取模型