算法

关键词抽取算法

关键词的抽取在很多场景下都会使用。对于文本抽取关键词,通过几个关键词可以简要的概括文本的含义。比如论文都会有摘要,下面都会有大约5关键词来描述摘要的内容。抽取关键词的核心问题是如何量化词的重要性。解决了这个问题,只要对文档中的词进… 阅读更多 »关键词抽取算法

Masked LM 完成对联模型

上次完成了“AI版对穿肠”,使用了UniLM模型,权重采用albert作为初始化权重。相当于把对联模型当成一般的seq2seq的结构,实际上对联的模型的输入和输出是等长的,也可以看成是序列标注问题,只不过标签类别是整个词库。也就是… 阅读更多 »Masked LM 完成对联模型