关键词抽取算法
关键词的抽取在很多场景下都会使用。对于文本抽取关键词,通过几个关键词可以简要的概括文本的含义。比如论文都会有摘要,下面都会有大约5关键词来描述摘要的内容。抽取关键词的核心问题是如何量化词的重要性。解决了这个问题,只要对文档中的词进… 阅读更多 »关键词抽取算法
关键词的抽取在很多场景下都会使用。对于文本抽取关键词,通过几个关键词可以简要的概括文本的含义。比如论文都会有摘要,下面都会有大约5关键词来描述摘要的内容。抽取关键词的核心问题是如何量化词的重要性。解决了这个问题,只要对文档中的词进… 阅读更多 »关键词抽取算法
介绍鸭子类型 我们知道Go语言没有class,也就意味着Go语言没有类和对象,也就无法做到真正意义上的面向对象编程。而面向对象编程非常重要的几个特性封装、继承、重载、多态。其中最重要的两个特性当属继承和多态了。继承可以实现类之间的… 阅读更多 »Go语言鸭子类型“面向对象”编程
JSON 数据格式介绍 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 它基于JavaScript Programming Langua… 阅读更多 »Go处理JSON方法
关系抽取是实体识别的下游任务,通常是先做完实体识别,然后在判断两个实体的关系,这种做法被称作流水线方法(pipline)。之后兴起了joint model的思路,联合抽取的方案,一个模型完成实体识别和关系抽取,并且很多论文都有验证… 阅读更多 »基于bert的一种关系抽取模型
上次完成了“AI版对穿肠”,使用了UniLM模型,权重采用albert作为初始化权重。相当于把对联模型当成一般的seq2seq的结构,实际上对联的模型的输入和输出是等长的,也可以看成是序列标注问题,只不过标签类别是整个词库。也就是… 阅读更多 »Masked LM 完成对联模型