算法

AI版“对穿肠”

2018年看到有人开发了对联的深度学习模型,看起来效果也不错。“对下联”这个任务对于NLP来说,算是文本生成问题,典型seq2seq的模型。早期的模型普遍采用encoder-decoder架构,编码器和解码器使用RNN或者变体较多… 阅读更多 »AI版“对穿肠”

Bert论文笔记

做了挺多NLP的任务,对于很多模块的原理都是通过看资料和论文,实践也是调用别人写好的模块(说明开源分享太好了😍)。纸上得来终觉浅,最近根据论文写了Transformer模块,还是花了挺多时间,看来要多动手,切勿纸上… 阅读更多 »Bert论文笔记

谈谈曾经挖的一个坑

曾经也是一个挖坑少年😁,现在发生了一点点改变。这里分享一个并不太光彩的小故事,也是我以前对技术原理掌握不深导致的,说起来挺惭愧的。 我在某公司做了医疗模型,第一个版本是风险评估的,本质上是一个文本分类问题。这个做得… 阅读更多 »谈谈曾经挖的一个坑

中文分词模型

最近一段时间没有更新文章了。忙着在家带孩子和找工作这两件事,有点焦头烂额了🤪,忙得差不多了,还是继续写点东西。本文将构建一个神经网络模型实现中文的分词。 介绍 中文分词任务就是解决这样的任务,比如: 我毕业于陕西师… 阅读更多 »中文分词模型