算法

很讨厌临时方案

说实话我很讨厌临时方案,这句话我说过很多次,任职不同的公司都说过。临时方案就像毒品,一旦用多了,你还戒不掉,慢慢还能产生依赖。于是一个接一个临时方案,最终堆积如山,成了祖传代码,不断易手变得不可维护,要不然只能重构或者丢弃整个产品… 阅读更多 »很讨厌临时方案

常用的概率分布

本篇文章整理常用的一些概率分布,这些经典的概率分布是实际生活中非常有用。之后的文章都会用到这些基础的概率分布。 离散型分布 离散型随机变量:随机变量可能取值能够一一列出来有限个或可列无限个。 假设离散型随机变量X,可能取值为x_1… 阅读更多 »常用的概率分布

神经网络的分类模型

NLP的入门算法应该是文本分类了,笔者最早接触文本分类的模型是采用keras框架搭建的分类,用了TextCNN和LSTM,很轻松的在短文本分类上取得很好的效果,很有成就感。后续完成了很多算法模型,较少关注理论层面去深入理解算法的原… 阅读更多 »神经网络的分类模型

KeyBERT关键词抽取

在关键词抽取算法中详细介绍了TF-IDF算法,从信息论的角度看就是词频越高,包含的信息量越大的词就是越重要的词,根据这个算法可以从预料中计算出词的权重,在推理的过程中只需要分词,查字典即可得到关键词重要程度排序,从而实现关键词抽取… 阅读更多 »KeyBERT关键词抽取