vincent

关注机器学习和算法的码农,喜欢编程和读书

基于DFA的敏感词扫描模块

摘要

DFA是一种通过字典树来存储敏感词的数据结构,通过扫描内容判断依次判断单个字是否内在字典中匹配,进而判断改词是否为敏感词。显而易见的,该算法的时间复杂度是线性的,不会随着敏感词的个数增加,耗时增加。反而当敏感词个数较大(不超过内存),算法的优越性能表现出来。
本文基于DFA的敏感词扫描模块,只支持python3.5及以上。

阅读更多 »基于DFA的敏感词扫描模块

详解装饰器

摘要

装饰器非常重要,不仅使代码看起来更简洁优雅,而且最大限度的复用了代码。本文主要讲解装饰器的3种用法,分别是:
1、闭包装饰器
2、类装饰器
3、Python第三方模块提供的方法
个人更推荐后面两种,可读性较好。这只是一个习惯而已,有人也觉得第一种更加简洁。

阅读更多 »详解装饰器