本周分享第6期

文章记录本周学习所得和一些想法,顺便推荐一些软件和电影。本周关键词:图数据库;抵制诱惑;寄生虫资源;

学习方向

本周学习知识图谱以及图数据库。

图数据库

图数据库本质上是数据库,是用来存储图结构数据的。近几年来社交平台的发展,对传统数据库提出的更多的要求。比如查询的速度和难度。最早存储社交网络数据肯定是关系型数据库,通过用户id去关联好友,以及用户的状态,于是整个业务的数据表就是非常多,对于条件筛选好友的好友的好友(三度关系),基本上就做不到。

图数据库的出现就极大的简化了这个过程。在图数据库中只关注节点和节点关系,最终构建出一张极大的关系网络。连两个人的朋友圈是否重叠,以及重叠的几个节点都能容易的找到。

基于社交图数据的挖掘有很多方向可以做,社交能力的评分,性格以及职业的预测,根据用户的内容以及习惯预测用户的健康状况,根据不同的需求挖掘潜在客户。是不是很有意思。

图数据库分类

图数据库的分类方式有很多种,根据维护的方式分:商业数据库和开源数据库。根据查询语言的标准分:Cypher、Gremlin和SPARQL。根据使用场景分:轻量级和重量级。

Neo4j

Neo4j是Java开发的图数据库,名气非常大,目前相对比较成熟。查询语言为Cypher。UI界面相对比较好看了,有web版和桌面版,支持Linux和Windows平台。目前已经使用neo4j构建了一个小型的知识图谱了,使用体验挺不错的。

gStore

gStore是由北京大学主导开发的图数据库引擎,查询语言为Sparql,开发语言是C++。目前只支持centos和Ubuntu。查询的endpoint非常简陋。目前开源的只有单机版,分布式版本只能合作,目前刚刚推出不久,本周搭建好了,还处于试用阶段。不过有团队维护,发展的潜力应该很大。

TinkerPop

TinkerPop是Apache下维护的开源图数据库。

Apache TinkerPop™ is a graph computing framework for both graph databases (OLTP) and graph analytic systems (OLAP).

官网给出的定位是图数据库框架和图分析系统,查询语言是Gremlin。目前还未使用过,打算下周尝个鲜。

如何抵抗游戏诱惑

王者荣耀是一款很不错的游戏,下班以后也经常玩。玩输了以后就一定要赢回来才会罢手,往往就陷进去了,基本上赢一局输一局。匹配算法的核心思想就是,尽可能玩更多局才能上分。

玩完以后直接卸载掉,下次想要玩的时候再安装。很多时候只是稍稍想玩,想着还要安装那么大的包,于是就放弃了。通过这种人为设置难度的办法,可以有效的减少玩游戏的频率。

很多时候我们的自制力差,主要是太方便了,比如购物APP随手就能打开,下单以后可能当天就到货,就算是剁手也晚了。推荐通过提高获取难度来抵制诱惑。比如卸载APP,只在浏览器中打开,并且浏览器连用户名密码也不保存,哈哈哈。

你真的需要那么多信息吗

每天微信以及各大新闻APP会产生海量的内容和资讯,每个人基本上关注几十上百个公众号,大量的推送通知,都在试图抢占用户的时间。你真的需要那么多信息和新闻吗?其实你在享受供奉的感觉,犹如大臣给皇帝呈上奏章,而你在享受尽知天下事的优越感,时不时还批注一番。

没有深思熟虑生产的内容,其质量必然不高,很多时候反而会干扰你的判断力,过量的信息也会增加你的焦虑。

推荐电影

韩国电影《寄生虫》终于有资源了,这类好电影我非常愿意去电影看。

迅雷下载资源

关注机器学习和算法的码农,喜欢编程和读书
文章已创建 66

发表评论

电子邮件地址不会被公开。

相关文章

开始在上面输入您的搜索词,然后按回车进行搜索。按ESC取消。

返回顶部