本周分享第4期

文章记录本周学习所得和一些想法,顺便推荐一些软件和电影。本周关键词: 知识图谱;图数据库;自然语言处理;机器学习;

本周学习

本周从周四上午出差学习,周一凌晨1点多才回到家,培训学习时间非常紧张,系统的学习了知识图谱的知识,再此做一个简单的分享。

知识图谱

这里涉及到一个过程。数据–>信息–>知识–>智慧。整个IT软件的发展实际上是把数据整理成信息提供给用户。比如各类报表数据,实际就是把数据按照各种统计指标,展示出来提供给客户。另外各大新闻网站和门户网站都是把数据整合成信息。

你在搜索引擎可以很容易的找到成龙的老婆的个人信息,但是你很难找到成龙的老婆的兄弟的堂弟是谁?任何搜索引擎或者数据库都不可能存储如此复杂结构的数据。

这就需要把信息进一步抽取出知识,大量的知识通过加工,融合,更新就能产生原来没有存储的知识,这个过程叫做推理。当大量知识具备一定推理能力以后,就有了智慧。我们人类不仅能轻易的分别出猫和狗,还能给出猫和狗的具体特征。简单说具备智慧的特征就是“知其然,并且知其所以然”。很显然目前深度学习仅仅只能做到知其然,离真正意义上的智慧还有很远。

知识图谱涵盖的几个领域

  1. 图论
    图论(英语:Graph theory)是组合数学的一个分支,和其他数学分支,如群论、矩阵论、拓扑学有着密切关系。图是图论的主要研究对象。图是由若干给定的顶点及连接两顶点的边所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系。顶点用于代表事物,连接两顶点的边则用于表示两个事物间具有这种关系1

  2. 图数据库
    图数据是一种非结构化数据(当然也可以转化为结构化数据),图数据库是存储这类数据的数据库。图数据库中你必须了解一些基础的算法。增删查改等操作。


图的添加或者融合。图中每个节点可能是一个实体类或者实体属性。需要歧义消解和实体相融等手段把这个子图放入原始的图谱中。放入图谱中需要考虑原来图谱是否存在这个节点,或者存在这个节点的同义实体或同义属性。


就是从原始图谱中删除错误的知识。如现在有一个企业知识图谱,但是某家企业被注销了。就需要删除与这家企业相关的实体和属性,以及关系。


如搜索算法,包含深度优先和广度优先算法。图的同构,子图匹配算法,子图近似匹配算法。


修改原始图谱中部分内容。比如以前美国总统是奥巴马,现在重新选举了,那么就需要修改为特朗普。新知识在不断变化,知识的修改更新非常重要。

其实整个知识的“增删改查”也是我们人类学习,构建认知的过程。比如我们学习新知识的时候,就会增加知识,当我们发现有些知识是错误的,于是就需要删除,有些认知是有偏差的,于是我们需要修正认知。

  1. 自然语言处理
    知识图谱来源于人类语言抽象出的符号,构建了大量的知识关联关系。对于自然语言处理的依赖是相当多的。比如首先得识别出实体,抽取出实体之间的关系,歧义消解等等处理手段,才有可能构建出知识来。

  2. 机器学习
    自然语言处理的过程中,除了统计自然语言的技术以外,基本上都来自于机器学习或者深度学习的技术。其中包括实体识别(当然实体识别也可以基于统计模型的HMM和CRF)和关系抽取。目前机器学习和深度学习在这方面取得了非常好的效果。

推荐软件

Todo软件

之间推荐过Pendo,是苹果系列的软件。不得不说苹果的办公软件非常丰富。最近发现Windows一款非常好用的TODO软件。Microsoft-todo,支持多个平台,云端同步任务。

本图片来源于微软官网

由于办公的电脑是Windows,工作计划需要写,目前本人也在使用这款todo软件。

欧路词典

上次推荐我使用的有道词典,有道词典在手机端没有任何问题,但在电脑端出现过好几次问题,主界面有时候无法显示,在取词的时候出现系统崩溃的现象。这么一件大企业开发的产品,出这种低级问题,有点不应该。目前只能转到UI丑一点的欧路词典了。

图片来源本人使用截图

Mac平台设计的很美观,Windows界面确实有点丑,勉强能够满足功能就行,词汇主要来源于平时浏览的论文,只能忍受咯。

中文独立播客

播客是苹果设备上默认安装的语音类软件,上面内容非常多,中文内容较少,推荐一些中文独立播客节目,目前本人还没有关注,有兴趣的读者可行自行尝试。

除此之外,用来学习英语也是非常好。非常多的英文节目,纯正的美式发音,各种谈话访谈节目,可以作为学习英语神器。

关注地址

本周关注时事

华为200万毕业生

这件事情比较轰动,尤其在目前大环境不太乐观,爆出大量裁员的背景下,华为对博士毕业生开出了年薪200万的薪资。非常诱惑人,这也证明一句古语“书中自有黄金屋,书中自有颜如玉”,虽然这句话说得很功利,但最起码体现了知识的价值,打脸了那些读书无用论者。

另一方面来说,这也可能导致不良竞争。应届毕业博士是否值200万,华为开出高薪去竞争,那就意味着开不了高薪的企业,招不到非常优秀的人才。最关键的是华为是享受了大量政府资源支持的企业,这种竞争本身就是违背自由市场原则的,这样做真的能给市场带来好处吗?


  1. https://zh.wikipedia.org/wiki/%E5%9B%BE%E8%AE%BA ↩︎
关注机器学习和算法的码农,喜欢编程和读书
文章已创建 66

一个回复在 “本周分享第4期

发表评论

电子邮件地址不会被公开。

相关文章

开始在上面输入您的搜索词,然后按回车进行搜索。按ESC取消。

返回顶部