机器学习优化

摘要

本文主要记录工作中的一点小事情。工作中的模型通常采用传统的机器学习模型,也就是专业人员提取强特征,之后采用决策树,随机森林或者是集成学习算法。同时也介绍了一些调参的经验,适合入门人士参考。
阅读更多 »机器学习优化

田忌赛马的脑洞

摘要

本文分别论述出马顺序透明和不透明情况下,田忌赛马的输赢情况。出马顺序双方不透明的情况下,田忌赢的概率为1/6;如果田忌在已知齐威王出马的顺序情况下,赢的概率可以控制为1;说明在博弈过程中,信息的重要性,同时预示着没有明确的博弈规则,竞争是相当混乱的,甚至是没有底线的。

阅读更多 »田忌赛马的脑洞

标签传递算法

摘要

在机器学习中,已标记的数据是较少的,其价值是非常高的。但在现实情况下,获取未标记的数据常常是非常容易的,因此研究少量已标记大量未标记的半监督学习的算法非常必要。

本文主要整理了半监督学习的标签传递算法(Label Propagation Algorithm),通过将已标记的数据,按照传递矩阵,传递给未标记数据,从而得到了软标记的数据。基于软标记的数据在模型的准确性和泛化能力上都优于仅有少量标记的数据的模型。

阅读更多 »标签传递算法