机器学习Machine Learning

  1. 我所了解到的机器学习
  2. 用机器学习做什么
  3. 机器学习的算法实现

机器学习是一门多领域交叉学科。专门研究计算机或其它软硬件设备怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。应用机器学习技术到产品中,给用户带来“机器具备人类般高智能”的震撼性体验。

机器学习比较活跃的领域:

我所了解到的机器学习

很多人喜欢亚马逊的图书推荐系统,它总能很准确的将你可能感兴趣的书籍推送到你的面前。

一个完整的推荐系统由四部分组成:收集用户行为信息的记录模块、分析处理用户偏好的模型分析模块、推荐算法模块(核心)和反馈处理模块。推荐系统的目标就是把合适的商品推荐给合适的人,目前常见的推荐机制算法包括基于关联规则的算法(Association Rule_based Recommendation)、基于内容的协同算法(Content-based Recommendation)、协同过滤推荐算法(Collaborative Filtering Recommendation)。

推荐系统的使用的数据主要都是日志/消费类的数据,通过一定的数据预处理,最终使用算法的数据是一个二维表或者是一个MXN的矩阵列是所有的商品类目,行是就是所有用户,对于你选择的时间范围内,如果浏览过某个或者购买过某商品,则标记为1(当然根据实际需要,可以根据次数标记为N),当然也可以是对商品的评分。


协同过滤的推荐机制又分为基于物品的推荐机制和基于用户的推荐机制。基于用户的推荐:假设相同的用户一定有相同的偏好,怎么确定其是同类用户类,你可以根据这二个用户的购买的商品类型或者对不同商品的打分来计算。

基于物品的推荐:假设喜欢某个商品的用户,一定也同样喜欢同样类型的商品,怎么选择这个同类型的商品,通过不同用户对其的打分或者评价或者购买来计算。

关于利用余弦相似性判断两个商品的相似程度请参考:
http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html

百度自2012年开始在深度学习(Deeping Learning 又叫无监督特征学习 Unsupervised Feature Learning)上获得了“巨大成功”,并在11月投入到了产品应用当中。主要受益的有语音识别(Speech Recognition)和图像识别(Image Recognition),与此同时还对百度的排名、文本检索、自然语言处理。

余凯介绍的百度深度学习:
http://pan.baidu.com/share/link?shareid=136269&uk=2267174042

斯坦福大学机器学习的公开课已经在网上流传了很多年,直到14年5月份这门课的主讲教授吴恩达加盟百度参与百度大脑项目的时候,机器学习又在网上掀起一股热潮……

浙江大学CCNT实验室的在2012年就向外界展示了他们的FlyingBuddy2系统——用大脑控制四旋翼无人飞行器飞行。

浙大的研究人员声称,在佩戴EEG(脑电图) 头盔之后,可通过思考“left hard”起飞或着陆无人机,“left”顺时针旋转,“right”前飞,“push”向上飞。其控制过程是:EEG头盔通过蓝牙向笔记本发送命令,笔记本再通过 Wi-Fi连接转发给无人机,而无人机同时可通过摄像头拍摄视频或照片,通过Wi-Fi发送回笔记本。

用机器学习做什么

可以用机器学习做的事情很多,举个例子,就拿信息的记录交流来说吧,有的时候你可能觉得打字都懒,那就让你通过记录或者发送语音信息吧,但人只会更懒,我想写本书,写字的速度甚至赶不上我飞快的思绪,那如果有东西能把我在脑中的整理好的或者未整理好的信息,直接输出为文字,甚至语音,而且还可以通过学习,响应到你的上下文,我觉得这会是我真正想做的机器学习。

当机器学习真的正在发生前所为有的变革之势,我们所有的之前所想终将变成现实。

机器学习的算法实现

主要有以下几类:

script>