(2)
第二个例子是谷歌训练机械手抓取。
传统方法肯定是看到那里有个机械手,就写好函数,move到xyz标注的空间点,利用程序实现一次抓取。
而谷歌现在用机器人训练一个深度神经网络,帮助机器人根据摄像头输入和电机命令,预测抓取的结果。简单说,就是训练机器人的手眼协调。机器人会观测自己的机械臂,实时纠正抓取运动。
所有行为都从学习中自然浮现,而不是依靠传统的系统程序。
为了加快学习进程,谷歌用了14个机械手同时工作,在将近3000小时的训练,相当于80万次抓取尝试后,开始看到智能反应行为的出现。据公开资料,没有训练的机械手,前30次抓取失败率为34%,而训练后,失败率降低到18%。
这就是一个自我学习的过程。
(3)
有人问了,深度学习,能学习写文章吗?
来看这个例子。斯坦福大学的计算机博士andrej kapathy曾用托尔斯泰的小说《战争与和平》来训练神经网络。每训练100个回合,就叫它写文章。100个回合后,机器知道要空格,但仍然有乱码。500个回合后,能正确拼写一些短单词。1200个回合后,有标点符号和长单词。2000个回合后,已经可以正确拼写更复杂的语句。
整个演化过程是个什么情况呢?
以前我们写文章,只要告诉主谓宾。而以上过程,完全没人告诉机器语法规则。甚至,连标点和字母区别都不用告诉它。不告诉机器任何程序。只是不停将原始数据进行训练,一层一层训练,最后输出结果——就是一个个看得懂的语句。
一切看起来都很有趣。人工智能与深度学习的美妙之处,也正在于此。
(4)
我还去硅谷看过一家公司——完全颠覆以往的算法,利用深度学习实现图像深度信息的采集。
众所周知,市面上已经有无人机,可实现人的跟踪。它的方法是什么呢?一个人,在图像系统里,一堆色块的组合。通过人工的方式进行特征选择,比如颜色特征,梯度特征。拿简单的颜色特征举例:比如你穿着绿色衣服,突然走进草丛,就可能跟丢。或,他脱了件衣服,几个人很相近,也容易跟丢。
此时,若想在这个基础上继续优化,将颜色特征进行某些调整,是非常困难的。而且调整后,还会存在对过去某些状况不适用的问题。
总之,这样的算法需要不停迭代,迭代又会影响前面的效果。
而硅谷这个团队,利用深度学习,把所有人脑袋做出来,只区分好前景和背景。区分之后,背景全部用数学方式随意填充,再不断生产大量背景数据,进行自学习。只要把前景学习出来就行。
据我所知,很多传统方法,还在采用双目视觉。用计算机去做局部匹配,再根据双目测出的两个匹配的差距,去推算空间另一个点和它的三角位置,从而判断离你多远。
可想而知,深度学习的出现,使得很多公司辛苦积累的软件算法直接作废了。
“算法为核心竞争力”,正在转变为,“数据为核心竞争力”。
技术人员必须进入新的起跑线。
(5)
最后再举个例子。
大家都做过胃镜。尤其胃痛,很痛苦。肠胃镜要分开做,而且小肠看不见。
有一家公司出了一种胶囊摄像头。吃进去后,在你的消化道,每5秒拍一幅图,连续摄像,此后再排出胶囊。所有关于肠道胃部的问题,全部完整记录。但医生光把那个图看完,就需要五个小时。原本的机器主动检测漏检率高,要医生复查。
后来,他们采用深度学习。采集8000多例图片数据灌进去,用机器不断学,不仅提高诊断精确率,减少了医生的漏诊,以及对稀缺好医生的经验依赖。只需要靠机器自己去学习规则。
深度学习算法,可以帮助医生作出决策。