详情请进入 湖南阳光电子学校 已关注:人 咨询电话:0731-85579057 微信号:yp941688, yp94168
人工智能技术进步的速度越来越快,每种细分技术所创造的价值正日益得到展现。
2013年,DeepMind发明了DQN算法,成功将深度学习和强化学习结合起来,开启了深度强化学习的新纪元。此后数年,强化学习的成果日新月异,很多非常困难的问题都被深度强化学习算法解决。
2016年,谷歌阿尔法围棋以4:1战胜围棋世界冠军、职业九段棋手李世石,不仅让深度学习为人们所知,而且掀起了人工智能的“大众热”,大家由此更加关注强化学习这一技术要点。
使用强化学习的一个很好的例子是让机器人学习如何走路。机器人首先向前迈出一大步然后跌倒。这一大步和摔倒是强化学习系统关注的响应点。由于反馈是负面的,所以继续调整,系统会根据多个负反馈的比对 终确定机器人应该把步子迈的小一点,不停地小,直到机器人走路不会摔倒为止。
通过强化学习,Boston Dynamics公司的机器人已经掌握了托举、后空翻、跳上窗台的要点。而迪斯尼幻想工程已经把这一点带到了一个新的层面,那就是让人形机器人来执行玩命的特技。
有业内人士指出,强化学习和其他的人工智能技术有一个很大的差异,那就是它的学习范式和其它技术不太一样。它不需要我们去收集数据,也不需要我们去做任何标记,而是我们把称之为智能体(Agent),放在一个环境里,就像动物或者我们自己生存的一个环境里,它会和环境自己打交道,自己学会在环境里如何完成一个任务,解决一个问题。
强化学习主要由智能体(Agent)、环境(Environment)、状态(State)和动作(Action)、奖励(Reward)组成。智能体将在环境的当前状态下,根据奖励信号做出动作,从而达到环境中的不同状态并得到奖励。
除了强化学习外,机器学习也备受关注。机器学习是AI的一个子集,是通过不同场景中的经验来训练系统的能力。随着车辆变得越来越自动化,开发人员可以使用机器学习训练系统来识别对象,并用更少的数据更好地解释其环境。
再来看一下深度学习。深度学习就是从有限样例中通过算法总结出一般性的规律,并可以应用到新的未知数据上。例如,我们可以从一些历史病例的集合中总结出症状和疾病之间的规律。这样,当有新的病人到来时,我们可以利用总结出来的规律来判断这个病人得了什么疾病。
那么,强化学习、机器学习、深度学习三者的区别是什么?简单说,人工智能范围 大,涵盖机器学习、深度学习和强化学习。如果把人工智能比喻成孩子大脑,那么机器学习是让孩子去掌握认知能力的过程,而深度学习是这种过程中很有效率的一种教学体系。
由强化学习、机器学习等技术构成的人工智能,其良好的发展前景引人期待。从全国来看,据艾瑞咨询测算,2022年国内人工智能核心产业规模有望达到1573亿元,复合增速达58%,产业将持续快速增长。如此广阔的市场空间,吸引着社会各界投资者的关注。
值得一提的是,发展“以人为本”的人工智能是全社会的课题,需要政府、商界、学界及所有利益相关方共担责任,协力推动。作为技术应用与推广的主体,企业负有不可推卸的社会责任。在研究强化学习相关技术时,企业要自觉遵守法规制度和社会公约,以此促进其有序、可持续应用。
未来,全球的可持续发展越来越依赖于数据创造的价值,而人工智能是数字经济中应用十分广泛的技术之一。或许再过几年,AI将在精准农业、智能家居、远程医疗、自动驾驶等领域发挥更加重要的作用。
责任编辑:tzh