宿舍小讲堂:深度强化学习

  • 申俊志 (计算机与控制学院)
  • 创建于 2017-04-25
  • 543

AlphaGo大战李世石

Breakout游戏

Flappy Bird游戏

主讲人—蔡健

深度强化学习在股票交易中的应用

机器玩游戏可以比人更优秀吗?AlphaGo为什么可以战胜李世石?这正是本次1-553宿舍小讲堂探讨的内容,如何训练机器玩游戏玩的比人更好——深度强化学习。

48晚上7点,1-553宿舍小讲堂正式开讲。本次小讲堂围绕的话题是现在最火的人工智能,作为本世纪人工智能的代表——AlphaGo一直是人们关注的热点。作为计算机与控制学院的一员,你一定也很想知道这些人工智能的背后究竟使用的是什么技术,本次的宿舍小讲堂就是要深入浅出,揭开这些人工智能背后的技术。

小讲堂一开始就介绍了AlphaGo的开发团队DeepMind,他们使用深度强化学习的方法,使机器在许多游戏方面表现出比人类更优秀的能力。比如经典游戏Breakout,还有前两年流行一时的Flappy Bird

本次主讲人蔡健从算法的角度分析了深度强化学习,详细讲解了Deep Q-learning算法,并使用本地机器演示了通过深度强化学习训练过的模型操作Flappy Bird,达到了人类所不能达到的水平,参与宿舍小讲堂的同学也亲自尝试了玩此游戏,效果确实不如训练过的模型,尽管同学们玩游戏的热情非常高涨。

除了适用于种类广泛的游戏,蔡健还向同学们讲述了深度强化学习在股票交易方面的应用。本次宿舍小讲堂同学们讨论热烈,学习热情非常高涨,这与本次的主题密不可分。人工智能已悄然深入我们的生活中,在将来的生活中也必将发挥越来越重要的作用,这也是同学们学习和创业最热门的方向。通过本次宿舍小讲堂,同学们更加深入的理解了当下人工智能的发展动态,为同学们以后学习和科研提供了一个很好的方向。

责任编辑:蔡宁宁