机器学习/人工智能强化学习Reinforcement Learning
01
我们为什么要研究强化学习?
当我们讨论人工智能的时候
2016年,AlphaGo通过学习历史棋谱,以4:1的成绩大战围棋冠军李世石。
2017年,AlphaGo Zero无师自通,仅通过自我博弈学习,以100:0的不败战绩绝杀“前辈”
AlphaGo。
著名的围棋人机大战,重新掀起一波人工智能热。
Alphago 原理=深度+强化(自我对弈学习+蒙特卡罗树搜索)
学python需要什么通过学习神经网络来完成高维数据的低维表示,解决的是感知的问题应用:图像识别,语音识别,推荐系统,自然语言处理感知vs决策
深度学习机器认知强化学习机器感知•真正的智能生活,需要机器认知,即机器真正理解人。•人工智能的目标是赋予机器像人一样思考并反应的智慧。•而强化学习是解决机器认知的一个重要技术。
•掌握了强化学习的基本方法和基本原理便掌握了创造未来的基本工具。解决“做什么”—如何将情境映射到行动,从而最大化数字奖励信号的方法。应用:路径规划,直升机飞行控制,博弈游戏