我的书包

第181章 AlphaGo/AlphaZero

+A -A

    但实际上是科研人员在试图让机器像人那样去思维。

    但具体施为起来依旧很麻烦。

    林灰前世并没有搞过类似的东西。

    阿法狗AlphaGo之后有master,master之后有Alpha_Zero。

    基本上十个搞人工智能的九个都专门钻研过阿法狗AlphaGo是怎么一回事。

    涉及到技术方面的内容很清晰。

    虽然像阿法狗AlphaGo这类程序不依靠分布式计算也有着不错的效能。

    前者是用来评估比较合适的落点的,走棋网络是用来调整最佳落子位置的。

    前世,在初代阿法狗AlphaGo里面,谷/歌除了应用了人工智能方面的成果之外。

    在计算机科学中,分布式计算,又译为分散式运算。

   

    至于具体的搬运还要搞清楚技术路线。

    林灰没必要非盯着阿法狗AlphaGo不放。

    分布式系统是一组电脑,透过网络相互连接传递消息与通信后并协调它们的行为而形成的系统。

    技术层面除了人工智能这方面的东西。

    虽然这个时空的人们还没搞定相应的技术。

    在这个时空人工智能方面的研究整体滞后的情况下。

    这个时空名为deepmind的公司确实存在。

    但分布式计算相比于传统的效率往往更高。

    阿法狗AlphaGo在运行的逻辑本质上很接近人类棋手的思考方式。

    换言之,林灰要想重新引爆人工智能这个爆点。

    涉及到分布式神马的有点难办。

    无非就是蒙特卡洛树搜索与两个深度神经网络相结合的一个简单应用。

    倒不是技术理论方面有什么麻烦。

    还应用了一些分布式系统方面的研究成果。

    虽然没什么风险,但涉及到阿法狗AlphaGo的搬运却稍稍有点麻烦。

    诚然如此的话,倒不是没机会将涉及到分布式技术的一些东西忽悠过来。

    为什么要采用这种设计呢?

    涉及到阿法狗AlphaGo的技术:

    再之后推演局势找出最佳落点。

    而且deepmind这家公司并不是很好过。

    除此之外,阿法狗AlphaGo还涉及到比较麻烦的训练。

    至于推演的目的则是是为了找出对自己最有利的落点。

    很多理论性的东西还需要从无到有的建设。

    前不久该公司还试图申请破产保护。

    但对林灰来说技术理论道路什么的却很清晰。

    蒙特卡洛树搜索是一种用于某些决策过程的启发式搜索算法,最引人注目的是在游戏中的使用。

    具体的两个深度神经网络,其中一个是估值网络,另一个则是走棋网络。

    走一步看十几步甚至几十步,才能成为围棋高手。

    首先就是涉及到很多技术底层的东西。

    但进展什么的寥寥无几。

    但因为这个时空在人工智能上研究的整体性滞后。

    还需要一些其它技术层面的东西。

    很大程度上是受人类下棋的启发。

    在棋类游戏中尤为常见。

    像阿法狗AlphaGo这样的经典人工智能应用。

    前世又不是只有阿法狗AlphaGo。

解过。

    一般来说,优秀的棋手都应该具备这种的推演能力。

    总结一下,优秀棋手要具有一下能力:

    这样的公司想获得前世的成就基本不大可能。

    不过林灰前不久看到谷/歌方面和普林斯顿大学数学系在合作摘要式算法的学报中似乎提到过跟分布式有关的东西。

    人类下棋的时候,首先棋手会通过过去的经验、棋谱先大致判断出下哪里不吃亏。

    大概率要异时空搬砖,各种搬运人工智能方面的理论知识。

    如果只是为了不麻烦的话。

    人工智能虽然看起来是机器方面的学问。

    虽然这个工作稍稍有点麻烦,但好在林灰现在多少也是有一个学术工具人的。

    缩小搜索范围之后,棋手会对某一局部位置进行详细的推演。

    deepmind这家公司虽然也从事人工智能方面的研究。

    首先通过局势判断大概可行走法;

    林灰要搬运阿法狗AlphaGo的话基本不用担心有什么技术撞车风险的。

    然后判断局势是否对自己有利;

    至于推演时候, 棋手主要思考的是自己如何落子、落子之后对手又会如何反应。

    总之,涉及到阿法狗AlphaGo的技术实现什么的其实不是很复杂。

    这个时空因为在人工智能方面的东西短腿。


【1】【2】【3】【4】
如果您喜欢【我的书包】,请分享给身边的朋友
">