第333章 高阶人工智能算法,拖后腿的人类
17号特工:“20世纪50年代发生在东北亚某半岛的战争让世界见识了高超步兵战术和指挥才华在战争中的威力。”
29号特工:“不错,建立在极高兵员素质,和拥有高超战术素养的指挥员之上,神州军队以灵活多变的战法,数次进行迂回穿插,分割包围的作战行动,多次击败了不可一世的17国联军。”
17号特工:“可以说,当时神州军队以极高的兵员素质,高超的指挥能力,搭配极高的战术素养和战术执行力,还有顽强的意志品质,弥补了技术装备和后勤支援能力的巨大差距,让一场看起来实力完全不对等的战争变成焦灼的持久作战。”
29号特工:“也是自那时起,那些复杂灵活的步兵战术开始被各国重视起来,之后随着特种作战崛起,大量作战行动由少儿精的特种部队完成,步兵战术变得愈加精细。”
17号特工:“一点没错,现在主要的军事大国都组建有数目不等的特种兵部队,其成员普遍要经历六年以上的残酷训练才能通过考核加入作战,战斗素养可见一斑,再加上行动时的规模更小,往往会使用极其精密的战术配合来执行任务。”
29号特工:“但是人与人的配合总是会有缝隙,人类士兵会受到体能,精力,精神状态,伤病等意外因素的影响,战役指挥员也不可能时时清醒,做到对所有细节完美把控,更不可能对所有战术决策做到准确无误。”
17号特工:“这是自然,只要是人,纵使训练程度再高,作战经验再丰富,也不可能完全不犯错误。”
29号特工:“但是在理论上,有一种家伙是可以做到完全不犯错的。”
17号特工:“高阶人工智能算法。”
29号特工:“没错,早在公元2018年,人工智能阿尔帕狗就在围棋对局中击败了人类所有的九段棋手,在号称人类智力巅峰的游戏中成为了新的独孤求败。”
17号特工:“如果没有战争,我或许会成为一名算法工程师,或者编写算法的高级程序员,因为入伍之前我就在学习应用数学和计算机学,对这方面我可谓是相当了解。”
29号特工:“我相信1号和其他的几个高层也是出于这样的考虑,才对你做这样的人体改造,让你成为指挥机器人军团作战的那个改造人。”
17号特工:“是这样,我和那些铁儿子们也需要磨合,如果我能在实战中寻找出高阶人工智能算法中可以继续提升效能的部分,就可以进一步优化算法,提升战力,日后甚至可以基于此组建规模更庞大,分工更明确,能执行更极端任务的高级智能战术机器人军团。”
29号特工:“这也算是一种,合理的穷兵黩武。”
17号特工:“就像阿尔帕狗在击败所有人类棋手后,开发者团队又采用多种方法对其进行了升级,首先是继续深化学习,不再模仿人类顶尖棋手,而是完全和自己对局的升级版人工智能阿尔帕狗max,最终它在和阿尔帕狗的绝对中取得了200比10的胜负比。”
29号特工:“这个,好像并不为人所熟知。”
17号特工:“没错,普罗大众关注的往往都是那些震惊世界的消息,阿尔帕狗击败所有九段棋手就是震惊的大消息,但之后它再升级的新闻热度就不如明星八卦了。”
29号特工:“嗯嗯,人嘛,并不真的关心世界和平,更多是好奇心理。”
17号特工又讲道:“彼时开发公司其实又进行了一次人工智能与人类棋手的对局,结果是新的阿尔帕狗max在让两子的前提下,依然能击败所有九段棋手,这意味着,人类已经被甩开了一大截。”
29号特工:“但我猜,有过第一次失败,舆论对这种事情已经不太敏感了,所以这一系列对局不出意外的没引发太多关注。”
17号特工点点头:“你猜的完全正确,但开发者团队依旧不满足,在阿尔帕狗max的基础上,他们又开始进行一项更大胆的工程,也是这项工程,奠定了高阶人工智能算法的理论雏形。”
29号特工问:“是什么?”
17号特工:“开发者将新阶段的人工智能算法命名为阿尔帕狗zero,这个名字是取从零开始之意。”
29号特工:“从零开始,他们要做什么?”
17号特工解释道:“前面的阿尔帕狗都是从阅读人类棋谱开始学习围棋的,同时在学习过程中会参考顶级人类棋手的对局,监控这个学习过程,有几位人工智能专家发现,人类棋手的一些坏的行为习惯,思维定势,在一定程度上制约了人工智能的学习能力。”
29号特工:“开始接触到人类固有的局限了吗?”
17号特工:“不错,基于这个发现,他们开启了阿尔帕狗zero项目,让新的人工智能彻底抛弃所有人类棋手的经验,完全从零开始,不阅读任何一页人类棋谱,也不参考任何一局人类棋手对局,就只学习围棋基本规则,然后自己和自己对局。”
29号特工:“那结果呢?”
17号特工:“经过8000多万局自己和自己的对局,阿尔帕狗zero练成出山,在和上一代阿尔帕狗max的对局中,取得了89胜0负的可怕战绩。”
29号特工无比震惊的说:“这完全就是毫无机会啊,难道说人类经验真的在制约人工智能迫近自己的极限实力吗?人类,真的是个拖后腿的油瓶子吗?”
17号特工:“很不幸,从结果来看,是这样的,按照彼时的测算,初代阿尔帕狗的实力约为3000,但阿尔帕狗zero的实力已经超过5000,这个差距简直是无法逾越的。”
29号特工突然意识到了些什么,问道:“你刚才已经提过一次实力3000和5000,莫非?”
17号特工:“你判断很准,从战术指挥能力来看,苏牙营算法与我第八局算法之间的差距,大概也是这么大。”
29号特工:“那这是不是意味着由第八局的算法指挥一支高级智能战术机器人军队,对战苏牙营算法指挥的另一支军团,也能获得89胜0负的战绩。”
17号特工摇摇头苦笑着说:“理论上,在封闭作战环境内,双方兵员硬实力完全一致的情况下,是这样,但现实里的战争比之棋盘上的对局,复杂程度称指数级增长,所以不能做这样的推算。”
29号特工:“你是想说,因为变量更多吗?”
17号特工稍稍思考后说:“也不全是,这么形容吧,棋盘之上是绝对公平的对决,一人一手,交替出招,而且抛开棋手,每一个棋子的绝对作用都完全相同。”
“哦。”29号特工似乎明白了些什么,紧跟着说,“你这么说我有些明白了,围棋是公平的艺术,但战争靠耍赖的技术,战术上比不过,我可以追加兵力火力,战局之内打不赢,我可以从外交,政治,后勤上操弄手段,至于更高阶的玩儿法,甚至可以像教员那样,利用指挥官之间的嫌隙,从棋手的心理做文章。”
17号特工:“还有一点,围棋的棋盘是有限的,但战场这个棋盘是可以扩大缩小的,正是因为诸多变量,导致变数无限增加,所以指挥一场一切未知且瞬息万变的战争,绝对要比围棋复杂得多,而旧时代的人工智能,不管计算能力再强,也都建立在天量的自我训练之上。”
29号特工:“嗯,你说的对,就那个阿尔帕狗zero,8000多万局对局才出山,也就是有量子计算机在后面支撑,人类棋手可是一辈子也对不了几万局,按照指数增长,让人工智能学会指挥作战,可能得几千万亿场模拟战争,只从计算机电量的消耗来看,把全世界能源烧光也不一定够。”
17号特工:“实际上,需要的作战次数可能更多,但就像我刚才说的,从完全脱离人类经验的阿尔帕狗zero开始,算法工程师和数学家们意识到,不借助任何人类经验,或许是破解高阶人工智能算法的奥秘之一。”
29号特工:“看来这才是那个阿尔帕狗zero的最大收获吧。”
17号特工:“人工智能算法从20世纪60年代问世,在之后的100年没有过实质性进步,以至于很多人认为那是又一个不可测定律左右的领域,是阿尔帕狗zero为数学家们提供了新思路,在那之前,他们想的都是怎么优化学习效率,细化应对不同情况的反馈机制,结果导致人工干预的痕迹越来越重。”
29号特工:“他们意识到,有先天缺陷的人类应该走开,算法应该愈加简单,脱离人工痕迹,才是真正可行的方向。”
17号特工:“其实他们也不敢确定这样到底对不对,但在人工智能算法100年没获得突破性升级的前提下,还是有无数机构愿意豪赌,他们投入海量资金和人力,进行这个方向的研究。”
29号特工:“结果就有了现在的,高阶人工智能算法?”
17号特工点点头:“从结果论,你说的没错,但这轻描淡写的一句,无法概括研究期间的艰辛。”
29号特工:“这我自然明白。”
17号特工:“总之,经过数万名学者近30年的研究,终于开发出,单次学习效率高于人类,信息处理能力和最终决策能力都远胜人类,且绝不犯错的高阶人工智能算法,这项技术首先被应用于军事,首先是各种战时辅助决策,但由人工智能挑大梁的领域,高级智能战术机器人军团是第一样成果,第八局主导的航天母舰项目,算是第二项大规模应用。”
29号特工:“只这样的技术,似乎不会一直用于打仗吧?”
说到此处17号特工擦了一把额头躺下的汗珠,并严肃的说道:“接下来的内容同,就是我说的,真正的大场面。”