蓝翔图书

字:
关灯 护眼
蓝翔图书 > 1976步步生莲 > 第1997章 硬件条件受限的情况下,“蒸馏”的重要性

第1997章 硬件条件受限的情况下,“蒸馏”的重要性(2/2)

然后通过两种方式进行强化。

    其一是,将历史比赛数据转化为知识,投喂给它。让它基于“规则”和“知识”,通过 mctS算法和神经网络组合自我训练。

    其二是不断给他找对手,它的深度卷积网络会在对局中基于胜率,自动捕捉高阶模式。

    听着很美好,但也导致参数空间扩张和外部数据资产的不断积累。

    简单的说,数据量越来越大。

    而计算机的算力、总线、内存、外部存储器和磁盘阵列控制器的吞吐、读写速度都是有限的。数据量越来越大,就意味着调用、比对、决策的时间越来越慢。

    而国际象棋的时间规则又那么严苛,这几乎是无解的矛盾……

    谁也没想到,这个问题在曲卓上次来时,所有人都没留意的情况下,就被初步解决了。

    虽然他只待了大半天,其中很大一部分时间还用在了开会和闲聊上。

    闲聊过程中,得知参数量越来越大,不但占用了大量宝贵的硬盘空间,甚至为了保证读取速度,不得不将数据分配到不同磁盘阵列里。

    确定了问题后,曲卓只用了两个小时左右,就编辑了一个知识库蒸馏程序。随后用蒸馏程序对现有数据进行清洗、去重,还修改了标注规则。

    “蒸馏”的过程非常慢,分布在四个磁盘阵列下,已经累积到接近3G的专项知识库,用了二十多个小时才完成。

    等蒸馏结束后,实验室的人惊讶的发现,新的智能体数据包,居然只有两百三十多兆,参数量从亿级骤降到了百万级。

    没有人知道如此夸张的脱水比,在提升知识密度的同时,会损失多少有效知识。但毫无疑问,运算速度重新回到了丝滑流畅的水平。

    呃~~

    只能说,不同的时代,对“丝滑流畅”这一评价的阈值,是不同的。

    然后,就是不断的惊喜。

    大概从去年年底诺贝尔颁奖前后开始,参数进行过深度优化的“悟空”,进入了连胜状态。

    消息传开后,之前那些体验后便失去了兴致的国际象棋高手们,有人起了再次体验的兴趣。

    今年一月中,“悟空”在所有人都毫无准备的情况下,突兀的赢了一位继去年夏天后,第二次至牛津体验与“悟空”对弈的国际象棋大师大卫?古德曼。

    大卫?古德曼国际棋联认证,Elo 2380-2400,世界排名290至300的Im级职业选手。

    “悟空”连赢了他三盘,一盘比一盘轻松。

    越来越轻松,不是“悟空”短时间内“棋力暴涨”,是大卫?古德曼在输掉第一盘后,被旁观者的惊讶和惊呼影响了心态,后面两盘水准连续下滑。

    虽然“悟空”只是赢了个国际排位三百名左右的大师,但三百名也是大师呀。

    很快,“woKong”战胜国际象棋Im级选手david Goodman这一消息,被戴英Eleics weekly(一份电子专业报)的81年一月上半月刊报道了出来,并很快在小圈子里引发了热议。

    (国际特级大师 Gm、国际大师 Im、棋联大师 cm)

    后面的一个多月,陆续有十余位得到消息的大师级选手,慕名前往剑桥和牛津……“悟空”的战绩是57胜,31负。

    在戴英各路媒体的重点关注和推波助澜下,消息瞬间“吹”遍了欧洲各国,甚至北美的媒体也跟着开始报道。

    尤其是计算机和电子类报纸、杂志,几乎全都做了报道,差异只在于篇幅、激动、乐观与质疑。

    四月初,“悟空”迎来了一位重量级对手,81年一月FIdE官方最新排名全球第五,毛子裔高卢Gm级国际特级大师斯帕斯基。

    结局是两胜一和两负。

    “悟空”首局输了,但斯帕斯基赢的并不轻松,第二局斯帕斯基依旧赢了,同样不轻松。第三局和棋,四、五局悟空连胜。

    很明显,只要一直下下去,“悟空”的连胜数几乎一定会不断累加下去。

    因为,只要不断电、不卡机,网络不出故障,“悟空”就能一直保稳定的状态。

    但43岁的斯帕斯基不行。半天完成五局,已经是他体力和脑力的极限了,继续下去状态只会不断下滑。

    “战平世界排名第五”这一消息惊爆后,“悟空”真的出名了。

    “woKong”这个单词刚与人工智能领域出现时,在戴英媒体的吹捧下,靠着q-learning、Gbdt等一系列新算法和卷积神经网络等全新的概念,成为了一时间热议的话题。

    但也只是一时热议……

    cht 2026
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈