既然已经知道了几乎所有影响功法的参数,以及有效的收益目标,那么张凡就可以尝试使用强化学习的方式,让机器不断的自我训练,得出一个相对优秀的功法了。
而且这种训练将会24小时永不停歇,只要拥有足够的时间以及运算能力,张凡将会得到不断更新迭代的武道功法!
“训练模型的搭建需要费点功夫,等到今晚在开始做。”
“现在的话,还是先强化一下自身吧!”
尽管训练模型最终的收益让张凡心动不已,但是无论是模型搭建还是训练过程都是极耗时间的工作。
相比起来,直接强化自己身体的方式是更为快捷、简便的操作形式。
就是非常费钱而已,但是对于从体验过超人般武力体验的张凡来说,只要能够满足自己的超人梦想。
这钱就花的值!
张凡根据功法模拟的身体强度,直接调节到19级的身体素质,对着系统喊道。
“系统,点化我自身!”
“叮!您的余额不足,点化失败”
张凡:……
张凡偷偷瞥了眼自己的余额,然后不由的破口大骂起来。
***,2万多两银子都不够?!
好吧好吧,是我自己没逼数了。
两万对于西宁城的富豪来说都不算事什么巨款,想靠着2w两就打造出一个19级的高手,是自己想多了。
张凡降低了目标等级,调到了15级,再次尝试了一下。
“叮!您的余额不足,点化失败”
…
10级!
“叮!您的余额不足,点化失败”
8级!
“叮!您的余额不足,点化失败”
7级
“叮!点化开始,扣除金额23,578两银子,预计点化时间10s”
点化开始的悦耳提示声响起,张凡紧紧皱起的眉头总算是舒展了开来。
而当他听到后面的金额数字之后,整个人身体都猛的一顿,看着余额里仅存的300多两银子,再次掩面痛哭了起来。
俺滴小钱钱啊!!!
这一章还是设定为主
强化学习方面的话,不知道有多少人感兴趣听我啰嗦,所以就一笔跳过了。
简单来说,他在相对有限的操作行为等等一些条件之下,可以进行自我训练、自我对弈,不断向着设定的最终目标进化的体系。
不同于深度学习,他不需要庞大的数据,也可以完成数据训练,很多游戏的AI都是通过强化学习而得出的
比如围棋的AI,其战绩不用我多说
王者的觉悟,前4关不算什么,但是5、6关的难度,想必玩过的读者们应该有所体会
剑灵2018世锦赛中亮相的AI,三种不同形态的AI,将世界冠军按在地上摩擦
嗯,以上就是强化学习的简单介绍以及其成果
喜欢我在异界开游戏请大家收藏:(m.zhuiyo.com)我在异界开游戏追哟文学更新速度全网最快。