科研系学霸

第34章 数据融合异常

天才一秒记住本站地址:[笔趣阁]
https://m.ibqg.vip最快更新!无广告!

第34章数据融合异常(第1/2页)

几个在实验室的师兄都点开链接,打算观摩一下周昀的独门秘籍。

就连刚刚趴下的邱彦都重新坐直了身子。

几人了看了一会儿,都不由发出感叹。

“我愿称之为——研究生新手入门宝典!”

“确实,我们那时候要有这东西,得少走多少弯路,不说别的,就这装环境,那时候就卡了我一两个月,

学怎么用github又是一两周,学会怎么找文献又是一两周,各种杂七杂八的东西学下来,半个学期就过去了,

而且这玩意儿又没有系统性的教程,都是自己一点点上网找的,不过你们这倒是好了,有周昀这东西,能省下不少时间。”

“对你们有帮助就行,如果别人有需要的话直接给就好了,只是别让人拿着我的东西去收费就好,看完觉得有帮助给我点个Star呗。”

“点了,要我说,你这玩意儿迟早得火!”

“那借你吉言了。”

短暂的吵闹过后,实验室又恢复了平静。

周昀看着屏幕上的实验记录,第一次感觉有些棘手。

能够支撑模型运行的核心代码他上周就写完了,然后设置了几组实验,跑了六天,今天刚好出结果。

只是这结果,有些不尽如人意。

在选择股票相同的情况下,甚至还没有之前那个只能接受数值和文本数据的阉割版模型效果好。

这就是AI领域的问题之一,模型完全是黑盒的,你永远不知道你的数据在模型里是怎么变化传输的,可能某一行代码出了问题,就会导致各种奇奇怪怪的问题。

不过还好,周昀在写代码的时候加入了大量的调试代码,因为每跑一次实验需要的时间太长了,

甚至这次他并没有用到所有的数据,只用了其中的一部分,跑一组实验就得一周,这还是64张H100的显卡集群的情况下,

如果用上全部的数据的话,虽然时间上不会是简单的倍乘关系,但至少也得两周。

但这也就是第一次训练时候需要大量数据才要这么久,等第一次训练好了,后续的再有新的数据,就不需要从头训练,只需要利用新的数据微调就行。

现在他就在看输出日志,观察到底是在哪一个环节出了问题,为了衡量模型的效果好坏,

他在数据预处理,数据融合,模型训练,结果输出这几个方面设计了几个指标。

经过观察,他大概确认了最为可能的一个原因。

数据融合异常。

因为模型接受的数据是多种模态的,所以在预处理之后还有一个数据融合阶段。

根据实验日志来看,问题就出现在了这一阶段。

原本的数据融合算法在只有两种模态数据的时候,效果很好,但是当数据的模态数量逐渐上升,

一些原本没有发现的bug逐渐显现出来,这也是导致最终效果不如原来模型的最为重要的原因。

当然,也可能是因为过拟合,数据泄露,这种普遍性的问题,只不过仅根据这次的输出日志来看,可能性不大。

“嗯......特征维度贡献方差过大?”划动滚轮的手指停下,周昀敏锐地看到了一条异常的输出。

本章未完,点击下一页继续阅读。

人气小说推荐More+

侯门嫡女惨死重生,世子爷日日轻哄
侯门嫡女惨死重生,世子爷日日轻哄
灵若是天地间唯二的神,和死对头争吵中不慎被踢进轮回境,成为侯府大小姐卫又璃。和她一母同胞的双生妹妹成了人人称赞的神女,而她则被家人嫌弃碾进泥里,最后被兄长一剑穿胸,踹下万丈深渊,落得个尸骨无存。…
兜了个豆
取名重复?我在网游里当NPC
取名重复?我在网游里当NPC
跨时代全息网游《猎天》公测,以游戏搬砖为生的刘空空当然不会错过!\n刘大猛这名字被人用了?换个名字不就好了,能不能麻烦快点别耽误我挣钱!\n一顿操作后,诶?我还没换名字怎么就进入游戏了?\n刘…
芥末味腰果
谢邀,我,小学生,已成厨神!
谢邀,我,小学生,已成厨神!
【美食】+【日常】+【无cp】+【温馨】+【治愈】+【搞笑】\n——\n“小学生唯一要做的事情就是好好上学……但我觉得方师傅上学是不务正业。”\n“排队终于到我了……方师傅,小学作业咱先放一放…
卖鸡蛋汉堡咯
我不是天才刑警
我不是天才刑警
韩凌曾是黑夜的裁决者,子弹即正义,鲜血写判词。穿越重获新生,那些曾经猎杀的魑魅魍魉,如今变成了卷宗里等待真相的谜题。精通最高明的反侦查手法,洞悉人性最深的阴暗,破案,更像是对经验的复盘。昔日屠…
勤奋的关关
这个师弟过于正义
这个师弟过于正义
萧麟穿越到了一部名为《剑山情缘录》的3D仙侠动漫里。师门皆是恋爱脑,世界都将在他们的爱恨情仇间重开。幸得“人气值系统”,人气越高,实力越强。于是,一个跟众人格格不入,正得发邪的师弟脱颖而出。…
十月恰米