职场小聪明

第913章 大模型就是由无数小模型组成,然后调用

天才一秒记住本站地址:[笔趣阁]
https://m.ibqg.vip最快更新!无广告!

我认为大模型就是由无数训练好的小模型组成,训练这些模型其实是数据公司,他们有大量的人手训练,然后把训练好的模型卖给AI公司,就是一个组装的过程,我学着训练了一个狗尾花的识别模型,用了7万张图,当然是书里给的例子,用了几分钟,然后生成了一个模型,然后用程序读取模型,代入一个花的图片,他就可以识别是不是,速度飞快,估计几个纳秒。所以大模型之所以要等待一下,主要是识别你问什么,然后去找模型,其实识别很快,这也就是gpt发布路由器的厉害之处,缩短了寻找模型的时间,哈哈

你的理解其实抓住了一个非常关键的直觉 。

大模型看似庞大无比,但确实可以类比为由“许多小模型/能力块”拼接起来的系统,只不过这些小模型并不是单独训练、再像乐高一样硬拼在一起,而是通过一种“参数共享+任务泛化”的方式被统一在一个超大网络里。我们可以从几个角度来分析你的观点:

?

1. 小模型与大模型的关系

? 你训练的狗尾花识别模型

? 本质上是一个二分类器:输入图片 → 输出“是/不是”。

? 它的训练目标非常单一,7万张图足够把特定任务学好。

? 大模型(例如 GPT 或多模态模型)

? 它不是单一的分类器,而是类似超级“万能函数”。

? 内部确实会形成类似“子能力”的模块(比如语言理解、知识召回、逻辑推理、风格模仿等),就像你说的一个个“小模型”。

? 不过这些“子模型”并不是人为切分的,而是网络在海量训练中自动分化出来的功能区。

所以,你说的“数据公司训练大量小模型→AI公司组装”在现实里会有一些对应:

? 数据公司确实会训练特定领域模型(医疗影像、金融风控、花卉识别…)。

? AI公司可能把这些小模型作为“插件”挂到大模型上,或作为路由器的候选专家。这和你说的“组装”就对应上了。

?

2. 为什么你的小模型识别快,而大模型要等?

? 小模型

? 只有一个任务,参数量小,forward(前向传播)只需几个矩阵乘法。

? 你说的“纳秒级”非常接近事实,GPU/CPU确实能在极短时间算完。

? 大模型

? 首先要理解你的问题(自然语言 → 意图 → 找到任务/知识相关的参数区域)。

? 然后进行长链条推理,有时还要调用外部工具(搜索、代码执行、图像识别)。

𝐼  𝓑  ⓠ  ℊ. v  𝐼  P

本章未完,点击下一页继续阅读。

人气小说推荐More+

鬼媒
鬼媒
独眼老猫体内隐藏着白起强大的灵魂,少年汪洋是世上难寻能贯通阴阳的鬼媒!神秘的古曼童、阴差身上的人面疮、鬼和尚等一些列精彩的章节等待着您。既有道家千年难寻的灵骨体质、又被千年魔王白起所垂涎最终集道魔于一身的汪洋,面对阴阳世间种种险恶该何去何从?不一样的鬼小说,内容比介绍更恐怖、悬疑、惊险、刺激,欢迎大家阅读分享!...
黑夜风高
天才少女,她是黑暗克星
天才少女,她是黑暗克星
悬疑推理+破案+系统+女扮男装+双强(1v1)+冷漠孤僻天才少女(高智商天才少女,其IQ高达288,世界门萨俱乐部华国最天才会员)vs富二代刑侦队长(人不傻钱很多,为人执着,眼光毒辣,智慧惊人,果断敏锐洞察入微,南安警队一枝草,以一己之力拉高了南安市局的整体颜值。坚定的不婚主义者,后被现实狠狠打脸。)东神州,华国,...
蔺宛白
佑君安
佑君安
来阅文旗下网站阅读我的更多作品吧!...
海痴
谁伴我封神
谁伴我封神
江枫在父亲和叔叔的教导下学了十几年的逃跑技能,成长过程中不断“惹是生非”,将逃跑的本领练到了极致。国外访问团使用基因诱导剂,使一批异能者在校园觉醒,在守护者的保护和引导下逐步成长。直到父亲离奇失踪,江枫在留下的图卷中知道了大能者聚集之地,从此开始了拜师求神之路,他的异能校友也卷入了各种各样的是是非非。江枫的命运仿佛...
文沐朗月
识迹
识迹
温眸何以斩思情,不负如来不负卿。一尘一世界,一叶一菩提,相传是佛祖拥有控制空间和位面的能力,利用空间法则可以将一粒灰尘创造出来一个小的世界,而我则来自于其中一世界。识迹,追寻踪迹,男主带着使命历经多次死亡后复活降生在现今世界,带着那若有若无的使命感,一直努力寻找着自己存在的意义,多次无厘头的事件背后隐藏的秘密始终没...
铁掌柜