职场小聪明

第914章 梯度下降

天才一秒记住本站地址:[笔趣阁]
https://m.ibqg.vip最快更新!无广告!

什么叫梯度下降,就是这个人工智能大模型的函数一定是个碗,或者下突的曲线,这样在任意一点的切线的斜率,就是函数的导数,多个变量叫偏导数,一个变量叫导数,实际就是求碗的最低点,无限接近,切线的斜率为0。就是个概率问题,实际无法达到,就像人认识一只猫,大概就是一只猫,长得像狗的猫也有,差不多就行了。汽车,四个轮的不一定是汽车,可能是步兵装甲车,就是这样,都是模糊的。

你理解得非常到位,我帮你稍微展开一下,让它更系统化:

?

1. 梯度下降的直观理解

你说的“函数像一个碗”其实就是 凸函数 的典型比喻。碗的底部就是我们要找的最小值,而“往下走”靠的就是斜率(导数)。

? 单变量情况:一条曲线,任意一点的切线斜率(导数)告诉我们,往左还是往右能下得更快。

? 多变量情况:就是在高维空间的“碗面”,切线斜率扩展成了“梯度向量”,它指向函数上升最快的方向。我们要走反方向(负梯度),才能往低处下。

所以“梯度下降”就是不断沿着负梯度走,像滚珠在碗里往底部滚,只是每次滚动的步子大小由 学习率 决定。

?

2. 为什么是“概率问题”

你说“无法真正达到最低点,只能无限接近”是对的。原因有三:

1. 计算精度:机器只能迭代有限次,不可能真的迭代到导数绝对为零。

2. 函数形状复杂:大模型的损失函数往往不是完美的碗,而是起伏山谷,有很多“局部低谷”。我们找到的点可能只是某个小谷底,而不是整个山谷的最低点。

3. 模型目标本身是近似:就像你说的“猫”和“狗”,现实世界的分类本身就是模糊的,函数无法定义一个绝对的“真值”,只能在概率意义下做到“尽量正确”。

所以梯度下降找到的解,本质上就是“一个够好的点”,而不是“绝对最优点”。

?

3. 类比到人的认知

你说“认识一只猫,大概就是一只猫”非常贴切。

? 机器学习里的“碗底”就是 最能解释数据的参数组合。

? 但数据有噪声、有歧义,就像长得像狗的猫,四个轮的不一定是汽车。

? 因此,模型不会给出“唯一答案”,而是给出一个 概率分布 —— 比如“这是猫的概率是 90%,狗的概率是 10%”。

这也是为什么深度学习常常用 交叉熵 这样的概率损失函数,而不是单纯的“对不对”。

?

4. 梯度下降背后的智慧

从哲学角度看,梯度下降有点像人的学习:

? 每次犯错(损失)后,沿着“错误最敏感的方向”调整一点点。

? 学不会一蹴而就,而是通过无数次小步修正,逐渐逼近“更合理的理解”。

? 最终得到的知识,也不是绝对正确的,而是“在大多数情况下有效”。

?

𝓲𝓑𝙌g. v𝓲ℙ

本章未完,点击下一页继续阅读。

人气小说推荐More+

鬼媒
鬼媒
独眼老猫体内隐藏着白起强大的灵魂,少年汪洋是世上难寻能贯通阴阳的鬼媒!神秘的古曼童、阴差身上的人面疮、鬼和尚等一些列精彩的章节等待着您。既有道家千年难寻的灵骨体质、又被千年魔王白起所垂涎最终集道魔于一身的汪洋,面对阴阳世间种种险恶该何去何从?不一样的鬼小说,内容比介绍更恐怖、悬疑、惊险、刺激,欢迎大家阅读分享!...
黑夜风高
天才少女,她是黑暗克星
天才少女,她是黑暗克星
悬疑推理+破案+系统+女扮男装+双强(1v1)+冷漠孤僻天才少女(高智商天才少女,其IQ高达288,世界门萨俱乐部华国最天才会员)vs富二代刑侦队长(人不傻钱很多,为人执着,眼光毒辣,智慧惊人,果断敏锐洞察入微,南安警队一枝草,以一己之力拉高了南安市局的整体颜值。坚定的不婚主义者,后被现实狠狠打脸。)东神州,华国,...
蔺宛白
佑君安
佑君安
来阅文旗下网站阅读我的更多作品吧!...
海痴
谁伴我封神
谁伴我封神
江枫在父亲和叔叔的教导下学了十几年的逃跑技能,成长过程中不断“惹是生非”,将逃跑的本领练到了极致。国外访问团使用基因诱导剂,使一批异能者在校园觉醒,在守护者的保护和引导下逐步成长。直到父亲离奇失踪,江枫在留下的图卷中知道了大能者聚集之地,从此开始了拜师求神之路,他的异能校友也卷入了各种各样的是是非非。江枫的命运仿佛...
文沐朗月
识迹
识迹
温眸何以斩思情,不负如来不负卿。一尘一世界,一叶一菩提,相传是佛祖拥有控制空间和位面的能力,利用空间法则可以将一粒灰尘创造出来一个小的世界,而我则来自于其中一世界。识迹,追寻踪迹,男主带着使命历经多次死亡后复活降生在现今世界,带着那若有若无的使命感,一直努力寻找着自己存在的意义,多次无厘头的事件背后隐藏的秘密始终没...
铁掌柜