网站首页 损失函数曲线
-
深度学习工程师必看:更简单的超分辨重构方法拿走不谢
作者|YongGuo,JianChen等译者|刘畅出品|AI科技大本营(ID:rgznai100)通过学习从低分辨率(LR)图像到高分辨率(HR)图像之间的非线性映射函数,深度神经网络在图像超分辨率(SR)任务上取得了较好...
2024-12-18 btikc 技术文章 19 ℃ 0 评论 -
机器学习:理解损失和损失函数 损失函数是干嘛的
当你训练监督机器学习模型时,你经常会听到最小化的损失函数...
2024-12-18 btikc 技术文章 20 ℃ 0 评论 -
NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liya...
2024-12-18 btikc 技术文章 20 ℃ 0 评论 -
CLIP微调简明教程 微调怎么调
CLIP等多模态模型通过将图像等复杂对象与易于理解、生成和解析的文本描述联系起来,开辟了新的AI用例。但是,像CLIP这样的现成模型可能无法代表特定领域中常见的数据,在这种情况下,可能需要进行微调以使模型适应该领域。...
2024-12-18 btikc 技术文章 25 ℃ 0 评论 -
一文读懂线性回归、岭回归和Lasso回归
本文介绍线性回归模型,从梯度下降和最小二乘的角度来求解线性回归问题,以概率的方式解释了线性回归为什么采用平方损失,然后介绍了线性回归中常用的两种范数来解决过拟合和矩阵不可逆的情况,分别对应岭回归和Lasso回归,最后考虑到线性回归的局限性,...
2024-12-18 btikc 技术文章 24 ℃ 0 评论 -
大模型预训练的降本增效之路——从信息密度出发
本文基于论文《Patch-LevelTrainingforLargeLanguageModels》,论文作者全部来自微信翻译团队。论文:https://arxiv.org/pdf/2407.12665代码:https://gi...
2024-12-18 btikc 技术文章 18 ℃ 0 评论 -
大模型:BERT模型和GPT模型的损失函数
BERT模型和GPT模型的损失函数主要都是交叉熵损失函数,但它们在具体应用上有所不同。...
2024-12-18 btikc 技术文章 24 ℃ 0 评论 -
ISO随便开!神经网络学习降噪算法解析
在做机身测试时,高ISO时的噪声表现一定是大家的关注重点,但从噪声的构建来看,弱光下很大程度的噪声都源自传感器自身的光电结构(散粒噪声的主要来源之一就是光子在传感器表面随即入射产生的光电子),同时也严格受制于制造工艺(热噪声、闪烁噪声、暗电...
2024-12-18 btikc 技术文章 19 ℃ 0 评论 -
20K star!搞定 LLM 微调的开源利器
LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为环境配置而放弃了。今天我们分享一个开源项...
2024-12-18 btikc 技术文章 18 ℃ 0 评论 -
“升维的降维打击”-参数训练的驻点分析
1.优化失败的原因在上一节(...
2024-12-18 btikc 技术文章 26 ℃ 0 评论
- 控制面板
- 网站分类
- 最新留言