网站首页 技术文章 第174页
-
一文读懂线性回归、岭回归和Lasso回归
本文介绍线性回归模型,从梯度下降和最小二乘的角度来求解线性回归问题,以概率的方式解释了线性回归为什么采用平方损失,然后介绍了线性回归中常用的两种范数来解决过拟合和矩阵不可逆的情况,分别对应岭回归和Lasso回归,最后考虑到线性回归的局限性,...
2024-12-18 btikc 技术文章 23 ℃ 0 评论 -
大模型预训练的降本增效之路——从信息密度出发
本文基于论文《Patch-LevelTrainingforLargeLanguageModels》,论文作者全部来自微信翻译团队。论文:https://arxiv.org/pdf/2407.12665代码:https://gi...
2024-12-18 btikc 技术文章 18 ℃ 0 评论 -
大模型:BERT模型和GPT模型的损失函数
BERT模型和GPT模型的损失函数主要都是交叉熵损失函数,但它们在具体应用上有所不同。...
2024-12-18 btikc 技术文章 24 ℃ 0 评论 -
ISO随便开!神经网络学习降噪算法解析
在做机身测试时,高ISO时的噪声表现一定是大家的关注重点,但从噪声的构建来看,弱光下很大程度的噪声都源自传感器自身的光电结构(散粒噪声的主要来源之一就是光子在传感器表面随即入射产生的光电子),同时也严格受制于制造工艺(热噪声、闪烁噪声、暗电...
2024-12-18 btikc 技术文章 18 ℃ 0 评论 -
20K star!搞定 LLM 微调的开源利器
LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为环境配置而放弃了。今天我们分享一个开源项...
2024-12-18 btikc 技术文章 18 ℃ 0 评论 -
“升维的降维打击”-参数训练的驻点分析
1.优化失败的原因在上一节(...
2024-12-18 btikc 技术文章 26 ℃ 0 评论 -
关于ROC曲线,要懂这8点! roc曲线的正确解读
为了更全面地评价诊断方法的真实性,必须考虑不同界值下诊断试验的真实性,这时就需要进行ROC曲线分析。那么,ROC曲线到底是“何方神圣”呢?别着急,接下来小编会一一为您进行解读!一、受试者工作特征曲线(ROC曲线)受试者工作特征曲线(rece...
2024-12-18 btikc 技术文章 17 ℃ 0 评论 -
图像语义分割实践(四)损失函数与实现
在确定检测任务和模型构建完成后,随之需要对训练的准则Criterion进行实现,可称之为损失函数或代价函数,简明而言,训练过程中真实值和计算值的误差。分割常见的损失函数如下crossentropyloss:交叉熵,通用于不同类样本量在一...
2024-12-18 btikc 技术文章 17 ℃ 0 评论 -
初学者指南:什么是随机梯度下降(SGD)
随机梯度下降(StochasticGradientDescent,简称SGD)是机器学习和深度学习中的一个重要优化算法。...
2024-12-18 btikc 技术文章 20 ℃ 0 评论 -
LlamaFactory可视化微调大模型 - 参数详解
LlamaFactory前言LLaMAFactory是一个用于微调大型语言模型的强大工具,特别是针对...
2024-12-18 btikc 技术文章 16 ℃ 0 评论
- 控制面板
- 网站分类
- 最新留言