网站首页 > 技术文章 正文
数学建模
谁用谁知道
前几天超模君再次收到沈林兴老师的邮件,邮件的几句话让超模君实为感动:
分享两字正是超级数学建模的理念!遥想创办超级数学建模至今,已有3个年头,一路上坚持下来,除了兴趣,还有各位模友大大的支持。
在此超模君向各位模友表示衷心的感谢,也感谢一直以来投稿给超级数学建模的各位老师们(沈林兴老师,崔继峰老师,王向东老师,林开亮老师、杨夕歌博士、李伟同学等等)。
此时,超模君还为投稿的模友准备超模君专属定制礼品,约吗?(来稿请戳:supermodeling@163.com)
作者:沈林兴
超级数学建模资深读者
文章来源:投稿
某机构对前几年收到的大量电子邮件做了分类,提取了邮件中的一些关键词,并做了统计。
假设三类邮件---工作邮件、一般邮件和垃圾邮件的比例(概率)分别为P1、P2、P3,(P1+P2+P3=1),第 i 类邮件每百封中含有关键词 j 的邮件数(出现关键词 j 的比例或概率)为 Pij 。
试问,关键词j在电子邮件中出现的概率是多少?如果一封新邮件中出现了关键词j,则该邮件属于垃圾邮件的概率是多少?
这是一个简化的问题,旨在研究如何自动识别垃圾邮件(如果某新邮件属于垃圾邮件的概率超过了预设的某个阈值,该邮件就被判定为垃圾邮件,自动放到垃圾信箱中,拒绝接收)。
虽然上述问题不难通过条件概率公式、全概率公式和逆概率公式推导并计算出结果,但对于大多数工作人员来说,对解答过程的理解还是有困难的。
为此,我们可以建立如下的数学模型:
上述模型中,从“电子邮件”到“关键词 j ”有三条路径,每条路径上有两段随机事件(第2段事件是在第1段事件发生条件下的随机事件)。
在该例中,我们可以将全概率公式和逆概率公式(贝叶斯公式)按如下方式来理解:
任一封电子邮件中,出现关键词j的概率等于从“电子邮件”到“关键词 j ”的所有路径的概率之和(全概率公式),而每条路径上的概率等于该路径上各段概率之积(条件概率公式)。
所以,电子邮件中出现关键词 j 的概率为:
P1*P1j +P2*P2j + P3*P3j
如果一封新的电子邮件中出现关键词 j ,则该电子邮件属于垃圾邮件的概率等于从电子邮件到关键词 j 的三条路径中走垃圾邮件路径的比例:
所以,出现关键词j的邮件属于垃圾邮件的概率=P3*P3j /(P1*P1j +P2*P2j + P3*P3j)
该结论通俗易懂,也便于记忆。
上述数学建模是隐蔽的,课堂上、书上都没有说。
该模型只有两层:邮件类和关键词。对于更复杂的情况(层次更多,每层上的项数也更多,各层之间的关系更复杂时),这种模型就更显出其威力。
以这种隐蔽的数学模型来理解和计算实际问题,使人感觉更能看透本质,掌握得更彻底,计算得更轻松,而且永生难忘。
该例也有利于对贝叶斯公式的深刻理解。逆概率公式基于全概率公式,但其应用却发生了奇特的飞跃。
全概率公式只是对已有的数据做统计,贝叶斯公式却能对新事物进行推断!(例如,用来自动识别垃圾邮件。)
这正是它在大数据处理、机器学习中大放光彩的原因。
上述数学模型实际上是横向的层次模型(在动态规划和神经网络中则是显式应用的)。
类似的数学模型在多元复合函数求导数时也十分有效。
设w是x,y,z的函数;x是u,v, s的函数;y是u,v的函数; z是u,v,t的函数;u,v都是s,t的函数,求w对t的偏导数。
为此,我们可以建立如下的数学模型:
从w到t的路径有七条:w-x-u-t, w-x-v-t, w-y-u-t,w-y-v-t, w-z-u-t, w-z-v-t, w-z-t。
w对t的偏导数等于各条路径上的导数之和,每条路径上的导数等于该条路径上各段偏导数之积。因此,
该模型的建立也是隐蔽的,教科书上没有明说。在这种隐蔽模型的支持下,麻烦的计算也就变得非常直观,不容易出错了。
上述两个不同领域中的问题居然采用了非常类似的模型。这说明其中蕴涵着某种共同的规律;也启发我们在学习过程中,应有拓展性思维;也提示我们在教学和研究过程中,有必要采用可视化、可释化、通俗化方法。
数学家常从平凡中提取规律,教师则需要将规律再转化为平凡,生动地讲好数学故事。这种认识上的回归属于螺旋式上升,更上一层楼。台面上(书本上)的严谨甚至刻板与台面下的白话俗解相辅相成。
这也是华罗庚导师所倡导的“从薄到厚,再从厚到薄”的读书、思考和研究方法。
本文由超级数学建模编辑整理
部分资料来源于网络
转载请在公众号中,回复“转载”
-----这里是数学思维的聚集地------
“超级数学建模”(微信号supermodeling),每天学一点小知识,轻松了解各种思维,做个好玩的理性派。30万数学精英都在关注!
商务合作请加微信zwz2434
猜你喜欢
- 2024-10-23 来学习一下概率论基本知识,它能防止你的模型过拟合
- 2024-10-23 神经网络综述 神经网络算法综述
- 2024-10-23 一文了解神经网络的原理 神经网络通俗易懂
- 2024-10-23 深度神经网络的可扩展定量验证 深度神经网络调参数技巧
- 2024-10-23 资源|贝叶斯神经网络简史 贝叶斯网络原理
- 2024-10-23 深度学习相关问题解析(梯度消失和过拟合)
- 2024-10-23 什么是深度学习神经网络? 什么叫深度神经网络
- 2024-10-23 什么是神经网络的激活函数? 神经网络 激活层
- 2024-10-23 科普|贝叶斯概率模型一览 贝叶斯概率公式例题
- 2024-10-23 旋极信息获得发明专利授权:“一种速变信号检测方法和装置”
你 发表评论:
欢迎- 最近发表
-
- 吴谨言专访大反转!痛批耍大牌后竟翻红,六公主七连发力显真诚
- 港股2月28日物业股涨幅榜:CHINAOVSPPT涨1.72%位居首位
- 港股2月28日物业股午盘:CHINAOVSPPT涨1.72%位居首位
- 港股3月2日物业股涨幅榜:CHINAOVSPPT涨1.03%位居首位
- 港股3月2日物业股午盘:CHINAOVSPPT涨1.03%
- 天赋与心痛的背后:邓鸣贺成长悲剧引发的深刻反思
- 冯小刚女儿徐朵追星范丞丞 同框合照曝光惹人羡,回应网友尽显亲民
- “资本大佬”王冉:51岁娶小17岁童瑶,并承诺余生为娇妻保驾护航
- 港股3月2日物业股午盘:CHINAOVSPPT涨1.03%位居首位
- 「IT之家开箱」vivo S15 图赏:双镜云窗,盛夏风光
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)