人工智能为什么可以智能,很大一部分原因就是因为人工智能可以对人类的视觉和声音进行识别。并且做出回应。
那么如何做到对视觉和声音做到感知的呢?
我们先看大脑是如何对这些视觉和听觉做出处理的。我们的大脑在出生后,就开始了声音和视觉的刺激训练,并且得到反馈,所以我们人类才会知道这个声音是是什么意思,知道这个语言和图像代表什么意思。
可以想想如果把一个人放在一个没有任何信息的环境里面,他是不懂得语言和图像的。
对图像和声音认知就需要进行特征提取
那么机器也是,要想了解图片和视频,要想对图像和声音认知就需要进行特征提取。我们需要将原始图片的数据,也就是像素值提取为有用的特征。
通常情况下像素值在对象的边界处是不同的,当存在阴影、图案内或者纹理表面时,相邻像素之间的差值称为图像梯度。
所以就需要计算图像梯度
所以就需要计算图像梯度,计算图像沿着水平X轴和垂直Y轴,然后将它们合称为二维矢量。
然后把他俩做差分操作,可以用矢量掩摸或者滤波器方便地表示。
本文暂时没有评论,来添加一个吧(●'◡'●)