图像识别中的特征提取是图像处理、复杂识别(含人脸识别、行为识别、姿态识别、物品识别等)、多维数据融合等实用技术得以应用的基础,它在智慧导航、资源分析、天气预报、环境监测、机器人、生物医学甚至军事打击等许多领域都有极其重要的参考价值。
实际应用中,机器(包含计算机和各类终端设备)是经由图像中的二维像素来精细化判别图像由什么组成,并依据快速程序分析抽象提取特征(一般同时会比对现有大数据库中的参考数据)才能真正看清楚“图像”,从而完成图像识别的第一步,是不可或缺的一环。
人脸识别门禁设备、全态识别闸机装置、智能货品标识平台,还有医学图像识别系统等,之所以今天得以广泛应用,从社会意义上来讲是因为它们取代了人们需要做的复杂识别工作,从数学意义上来讲则是:明确了一种从具体客观图像转换到特定数学空间的分类区别方法;其中特定的数学空间称为特征空间,这类转换方法就是图像特征提取方法。
一定要知道的两点是:
一、机器(包含计算机和各类终端设备)本质上是不会“看图”的,它们在程序的指挥下只会也只能看懂数字,那么通过机器提取图像特征的过程实际上是图像的“非图像”表征,例如是数值、向量或者符号;有了这些数值、向量或者符号形式的传递及归类,就能通过机器训练过程教会机器如何读懂这些特征,从而使它们具有识别图像的本领。
二、对于具体图像而言,每一幅图像都有或多或少的自身特征;主观上能感受的特征包含边缘、亮度、纹理、颜色等等,客观上如果要机器读懂,则需转换为矩阵、直方图、函数关系等等;原因是机器很难具备主观快速经验集成思维,它们只能在人控制下通过程序识别图像特征,这就是人工智能领域所期待的尽量将“客观到主观”的反映过程替换为“客观到客观”的反映过程。
图像特征过程提取应该针对每一幅不同的图像进行分类处理,其评价判断标准应该不固定。但是,我们已经开始寻找共性,在实际程序编写过程中建议将下述几点作为指导具体应用的原则:
一、图像特征提取应适应外部情况变化的影响,举个例子:如果要识别不同汽车的车牌号码,那么图像照片可能是在不同光照条件下从不同角度获取的,我们编写的程序应忽略颜色、亮度、几何失真变形(含角度变化)的影响,也就是说对车牌号码提取识别不敏感的参数要抛弃。
二、图像特征提取应快速且容易,我们应该尽量考虑减少机器实施数学运算(通常是加法或乘法或积分或微分)的复杂程度,如果过于复杂,机器会很累,成本代价也会很高。
三、图像特征提取应具有合适的机器训练(Training)和机器测试(Testing)过程,本来通过机器训练来区别猫头鹰、老鹰和猫,但我们在机器测试过程中只关注是否有头部、眼睛,忽略颜色、尺寸、异类生物特征等,并以此共性作为最高等级的特征提取参数,就可能顾此失彼,尽管这一特征相当重要。
四、图像特征提取要防止分类“维度灾难”,例如我们要识别哈密瓜和西瓜,那么颜色和表皮纹理就是很好的维度特征,但是我们画蛇添足,继续加入尺寸、形状这些维度特征就可能无益,极端情况下还会对特征分类形成干扰。
本来还有许多要讲的,供大家编写程序参考,但时间有限,晚上写作又有点犯困,谢谢大家理解,今后继续….
本文暂时没有评论,来添加一个吧(●'◡'●)