网站首页 > 技术文章 正文
在这篇文章中,我们讨论什么是One-Hot编码?为什么以及何时使用它来处理机器学习测试。在许多机器学习案例中,特征并不总是连续值,可能是分类值。
例如:
- [“male”, “female”]
- [“from Europe”, “from US”, “from Asia”]
- [“uses Firefox”, “uses Chrome”, “uses Safari”, “uses Internet Explorer”]
如果您使用这些数字来表示,那将更有效,例如:
- [“male”, “from US”, “uses Internet Explorer”] -> [0, 1, 3]
- [“female”, “from Asia”, “uses Chrome”]-> [1, 2, 1]
但是,在我们转换为数字表示后,上述数据无法直接在我们的分类器中使用。因为estimator 会认为要排序的类,但实际上是无序的。例如:衣服的尺寸类别数据是任意排序的。
首先,创建一个DataFrame并命名列,Python代码如下:
# Python program to demonstrate
import pandas as pd
df2 = pd.DataFrame(
[['Green','M', 10.1, 1 ], ['Red','L',13.5, 2 ], ['Blue','XL',13.5, 2 ], ['Red','L', 10, 1 ]])
df2.columns = ['Color','Size','Price','Classlable']
df2
#map(fun, iter)
#fun : It is a function to which map passes each element of given iterable.
#iter : It is a iterable which is to be mapped.
size_mapping =
{
'XL':3,
'L':2,
'M':1
}
df2['Size'] = df2['Size'].map(size_mapping)
使用“get_dummies”函数很简单——使用prefix函数指定要对哪些列进行编码,然后得到一个dataframe,用One hot编码替换原始列。Python示例代码:
onehot_encoding = pd.get_dummies(df2['Color'], prefix='Color')
df2 = df2.drop('Color',1)
onehot_encoding
pd.concat([onehot_encoding, df2],axis=1)
在本教程中,您了解了如何使用Python中的one hot编码对机器学习的分类序列数据进行编码。
- 上一篇: 大数据人才,到底应具备哪些技能?
- 下一篇: 08-人人都懂的人工智能:高维的one-hot编码
猜你喜欢
- 2024-10-12 数据预处理-分类变量数据编码 分类变量数据分析
- 2024-10-12 程序员深夜用Python跑神经网络,只为用中二动作关掉台灯
- 2024-10-12 Pandas第十三课:特征工程与数据预处理
- 2024-10-12 CVPR2019 | 面对高度不均衡数据如何提高精度?这篇文章有妙招
- 2024-10-12 数据特征常用构建方法详解及实例 数据特征包括哪些?
- 2024-10-12 “千克”和“毫升”:单位不同就不能做朋友了吗?
- 2024-10-12 a和one的区别 a与one区别
- 2024-10-12 手把手教你做客户挽留模型【纯技术】
- 2024-10-12 机器学习中的独热编码,你知道多少?
- 2024-10-12 One Hot Encoder 在机器学习分类模型中的重要性
你 发表评论:
欢迎- 最近发表
-
- 在 Spring Boot 项目中使用 activiti
- 开箱即用-activiti流程引擎(active 流程引擎)
- 在springBoot项目中整合使用activiti
- activiti中的网关是干什么的?(activiti包含网关)
- SpringBoot集成工作流Activiti(完整源码和配套文档)
- Activiti工作流介绍及使用(activiti工作流会签)
- SpringBoot集成工作流Activiti(实际项目演示)
- activiti工作流引擎(activiti工作流引擎怎么用)
- 工作流Activiti初体验及在数据库中生成的表
- Activiti工作流浅析(activiti6.0工作流引擎深度解析)
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)