网站首页 > 技术文章正文

斌哥带你学AI——文本分类

btikc 2024-12-08 12:28:01 技术文章 41 ℃ 0 评论

easyDL文本分类

点击立即使用，会弹出选择模型类型框，选择文本分类-单标签

进入文本分类模型界面，点击创建模型

点击创建模型后，填入相关信息，并点击下一步。

就生成了我们创建的模型。

下面进行数据集的创建，点击数据总览，创建数据集

点击创建数据集，然后填入相关信息。

创建完数据集，点击导入

进入数据导入界面，选择无标注信息，本地导入，上传压缩包，以文件件命名类别（图像数据要按照类别分成不同的文件夹，文件夹名字即为标签或者类别信息，最后，把最上层一个大文件夹压缩成.zip文件），点击上传压缩包。

上传完成后，需要等待一会，完成数据的上传。刷新页面即可。

等待一会，刷新页面，点击查看。

可以看到上传的数据信息，因为上传的数据是有标签的数据，可以看到我们对文本提前进行了分类，文件夹名字为文本的类别信息。分类信息是科技，教育和美食。

再次点击我的模型，选择训练。

添加训练数据

选择数据集，然后勾选标签并点击添加，然后可以看到添加的数据集。按照默认配置，点击开始训练

有提示，点击继续训练

开始训练后，请勾选短信提示，训练结束会有短信提示。可以关闭网页去干点别的事情。

训练时间与你数据集的大小有关。

喝杯茶，休息休息，大约十分钟吧，收到百度的短信提示，模型训练完毕。

回到主页，对模型进行验证测试，点击校验。

点击启用校验模型

需要等待一会，然后出现校验界面，可以查看模型评估报告。

具体测试模型，从网上下载相关类别评论或者直接输入相关类别本文信息，就可以识别出文本信息属于哪类，可以调整置信度调节检测效果。

最后，发布模型即可。按照下面填入信息，接口地址后面还会用到，点击提交申请。

等待模型发布完成

等待一会，模型发布完成。点开服务详情查看接口信息。

记录这个接口地址，并点击立即使用，登录服务控制台,并点击创建应用。

填入相关信息，并点击立即创建。

这两个参数需要记住后面访问服务器接口还需要用到。有这两个参数生成token。注意每个模型免费的次数只有1000次，这1000次包括访问服务器失败的次数。

万事具备，只差测试了。测试的化，需要建立一个文本文件，把评论信息写入即可，我写入的内容是今天这个事情真牛，百度无人车上路了！这是科技进步的一天，未来更美好

总结，我们可以根据这个流程，训练自己的文本识别模型，只需要少量样本就可以完成对科技，教育，美食的评论的分类识别，方便，有个接口，我们可以在边缘端访问部署的服务器，完成对相关设备的控制。又一个课程设计题目出来了，哈哈哈！未完待续！………………………………..