计算机系统应用教程网站

网站首页 > 技术文章 正文

斌哥带你学AI——文本分类

btikc 2024-12-08 12:28:01 技术文章 41 ℃ 0 评论


easyDL文本分类


点击立即使用,会弹出选择模型类型框,选择文本分类-单标签


进入文本分类模型界面,点击创建模型

点击创建模型后,填入相关信息,并点击下一步。

就生成了我们创建的模型。

下面进行数据集的创建,点击数据总览,创建数据集


点击创建数据集,然后填入相关信息。

创建完数据集,点击导入

进入数据导入界面,选择无标注信息,本地导入,上传压缩包,以文件件命名类别(图像数据要按照类别分成不同的文件夹,文件夹名字即为标签或者类别信息,最后,把最上层一个大文件夹压缩成.zip文件),点击上传压缩包。


上传完成后,需要等待一会,完成数据的上传。刷新页面即可。

等待一会,刷新页面,点击查看。

可以看到上传的数据信息,因为上传的数据是有标签的数据,可以看到我们对文本提前进行了分类,文件夹名字为文本的类别信息。分类信息是科技,教育和美食。


再次点击我的模型,选择训练。

添加训练数据

选择数据集,然后勾选标签并点击添加,然后可以看到添加的数据集。按照默认配置,点击开始训练

有提示,点击继续训练

开始训练后,请勾选短信提示,训练结束会有短信提示。可以关闭网页去干点别的事情。

训练时间与你数据集的大小有关。

喝杯茶,休息休息,大约十分钟吧,收到百度的短信提示,模型训练完毕。

回到主页,对模型进行验证测试,点击校验。

点击启用校验模型

需要等待一会,然后出现校验界面,可以查看模型评估报告。

具体测试模型,从网上下载相关类别评论或者直接输入相关类别本文信息,就可以识别出文本信息属于哪类,可以调整置信度调节检测效果。

最后,发布模型即可。按照下面填入信息,接口地址后面还会用到,点击提交申请。

等待模型发布完成

等待一会,模型发布完成。点开服务详情查看接口信息。

记录这个接口地址,并点击立即使用,登录服务控制台,并点击创建应用。

填入相关信息,并点击立即创建。

这两个参数需要记住后面访问服务器接口还需要用到。有这两个参数生成token。注意每个模型免费的次数只有1000次,这1000次包括访问服务器失败的次数。

万事具备,只差测试了。测试的化,需要建立一个文本文件,把评论信息写入即可,我写入的内容是今天这个事情真牛,百度无人车上路了!这是科技进步的一天,未来更美好


总结,我们可以根据这个流程,训练自己的文本识别模型,只需要少量样本就可以完成对科技,教育,美食的评论的分类识别,方便,有个接口,我们可以在边缘端访问部署的服务器,完成对相关设备的控制。又一个课程设计题目出来了,哈哈哈!未完待续!………………………………..

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表