网站首页 > 技术文章 正文
【新智元导读】NLP方向近日各种大神工具层出不穷。然而,实践才是硬道理,如何将它们应用到自己的模型是个关键问题。本文就对此问题进行了介绍。
近期的NLP方向,ELMO、GPT、BERT、Transformer-XL、GPT-2,各种预训练语言模型层出不穷,这些模型在各种NLP任务上一次又一次刷新上线,令人心驰神往。但是当小编翻开他们的paper,每一个上面都写着四个大字:“弱者退散”,到底该怎么将这些顶尖工具用到我的模型里呢?答案是Hugging Face的大神们开源的pytorch-pretrained-BERT。
Github 地址:
https://github.com/huggingface/pytorch-pretrained-BERT
模型简介
近期的各种预训练语言模型,横扫各种NLP任务,这里我们介绍三个最火的预训练模型:
- BERT,由Google AI团队,发表于2018年10月11日。它的文章是: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding。
- Transformer-XL, 由Google AI和Carnegie Mellon大学,发表于2019年1月9日。它的文章是:Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context。
- GPT-2,由OpenAI 团队,发表于2019年2月14日,它的文章是:Language Models are Unsupervised Multitask Learners。
基本上,每一个文章,都在发表的时候,刷新当时的几乎所有NLP任务的State-of-the-Art,然后引发一波热潮。 当然,目前风头正盛的是GPT-2,它前几天刚发表。
开源实现
然而,让小编翻开他们的paper,发现每一个上面都写着四个大字:“弱者退散”,到底该怎么将这些顶尖工具用到我的模型里呢,Hugging Face 的大神们,紧跟前沿,将所有的预训练语言模型都实现并开源了。更令人钦佩的是,它们还做了很多封装,让大家都可以才在这些巨人模型的肩膀上。
Hugging Face开源的库叫pytorch-pretained-bert, 你可以在本文开头找到链接。接下来的部分,我们介绍一下它的安装和使用。
安装使用
你可以直接使用 Pip install 来安装它:
pip install pytorch-pretrained-bert
pytorch-pretrained-bert 内 BERT,GPT,Transformer-XL,GPT-2。
为了获取一句话的BERT表示,我们可以:
拿到表示之后,我们可以在后面,接上自己的模型,比如NER。
我们也可以获取GPT的表示:
Transformer-XL表示:
以及,非常火的,GPT-2的表示:
有了这些表示,我们可以在后面,接入自己的模型,比如:
- 文本分类
- https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_classifier.py
- 阅读理解
- https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_squad.py
- 语言模型
- https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_lm_finetuning.py
- 等等
本文经授权转载自专知
猜你喜欢
- 2024-10-12 两篇软文带领新手小白了解Transformer的前世今生(一)
- 2024-10-12 关于BERT:你不知道的事 关于邻家的天使不知不觉把我惯成废人这件事动漫
- 2024-10-12 「AI岗面试必备」XGBoost、Transformer、BERT、水波网络原理解析
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)