网站首页 > 技术文章正文

大数据Hadoop生态圈学习二:Hive安装与配置

btikc 2024-10-12 10:57:28 技术文章 52 ℃ 0 评论

Hive安装及配置

hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。

安装前基本环境准备：

以上基础环境请参考【IT小乙班】的文章：Linux系统部署hadoop集群超详细版

1、官网下载hive

#https://hive.apache.org/downloads.html

2、解压安装

#tar zxvf apache-hive-2.3.3-bin.tar.gz -C /usr/local

#mv apache-hive-2.3.3-bin hive

3、配置环境变量

vim /etc/profile

4、查看版本信息

5、配置Hive（/usr/local/hive/conf）

#vim hive-sit.xml

数据库连接到本地198数据库，这里不在安装MySQL数据库，注意：最好新建一个hive-site.xml，按照我上述的配置即可，请勿在拷贝和修改配置可能导致数据库无法创库Hive

6、修改配置文件

修改hive-env.sh文件添加

7、mysql-connect驱动包，将jar复制到hive的lib目录下

mysql-connector-java-5.1.40-bin.jar

mysql-connector-java-5.1.46.jar

移动至此目录中 /usr/local/hive/lib/

8、初始化及测试

初始化:bin/schematool -dbType mysql -initSchema

会在mysql自动生成hive库

返回198数据库查看是否有Hive库和表信息

9、启动:bin/hive

原创声明：本文章是本人在今日头条的原创内容，如需转载请注明来源和原作者。

大家如果在头条号有电脑日常问题，可以在下方评论，看到后会第一时间回复大家。

作者： IT小乙班

关注【IT小乙班】头条号，每天收获最实战的电脑技能干货。

如果你喜欢我的文章，不妨点赞、转发、收藏一下哦！