计算机系统应用教程网站

网站首页 > 技术文章 正文

大数据Hadoop生态圈学习二:Hive安装与配置

btikc 2024-10-12 10:57:28 技术文章 12 ℃ 0 评论

Hive安装及配置

hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。

安装前基本环境准备:

  1. JDK 1.8
  2. 修改master/s1/s2主机名及别名
  3. 关闭防火墙
  4. 关闭SELinux
  5. 配置ssh免密码登录
  6. 启动Hadoop集群及zookeeper

以上基础环境请参考【IT小乙班】的文章:Linux系统部署hadoop集群超详细版


1、官网下载hive

#https://hive.apache.org/downloads.html

2、解压安装

#tar zxvf apache-hive-2.3.3-bin.tar.gz -C /usr/local

#mv apache-hive-2.3.3-bin hive

3、配置环境变量

vim /etc/profile

4、查看版本信息

5、配置Hive(/usr/local/hive/conf)

#vim hive-sit.xml

数据库连接到本地198数据库,这里不在安装MySQL数据库,注意:最好新建一个hive-site.xml,按照我上述的配置即可,请勿在拷贝和修改配置可能导致数据库无法创库Hive

6、修改配置文件

修改hive-env.sh文件添加

7、mysql-connect驱动包,将jar复制到hive的lib目录下

mysql-connector-java-5.1.40-bin.jar

mysql-connector-java-5.1.46.jar

移动至此目录中 /usr/local/hive/lib/

8、初始化及测试

初始化:bin/schematool -dbType mysql -initSchema

会在mysql自动生成hive库

返回198数据库查看是否有Hive库和表信息

9、启动:bin/hive


原创声明:本文章是本人在今日头条的原创内容,如需转载请注明来源和原作者。

大家如果在头条号有电脑日常问题,可以在下方评论,看到后会第一时间回复大家。

作者: IT小乙班

关注【IT小乙班】头条号,每天收获最实战的电脑技能干货。

如果你喜欢我的文章,不妨点赞、转发、收藏一下哦!

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表