spark连接hive，使用sparksql处理hive中的数据

程序员文章站 2022-07-14 15:26:14

...

spark连接到hive首先要先配置3个文件，放到idea的resource目录下，如下：
core-site.xml
从集群环境中拉下来。
hdfs-site.xml
从环境中拉下来
hive-site.xml：
<configuration>
<property>
<name>hive.exec.scratchdir</name>
<value>/user/hive/tmp</value>
</property>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
<property>
<name>hive.querylog.location</name>
<value>/user/hive/log</value>
</property>
<property>
<name>hive.metastore.uris</name>
<value>thrift://knowyou-hdp-02:9083</value>
</property>

<property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://knowyou-hdp-01:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8&amp;useSSL=false</value>
</property>
<property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
</property>
<property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>hive</value>
</property>
<property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>hive</value>
</property>

</configuration>

pom文件配置，与集群环境一致
<dependencies>

<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-sql_2.11</artifactId>
<version>2.2.0</version>
</dependency>

    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-hive_2.11</artifactId>
        <version>2.2.0</version>
        <scope>compile</scope>
    </dependency>

    <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core -->
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-core_2.11</artifactId>
        <version>2.2.0</version>
    </dependency>
</dependencies>

程序测试：成功
object SparkHive {

def main(args: Array[String]): Unit = {

val spark = SparkSession
  .builder()
  .master("local[*]")
  .appName("aaa")
  .enableHiveSupport()
  .getOrCreate()
spark.sparkContext.setLogLevel(LogLevel.ERROR.toString)
val sql = "select * from default.sparkdemo"
spark.sql(sql).show()

}
}

转载于:https://www.jianshu.com/p/30163fb3341b

上一篇： leetcode 371 不用加减求两数之和

下一篇：头脑风暴--原生JS实现汉诺塔游戏

spark连接hive，使用sparksql处理hive中的数据

【大数据】SparkSql 连接查询中的谓词下推处理 (一)

【大数据】SparkSql 连接查询中的谓词下推处理 (二)

spark连接hive，使用sparksql处理hive中的数据

hive中数据倾斜问题的处理(hive调优)

Spark读取Hive中的数据加载为DataFrame

使用idea, sparksql读取hive中的数据

使用Hive读取Hbase中的数据

HIVE中get_json_object与json_tuple使用处理json格式数据

使用php显现hive中的数据，有办法展现吗

使用php展现hive中的数据，有办法展现吗？