Spark SQL----REPAIR TABLE

REPAIR TABLE恢复表目录中的所有分区，并更新Hive metastore。使用PARTITIONED BY子句创建表时，会在Hive metastore中生成并注册分区。但是，如果分区表是根据现有数据创建的，则分区不会自动在Hive metastore中注册。REPAIR TABLE对不存在的表或没有分区的表抛出异常。恢复分区的另一种方法是使用ALTER TABLE RECOVER PA

85程序员老王

284人浏览 · 2024-07-15 09:49:50

85程序员老王 · 2024-07-15 09:49:50 发布

Spark SQL----REPAIR TABLE

一、描述
二、语法
三、参数
四、例子

一、描述

REPAIR TABLE恢复表目录中的所有分区，并更新Hive metastore。使用PARTITIONED BY子句创建表时，会在Hive metastore中生成并注册分区。但是，如果分区表是根据现有数据创建的，则分区不会自动在Hive metastore中注册。用户需要运行REPAIR TABLE来注册分区。REPAIR TABLE对不存在的表或没有分区的表抛出异常。恢复分区的另一种方法是使用ALTER TABLE RECOVER PARTITIONS。为了与Hive兼容，还可以使用MSCK REPAIR TABLE调用此命令。
如果表是缓存的，则该命令将清除该表的缓存数据及引用该表的所有从属项。下次访问该表或从属项时，缓存将被延迟填充。

二、语法

[MSCK] REPAIR TABLE table_identifier [{ADD|DROP|SYNC} PARTITIONS]

三、参数

table_identifier
指定要修复的表的名称。表名称可以选择性地使用数据库名称进行限定。
语法：[ database_name. ] table_name
{ADD|DROP|SYNC} PARTITIONS
指定如何恢复分区。如果未指定，则默认为ADD。
- ADD，该命令为基表文件夹中不属于任何表分区的所有子文件夹向session catalog添加新分区。
- DROP，该命令会从session catalog中删除文件系统中不存在位置的所有分区。
- SYNC是DROP和ADD的组合。

四、例子

-- create a partitioned table from existing data /tmp/namesAndAges.parquet
CREATE TABLE t1 (name STRING, age INT) USING parquet PARTITIONED BY (age)
    LOCATION "/tmp/namesAndAges.parquet";

-- SELECT * FROM t1 does not return results
SELECT * FROM t1;

-- run REPAIR TABLE to recovers all the partitions
REPAIR TABLE t1;

-- SELECT * FROM t1 returns results
SELECT * FROM t1;
+-------+---+
|   name|age|
+-------+---+
|Michael| 20|
+-------+---+
| Justin| 19|
+-------+---+
|   Andy| 30|
+-------+---+

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

一文读懂AI大模型核心术语：从参数到Agent的完整指南

2048 AI社区

结合AI大模型的本地知识库搭建方法总结，大模型入门到精通，收藏这篇就足够了！

2048 AI社区

Paint API之—— Xfermode与PorterDuff详解(三)

本文详解Android中PorterDuff的18种混合模式，包括ADD、CLEAR、DARKEN等，通过公式解析Alpha通道和颜色通道的计算方式。每种模式都配有组合逻辑、处理方式和效果示例说明，如ADD模式会使颜色叠加变亮，CLEAR模式会完全透明化等。文中还提供了与WebView、Socket集成的实战场景，帮助开发者系统掌握PorterDuff混合模式的应用。