前提条件
使用Hue WebUI编辑器前,请前往翼MR Manager-集群服务-Hue-连接器管理页面,选择需要启用的连接器,启用成功后,请在页面右上角的运维操作中重启Hue集群服务。重启后,即可前往Hue WebUI页面进行使用。
当前版本支持使用LDAP账号访问Hue。若使用admin、hdfs或hive等已有权限的用户登录Hue,无需进行Ranger授权,可以跳过此步骤;如果新建LDAP用户,需要通过Ranger授予Hive与HDFS权限,操作步骤如下:
1)前往翼MR Manager-集群服务中-点击Ranger-插件启用-启用Hive与HDFS,并重启Hive与HDFS服务;
2)登录Ranger WebUI界面给需要登录的用户授权HADOOP SQL/HDFS等权限。
注意
如果没有给登录用户授权,查询hive可能报错Error, Permission denied: user=test, access=WRITE等问题。
修改core-site.xml文件,为Hue用户配置代理权限。在HDFS-配置管理中修改core-site.xml文件配置,新增 hadoop.proxyuser.hue.hosts与hadoop.proxyuser.hue.groups配置项,配置值可按需设置为*,保存并同步配置后,请重启HDFS与Hive-hiveserver2。
注意
如果没有为Hue用户配置代理权限,可能会报错Failed to validate proxy privilege of hue for test(登录用户)。
若通过公网访问Hue WebUI,需保障网络畅通,您可前往控制台-节点管理,为Hue所在的master节点绑定弹性IP,为安全组配置入方向访问规则后,点击访问链接与端口页面中的链接,前往Hue WebUI页面。
Hue通过JDBC连接Trino 查询引擎。Trino支持多个Catalog(如 hive、mysql等),但Hue默认连接Trino自带system的系统Catalog ,仅用于监控和元数据查询,无法访问Hive表等业务数据。如何查询Hive或其他业务数据?您有两种方式:
方式一:修改Hue默认连接的Catalog(推荐)
编辑Hue配置文件hue.ini,将Trino URL中的system替换为您实际使用的Catalog名称(例如hive)
[[[trino]]] name=Trino JDBC interface=jdbc options='{"url":"jdbc:trino://your-trino-host:9808/hive", "driver": "io.trino.jdbc.TrinoDriver", "user": "trino", "password_script": "/path/to/password_script.sh"}'保存后重启Hue,即可在查询编辑器中直接使用SQL
SELECT * FROM default.users方式二:在SQL中显式指定Catalog(无需改配置)
即使默认Catalog是system,您仍可通过完整表名查询任意Catalog中的数据。
使用SQL查询Hive 中的表
SELECT * FROM hive.default.users注意
请确保Trino服务端已正确配置对应的Catalog(如 hive.properties)。
使用编辑器
在访问链接与端口页面,单击Hue服务所在行的链接前往Hue WebUI页面,输入LDAP账户和密码,即可正常访问Web UI页面。
在Hue的左侧导航栏,单击
图标,选择Hive即可进入Hive编辑器。
以Hive为例,点击列表中上方的刷新按钮,即可查询集群上的数据库表列。
在语句编辑区输入语句,即可执行任务。