跳到主要内容

QuickSight

QuickSight 可以通过官方 MySQL 数据源连接 Apache Doris,并支持 Directly queryImport 模式。本文面向希望在 QuickSight 中分析 Doris 数据的用户,介绍连接准备、数据集创建,以及基于 TPC-H 数据构建多表关联可视化看板的流程。

适用场景

使用场景用户目标操作结果
接入 Doris 数据源在 QuickSight 中通过官方 MySQL 数据源连接 Apache DorisQuickSight 可以访问 Doris 集群中的数据
创建分析数据集基于 Doris 表创建 QuickSight Dataset数据集可用于后续分析和可视化
构建多表关联看板使用 TPC-H 的 customernationorders 表进行关联分析生成按国家和订单状态统计订单数量的看板

操作流程

阶段操作目标说明
第一步完成连接前准备确认 Doris 版本、网络连通性和 MySQL 兼容版本
第二步创建 QuickSight 数据源使用 QuickSight 官方 MySQL 连接器连接 Apache Doris
第三步创建 Dataset选择 Doris 表并使用 Directly query 模式创建数据集
第四步构建可视化看板添加多个 Dataset,配置表关联,并发布分析看板

前提条件

开始配置前,请确认以下条件已经满足:

准备项要求
Doris 版本Apache Doris 版本不低于 3.1.2
网络连通性根据 Doris 部署环境配置 VPC 和安全组,确保 AWS 服务器可以访问 Doris 集群
MySQL 兼容版本在连接 Doris 的 MySQL client 上声明 MySQL 兼容版本

在连接 Doris 的 MySQL client 上执行以下 SQL,声明 MySQL 兼容版本:

SET GLOBAL version = '8.3.99';

执行以下 SQL 校验配置结果:

mysql> show variables like "version";
+---------------+--------+---------------+---------+
| Variable_name | Value | Default_Value | Changed |
+---------------+--------+---------------+---------+
| version | 8.3.99 | 5.7.99 | 1 |
+---------------+--------+---------------+---------+
1 row in set (0.01 sec)

将 QuickSight 连接到 Apache Doris

本节介绍如何在 QuickSight 中创建 Doris 数据源,并基于 Doris 表创建 Dataset。

第一步:新建 QuickSight 数据集

访问 QuickSight 控制台,进入数据集页面,并点击 新建数据集

进入 QuickSight 数据集页面

新建 QuickSight 数据集

第二步:选择 MySQL 连接器

搜索并选择 QuickSight 内置的官方 MySQL 连接器。

选择 QuickSight MySQL 连接器

第三步:填写 Doris 连接信息

按页面要求填写 Doris 连接信息。MySQL 接口端口默认为 9030,实际端口以 Doris FE 的 query_port 配置为准。

填写 Doris 连接信息

第四步:选择 Doris 表和查询模式

从列表中选择需要分析的 Doris 表。

选择 Doris 表

建议选择 Directly query 模式。

选择 Directly query 模式

点击 Edit/Preview data 后,可以查看表结构、调整自定义 SQL,并在此处修改 Dataset。

预览和编辑 QuickSight Dataset

第五步:发布 Dataset 并创建可视化

完成 Dataset 配置后,可以继续发布数据集并创建新的可视化。

发布 QuickSight Dataset

在 QuickSight 中构建可视化

本节以 TPC-H 数据作为数据源,演示如何在 QuickSight 中构建基于多表关联的可视化看板。Doris TPC-H 数据源的构建方式请参考 TPC-H 基准测试文档

示例目标是统计各个国家在不同订单状态下的订单数量。由于 Doris 在多表关联场景下具有较好的查询性能,本文使用 customernationorders 三张表进行关联分析。

第一步:基于 Doris 表创建 Dataset

  1. 使用前面创建的 Data source 添加以下表作为 Dataset:

    • customer
    • nation
    • orders
  2. 点击 创建数据集

    创建 QuickSight 数据集

  3. 选择前面创建的数据源。

    选择已创建的数据源

  4. 选择需要的表。

    选择需要分析的表

  5. 选择 Directly query 模式。

    为 Dataset 选择 Directly query 模式

  6. 点击 Visualize 创建数据源,并按照相同步骤为其他表创建数据源。

第二步:向分析中添加多个 Dataset

  1. 进入仪表盘制作工作台,点击当前 Dataset 下拉框,选择 添加新的数据集

    在分析中添加新的数据集

  2. 勾选所有需要使用的数据集,点击 Select,将其添加到当前仪表盘。

    选择多个 Dataset

第三步:配置 Dataset 关联关系

  1. 添加完成后,点击 nation 的操作入口,进入编辑数据集界面。

    进入 nation 数据集编辑界面

  2. 点击 Add data 添加数据源。

    添加数据源到 Dataset

  3. 将三张表添加进去后,配置关联键。关联关系如下:

    左表左字段右表右字段
    customerc_nationkeynationn_nationkey
    customerc_custkeyorderso_custkey

    配置三张表的关联关系

  4. 关联完成后,点击右上角 Save & publish 发布。

    发布关联后的 Dataset

第四步:配置图表并发布看板

  1. 回到已添加三个数据源的 Analyses 界面,点击 n_name,生成按国家名称统计订单总数的图表。

    按国家名称统计订单总数

  2. VALUE 中选择 o_orderkey,在 GROUP/COLOR 中选择 o_orderstatus,即可得到按国家和订单状态统计订单数量的看板。

    按国家和订单状态统计订单数量

  3. 点击右上角 Publish,完成看板发布。

完成结果

至此,已经成功将 QuickSight 连接到 Apache Doris,并实现了数据分析和可视化看板制作。