新一代全场景数据仓库|云数据仓库 GaussDB(DWS),企业数字化转型的坚实伙伴
发布时间:2025-06-06
云数据仓库服务GaussDB(DWS)是一种基于华为云基础架构和平台的在线数据分析处理数据库,提供即开即用、可扩展且完全托管的分析型数据库服务,兼容ANSI/ISO标准的SQL92、SQL99和SQL 2003语法,同时兼容PostgreSQL/Oracle/Teradata/MySQL等数据库生态,为各行业PB级海量大数据分析提供有竞争力的解决方案。
DWS提供存算一体、存算分离多种产品形态,围绕企业级内核、实时分析、协同计算、融合分析、云原生五大方向构筑业界前列数据仓库。
  • 存算一体:面向数据分析场景,为用户提供高性能、高扩展、高可靠、高安全、易运维的企业级数仓服务,支持2048节点、20PB级超大规模数据分析能力,适用于“库、仓、市、湖”一体化的融合分析业务。
  • 存算分离:采用存算分离云原生架构,计算、存储分层弹性伸缩,极致性价比,采用多逻辑集群(Virtual Warehouse,以下简称VW)共享存储技术,实现不同负载的计算隔离和并发扩展,适用于OLAP分析场景。

     

 
 
超强扩展,助力用户便捷高效管理
 

GaussDB(DWS)与传统数据仓库相比,主要有以下特点与显著优势,可以解决多行业超大规模数据与通用平台管理问题:

易使用

 

  • 一站式可视化便捷管理
GaussDB(DWS)让用户能够轻松完成从项目概念到生产部署的整个过程。通过使用GaussDB(DWS)管理控制台,用户不需要安装数据仓库软件,也不需要部署数据仓库服务器,就可以在几分钟之内获得高性能、高可靠的企业级数据仓库集群。
用户只需单击几下鼠标,就可以轻松完成应用程序与数据仓库的连接、数据备份、数据恢复、数据仓库资源和性能监控等运维管理工作。
  • 与大数据无缝集成
用户可以使用标准SQL查询HDFS、对象存储服务(Object Storage Service,OBS)上的数据,数据无需搬迁。
  • 提供一键式异构数据库迁移工具
GaussDB(DWS)提供配套的迁移工具,可支持MySQL、Oracle和Teradata的SQL脚本迁移到GaussDB(DWS)。

高性能

  • 云化分布式架构
GaussDB(DWS)采用全并行的MPP架构数据库,业务数据被分散存储在多个节点上,数据分析任务被推送到数据所在位置就近执行,并行地完成大规模的数据处理工作,实现对数据处理的快速响应。
  • 查询高性能,万亿数据秒级响应

GaussDB(DWS)通过算子并行执行、向量化执行引擎实现指令在寄存器并行执行,以及LLVM动态编译减少查询时冗余的条件逻辑判断,助力数据查询性能提升。

GaussDB(DWS)支持行列混合存储,可以同时为用户提供更优的数据压缩比(列存)、更好的索引性能(列存)、更好的点更新和点查询(行存)性能。

  • 数据加载快
GaussDB(DWS)提供了GDS极速并行大规模数据加载工具。
  • 列存下的数据压缩

对于非活跃的早期数据可以通过压缩来减少空间占用,降低采购和运维成本。

GaussDB(DWS)列存储压缩支持Delta Value Encoding、Dictionary、RLE 、LZ4、ZLIB等压缩算法,且能够根据数据特征自适应的选择压缩算法,平均压缩比7:1。压缩数据可直接访问,对业务透明,极大缩短历史数据访问的准备时间。

易扩展

按需扩展:Shared-Nothing开放架构,可随时根据业务情况增加节点,扩展系统的数据存储能力和查询分析性能。
扩容后性能线性提升:容量和性能随集群规模线性提升,线性比0.8。
扩容不中断业务:扩容过程中支持数据增、删、改、查,及DDL操作(Drop/Truncate/Alter table),表级别扩容技术,扩容期间业务不中断、无感知。

支持在线升级:8.1.1及以上源版本支持大版本在线升级,8.1.3及以上源版本支持补丁在线升级,升级期间用户无需停止业务,业务存在闪级秒断。

 

高可靠

事务管理:支持事务块,用户可以通过start transaction命令显式启动一个事务块;
支持单语句事务,用户不显式启动事务,则单条语句就是一个事务;分布式事务管理;支持全局事务信息管理,包括gxid、snapshot、timestamp的管理,分布式事务状态管理,gxid溢出的处理;分布式事务支持ACID特性,数据强一致保证;支持分布式死锁预防,保证在出现死锁时自动解锁或者预防死锁。
全方位HA设计:GaussDB(DWS)所有的软件进程均有主备保证,集群的协调节点(CN)、数据节点(DN)等逻辑组件全部有主备保证,能够保证在任意单点物理故障的情况下系统依然能够保证数据可靠、一致,同时还能对外提供服务。

安全:GaussDB(DWS)支持数据透明加密,同时可与数据库安全服务(DBSS)对接,基于网络隔离及安全组规则,保护系统和用户隐私及数据安全。GaussDB(DWS)还支持自动数据全量、增量备份,提升数据可靠性。

高可靠

 
按需付费:GaussDB(DWS)按实际使用量和使用时长计费。用户需要支付的费率很低,只需为实际消耗的资源付费。
门槛低无需前期投入较多固定成本,可以从低规格的数据仓库实例起步,后续随时根据业务情况弹性伸缩所需资源,按需开支。
 
 
GaussDB(DWS),多样化的使用方式
 

企业级数据仓库和标准SQL的支持

GaussDB(DWS)为用户提供了PB级高性能数据库,主要体现在:
  • MPP大规模并行处理框架,支持行列混存、向量化执行,实现万亿数据关联分析秒级响应。
  • 内存计算,基于Bloom Filter的Hash Join优化,性能提升2~10倍。
  • 支持全对称分布式的Active-Active多节点集群架构,系统无单点故障。
  • 基于电信技术优化的大规模集群通信,提升计算节点间的传输效率
  • 基于代价的智能优化器,根据集群规模、数据量、生成最优计划,提高执行效率。

多样化的数据导入方式

 

从OBS(对象存储服务)并行导入数据:

  • 使用GDS从远端服务器导入数据;

  • 通过INSERT语句直接写入数据;

  • 使用COPY FROM STDIN导入数据;

  • 使用gsql元命令导入数据;

  • 从MRS导入数据到集群;

  • 使用CDM(云数据迁移服务)迁移数据到GaussDB(DWS);

  • 使用DSC工具迁移SQL脚本;

  • GaussDB(DWS)还支持主流第三方ETL工具进行数据导入。

应用程序接口

支持调用JDBC接口;支持调用ODBC接口;Python第三方psycopg2等标准接口。

支持多种数据库工具

gsql工具;Data Studio工具;GDS工具;DSC SQL语法迁移工具。

 
 
多场景覆盖,打造大数据时代新型数据仓库
 

 

传统数仓替换

传统数据库或数仓产品面临数据存不下、查不出、扩容难、成本高的痛点。GaussDB(DWS)作为新一代全场景数据仓库,具备极致性能、高扩展、极简易用、一站式分析等特性,满足大数据时代企业构建新型数仓的需求。

优势:

  • 平滑迁移

提供配套的迁移工具,支持Teradata、Oracle/Exadata、Greenplum等数据分析系统的平滑迁移。

  • 完备的数据库及SQL能力

支持SQL 2003标准,兼容Oracle/Teradata的部分语法和数据结构,支持全局事务、存储过程、数据强一致性保证。

  • 库仓一体

逻辑集群,支持一套集群容纳数据集市、数据仓库。

一站式BI解决方案

企业积累的海量数据及各种数据资产,体量庞大、需高性能大数据平台支撑进行全量数据分析和挖掘。依托DWS+BI工具打造全局的、直观的、关联性的、可视化的运营数字化分析平台 ,以数据分析来驱动业务价值提升及管理提升。

优势:

  • 多源数据接入

多源数据采集,打破数据孤岛,形成统一的数据展现平台。

  • 统一分析决策平台

统一的数据决策平台,多维分析企业经营数据,有效支撑企业的经营决策。

  • 多场景展现

搭配BI工具多终端数据展现PC端/移动端/大屏,满足业务部门各种报表诉求。

数据湖分析

整合数据资源,构建大数据平台,发现数据价值,成为企业经营的新趋势和迫切诉求。DWS Express可直接对存储在对象存储OBS上的大数据平台集成、处理后的数据进行分析。

优势:

  • 统一分析入口

以DWS的SQL作为上层应用的统一入口,应用开发人员使用熟悉的SQL语言即可访问所有数据。

  • 实时交互式分析

针对即时的分析需求,分析人员通过DWS Express,可实时从大数据平台中获取信息。

  • 弹性伸缩

客户可使用DWS Express提供的由成百上千节点组成的加速集群,相比本地托管集群,效率提升数百倍。

实时数据分析

移动互联网、IoT场景下会产生大量实时数据,为了快速获取数据价值,需要对数据进行实时分析,DWS的快速入库和查询能力可支持实时数据分析。

优势:

  • 流式数据实时入库

IoT、互联网等数据经过流计算及AI服务处理后,可实时写入DWS。

  • 实时监控与预测

围绕数据进行分析和预测,对设备进行监控,对行为进行预测,实现控制和优化。

  • AI融合分析

AI服务对图像、文本等数据的分析结果可在DWS中与其他业务数据进行关联分析,实现融合数据分析。

注:本文素材来自华为云,版权归作者所有