11---
2- title : Databend 免拷贝数据共享的工作原理
2+ title : Databend 免拷贝数据共享(Data Sharing)工作原理
33---
44
55## 什么是数据共享?
66
7- 不同团队需要相同数据的不同部分。传统解决方案需要多次复制数据,成本高昂且难以维护 。
7+ 不同团队需要相同数据的不同部分。传统解决方案需要多次复制数据,导致成本高昂且难以维护 。
88
9- Databend 的 ** [ ATTACH TABLE] ( /sql/sql-commands/ddl/table/attach-table ) ** 优雅地解决了这个问题:为同一份数据创建多个视图而无需复制 。这利用了 Databend 的** 真正存储计算分离 ** 架构——无论使用云存储还是本地对象存储: ** 存储一次,随处访问** 。
9+ Databend 的 ** [ ATTACH TABLE] ( /sql/sql-commands/ddl/table/attach-table ) ** 优雅地解决了这一问题:为相同数据创建多个“视图”而无需复制 。这利用了 Databend 的** 真正计算存储分离 ** 架构——无论使用云存储还是本地对象存储,都能实现 ** 存储一次,随处访问** 。
1010
11- 可以将 ATTACH TABLE 想象成计算机快捷方式——它们指向原始文件而不复制文件 。
11+ 可以将 ATTACH TABLE 类比为计算机快捷方式——它指向原始文件而不复制文件 。
1212
1313```
14- 对象存储( Object Storage) (S3, MinIO, Azure 等 )
14+ Object Storage (S3, MinIO, Azure, etc. )
1515 ┌─────────────┐
16- │ 您的数据 │
16+ │ Your Data │
1717 └──────┬──────┘
1818 │
1919 ┌───────────────────────┼───────────────────────┐
2020 │ │ │
2121 ▼ ▼ ▼
2222┌─────────────┐ ┌─────────────┐ ┌─────────────┐
23- │ 营销团队 │ │ 财务团队 │ │ 销售团队 │
24- │ 视图 │ │ 视图 │ │ 视图 │
23+ │ Marketing │ │ Finance │ │ Sales │
24+ │ Team View │ │ Team View │ │ Team View │
2525└─────────────┘ └─────────────┘ └─────────────┘
2626```
2727
@@ -30,34 +30,34 @@ Databend 的 **[ATTACH TABLE](/sql/sql-commands/ddl/table/attach-table)** 优雅
3030** 步骤 1:查找数据位置**
3131``` sql
3232SELECT snapshot_location FROM FUSE_SNAPSHOT(' default' , ' company_sales' );
33- -- 结果: 1/23351/_ss/... → 数据位于 s3://your-bucket/1/23351/
33+ -- Result: 1/23351/_ss/... → Data at s3://your-bucket/1/23351/
3434```
3535
3636** 步骤 2:创建团队特定视图**
3737``` sql
38- -- 营销:客户行为分析
38+ -- Marketing: Customer behavior analysis
3939ATTACH TABLE marketing_view (customer_id, product, amount, order_date)
4040' s3://your-bucket/1/23351/' CONNECTION = (ACCESS_KEY_ID = ' xxx' , SECRET_ACCESS_KEY = ' yyy' );
4141
42- -- 财务:收入跟踪
42+ -- Finance: Revenue tracking
4343ATTACH TABLE finance_view (order_id, amount, profit, order_date)
4444' s3://your-bucket/1/23351/' CONNECTION = (ACCESS_KEY_ID = ' xxx' , SECRET_ACCESS_KEY = ' yyy' );
4545
46- -- 人力资源:员工信息(不含薪资)
46+ -- HR: Employee info without salaries
4747ATTACH TABLE hr_employees (employee_id, name, department)
4848' s3://data/1/23351/' CONNECTION = (...);
4949
50- -- 开发:生产结构(不含敏感数据)
50+ -- Development: Production structure without sensitive data
5151ATTACH TABLE dev_customers (customer_id, country, created_date)
5252' s3://data/1/23351/' CONNECTION = (...);
5353```
5454
5555** 步骤 3:独立查询**
5656``` sql
57- -- 营销分析趋势
57+ -- Marketing analyzes trends
5858SELECT product, COUNT (* ) FROM marketing_view GROUP BY product;
5959
60- -- 财务跟踪利润
60+ -- Finance tracks profit
6161SELECT order_date, SUM (profit) FROM finance_view GROUP BY order_date;
6262```
6363
@@ -66,14 +66,14 @@ SELECT order_date, SUM(profit) FROM finance_view GROUP BY order_date;
6666** 实时更新** :当源数据发生变化时,所有附加表都能立即看到更新。
6767``` sql
6868INSERT INTO company_sales
VALUES (
1001 ,
501 ,
' Laptop' ,
1299 .
99 ,
299 .
99 ,
' [email protected] ' ,
' 2024-01-20' );
69- SELECT COUNT (* ) FROM marketing_view WHERE order_date = ' 2024-01-20' ; -- 返回: 1
69+ SELECT COUNT (* ) FROM marketing_view WHERE order_date = ' 2024-01-20' ; -- Returns: 1
7070```
7171
72- ** 列级安全性 ** :团队只能看到他们需要的内容——营销团队看不到利润,财务团队看不到客户邮箱 。
72+ ** 列级安全 ** :团队只能看到各自需要的内容——营销团队无法看到利润,财务团队无法看到客户邮箱 。
7373
74- ** 强一致性** :永远不会读取部分更新,始终看到完整快照——非常适合财务报告和合规性要求 。
74+ ** 强一致性** :永远不会读取部分更新,始终访问完整快照——非常适合财务报告和合规要求 。
7575
76- ** 完整性能** :所有索引(Index)自动生效,性能与常规表相同 。
76+ ** 完整性能** :所有索引(Index)自动生效,与常规表速度相同 。
7777
7878## 为什么这很重要
7979
@@ -88,7 +88,7 @@ SELECT COUNT(*) FROM marketing_view WHERE order_date = '2024-01-20'; -- 返回
8888## 底层工作原理
8989
9090```
91- 查询( Query): SELECT product, SUM(amount) FROM marketing_view GROUP BY product
91+ Query: SELECT product, SUM(amount) FROM marketing_view GROUP BY product
9292
9393┌─────────────────────────────────────────────────────────────────┐
9494│ 查询执行流程 │
@@ -130,6 +130,6 @@ SELECT COUNT(*) FROM marketing_view WHERE order_date = '2024-01-20'; -- 返回
130130 结果:产品销售摘要
131131```
132132
133- 多个 Databend 集群可以同时执行此流程而无需协调——真正的存储计算分离在实际应用中的体现 。
133+ 多个 Databend 集群可以同时执行此流程而无需协调——这是真正计算存储分离的实际体现 。
134134
135- ATTACH TABLE 代表了一个根本性转变:** 从为每个用例复制数据转向一个副本多个视图 ** 。无论在云环境还是本地环境中,Databend 的架构都能实现强大、高效的数据共享,同时保持企业级的一致性和安全性 。
135+ ATTACH TABLE 代表了一个根本性转变:** 从为每个用例复制数据转变为单一副本支持多个视图 ** 。无论在云环境还是本地环境中,Databend 的架构都能实现强大、高效的数据共享,同时保持企业级一致性和安全性 。
0 commit comments