7

公司内部使用的数仓命名规范

 3 years ago
source link: https://www.techug.com/post/naming-standard-of-data-warehouse-used-in-company.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

一、通用命名规范

1、目前主流的命名方法大体分类:大驼峰命名法 (camelCase) 和小驼峰命名法 (snake_case),本规范要求使用小驼峰命名法 (snake_case),统一为小写字符,单词之间使用下划线隔开,贴源层字段可以不遵守,字段命名和源系统保持一致。

2、单词长度不超过 64 个字符,字段或者表命名小于 6 级

3、命名尽量做到见名知意,言简意赅,尽量使用英文以及符合业界要求的字符,特殊情况下可以使用汉语拼音缩写

4、尽量避免使用关键字,确实需要使用关键字情况下使用“`”转义

5、优先使用词根管理规范中已有的关键字,定期维护词根规范表

6、定期 review 新增命名使用的字段规范性

二、表命名规范

1、聚合粒度以及加工频率字段说明

3、数据表命名规范详解

其他字段相关说明

1、数据表 etl 时间字段统一使用 etl_time

2、标志类型的字段,是否类型的,统一使用 int 类型,取值统一使用 0/1,0 代表否,1 代表是,不允许出现空值域(如果有空值则新增取值 2,代表未知)

3、字段命名规范中未说明的部分参照通用命名规范

四、任务命名规范

任务是组成工作流的最小单位,也是完成一次 ETL 的最小开发单位,同时也是调度任务进行失败重试的最小单元。我们要求一个任务只写一张目标表,同时任务的命名中必须包含该目标表的表名。

本文文字及图片出自 InfoQ


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK