公司内部使用的数仓命名规范
一、通用命名规范
1、目前主流的命名方法大体分类:大驼峰命名法 (camelCase) 和小驼峰命名法 (snake_case),本规范要求使用小驼峰命名法 (snake_case),统一为小写字符,单词之间使用下划线隔开,贴源层字段可以不遵守,字段命名和源系统保持一致。
2、单词长度不超过 64 个字符,字段或者表命名小于 6 级
3、命名尽量做到见名知意,言简意赅,尽量使用英文以及符合业界要求的字符,特殊情况下可以使用汉语拼音缩写
4、尽量避免使用关键字,确实需要使用关键字情况下使用“`”转义
5、优先使用词根管理规范中已有的关键字,定期维护词根规范表
6、定期 review 新增命名使用的字段规范性
二、表命名规范
1、聚合粒度以及加工频率字段说明
3、数据表命名规范详解
其他字段相关说明
1、数据表 etl 时间字段统一使用 etl_time
2、标志类型的字段,是否类型的,统一使用 int 类型,取值统一使用 0/1,0 代表否,1 代表是,不允许出现空值域(如果有空值则新增取值 2,代表未知)
3、字段命名规范中未说明的部分参照通用命名规范
四、任务命名规范
任务是组成工作流的最小单位,也是完成一次 ETL 的最小开发单位,同时也是调度任务进行失败重试的最小单元。我们要求一个任务只写一张目标表,同时任务的命名中必须包含该目标表的表名。
本文文字及图片出自 InfoQ
本文文字及图片出自
你也许感兴趣的:
- 【外评】如果人工智能能胜任你的工作,也许它还能取代你的首席执行官
- 【外评】为什么你的 Linux 内核错误报告可能毫无结果?
- 【外评】人工智能提供假冒的 Facebook 客户服务电话导致一男子陷入骗局
- 【外评】谷歌浏览器(Google Chrome)将关闭扩展系统 Manifest V2,开启更严格的 Manifest V3
- 【外评】泄露API文档揭示谷歌搜索如何把守互联网大门
- 【外评】训练与聊天不同:ChatGPT 和其他 LLM 不会记住你说的每一句话
- 【外评】谷歌搜索 API 文档泄露
- 【外评】大数据已死
- 如何在家培育食盐或氯化钠大晶体
- 【译论】是什么原因导致 Windows 11 的性能比 Windows XP 差得多?
共有 1 条讨论