Smart Community(1)之设计规范

2023-09-16 21:12:10

通过前面大数据开发相关知识的学习,准备做一个项目进行练习---我给他起了一个响亮的名字:基于HadoopHA的智慧社区服务平台

设计规范:

做一个项目之前肯定要先规定一些开发过程中的设计规范

(一)数据埋点规范:

数据埋点:是一种在软件、应用程序或网站中插入代码的技术,用于收集和跟踪用户行为和事件的数据。通过在关键位置插入代码片段(埋点),可以记录用户在应用程序中的操作和交互,以及其他有关系统和用户行为的信息。

(1)确保灵活、高可扩展

(2)兼顾后续的处理、分析的方便性

(3)确保可跟踪、数据正确性

(4)业务数据打通

(5)考虑不同C端产品特性与用户体验

(6)确保性能、敏感数据安全性

(二)数仓层次设计规范:

 ODS层:是原始数据层,是最接近数据源的一层,将数据源中的数据经过ETL之后装入ODS层,ODS的数据结构一般与数据来源保持一致,便于减少ETL工作的复杂性。

DWD层:是明细数据层,进行维度建模,该层的表结构和粒度与原始表保持一致,不过对ODS层数据进行清洗、维度退化、脱敏等,最终得到的数据是干净的,完整的,一致的数据。一般采用星型模型,呈现的状态一般为星座模型。 维度建模一般分为四步: 选择业务过程(先选择容易实现的)、 声明粒度(以最低的原子粒度处理数据)、 确认维度(考虑其他维度是否可以被属性化)、 确认事实(确认将那些事实---(指的是度量值,一些具体数据)放入事实表中)。

DWS层:服务数据层,基于DWD层的明细数据,按天轻度汇总成某一个主题域的服务数据,一般是宽表。DWS层统计各个主题对象的当天行为,以及一些业务明细数据,服务于DM(数据集市)层的某个主题。

(三)表命名规范:

英文在不是原意的情况下采用缩写,避免数字开头

能够合理的区分出表所描述的数据域、数据周期等。 命名规范设定:

层次_数据域_修饰/描述_范围/周期

订单相关数据表

dwd层: d_ord_info_d

dws层: s_ord_st_d

维度表(dimension

用户维度: dim_user_d

商品缓慢渐变维表: dim_product_l

ods层

对于ods层表,最好能够区分数据来源,包括在来自什么系统、源数据名称。

eg 从业务系统全量采集订单(loan_order)数据到ods层 业务系统编码: buss 业务系统订单表: loan_order ods层表命名: o_buss_loan_order_d

(四)脚本命名规范:

•ETL脚本名称尽可能和所产出的表同名 •数据采集、 数据推送脚本尽可能标识数据去向

•ETL脚本若产生多个表, 采用对应的数据域和语义描述命名

•Jar包命名以实际的业务处理逻辑语义描述为主,调度任务命名同样尽量以产出表名命名。

eg:

订单ETL过程 从表o_buss_loan_order_d整理数据并且装载到dwd层表d_ord_info_d中。

ETL脚本命名: d_ord_info_d.sh

ETL任务命名: d_ord_info_d 一个ETL脚本产出多个表,比如从商品表中分离出商品维度、厂家维度。

ETL脚本命名: dim_product_mfrs_d.sh

ETL任务名称: dim_product_mfrs_d 采集数据到ods层的表o_buss_loan_order_d imp_o_buss_loan_order_d.sh

数据表dm_ord_trsfm_d推送到BI系统 exp_bi_dm_ord_trsm_d.sh

(五)开发规范:

数仓中MR程序尽可能统一输入参数、输出参数,单个jar程序的功能模块清晰,避免多种处理逻辑写入一个jar包。

每个ETL脚本尽可能产出一张数仓表,方便任务排查,同时也减少数仓表的耦合性。

ETL脚本格式、备注清晰,避免大范围、格式杂乱的脚本,合理利用临时表。

字段列对齐 关键字列对齐

禁止使用Tab, 全部使用4个空格代替

更多推荐

微服务07-认识MQ+RabbitMQ入门

1.前言了解同步调用和异步调用1.1.同步调用比如这里的支付服务,需要等待订单服务、短信服务…执行完毕才能执行,这样支付整个流程完毕需要500ms然后如果订单、仓储等其中一个服务挂掉了,那么支付服务请求请求不了,挂掉的服务越来越多,级联失败;——>服务提供者出现问题,那么整个微服务都会出现故障;资源浪费:消费者需要等待

C#多线程

一、多线程实现方式1.使⽤Thread类:System.Threading.Thread类是C#中最基本的多线程编程⼯具。2.使⽤ThreadPool:线程池是⼀个管理和重⽤线程的机制,它可以在应⽤程序中创建和使⽤多个线程,⽽⽆需显式地管理线程的⽣命周期。你可以使⽤ThreadPool.QueueUserWorkIte

测试工程师面试之设计测试用例

以下的问题答案,仅供参考,如小伙伴们有更好的答案,欢迎大家评论区留言,谢谢大家测试工程师面试之设计测试用例1、请说一说简单用户界面登陆过程都需要做哪些分析2、请对此系统设计测试用例:一个系统,多个摄像头,抓拍车牌,识别车牌,上传网上,网上展示3、请你对吃鸡游戏进行压力测试4、请对朋友圈点赞功能进行测试5、如果做一个杯子

【国漫逆袭】火灵儿重返第一巅峰,云曦排名飙升,不良人陷入颓势

Hello,小伙伴们,我是小郑继续为大家深度解析完国漫资讯。为了增加平台用户的活跃程度,也为了了解观众对作品和角色的喜爱,小企鹅推出各式各样榜单,其中就包括【动漫角色榜】,目前周榜已经更新,相比起上周榜单,本周的榜单有了明显变化,接下来就随小郑一起来看一下吧!①完美再次发力在该榜单开始之后,《完美世界》各大角色排名一直

Keepalived+LVS高可用集群

目录一、keepalived介绍:二、keepalived工具介绍:(1)管理LVS负载均衡软件:(2)支持故障自动切换:(3)实现LVS负载调度器、节点服务器的高可用性(HA):三、Keepalived体系主要模块:四、keepalived脑裂及解决办法:1、Keepalive脑裂:2.脑裂原因:3.脑裂应对策略:五

安卓可视大屏寻呼台 兼容标准sip协议

SV-A32i安卓可视大屏寻呼台兼容标准sip协议A32i是专门针对行业用户需求研发的一款可视大屏寻呼台产品,配备鹅颈麦克风,支持高清免提通话。基于Android9.0系统,可支持第三方Android应用安装使用,界面使用便捷。采用10.1英寸彩色触摸屏,内置蓝牙5.0模块和2.4G/5GWi-Fi模块,同时集成USB

Jmeter和Postman那个工具更适合做接口测试?

软件测试行业做功能测试和接口测试的人相对比较多。在测试工作中,有高手,自然也会有小白,但有一点我们无法否认,就是每一个高手都是从小白开始的,所以今天我们就来谈谈一大部分人在做的接口测试,小白变高手也许你只差这一次深入了解!一、接口测试的目的已经是老生常谈了,我想不用我说,凡是说到接口总会被问及这个话题,的确,没有目标就

用开源代码构建机器人需要考虑的问题

导读或许你正在考虑(或正在进行)将机器人使用开源软件推向市场。这个机器人是基于linux构建的。也许你正在使用机器人操作系统(ROS)或任务导向操作套件(MOOS),或者是另外一个可以帮助你简化开发过程的开源中间件。当开发接近实用化,对回报的期望开始给你带来一些压力。你可能会被问到“我们的产品什么时候可以开始销售?”,

7.2.7 【MySQL】用于分组

有时候我们为了方便统计表中的一些信息,会把表中的记录按照某些列进行分组。比如下边这个分组查询:SELECTname,birthday,phone_number,COUNT(*)FROMperson_infoGROUPBYname,birthday这个查询语句相当于做了3次分组操作:1.先把记录按照name值进行分组,所

基于Java+SpringBoot+Vue前后端分离网络海鲜市场系统设计和实现

博主介绍:✌全网粉丝30W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌🍅文末获取源码联系🍅👇🏻精彩专栏推荐订阅👇🏻不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题

强化学习从基础到进阶-案例与实践[4.2]:深度Q网络DQN-Cart pole游戏展示

【强化学习原理+项目专栏】必看系列:单智能体、多智能体算法原理+项目实战、相关技巧(调参、画图等、趣味项目实现、学术应用项目实现专栏详细介绍:【强化学习原理+项目专栏】必看系列:单智能体、多智能体算法原理+项目实战、相关技巧(调参、画图等、趣味项目实现、学术应用项目实现对于深度强化学习这块规划为:基础单智能算法教学(g

热文推荐