天才一秒记住【长江书屋】地址:https://www.cjshuwu.com
push机制通常采用在线方式工作y可以把数据变化传播到目标数据存储
结构。
数据转换
包括数据重构和整合数据内容清洗或集成
数据加载
对整个目标数据存储结构进行刷新y或者只是对目标数据存储进行增量更
新。
早期的etl解决方案通常以固定的周期运行批处理工作y从平面文件和
关系数据库中捕捉数据y并把这些数据整合到数据仓库中最近这几年y
商业etl工具供应商已经对产品做了很大的改进y对产品功能进行了扩
展y具体如下x
1额外的数据源
2额外的目标
3改进的数据转换功能
4更好的管理
5更好的性能
6改进的可用性
7增强的安全性
8支持基于数据联邦的数据集成方法
数据抽取模块的功能x
1确定数据源y即从哪些源系统进行数据抽取。
2定义数据接口y对每个源文件及系统的每个字段进行详细说明。
3确定数据抽取的方式x是主动抽取还是由源系统推送y是增量抽取。
还是全量抽取y是每日抽取还是每月抽取。
数据清洗与切换
数据清洗与转换x
数据清洗主要是对不完整数据错误数据重复数据进行处理
数据转换包括如下操作
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!