文档介绍:Informatica技术解决方案
提交人: 闫东
联系电话: 010-82705218
提交日期: 2018-05-05
版本号:
目录
序言 1
Informatica公司介绍 1
Informatica公司针对各行业的解决方案及特点 3
2 设计理念 9
设计理念的先进性 9
设计理念的符合性 12
3 基本功能 14
字段级的操作,主要包括:字段映射,映射的自动匹配,字段的拆分,多字段的混合运算,自动完成时间类型的转换 14
记录级的操作,主要包括:去重复记录,记录间合并或计算,记录拆分等 15
表级的操作,主要包括:代理键的生成,行列变换,排序,统计,制造样品数据 16
数据库级的操作,主要包括:对各种码表的支持包括GBK(必需)、Unicode(必需)、ASCII(必需) 17
4 技术特点 21
跨异构数据库的关联、支持关联条件的复杂程度、自定义函数的实现、过滤条件的复杂程度 21
支持的数据类型,包括Binaray、Date/Time、Decimal、Double、Integer、String、Text、Real、Small Integer等 21
抽取断点,支持参数抽取的灵活程度,如何抽取远程数据,抽取数据的事务处理支持,抽取的字段是否可以动态修改,对抽取的环境变量配置情况,环境变量是否可以动态修改 23
是否支持脏读,数据的提交方式,支持各种数据库的批量装载功能包括Oracle(必需)、informix、DB2、SQL Server,针对不同数据库是否具有批量加载能力包括Oracle(必需),informix,DB2,Sybase,teradata 27
在转换过程中是否支持数据比较的功能,在设计调试时能否对每个转换环节进行数据预览,在设计调试时能否对每个转换环节进行性能监控,在转换过程中是否支持按行按列的分组聚合,能否提供直观的视图、灵活的配置以及能否自定义功能,是否提供丰富的转换函数,是否支持诸如validate、 translate、 Hierarchy Flattern,Map,Merge 等转换功能,ETL过程中数据转换的可追溯能力 29
不同类型运算所耗的系统资源状况,包括常见的Join、lookup、mapping、aggreagation、sort、pivot、filter等 40
是否内置提供数据预览和数据质量评估的功能 41
是否内置提供具有强大的元数据管理功能 45
对于实时ETL及按需ETL的支持 51
5 整体架构 53
对平台的支持,支持主流的操作系统平台包括Sun Solaris,HP-UX(必需), IBM AIX(必需), Linux, Windows(必需)等。 53
对数据源的支持,支持常见的数据源,包括Oracle(必需),DB2(必需),Informix(必需),Sybase,SQL server,Teradata,SAS,Text(必需),Excel,SAP R/3,PeopleSpft,Sieble,IMS,VSAM,QSAM on 390,用户自定义文件,FTP(必需),XML(必需),Message Queue,Email,Weblog,OleDB,其它 54
支持数据库的种类、连接方式、配置方式及是否随产品打包,包括Oracle(必需),DB2(必需),Informix(必需),Sybase,SQL server 56
产品自身并行处理能力,对并行数据库的支持情况如Oracle RAC/OPS,系统的线性可扩展性 56
是否支持远端的数据抽取和加载功能 59
对错误恢复逻辑的支持,对异常情况的处理是否得当,对于出现差错的流程是否支持异常控制、错误告警以及错误流程恢复的加载 60
对中间存储的支持 65
产品可编程的灵活性如何,模块化的设计能力 65
能否根据日志监测源数据的变化,是否支持增量抽取,增量抽取的处理方式,增量加载的处理方式,是否提供数据更新的时间点或周期,以便可以灵活处理 67
对元数据的管理,主要包括:元数据存储的提取方式、元数据存储的开放性、元数据存储的可移植性、是否提供多种方式访问元数据、元数据的版本控制程度、是否支持开放的元数据标准如CWM、是否支持XML进行元数据交换、是否支持分布式的元数据访问和管理、是否生成元数据报表、是否支持ETL过程的冲突分析、是否支持基于元数据的查询功能、是否支持ETL过程的流程分析等。 68
可以实现