时间:2021-07-01 10:21:17 帮助过:55人阅读
关键性能指示器和数据挖掘预测的可靠性完全取决于数据的有效性。尽管有效数据对于做出商业决策的重要性日益增强,但确保数据有效性的难度也在不断加大。数据正在源源不断地从各种系统和源流入您的企业和大量用户。 很难定义数据质量的度量标准,因为它们针对
关键性能指示器和数据挖掘预测的可靠性完全取决于数据的有效性。尽管有效数据对于做出商业决策的重要性日益增强,但确保数据有效性的难度也在不断加大。数据正在源源不断地从各种系统和源流入您的企业和大量用户。
很难定义数据质量的度量标准,因为它们针对于特定的域或应用程序。定义数据质量的一个常用方法是数据事件探查。
数据配置文件是有关数据的汇总统计的集合,可能包含下列内容:
• 用户表中的行数。
• State 列中非重复值的数量。
• Zip 列中空值或缺少值的数量。
• City 列中的值的分布情况。
• Zip 列中 State 列的函数依赖关系的强度,即对于给定的 zip 值,此状态应始终不变。
在此演示中,我们假设贵公司对客户端信息有特定的数据质量要求。如下所示。
a. 每个客户端必须是唯一可识别的客户端,且不能包括任何重复内容
b. 人口统计信息不得为空
c. 城市应包含相应的国家地区代码组合
步骤
启动(使用 Hyper-V)
注意:由于某些虚拟机配置和实验环境设置,很可能不需要您启动 Hyper-V Manager即可启动实验环境。在某些实验环境中,也不要求您登录到虚拟机,因为此配置可能已预设或保存。
1. 从Start菜单启动 Hyper-V Manager。
2. 右键选择 Bin07_SQL2008HOLS,然后单击Start。
3. 再双击Bin07_SQL2008HOLS,打开虚拟机窗口。
4. 您可以按Ctrl+Alt+Break将虚拟机切换到全屏显示。若要将虚拟机切换回窗口显示,则再次按下Ctrl+Alt+Break。
5. 使用密码 pass@word1 以Student 身份登录
在 Business Intelligence Development Studio 中启动 SSIS 解决方案。
解决方案资源管理器是 Microsoft 中的一个组件,您可以用来查看和管理项目。 6. 单击Start | All Programs | Microsoft SQL Server 2008。右键单击 SQL Business Intelligence Development Studio,然后选择Run as Administrator。在出现提示时单击Continue。
7. 单击File | New Project,然后从商业智能项目类型中在 Visual Studio 安装的模板下选择 Integration Services Project。
8. 在New Project对话框的Solution Name文本框中键入 SSISAdvancedLAB 作为解决方案名称
9. 将Location更改为:C:\SSISHOLS\SSIS。
10. 单击OK