1、隐含性:数据挖掘是要发现深藏在数据内部的知识,而不是那些直接浮现在数据表面的信息。常用的BI工具,例如报表和OLAP,完全可以让用户找出这些信息。新奇性:挖掘出来的知识应该是以前未知的,否则只不过是验证了业务专家的经验而已。只有全新的知识,才可以帮助企业获得进一步的洞察力。
2、模式识别、粗糙集、模糊数学等相关技术。数据挖掘的技术可分为:统计方法、机器学习方法、神经网络方法和数据库方法。而统计方法可细分为:回归分析、判别分析。神经网络方法可细分为:前向神经网络、自组织神经网络等。数据库方法主要是基于可视化的多维数据分析或OLAP方法,另外还有面向属性的归纳方法。
3、大数据的价值在于挖掘其中隐藏的珍贵信息,尽管数据密度低,但通过机器算法和业务逻辑,能够发掘出显著价值。数据增长速度快,处理要求实时,数据的准确性和可信度也至关重要。数据仓库作为商业智能的核心组件,是企业整合和分析数据的中心。