射频和无线供应商和资源的家

一站式满足您的射频和无线需求

数据挖掘教程|数据挖掘基础

本数据挖掘教程涵盖了数据挖掘基础知识,包括数据挖掘架构工作、公司、应用程序或用例、优势或好处等。的数据挖掘教程还提到了其他数据挖掘资源的链接,包括工具和技术等。

定义:
数据挖掘是指从大量数据中提取知识的术语。它可以类似于金矿,从深处的沙子、石头和灰尘中提取黄金。例如从amazon或flipkart等大量数据库中搜索特定规格或定价的手机,以及在谷歌或其他搜索引擎上搜索特定的模式或查询。这是指从数据库或数据仓库中大量可用的数据中提取出我们感兴趣的数据。

数据挖掘使用搜索算法、工具和技术,以提供优秀的用户性能。许多公司正在世界各地开发软件工具,以提供不同形式的数据分析。主要的数据挖掘工具有IBM的SPSS Clementine和Intelligent Miner, SGI的MineSet, SAS的Enterprise Miner等。以下是数据挖掘的用例或应用。

数据挖掘应用或用例

以下是数据挖掘在不同领域的应用或用例:
•银行业务:根据老客户预测好客户,审批贷款/信用卡
•客户关系管理:确定哪些人可能会跳槽到竞争对手那里。
•目标营销:确定促销活动的可能反应者
•欺诈检测:从电信、金融交易的在线事件流中识别欺诈事件
•制造生产:工艺参数变化时自动调节旋钮
•医学:疾病结局、治疗效果
•分析患者病史:寻找疾病之间的关系
•分子/制药:识别新药
•科学数据分析:通过搜索子星系团来识别新的星系
•网站/商店设计和推广:发现访问者对页面的亲和力并修改布局

数据挖掘过程包括以下所有步骤:
•数据选择•预处理:清洗•转换•挖掘•结果评估•可视化

数据挖掘体系结构工作

数据挖掘体系结构工作

图1描述了数据挖掘架构工作。让我们以在亚马逊网站上搜索1万到1.5万的智能手机为例。

➨在底部,图描述了要从哪里获取数据的数据源。它包括数据库、数据仓库、万维网和其他存储库。
➨下一步涉及到数据清洗、数据选择和数据集成。数据清理指的是删除不需要的数据以及其中的噪声。解析器执行这个清理操作。数据选择是指从海量的可用数据中筛选出感兴趣的数据。数据集成是指对数据进行聚合或组合,并将集成后的数据存储在数据库中。
➨数据仓库服务器或数据库服务器为用户的请求提供服务,即它根据用户的兴趣查找、提取并提供相关数据。即数据挖掘请求。
➨数据挖掘引擎:这是数据挖掘系统中非常重要的模块。它可以完成各种任务,包括描述、预测、关联、相关分析、分类、聚类分析等。它与数据库或仓库、知识库和模式评估模块相互作用。

数据挖掘是如何工作的

➨模式评估:此组件或模块与其他模块交互,以根据用户给定的模式集中搜索。如果请求的查询是前面的查询之一,则从前面存储的知识库中获得结果。这是存储所有搜索查询结果的地方,以便下次如果搜索相同的模式,数据挖掘过程不需要经历所有步骤,而是将从其数据库中交付结果。图2显示了派生这个知识库所涉及的步骤。它包括目标数据的提取、预处理数据、转换数据、搜索模式的确定和结果在知识库中的存储。
➨用户界面:该模块帮助用户向数据挖掘系统提出搜索查询,以定位10K至15K范围内的智能手机。其余的工作由数据挖掘体系结构为用户完成。

数据挖掘的好处或优势

以下是好处或数据挖掘的优势无论是个人还是组织。
•它有助于根据用户行为和数据模式识别欺诈交易。这将有助于银行以及金融机构根据用户行为发放贷款、信用卡等。
•它有助于让客户根据他们以前的购买行为和谷歌上的搜索模式,根据相关的广告活动来购买产品。因此,机器学习等数据挖掘技术有助于提高企业的销售额。谷歌和其他搜索引擎利用它在网页上推送相关广告。这将使客户、广告商和营销公司受益。
•根据客户反馈和以前的购买情况,它有助于改善零售和其他杂货店的布局。这将有助于零售商店把最畅销的商品放在正确的地方,以引起顾客的高度关注。
•它有助于在流行的电子商务网站上搜索和选择正确的产品,如亚马逊,flipkart等。

对…有完全的了解数据挖掘基础,参考所有数据挖掘教程的链接。

数据挖掘教程相关链接

数据挖掘工具和技术云存储教程什么是云存储类型基础设施它是如何工作的传统存储与云存储服务提供商云存储安全云计算教程


分享本页

翻译本页
Baidu