数据清洗过滤器OpenRefine是一款专业的大数据清洗工具,具有优化数据质量的擢用,数据经常被称为一座金矿,要不断的进行维护处理,小编推荐的这款OpenRefine非常的实用,有需要的赶快下载吧!
软件特色
Data Profiling也叫做数据考古(Data Archeology),是数据集(Data Set)内部为达一致性、单值性和逻辑性而进行的数值质量的统计分析及评估。数据剖析是Olson于2003年提出的概念,使用分析技术来发现正确的、结构化的、有内容、有质量的数据。换句话说,它是评估你的数据和信息的当前状态以及包含了多少错误的方法。
Data Cleaning是尝试通过移除空的数据行或重复的数据行、过滤数据行、聚集或转换数据值、分开多值单元等,以半自动化的方式修复错误数据的过程。数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认。
安装方法
1、OpenRefine在Windows的安装
下载ZIP包
解压到某个目录;
要运行OpenRefine,双击openrefine.exe文件。
2、OpenRefine在Mac的安装
下载DMG文件
打开磁盘镜像,拖动OpenRefine的图标到Applications目录;
双击图标以启动OpenRefine。
3、OpenRefine在Linux的安装
下载gzipped包
解压到当前用户的home目录;
在终端命令行环境,键入./refine以启动OpenRefine。
∨ 展开