GeoKettle¶
抽取、转换与装载(Extract Transform Load ,即 ETL)¶
GeoKettle 是一套以 Pentaho Data Integration 数据集成工具(又名 Kettle)为基础而具备空间信息处理功能的软件系统。作为一套强大的抽取、转换与装载平台,GeoKettle 通过基于元数据的工作方法建立和更新各类地理信息数据库、数据仓库与网络服务。
GeoKettle 使用户得以从数据源抽取所需的信息,完成数据的清理、纠错和结构转换,从而得到符合一定标准的数据,并将其装载进入数据库管理系统、GIS 数据库文件或网络服务平台中。对于解决复杂、海量数据的自动化处理,数据格式转换,数据库输入、迁移等问题,GeoKettle 能够提供无需编程工作即可实现的有效解决方案。
在地理空间信息软件领域,GeoKettle 类似于 Feature Manipulation Engine ,一款私有的商业性 ETL 工具。作为一款稳定,高效,兼容国际标准,拥有数百种功能,支持读写大量的数据格式、服务和数据库的 ETL 产品,GeoKettle 被全球包括政府机构、银行、保险、空间信息集成在内的众多机构选用。
基本特性¶
- 数据抽取:
- 超过 35 种数据库,包括 MySQL 、PostgreSQL/PostGIS 、Oracle 等
- XML 文件
- XLS 文件
- Xbase 文件(dBase 、Foxpro 等)
- 文件系统信息
- 派生数据
- 微软 Access 系统数据
- LDAP 轻量名录存取协议
- GeoMondrian 空间信息联机处理系统(SOLAP)
- 空间数据文件:Shapefile 、GML 3.1.1 、KML 2.2 及所有 OGR 开放向量数据格式
- OGC 开放地理空间信息联盟标准网络服务:地理要素(WFS)、传感器数据(SOS)、编目数据(CSW)
- 数据转换:
- 引擎式处理系统(非代码生成器)
- 从数据库、数据文件或内存读取
- 基本运算功能
- Javascript 、SQL 及正则脚本
- 数据分割
- 制图
- 选取
- 切分
- 过滤
- 合并
- 连接
- 复制
- 并行计算支持
- 主元变换
- 空间分析:缓冲区、几何中心、距离、交集、并集等
- 高级空间运算:剪切, 德劳奈三角化, 几何边界抽稀/平滑, 要素拆分等
- 空间聚合
- 图形预览
- 数据装载
- 数据库:MySQL 、PostgreSQL/PostGIS 、Oracle 等
- 数据仓库 population
- 空间数据格式:Shapefile(shp)、GML 3.1.1 、KML 2.2 、所有 OGR 标准格式
- OGC 网络服务:网络编目服务(CSW)等
- 切分装载
- 批量装载
- 并行装载
- 分布式装载
- 操作环境 * 通过名为“Spoon”的图形界面可以设置转换过程的所有选项 * 命令行界面亦可用于执行操作 * 网络服务:远程执行与分布式运算适用于处理超大型的数据集 * Java 开发接口 * 插件支持
遵循的标准¶
- OGC 开放地理空间信息联盟标准(SFS 、CSW 、SOS)
相关信息¶
官方网站: http://www.geokettle.org/
发布协议: GNU Lesser General Public License (LGPL) version 2.1
软件版本: 2.6
平台支持: Windows, Linux, Mac, Solaris
接口语言: Java, Javascript
帮助文档: http://www.spatialytics.org & http://www.spatialytics.com