GeoKettle¶
抽取、转换与装载(Extract Transform Load ,即 ETL)¶
GeoKettle 是一套以 Pentaho Data Integration 数据集成工具(又名 Kettle)为基础而具备空间信息处理功能的软件系统。作为一套强大的抽取、转换与装载平台,GeoKettle 通过基于元数据的工作方法建立和更新各类地理信息数据库、数据仓库与网络服务。
GeoKettle 使用户得以从数据源抽取所需的信息,完成数据的清理、纠错和结构转换,从而得到符合一定标准的数据,并将其装载进入数据库管理系统、GIS 数据库文件或网络服务平台中。对于解决复杂、海量数据的自动化处理,数据格式转换,数据库输入、迁移等问题,GeoKettle 能够提供无需编程工作即可实现的有效解决方案。
在地理空间信息软件领域,GeoKettle 类似于 Feature Manipulation Engine ,一款私有的商业性 ETL 工具。作为一款稳定,高效,兼容国际标准,拥有数百种功能,支持读写大量的数据格式、服务和数据库的 ETL 产品,GeoKettle 被全球包括政府机构、银行、保险、空间信息集成在内的众多机构选用。
基本特性¶
- 数据抽取:
- 超过 35 种数据库,包括 MySQL 、PostgreSQL/PostGIS 、Oracle 等
 - XML 文件
 - XLS 文件
 - Xbase 文件(dBase 、Foxpro 等)
 - 文件系统信息
 - 派生数据
 - 微软 Access 系统数据
 - LDAP 轻量名录存取协议
 - GeoMondrian 空间信息联机处理系统(SOLAP)
 - 空间数据文件:Shapefile 、GML 3.1.1 、KML 2.2 及所有 OGR 开放向量数据格式
 - OGC 开放地理空间信息联盟标准网络服务:地理要素(WFS)、传感器数据(SOS)、编目数据(CSW)
 
 - 数据转换:
- 引擎式处理系统(非代码生成器)
 - 从数据库、数据文件或内存读取
 - 基本运算功能
 - Javascript 、SQL 及正则脚本
 - 数据分割
 - 制图
 - 选取
 - 切分
 - 过滤
 - 合并
 - 连接
 - 复制
 - 并行计算支持
 - 主元变换
 - 空间分析:缓冲区、几何中心、距离、交集、并集等
 - 高级空间运算:剪切, 德劳奈三角化, 几何边界抽稀/平滑, 要素拆分等
 - 空间聚合
 - 图形预览
 
 - 数据装载
- 数据库:MySQL 、PostgreSQL/PostGIS 、Oracle 等
 - 数据仓库 population
 - 空间数据格式:Shapefile(shp)、GML 3.1.1 、KML 2.2 、所有 OGR 标准格式
 - OGC 网络服务:网络编目服务(CSW)等
 - 切分装载
 - 批量装载
 - 并行装载
 - 分布式装载
 
 - 操作环境 * 通过名为“Spoon”的图形界面可以设置转换过程的所有选项 * 命令行界面亦可用于执行操作 * 网络服务:远程执行与分布式运算适用于处理超大型的数据集 * Java 开发接口 * 插件支持
 
遵循的标准¶
- OGC 开放地理空间信息联盟标准(SFS 、CSW 、SOS)
 
相关信息¶
官方网站: http://www.geokettle.org/
发布协议: GNU Lesser General Public License (LGPL) version 2.1
软件版本: 2.6
平台支持: Windows, Linux, Mac, Solaris
接口语言: Java, Javascript
帮助文档: http://www.spatialytics.org & http://www.spatialytics.com
