網絡信息采集系統(KSpider)

一、產品簡介

KSpider網絡信息資源采集系統是一個集網絡數據采集、分析、存儲、管理及檢索等功能於一體的網絡信息資源整合系統。

二、服務對象

大專院校、科研機構、企事業單位。

三、產品功能

1、先進的智能代理

準確篩選用戶感興趣的信息並自動分類,支持用戶自定義分類體系,為用戶提供了多種方式定制感興趣的主題。

2、強大的信息采集能力

高效的信息采集技術完成網絡數據獲取,能快速、全面、準確的從Internet上獲取數據。

3、體系結構靈活

采集蜘蛛群集,智能代理群集,應用服務器智能調度,各子系統可以隨時斷開隨時連接到系統中來,不影響整個系統的運行。

4、基於KBase的海量數據存儲和全文檢索

支持海量非結構化數據的存儲管理,擁有成熟的全文檢索技術,檢索速度達500G/S,處於業界領先水平。

5、優秀的發布系統

支持動態摘要和敏感摘要,並標紅,Google風格檢索,提供網頁快照,網頁自動關聯。

6、穩定可靠的系統性能

采用分布式的群集系統、高效的搜索算法以及靈活的體系結構,保證整個系統的穩定、易用。

7、滿足用戶的各種個性化檢索需求

支持用戶自定義符合自己行業、企業特殊需求的個性化分詞詞典。

8、支持主流的中文編碼標準

包括GBK(漢字內碼擴展規範)、GB2312(簡體)、BIG5(繁體),UTF-8,並且能夠在不同的編碼之間轉換。