大数据挖掘及图形化展示系统采购公示

发布日期:2015-06-15
我单位(上海产业技术研究院)因研发项目的需求需要采购大数据挖掘及图形化展示系统,现公开征求供应商。本单位将根据公开、公平、公正原则,产品性价比、客户评价和售后服务质量相结合的方式,选择供应商。
大数据挖掘及图形化展示工具是一套软件系统,其中包括大数据挖掘、图形化展示两大功能特点。
一、参数要求如下:
1. 总体技术架构:
1) 兼顾大数据批量处理和小样本数据精确查询统计的性能需求。
2) 有效合理利用CPU以及内存等计算资源。
3) 谨慎设计,避免高并发场景的性能瓶颈点。
4) 计算资源有效管控,避免出现系统负荷过载。
5) 在接口设计和SQL支持等方面减少系统迁移和新项目开发成本。
6) 具备内存计算能力,面对海量数据提供交互式数据统计能力。
7) 具备在实时流数据处理上通过SQL灵活实现业务逻辑以及支持流上数据挖掘的能力。
8) 具备海量图片和数据的高速存储与读取能力。
9) 具备分布式事务处理能力。
10) 友好的运维监控界面,提供外部集成接口。
11) 支持在线扩容,良好的备份与恢复机制。
2. 数据库需求:
1) 接口驱动要求:提供标准JDBC(包括JDBC type 4 driver)、ODBC驱动,ODBC驱动至少兼容linux、window(64位)。
2) SQL语法支持:支持大部分SQL2003语法,支持部分PL/SQL语法,
3) 提供表分区功能,至少提供日期、区间等分区能力,分区技术至少为2级。
4) 支持表压缩功能。
5) 支持内存/SSD/硬盘混合多级存储。
6) 支持分布式CUBE。
7) 支持生命周期管理。
8) 支持大表索引管理。
9) 支持数据导入导出。
3. 数据分析与挖掘算法需求:
1) 支持并行化统计算计和机器学习基础算法库,支持并行化基础算法,能够处理大数据集。
2) 支持R语言进行快速数据分析。
4. 提供数据挖掘可视化展现能力,提供海量数据分析挖掘结果的可视化展现,提供SQL分析查询记过可视化支持能力。
5. 支持在线NOSQL数据库能力。
6. 支持流式计算能力。
7. 支持多租户与安全管控
8. 符合以Hadoop/Spark为代表的主流技术发展趋势要求,能够容易实现与第三方软件的快速集成。
9. 支持以Web图形界面实现Hadoop节点批量自动集群部署、监控和管理能力,支持图形界面实现Hadoop资源监控。
10. 支持用户安全认证,支持数据访问权限管理。
11. 保证系统容错及可靠性能力。
12. 系统易维护。
13. 性能需求:
1) 支持从数据仓库或者NoSQL数据库中将数据装载入内存或SSD组成的分布式内存列式缓存,进行交互式SQL分析和数据挖掘,应达到如下性能:单台机器1秒内扫描记录数在1亿条以上;数据存放在SSD上时,SQL性能与存放在内存中性能相近;总体分析性能比原生Hadoop MapReduce快10倍以上,比原生Spark快2倍以上。
2) 对于基于NoSQL数据库中的数据检索性能,应达到如下性能:按关键字检索单表记录延时小于20ms,单个节点并发度超过1000;按关键字检索多表关联记录延时小于200ms, 单个节点并发度超过200;多表关联检索并汇总统计延时小于200ms, 单个节点并发度超过过30。
3) 其它性能需求:从文本文件中导入数据单机性能不低于30MB/S;支持高速随机Key-Value的查询/插入和低延时的统计能力,插入性能每台服务器每秒需达到10000记录/秒(每条记录至少1KB以上);流处理系统最低延时处理间隔为100毫秒,单服务器需可处理10万记录/秒。
14. 软件支持服务需求:
1) 业务团队及技术开发团队培训。
2) 产品正式交付上线后两年内提供运维支持服务及产品缺陷修复和产品升级服务。
二、采购方式
如有意向请提供以下资料密封后送交我单位或扫描后发至:1、公司介绍;2、应征产品说明;3、报价;4、售后服务等内容;5、公司营业执照复印件;6、联系方式等资料并加盖公章。
我单位将根据有关规定择优选择供货商。所有资料我单位不负责退回。
地址:上海产业技术研究院 金苏路200号F栋
邮箱: wzx@ssc.stn.sh.cn
联系人:武智霞
电话:021-20295102

截止日期: 2015年6月21 日17:00(以实际收到应征书为准)。截止日期后本单位概不受理。