1、hortonwork 和 cloudera 比较
除了功能,还需要对维护性能进行比较
2、环境部署需要细化
部署哪些组件
部署哪些webservice服务
各节点之间如何规划
内存磁盘资源如何分配
是否开启组件高可用
若开启组件高可用,是否考虑部署2套zookeeper
离线集群与在线集群如何互通
3、大数据组件中存储列表应该列出
列出存储的表
给出各表的数据逻辑,即从和数据源来,可如何使用
是否需要考虑历史数据,是否考虑使用拉链表
4、数据迁移方案需要优化
迁移时是否需要停服务 (NO)
哪些数据需要迁移,哪些可以考虑不迁移
mysql中的数据如何迁移
hive、hbase、hdfs中数据如何迁移
为什么使用sqoop
为什么不用distcp
迁移的持续时间预估
迁移后如何进行验证
时间: 2024-12-07 05:56:33