基于Spark平台的XP-EHH算法的分布式处理实现方法
周维; 谢海兵; 刘长春; 罗静; 张亚平
2016-11-07
专利权人云南大学
公开日期2017-03-15
授权国家中国
专利类型发明
摘要本发明公开了一种基于Spark平台的XP‑EHH算法的分布式处理实现方法,首先采集染色体数据,存储至HDFS文件系统,然后对染色体数据进行预处理,将预处理后的染色体数据缓存至Spark平台的RDD缓存中,将需要使用的数据广播到参与XP‑EHH算法分布式处理的Spark工作节点中;将ped文件RDD拆分成不同的片段,发放给各个Spark工作节点,各个Spark工作节点并行化地执行XP‑EHH计算的各个步骤,从而实现分布式处理。采用本发明可以因为XP‑EHH算法的并行化执行,使得在大数据环境下基于Spark平台的XP‑EHH算法能够保持良好的扩展性,进而能够克服现有实现方式无法支持大数据的问题。 
申请日期2016-11-07
专利号CN106503225A
语种中文
申请号201610972593.7
文献类型专利
条目标识符http://ir.kiz.ac.cn/handle/152453/11631
专题科研部门_分子进化与基因组多样性(张亚平)
作者单位1.云南大学
2.中国科学院昆明动物研究所
推荐引用方式
GB/T 7714
周维,谢海兵,刘长春,等. 基于Spark平台的XP-EHH算法的分布式处理实现方法. CN106503225A[P]. 2016-11-07.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
2017052321.pdf(1167KB)专利 开放获取CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[周维]的文章
[谢海兵]的文章
[刘长春]的文章
百度学术
百度学术中相似的文章
[周维]的文章
[谢海兵]的文章
[刘长春]的文章
必应学术
必应学术中相似的文章
[周维]的文章
[谢海兵]的文章
[刘长春]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。