毕业设计(论文)题目:一种适合大数据分析的MLCS算法的设计与实现一、毕业设计(论文)内容及要求(包括原始数据、技术要求、达到的指标和应做的实验等)
寻找多个字符序列中的最长公共子序列问题,即MLCS问题,在生物信息学、计算基因学、数据挖掘、模式匹配等领域都有着重要的应用。大数据时代下,由于寻找序列的长度和维度较高,传统MLCS算法不能很好地适应大数据时代的需要。87037
本课题要求在Windows操作系统环境下,用Eclipse搭建开发环境,设计出一种面向大数据的寻找多个字符序列中最长公共子序列的算法,并利用Java语言实现,并对设计的算法进行呢测试和验证。论文网
技术要求:
1。在主流平台上进行算法测试和验证;
2。开发语言使用Java。
二、完成后应交的作业(包括各种说明书、图纸等)
1。毕业设计论文;
3。源程序文件。
三、完成日期及进度
2月22日至6月12日,共16周。
进度安排:
1。2。22~3。13(三周)项目调研,阅读资料,熟悉开发环境;
2。3。14~3。20(一周)熟悉传统MLCS算法及相关应用;
3。3。21~4。2(两周)熟悉Eclipse开发平台及Spark测试平台;
4。4。3~5。1(四周)设计并实现新型MLCS算法;
5。5。2~5。14(二周)测试并优化;
6。5。15~6。12 (四周)撰写论文,毕业设计答辩。
四、主要参考资料(包括书刊名称、出版年月等):
[1]何畏。快速精确字符串匹配算法研究[D]。合肥工业大学,2010。
[2]许亚美。手写维吾尔文字识别若干关键技术研究[D]。西安电子科技大学,2014。
[3]舒翔。基于索引和序列匹配的代码克隆检测技术研究[D]。杭州电子科技大学,2015。
[4]逯洋。求任意两个字符串的最大匹配子串及其长度的算法设计[J]。科技广场,2007,03:173-174。
[5]张国平,徐汶东。字符串模式匹配算法的改进[J]。计算机工程与设计,2007,20:4881-4884。
[6]余建明,徐波,薛一波。基于网络处理器的高速字符串匹配[J]。清华大学学报(自然科学版),2008,04:589-591。
[7]赵珊,郑清洁。基于字符串匹配技术的图像检索算法[J]。高技术通讯,2010,02:117-121。
[8]邹旭楷,王素琴。一种优化的并行字符串匹配技术[J]。郑州大学学报(自然科学版),1994,01:41-45。
[9]范立新。用位并行法进行过滤的中文近似串匹配算法[D]。浙江大学,2006。
[10]MikhailJ。Atallah,ElenaGrigorescu,YiWu。Alower-variancerandomizedalgorithmforapproximatestringmatching[J]。InformationProcessingLetters,2013,11318:。