8

3.2.2 专利申请地区分析 9

3.2.3 专利技术主题分析 10

3.2.4 主要申请公司分布分析 12

3.3本章小结 13

4 文本聚类分析和关联规则分析的应用研究 14

4.1 文本聚类分析的技术和原理 14

4.1.1 文本预处理 14

4.1.2 文本特征选择 14

4.1.3 文本特征表示 16

4.1.4 层次聚类方法原理 16

4.2专利文本聚类分析 17

4.2.1 内容特征表示及建模 17

4.2.2 专利文本聚类及结果分析 20

4.3 专利关联规则的结果及分析 22

4.3.1 雅马哈两轮机动摩托车领域的关键技术说明 22

4.3.2 专利技术主题关联规则挖掘 22

4.4 本章小结 24

5 总结与展望 26

5.1 论文主要工作 26

5.2 展望 26

致谢 27

参考文献 28 

1 绪 论

众所周知,专利、专利信息展示出了人类的智慧,从人类社会开始发展,一切社会发明创造和成就都被记载下来。专利信息可以说是较为系统和全面,能及时更新的技术情报资源,内容包含了科技创新、经济发展以及战略决策等。因此,从这包罗万象的专利信息中提取和发现有价值有意义的专利知识,然后经过转化,变成有用的情报知识,对提高政府和企业的竞争力有重大的作用。然而,目前一些传统的数据库管理系统存在许多缺点和不足, 无法满足用户的需求。而数据挖掘能够自动、智能和快速地从数据库中挖掘出有用的信息和知识的技术,正好有效地解决了这一问题。

把专利信息分析和数据挖掘技术联系起来,从浩如烟海的专利信息中挖掘隐藏在里面的,事先不知道,却又可能是用户感兴趣并且有用的信息和知识,具有很重要的研究和现实意义。

对于数据挖掘的应用,本文首先针对专利文献的外部特征做了一定研究,结合专利文献的表征内容和自身特点,以摩托车领域在中国境内专利申请情况为主要背景,分析了摩托车行业的现实情况。然后利用数据挖掘技术中的关联规则挖掘和文本聚类分析相结合的方法对雅马哈公司的所有专利进行深入分析,将数据挖掘的方法和理论知识应用到实际系统中,为今后的专利信息挖掘工作提供了更多的实例。

1.1 研究的背景和意义

随着世界技术变革的如火如荼的进行, 国内外企业之间的竞争日趋激烈,各国政府和企业都越来越重视专利战略研究, 它的核心正是专利信息分析。企业要想在这场优胜劣汰的游戏中立于不败之地,就要具备强大的技术能力,并且抢先获得精确的信息源。专利信息是世界上系统的、全面的、更新较快的技术情报源,充分利用专利信息,可以大量缩短科研周期,节约科研经费,实现很高的经济价值,并且能在企业的技术竞争中形成一大助力。然而,也因为专利信息的海量数据和繁杂信息,如何快速准确的从中提取信息变成了一大问题。而数据挖掘这一能自动智能和快速的从数据库中挖掘有用信息的技术方法正好迎合了这种需求。运用数据挖掘技术,把专利文献中隐含的、潜在有用的信息找出来,再分析专利文献中所涉及的技术细节以及找个各种技术之间的关联,给企业提供未来的发展道路和技术的延伸方向,帮助企业做出正确的战略决策,无疑对企业的良性发展具有很大的帮助的。因此,专利信息对于国家、企业而言都有很重要的作用,同时,正确、快速地运用数据挖掘技术最大程度地开发和利用专利信息成为国家和企业取得竞争优势的重要保证[2]。源[自[优尔``论`文]网·www.youerw.com/

上一篇:基于案例推理的轨道交通运营智能控制方法研究
下一篇:Netlogo网络舆论会话情境关联与聚合研究

基于Apriori算法的电影推荐

数据挖掘在电子商务中的应用

数据挖掘的主题标绘数据获取技术与实现

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

python基于决策树算法的球赛预测

安康汉江网讯

老年2型糖尿病患者运动疗...

张洁小说《无字》中的女性意识

新課改下小學语文洧效阅...

ASP.net+sqlserver企业设备管理系统设计与开发

麦秸秆还田和沼液灌溉对...

互联网教育”变革路径研究进展【7972字】

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析

网络语言“XX体”研究