企业公共信息互联网抓取与分析研究(3)
时间:2021-10-17 20:14 来源:毕业论文 作者:毕业论文 点击:次
32
1 综述 1。1 背景及意义 1。1。1 背景 同一切事物的发展趋势相同,计算机从萌芽到走进大众视野,再到如今形成的“有它万事足,无它寸步难行”的局势,无不反应了其举足轻重的地位。倘若将互联网视为枝繁叶茂的大树,那么因特网便是其骨干,随着因特网的出现,逐步成为了互联网的代名词。 起初,网页信息内容都是以HTML格式处理的,该阶段兴起的搜索引擎也都是以此为依据实现的。但是,随着社会的不断发展,推动着技术发生了天翻地覆的变化。信息的来源渠道变得广泛,数量和种类多样,人们对信息的需求程度以及依赖度同样与日俱增。在这个阶段,网络的汪洋大海,也出现了更多的“种族”, 文件类型开始变的纷繁复杂,出现了PDF、FLASE等格式的文件,除了类型变得繁多之外,格式也同样变得多种多样。人们一下子变成了飘荡在大海中小舟里的渔民,尽管可以借助搜索引擎获得数据,但是,还是存在大量的信息深埋海底,或者被隐藏而不易被获得,这就成为了初期的深层网络企业公共信息。 技术的飞速发展,带动了社会经济的进步,良好的社会环境为企业的萌生与发展奠定了基础。随着,大量企业的成熟发展,越来越多的信息涌入人们的生活。举个例子,股民因为切身利益,会时常关注购入证券的企业信息,包括企业年报及企业市盈率、每股收益、每股公积金等指标。这里企业的财务公告的信息就是网民需要的信息。但是,很多用户在面对信息的汪洋时,茫然不知所措,他们无法获取到自己所需要的信息。这就对固有信息检索提出了更高的要求。 但是科学技术并不会因为一个环节的不完善而止步不前,面对日益增长的海量信息,专家没有停止探索,而是就当前的形势对网络信息检索开展了新的研究。有针对FTP企业公共信息的Archive,针对Gopher企业公共信息的Veronica等。但是信息的发展速度,对于搜索引擎的进步速度来说,远远望尘莫及。我们利用工具从信息汪洋中淘出来的,仅仅是沧海一粟,而藏在深层的,或者真正是我们所需要的却往往容易被忽略。论文网 1。1。2 意义 经济及科技的发展对人们的意识形式也产生影响,现代人们的民主意识不断提高,对政府、企业公开的信息要求也随之增加。但是信息公开制度、监督与执法环境不足以适应这些要求。这就使得信息的获取与分析成为了一个突出的问题。本论文将试图通过梳理相关文献,对国内政府网站的信息获取分析进行阐述,从而寻求行之有效的解决方案。这样起到的作用是:(1)在科学管理中发挥参谋和智囊作用;(2)在研究开发中担负助手作用;(3)在市场拓展中起到“防护伞”的作用;(4)在信息的监督与动态追踪监测中起耳目和预警作用。 1。2 研究内容 课题研究内容由以下几点组成: 1。2。1 课题研究现状 近年来有关企业公共信息获取的问题为众多学者热烈探讨,虽角度各异,但其理解趋向一致,现从如下几方面入手展开述评: 1、企业公共信息获取存在的问题 (1)赵莉学者在《论企业公共信息获取》中提出:我国作为最大的发展中国家,近些年发展迅猛,已然成为强国。但是同发达国家相比,目前我国信息系统依然存在问题。比如信息化程度不高,信息获取渠道不够完善。这些问题直接导致了公众获取信息渠道的单一以及获取效率的低下;除此之外,我国法律体系也不够完善,缺乏组织制度和监督体系的保障;缺乏权威的中间协调机构,各自为政,互不沟通现象突出,给公众获取信息带来不便[3]。 (责任编辑:qin) |