数据和显示的关系 内容描述与现实方式整体合为一体 内容描述与现实方式相分离
保值性 不具有保值性 具有保值性
编辑及浏览工具 已有大量的编辑,浏览工具 编辑浏览工具尚不成熟
结构描述 不支持深层的结构描述 文件结构嵌套可以复杂到任何程度
与数据库的关系 没有直接联系 与关系型和层状数据库均可以对应和转换
超级链接 单文件、书签链接 可以定义双向链接、多目标链接、扩展链接
大小写敏感性 大小写不区分 大小写区分
表1:HTML与XML的区别
总而言之,XML与HTML的设计区别是:XML 被设计为传输和存储数据,其焦点是数据的内容。而HTML 被设计用来显示数据,其焦点是数据的外观。HTML 旨在显示信息,而 XML 旨在传输信息。
证券数据的设计存储
以时间为单位的数据格式的选择
在大多的程序设计,例如图书管理系统、进销存管理系统,又或者是网页的开发,大多的数据存储选择的是用SQL Server或者MySQL,Access,Oracle等数据库存储,一方面是因为数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,为数据的检索提供了很大的便利,从而方便了数据的利用。
而本课题研究的以时间为单位的证券相似度的研究,其数据来源是各大财经网站提供的证券数据,其特点为数据量大,每一时间节点的数据结构相同。而研究证券数据的相似度时不需要研究不同文度的数据之间的关系,关注的仅仅是数据本身。而XML与Access,Oracle和SQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力, XML仅仅是存储数据。事实上XML与其他数据表现形式最大的不同是:他极其简单。这是一个看上去有点琐细的优点,但正是这点使XML与众不同。
同时由于算法的原因,需要频繁调用数据,使用数据库会使得内存频繁访问数据库,加大了算法的计算工作,而使用XML则无此不足。因此在多方面考虑之后,对于本课题的数据的存储,选择了使用XML标记语言来存储。
以时间为单位的数据格式的设计
本课为了更简单方面的说明所需要研究的内容,选取的上证指数从2013年4月1号,以日为单位的10组数据,其具体数据如表2:
日期 开盘 收盘 涨跌额 涨跌幅 最低 最高 成交量(手) 成交金额(万)
2013-04-16 2169.63 2194.85 12.90 0.59% 2165.78 2196.43 79992176 6695584.50
2013-04-15 2199.91 2181.94 -24.84 -1.13% 2177.39 2204.99 71632320 5816217.50
2013-04-12 2218.09 2206.78 -12.77 -0.58% 2204.44 2226.26 66846340 5619688.00
2013-04-11 2236.98 2219.55 -6.57 -0.30% 2217.26 2242.48 73632704 6213270.00
2013-04-10 2224.93 2226.13 0.35 0.02% 2212.56 2233.04 80619624 7109021.50 以时间为单位的证券相似度的研究+文献综述(4):http://www.youerw.com/shuxue/lunwen_2994.html