搜索结果: 76-90 共查到“计算机科学技术 XML”相关记录223条 . 查询时间(0.031 秒)
基于Nutch的XML网站全文搜索引擎实现
XML信息检索 可扩展样式表语言转换 基于Nutch的搜索引擎
2009/7/31
普通搜索引擎的网页抓取程序只能理解常见HTML标签,无法对XML网站的内容做有效解析。该文建立一个包含动态自定义标签的纯XML网站,提出借助XSL样式信息帮助网页抓取程序理解XML网页标签含义的方案,实现了基于Nutch的XML网站全文搜索引擎。
基于XML的地理数据集成研究及应用
地理信息系统 数据集成与共享 可扩展标记语言
2009/7/31
在企业实施信息化进程中,由不同核心技术构建的信息服务、管理系统和地理信息系统分别以不同的存储格式存放在不同地理位置的不同系统中,给数据综合利用和数据共享带来了很大的不便。该文利用XML和Java语言的优越性,提出一种利用接口技术、网络传输技术和XML相关技术的地理信息数据集成框架,并利用该框架模型实现了应急GIS系统与接警系统的集成和共享。应用验证了该框架的合理性,结果表明它是可行和有效的。
基于XML的分布式数据库非递归查询
分布式数据库 非递归查询 最小视图
2009/7/31
分布式数据库系统数据的物理分布和冗余导致其处理难度和复杂度增加,分布式数据库的查询优化是数据库查询理论的核心。该文应用XML技术,分析用户提交的非递归查询任务,得到一个最小查询视图。对各分布式数据库进行查询,处理查询所得结果并返回给用户,实现对分布式数据库的有效查询。
基于纯XML数据库的SCL文件管理
IEC61850标准 变电站配置描述语言 纯XML数据库
2009/7/31
介绍IEC61850系列标准中的变电站配置描述语言的文件结构,阐述系统的配置流程及各种数据文件的交换过程,提出在XML文件管理维护上采用纯XML数据库技术。直接将XML文本文件作为存储单元。创建2个索引文件,运用传统的B+树数据结构建立索引。针对XML文件的特性,采用XML路径语言XPath表达式的方法进行文件查询。
基于自动机的XML流多查询处理
XML数据流 前缀共享 自动机
2009/7/30
XML流数据处理在研究领域引起广泛关注,该文针对XML流上的多查询处理提出一种算法,把多个查询合并为一个共享前缀的查询树,应用自动机和运行时栈相结合的方法,单遍扫描XML流处理数据流上的多个查询。该算法采用一种分层栈结构保存查询模式匹配候选集,利用XML节点的区间编码来确定节点之间的关系,返回整条匹配路径。
面向XML数据库的智能数据清洗策略
XML数据库 数据清洗 贝叶斯公式
2009/7/30
针对XML数据质量问题,通过引入贝叶斯学习方法与马尔可夫链概率转移策略建立XML数据清洗过程的元数据模型,根据综合清洗结构化数据中相似重复记录的思想,提出一种智能清洗XML数据的新方法。实验表明,与其他方法比较,该方法不仅自动化程度较高,降低人工参与的程度,而且精确率和查全率提升了2%~5%。
一种有效的XML数据清洗方法
主动学习 匹配规则 哈希
2009/7/30
研究XML格式的重复数据元素的特点,提出对于特定应用领域,在具体的上下文环境中主动学习XML重复元素的识别规则。通过结构转换,将结构不尽相同的XML数据映射成结构一致的数据,并通过学习不同层次数据元素间的依赖关系权重来获得匹配规则。根据学习得到的转换和匹配规则,采用哈希过滤的方法来提高检测重复XML元素的效率。该方法能够有效地解决XML重复检测面临的结构多样性的问题,理论分析和实验表明,该方法有较...
有效支持数据更新的XML索引研究
可扩展标记语言 XML数据更新 XML查询
2009/7/29
高效的索引是提高XML数据查询效率的关键,目前已经提出了许多XML索引算法,它们大多数都不支持XML数据更新。对CSSU编码进行了改进,提出了一种新的有效支持数据更新的路径索引算法,该索引算法有效支持单支查询和多支查询。
DM XML加速线性Twig查询的实现
结构连接 小枝查询 编码方案
2009/7/24
每一个复杂的Twig查询都由线性Twig查询构成,有效地处理线性Twig查询显得非常重要。DM XML系统以国产DM5.6关系数据库为平台,融合结构映射和模型映射,实现独特的路径分区编码方案来存储XML数据。在系统中,线性Twig查询解析后,形成线性Twig查询的路径集,而该集合中的每一个路径可被唯一变换为关系数据库中整型主键的范围查询。实验结果显示,路径分区编码方案能加速线性Twig查询,它将为...
Native XML数据库的文档编码机制研究
Native XML数据库 编码机制 XML查询
2009/7/24
Native XML数据库快速查询的实现,可以采用基于XML文档编码的结构连接算法。而结构连接算法的实现需要对XML文档进行编码,以便于快速判断XML文档树结点之间的祖先后裔关系。在对现有编码机制进行综述的前提下,提出一种新的XML文档编码机制——前缀整除编码(PDIV)机制。该机制编码形式简单,只需要一个正整数即可充分表示结点在XML文档树中的位置信息;可以实现祖先后裔关系的快速查询;支持XML...
XML查询优化模型XQO的研究设计
查询代数 查询树 路径表达式
2009/7/24
XML现有的查询技术不够成熟,效率低下,精确度不高,如何优化查询成为业界热点和难点问题。结合当今查询优化算法技术,设计了一个查询优化模型XQO,从查询过程的各个阶段进行优化查询解析、逻辑优化、物理优化,设计执行策略和算法,并从实验结果验证优化的效果。
XML模式到关系数据模式转换的研究
关系模式 约束 函数依赖
2009/7/24
分析和研究了DTD模式到关系模式的内联映射算法,提出一种带约束条件和函数依赖的映射方法。该方法结合给定规则对XML DTD进行简化,构造带约束条件的DTD图,并依照图中的一些函数依赖关系以及函数依赖关系的讨论得到最终关系集合,在引入映射方法的同时给出实例进行介绍,从而得到更加完备的关系模式。
XML弱函数依赖及单依赖集合研究
弱函数依赖 单依赖 空值
2009/7/24
XML弱函数依赖是在XML数据库中引入空值理论后的函数依赖。在空值、不完全树元组等概念的基础上,定义了弱函数依赖、单依赖集合,证明了单依赖集合判定定理和单依赖集合判定可终止定理。
多级安全XML文档删除操作安全策略研究
完整性 可用性 隐通道
2009/7/23
XML应用的不断扩展带来了XML安全的需求。目前关于XML安全性的研究主要集中于自主访问控制、基于角色的访问控制和视图技术,而对于强制访问控制很少有研究。对多级安全XML文档的元素删除操作进行了研究。由于在结构完整性约束和实体完整性约束下,低安全等级用户的元素删除操作可能导致高安全等级数据失去可用性或者产生信息隐通道,为此提出了一个滞后删除策略,并描述了该策略的完整性性质及实现。
基于Bagging的XML文档集成聚类研究
可扩展标记语言(XML) 文档聚类 Bagging算法
2009/7/21
将集成学习方法应用到XML文档聚类中来改进传统聚类算法的不足。提出一种标签与路径相结合的XML文档向量模型,基于这个模型,首先对原始文档集进行多次抽样,在新文档集上进行K均值聚类,然后对得到的聚类中心集合进行层次聚类。在人工数据集和真实数据集上的实验表明,该算法在召回率和精确率上优于K均值算法,并且增强了其鲁棒性。