首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 500 毫秒
1.
一种基于词上下文向量的文本自动分类方法   总被引:1,自引:0,他引:1  
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。  相似文献   

2.
在Web信息检索中,为了明确用户的查询需求,很多搜索引擎和全文数据库提供了相关词提示功能。本文简要介绍了Web信息检索中相关词提示的获取技术,并对相关词提示效果进行实际调查分析。从关键词库中随机抽取若干关键词,在选定的搜索引擎和全文数据库上进行信息检索,获取抽样关键词的相关提示词。通过关键词检索、人工打分和数据统计,进行查询扩展分析、查询式专指度分析和查准率分析,给出相关词提示在改善检索效果和用户满意度方面的综合评价。  相似文献   

3.
乌岚 《科技通报》2013,(1):154-156,180
提出了一种基于多样约束模型的数据库优化查询方法。将数据库中数据进行分类处理,按照数据特征将数据库中信息分为多个不同的类别,为数据库优化查询提供准确的数据基础。建立多样约束模型,判断符合查询条件的数据类别,根据不同的数据类别进行数据查询,从而实现数据库优化查询。实验结果表明,利用这种算法进行数据库查询优化,能够有效提高数据库信息查询的效率。  相似文献   

4.
Oraele C++调用接口   总被引:1,自引:0,他引:1  
OCCI是一种新的高性能Internet应用程序调用API。通过它可以很方便的连接数据库,执行SQL语句,插入、更新数据库表单的取值,获取查询结果,执行数据库中存储过程,以及访问数据库方案对象的元数据。  相似文献   

5.
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。  相似文献   

6.
丁秀琴 《科技通报》2015,(4):199-201
采用传统算法进行混合型数据库查询,由于文档与查询的匹配过于严格,存在对检索词的重要程度无法区分的问题,造成无法进行检索结果的排序的缺陷。为此,提出了一种基于改进均值聚类算法的混合型数据库查询优化方法。建立混合型数据库查询执行计划代价模型,精准的定义了数据库查询执行代价。将改进均值聚类算法与粒子群算法有效的相融合,将粒子群中的粒子划分为多个子群,更新所有的粒子,通过粒子间的相互信息融汇,搜寻到数据库查询最优解。实验仿真证明,基于改进均值聚类算法的混合型数据库查询优化方法精确度高,效率高。  相似文献   

7.
本文介绍了利用Eclipse为开发工具,前台使用JSP技术,后台使用Java语言,数据库采用MySQL开发的一个基于Servlet的图书管理系统,详细介绍了整体软件流程和数据库表单设计思路,并对系统进行了实测,给出了系统运行界面。该系统的架构模式是BS模式,采用多个模块,实现了图书的查询、图书信息的录入、修改等功能。  相似文献   

8.
《科技风》2020,(6)
基于史料记载的明清时期山东省蝗灾信息,应用GIS和数据库技术,构建明清时期山东省蝗灾数据库平台。数据库平台依托底层web应用服务器提供的地图、业务数据服务接口,实现蝗灾数据库的可视化展示。该数据库平台具备蝗灾事件详细信息查询和分时段统计功能,并提供蝗灾数据的可视化展示功能,可为山东省县域尺度上蝗灾时空演变规律研究和未来蝗灾发展趋势预测提供数据支撑和平台借鉴。  相似文献   

9.
如何准确理解用户提交的查询成为搜索引擎面临的一个难题,对查询进行自动分类是尝试解决问题的一种方法。提出基于相关查询对查询进行自动分类的方法。首先介绍此方法的设计思路和流程,同时对关键处理步骤进行说明,然后选择百度风云榜的数据作为测试集进行测试验证,查准率可达到71.74%,最后分析和总结方法不足之处以及下一步研究计划。  相似文献   

10.
通过对文本数据库的优化索引提高信息检索功能,传统的数据库索引方法采用单层文本特征聚类方法,聚类特征不一致时,存在非法聚类和非法结果输出的安全问题。提出一种基于虚拟数据加速分布重组的数据库索引技术,首先构建虚拟数据加速分布重组模型,改进数据库的分布模型,提高对文本数据的索引能力,把需要的文档集经过预处理后,构建文本数据库,算出各个候选扩展词的权重后,需要根据各个词与原查询词的相关度,构成数据库文本扩展词集合,采用相关规则挖掘的规则词作为扩展,得到了虚拟数据的加速分布系统状态函数,构建规则库,从中提取与原查询相关的扩展词,进而实现查询扩展,实现数据库索引算法改进。仿真结果表明,该算法进行文本数据库索引的收敛性好,检索精度和有效连接数较高,执行时间短,展示了其优越性。  相似文献   

11.
12.
作为数据的承载平台,数据库在各行各业都得到了广泛应用。查询操作是数据库管理系统最重要的功能之一,使用频率最高。以关系型数据库为基础,从不同的角度出发,对数据库查询优化策略进行了研究。  相似文献   

13.
通过分析开源网络爬虫Heritrix的工作原理及架构,针对Heritrix开源爬虫只能对全网站进行通爬的特点,对Heritrix进行改进,增加了基于Hash算法的增量式抓取模块。实验表明,改进的Heritrix能够有效实现对网页的增量式抓取。  相似文献   

14.
李若  崔海峰  张春红 《情报科学》2006,24(7):1053-1057
期刊题录库是图书馆利用现代化手段,建立具有分类目录式资源组织体系、动态链接等特征的数据库检索平台。本文利用Dreamweaver MX和ASP实现了期刊题录库的建设,具有题录检索、管理、统计功能。通过添加、修改、删除的交互式动态网页的制作,实现了主页面和网页提交表单的动态设计,以此为基础,可以实现很多数据库的链接与生成,极大丰富了图书馆主页中交流互动的栏目设置。  相似文献   

15.
[目的/意义]根据用户网络查询重构行为预测查询重构策略,可以为用户提供查询帮助,提高用户网络查询交互体验。[方法/过程]以预测模型构建过程为基础对最新研究成果进行梳理,包括查询重构策略划分、查询重构行为特征选取、查询重构情境影响因素,以及预测模型构建方法,揭示研究进展与存在问题,最后提出研究展望。[结果/结论]对查询重构策略预测研究还有较大探索空间,展望可为后续相关研究提供一定参考。  相似文献   

16.
Students use general web search engines as their primary source of research while trying to find answers to school-related questions. Although search engines are highly relevant for the general population, they may return results that are out of educational context. Another rising trend; social community question answering websites are the second choice for students who try to get answers from other peers online. We attempt discovering possible improvements in educational search by leveraging both of these information sources. For this purpose, we first implement a classifier for educational questions. This classifier is built by an ensemble method that employs several regular learning algorithms and retrieval based approaches that utilize external resources. We also build a query expander to facilitate classification. We further improve the classification using search engine results and obtain 83.5% accuracy. Although our work is entirely based on the Turkish language, the features could easily be mapped to other languages as well. In order to find out whether search engine ranking can be improved in the education domain using the classification model, we collect and label a set of query results retrieved from a general web search engine. We propose five ad-hoc methods to improve search ranking based on the idea that the query-document category relation is an indicator of relevance. We evaluate these methods for overall performance, varying query length and based on factoid and non-factoid queries. We show that some of the methods significantly improve the rankings in the education domain.  相似文献   

17.
A vast amount of valuable information, produced and consumed by people and institutions, is currently stored in relational databases. For many purposes, there is an ever increasing demand for having these databases published on the Web, so that users can query the data available in them. An important requirement for this to happen is that query interfaces must be as simple and intuitive as possible. In this paper we present LABRADOR, a system for efficiently publishing relational databases on the Web by using a simple text box query interface. The system operates by taking an unstructured keyword-based query posed by a user and automatically deriving an equivalent SQL query that fits the user’s information needs, as expressed by the original query. The SQL query is then sent to a DBMS and its results are processed by LABRADOR to create a relevance-based ranking of the answers. Experiments we present show that LABRADOR can automatically find the most suitable SQL query in more than 75% of the cases, and that the overhead introduced by the system in the overall query processing time is almost insignificant. Furthermore, the system operates in a non-intrusive way, since it requires no modifications to the target database schema.  相似文献   

18.
基于Web资源的信息抽取技术   总被引:7,自引:0,他引:7  
郭志红 《情报科学》2002,20(12):1282-1284
Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。如何将这些信息抽取出来,转化成结构化信息供其它信息集成系统所利用,成为该领域的研究热点。本文介绍了一个简单的Web信息抽取模型,对于基于该模型的wrapper归纳技术进行了探讨,并描述了一个wrapper自动生成系统的原型。  相似文献   

19.
房岩  孙刚  刘倩 《现代情报》2010,30(12):51-54
按照安全性与开放性并重、领先性与成熟度并重、有效性与易用性并重原则,开发了基于GIS和网络技术的长春市水资源可持续管理信息系统。系统平台包括硬件条件、软件环境、网络支持和管护人员,数据库包括基础数据库、方法数据库、模型数据库、动态数据库、地图数据库和多媒体数据库,子系统包括系统控制子系统、数据维护子系统、系统管理子系统、信息查询子系统、动态监测子系统、分析预测子系统和信息发布子系统。系统的应用将使城市水资源管理由经验管理、定性管理转向科学管理、定量管理,为建设节水型城市提供决策依据。  相似文献   

20.
纪留利 《科技广场》2011,(3):120-122
本文以ASP、Dreamweaver、Access作为系统的开发工具,利用现有的校园网络资源,设计开发了一个基于Web数据库的学生选课管理系统,建立选课服务器,各院(系,室)的网络终端作为浏览器,学生可以在校园网络的任何一个用户终端上选课或进行有关信息的查询,教务管理部门(即管理员)实施统一的选课管理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号