期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王鹏亮《黑龙江科技信息》2015,(4):6-7

薄壁件模型广泛应用于复杂且高精度的产品设计中,例如航空结构件、汽车覆盖件和注塑模型等。在模型进行有限元仿真分析前,通常需要对模型进行简化以提高分析效率。而薄壁件模型最有效的简化方式就是中面抽取,简化后模型转换为2D的中面模型。现在已经有很多关于中面抽取的研究,但是这些方法仅能处理一些简单的薄壁件模型,而对一些几何复杂的薄壁件模型无法处理。本文提出了一种基于NURBS曲面拟合的中面抽取方法,很好的解决了具有复杂几何的薄壁件模型的中面抽取问题。最后,通过实例验证方法的有效性和鲁棒性。相似文献

2.

信息抽取技术在数字图书馆中的应用

李中言李普跃《现代情报》2007,27(10):96-97

本文论述了信息抽取技术的概念、类型、内容和信息抽取系统设计方法。提出了信息抽取系统模型，以及它在数字图书馆中的应用。相似文献

3.

基于LDA-WO混合模型的微博话题有序特征抽取研究

下载免费PDF全文

梁珊邱明涛马静《情报科学》2017,35(7):44-49

【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将ＬDA模型与WO模型结合,提出了基于 LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词, 然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于LDA-WO模型的特征词提取方法进行特征抽取,抽取到的特征词可读性更强,可弥补传统LDA模型在话题可解释性上的不足。相似文献

4.

基于深度学习框架的实体关系抽取研究进展

下载免费PDF全文

李枫林柯佳《情报科学》2018,36(3):169-176

【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然语言的先验知识,实体关系抽取将会取得更好的效果。相似文献

5.

基于网络科技信息的事件抽取研究

下载免费PDF全文

刘振《情报科学》2018,36(9):115-117

【目的/意义】为了帮助科研人员从海量信息中发现热点和重大研究进展,抽取出有用的事件信息。【方法/ 过程】采用条件随机场方法和语义角色标注技术,构建了模型进行训练和学习。【结果/结论】提出了科技事件抽取框架,实现了科技事件抽取系统,取得了一定的抽取效果,该系统的可扩展性和可移植性有待提高。相似文献

6.

金融领域文本序列标注与实体关系联合抽取研究

下载免费PDF全文

唐晓波刘志源《情报科学》2021,39(5):3-11

【目的/意义】金融领域实体关系抽取是构造金融知识库的基础,对金融领域的文本信息利用具有重要作用。本文提出金融领域实体关系联合抽取模型,增加了对金融文本复杂重叠关系的识别,可以有效避免传统的流水线模型中识别错误在不同任务之间的传递。【方法/过程】本文构建了高质量金融文本语料,提出一种新的序列标注模式和实体关系匹配规则,在预训练语言模型BERT（Bidirectional Encoder Representations from Transformers）的基础上结合双向门控循环单元 BiGRU（Bidirectional Gated Recurrent Units）与条件随机场 CRF（Conditional Random Field）构建了端到端的序列标注模型,实现了实体关系的联合抽取。【结果/结论】针对金融领域文本数据进行实验,实验结果表明本文提出的联合抽取模型在关系抽取以及重叠关系抽取上的F1值分别达到了0.627和 0.543,初步验证了中文语境下本文模型对金融领域实体关系抽取的有效性。【创新/局限】结合金融文本特征提出了新的序列标注模式并构建了基于BERT的金融领域实体关系联合抽取模型,实现了对金融文本中实体间重叠关系的识别。相似文献

7.

信息抽取技术在竞争情报研究中的应用 总被引：7，自引：1，他引：7

余丰朱东华《情报杂志》2006,25(3):25-26,29

介绍竞争情报和竞争情报系统以及信息抽取技术,并将隐马尔可夫模型引入到了文本信息的抽取之中,在此基础上提出了基于信息抽取技术的竞争情报系统模型. 相似文献

8.

基于深度学习的领域本体概念自动获取方法研究

王思丽祝忠明刘巍杨恒《情报理论与实践》2020,43(3):145-152,144

[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。相似文献

9.

基于向量空间模型的特征抽取技术分析

任克强张国萍赵光甫《科技广场》2007,(9):16-18

特征降维是基于向量空间模型(VSM)文本分类的关键技术之一,特征抽取是特征降维的主要方法。本文主要分析了几种常用的特征抽取方法,并给出了它们的实现步骤。相似文献

10.

一种基于TFIDF方法的中文关键词抽取算法 总被引：4，自引：1，他引：3

徐文海温有奎《情报理论与实践》2008,31(2):298-302

本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法.该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词.通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著. 相似文献

11.

中文事件抽取研究文献之算法效果分析

吉久明陈锦辉李楠孙济庆《现代情报》2015,35(12):3-10

事件抽取是指识别文本中描述在某个时间(或时间段),某个地点或地区,由一个或多个角色参与的某动作的事件。首先对我国关于事件抽取研究的文献进行了总结,给出事件抽取的主要方法及模型。并针对文献中对这些事件抽取方法的效果进行统计分析,探讨各种事件抽取方法或模型的效果及适用性。经过对现有研究文献的统计,结论为:当前有关事件抽取的研究仍在继续,主要集中于金融资讯、会议信息、突发事件、个人简历等来自网页、微博微信等自媒体信息或军事法律等专业文件的事件抽取,所采用的算法包括SVM、CRF、ME、模式匹配、聚类算法等;CRF算法应用与个人简历事件抽取效果最好,采用模式匹配算法的有效文献量相对较多,触发词方法的综合效果较优于模式匹配算法,但较多领域存在触发词算法的查全率较低的问题。相似文献

12.

高校网站群信息抽取系统分析与设计

楼俊君《黑龙江科技信息》2013,(20):155-155

本文介绍了一个基于高校网站群的信息抽取模型的的设计与实现。信息抽取系统分为信息抽取模块、抽取标准分析模块、抽取结果展示模块,采用关键字搜寻方式来提取信息。本系统可以运行在校园网站群之上,自动对各种关键字进行匹配与提取。测试证明,这种方法完全满足高校网站群的需求。相似文献

13.

基于卷积神经网络的旅游信息关系抽取研究

鲍玉来耿雪来飞龙《现代情报》2019,39(8):132-136

[目的/意义]在非结构化语料集中抽取知识要素,是实现知识图谱的重要环节,本文探索了应用深度学习中的卷积神经网络（CNN）模型进行旅游领域知识关系抽取方法。[方法/过程]抓取专业旅游网站的相关数据建立语料库,对部分语料进行人工标注作为训练集和测试集,通过Python语言编程实现分词、向量化及CNN模型,进行关系抽取实验。[结果/结论]实验结果表明,应用卷积神经网络对非结构化的旅游文本进行关系抽取时能够取得满意的效果（Precision 0.77,Recall 0.76,F1-measure 0.76）。抽取结果通过人工校对进行优化后,可以为旅游知识图谱构建、领域本体构建等工作奠定基础。相似文献

14.

基于情感分析与TextRank的负面在线评论关键词抽取

下载免费PDF全文

庞庆华董显蔚周斌付眸《情报科学》2022,40(5):111-117

【目的/意义】负面在线评论已成为商家重要的经营决策信息,对了解客户消费满意度、改善产品和服务质量具有重要意义。【方法/过程】该文将情感分析和关键词抽取相结合,提出一种基于BiGRU-CNN 和 TextRank的在线评论负面关键词抽取方法,即首先对在线评论文本数据进行清洗,然后构建 BiGRU- CNN 情感分类模型对在线评论进行情感分析,最后采取TextRank 方法抽取情感分析得到的负面评论中的关键词。利用这种方法,对十个产品与服务类别的6万余条消费者在线评论文本数据进行实证分析。【结果/结论】实验结果表明,该方法能准确判别客户负面在线评论情感倾向,F1值达92.41%,并且负面在线评论关键词抽取结果能较好帮助商家完善产品质量和服务。【创新/局限】提出一种结合双向GRU 和CNN 结合的情感分类模型,在此基础上基于TextRank 方法抽取情感分析得到的负面评论中的关键词,进一步提升模型对于在线评论情感分析的准确性。相似文献

15.

基于知识元抽取的不同学科领域研究方法交流态势分析——以情报学与计算机科学学为例

邹洋杰李秀霞王晓璎《情报杂志》2023,(7):154-160

[研究目的]为细粒度发现相近学科间的知识关联,推动学科间知识交流,通过抽取方法知识元,探析不同学科领域研究方法的交流态势。[研究方法]以情报学和计算机科学学为例,首先,编写方法知识元抽取规则,基于规则抽取两学科领域大样本文献的方法知识元,构建学科领域方法知识元库;再利用LDA模型抽取两学科领域代表性期刊的方法知识元;以此为基础,对比分析两学科领域的高频研究方法、已交流的研究方法、存在交流潜力的研究方法。[研究结论]研究发现,两学科已交流的研究方法有：聚类分析、LDA模型、BP神经网络、支持向量机、主成分分析、协同过滤、文献计量等;具有交流潜力的研究方法有：提高准确率的分类算法(AdaBoost算法、XGBoost算法、SMOTE算法)、图卷积神经网络、自然语言处理模型GloVe模型等。该研究不仅能为情报学研究者选择计算机科学学领域的研究方法提供参考,而且也为学科交叉研究提供了一种新思路。相似文献

16.

基于领域本体的Web信息抽取模型研究

岳国伟吕楠申玉三《情报探索》2012,(1):105-107

分析了信息抽取的研究现状,提出了一种基于领域本体的Web信息抽取模型,对模型中的各部分功能进行了简要说明,明确了信息抽取的系统流程,提高了信息抽取效率。相似文献

17.

基于标签样式和密度模型的网页正文自动抽取

下载免费PDF全文

廖建军《情报科学》2018,36(7):123-129

【目的/意义】为给数字出版知识服务系统提供高质量的文本语料以供知识抽取,本文提出了基于标签样式和密度模型来抽取网页正文的方法。【方法/过程】该方法先根据标签样式将网页文本进行分块,再根据各块文本内容的文本密度、标点密度、非超链接密度计算出综合密度,最后通过阈值判断抽取出网页中信息含量高的正文。【结果/结论】该方法简单高效无需人工编写规则或训练,能完整地抽取出网页正文。通过随机选取新闻网页进行实验,结果表明该方法能有效地自动抽取网页正文,适用于不同设计风格的网站,而且准确率和召回率优于基于统计的 CEPR抽取方法。相似文献

18.

基于统计与规则的术语抽取

程斌张水茂《科技广场》2009,(9):26-28

术语抽取是自然语言处理领域的一项基础性工作。本文提出了一种基于统计与规则相结合的术语抽取方法：首先在对主语料进行分词标注的基础上,通过基于词性规则的重复串查找得到候选术语,然后依据术语具有单元性和术语性的特点,先后采用SCP以及C-value模型对候选术语进行过滤得到术语。实验表明该方法切实有效,可以识别不同长度和不同领域的术语,能够应用于词典编纂和术语抽取等领域。相似文献

19.

面向中文科技文献非结构化摘要的知识元表示与抽取研究——基于知识元本体理论

郑梦悦秦春秀马续补《情报理论与实践》2020,43(2):157-163

[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。相似文献

20.

国际贸易技术壁垒信息采集系统设计与实现

翟东升余旸《情报杂志》2005,24(8):33-35

提出了一个应用于国际贸易技术壁垒预警系统中的网页表格信息抽取的可行性方案。数据抓取从对Web页的HTML源代码分析入手,采取基于Ontology的抽取方法,结合一系列成熟模型,进而建立网页信息采集系统并且通过测试。实验结果表明该方案切实可行,且抓取具有较快的速率和较高的准确性。相似文献