首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
谢海涛  肖倩 《现代情报》2019,39(9):28-40
[目的/意义]对社交媒体中热门新闻的及时识别,有助于加速正面资讯的投送或抑制负面资讯的扩散。当前,基于自然语言处理的传统识别方法正面临社交媒体新生态的挑战:大量新闻内容以图片、音视频形式存在,缺乏用于语义及情感分析的文本。[方法/过程]对此,本文首先将社交网络划分为众多社群,并按其层次结构组织为贝叶斯网络。接着,面向社群构建基于卷积神经网络的热门新闻识别模型,模型综合考虑新闻传播的宏观统计规律及微观传播过程,以提取社群内热门新闻传播的特征。最后,利用贝叶斯推理并结合局部性的模型识别结果进行全局性热度预测。[结果/结论]实验表明,本方法在语义缺失场景下可有效识别热门新闻,其准确度强于基于语义信息的机器学习方法,模型具有良好的时效性、可扩展性和适用性。该研究有助于社交媒体的监管机构及时识别出各类不含语义信息且迅速扩散的热点内容。  相似文献   

2.
[目的/意义]网络新闻是获取突发事件情报的重要来源之一,提高海量网络新闻中突发事件的识别准确率和分类效果,并减少非突发事件新闻造成的开放集识别问题和降低人工标注非突发事件新闻的成本,这是当前突发事件识别与分类研究的重要课题。[方法/过程]选择BERT预训练模型获得文本的特征表示,融合不同层级之间的语义信息增强文本表示的质量,采用自适应决策边界模型,学习各突发事件类别在高维语义表示空间上的球形最佳决策边界,根据新闻样本的文本表示和各突发事件类别的球形最佳决策边界的欧几里得距离,检测出突发事件新闻并判断突发事件的类别,并在CEC公开数据集和实时爬取的中文新闻数据集CEN上对模型的有效性进行验证。[结果/结论]实验结果表明,本文模型在CEC数据集和CEN数据集上的宏F1值分别为98.46%和95.80%,与基准模型相比,本文模型的宏F1值分别提升了5.15%和19.69%。模型应用展示了提出方法在解决实际问题时的有效性。[局限]未考虑突发事件新闻可能存在多标签的情况。  相似文献   

3.
吴树芳  杨强  侯晓舟  尹萌 《情报杂志》2023,(11):119-125
[研究目的]引导式主题模型可以引导生成有倾向性的敏感主题,提高网络敏感信息识别性能,对维护国家安全和社会稳定具有重要意义。[研究方法]针对当前网络敏感信息识别研究构建敏感信息特征不全面和不准确,从而导致识别性能欠佳的问题,提出基于SSI-GuidedLDA模型的引导式网络敏感信息识别方法。首先,从多源网络资源中爬取敏感种子词,并基于词向量模型Word2Vec获得种子词的敏感语义相关词,构建更为完备、准确的敏感特征。其次,将构建的敏感特征融入引导式主题模型,得到改进后的模型SSI-GuidedLDA。最后,基于SSI-GuidedLDA模型获得待识别信息的主题分布,通过主题分布概率判断其是否为网络敏感信息。[研究结论]在新浪微博数据集上的实验结果显示,与已有方法相比,提出的方法在准确率、召回率和F1值上均有一定提高。  相似文献   

4.
[目的/意义]为了解决互联网时代信息过载的问题,尝试从海量的新闻报道中自动抽取新闻事件,并按照事件发生的时间进行排序,向用户展示结果。[方法/过程]利用网络爬虫自动获取新闻文本,使用中心事件句判定和RoBERTa+MRC的方法进行实体抽取,从非结构化文本中抽取语义信息并生成结构化的新闻摘要。在此基础上,对摘要中的时间信息进行标准化处理,并按照时间顺序生成新闻时间线。[结果/结论]实验结果表明,中心事件句判定和RoBERTa+MRC相较于传统方法有更好的事件抽取效果,文章设计的新闻时间线展示系统能够帮助用户了解新闻事件的发展脉络,解释新闻主题的事件走向与演化规律。  相似文献   

5.
[目的/意义]用户的风险感知程度会直接影响用户采纳健康信息的行为和效率。因此,探究用户对网络健康信息的风险感知维度及其影响因素,有利于制定更具针对性的网络健康信息服务策略以及公共政策,促进互联网健康信息服务业的发展。[方法/过程]研究对网络健康信息用户进行半结构化访谈,基于扎根理论对资料进行开放性编码、主轴编码和选择性编码。[结果 /结论]通过分析共得到134个概念,40个范畴和12个主范畴,解析出六维度网络健康信息风险感知结构(包括信息质量风险、信息来源风险、隐私风险、心理风险、系统质量风险和财务风险),并构建网络健康信息风险感知理论模型,为解读网络健康信息风险感知与健康认知能力和风险后果之间的关系提供了理论依据。  相似文献   

6.
[目的/意义]识别潜在技术关系对企业寻找竞合对象、提升创新能力具有重要意义。研究提出一种融合专利类别与语义信息的企业潜在技术关系测算方法,有助于判断企业之间的技术重叠、补充和匹配程度。[方法/过程]首先,建立企业—IPC—专利文本三层映射矩阵,统计企业之间的IPC交集、补集等数据;其次,基于IPC和专利文本分别计算企业在类别和语义维度上的指标,实现在相同层级上计算企业的技术相似度和互补度;最后,计算技术匹配度,建立企业技术匹配度矩阵,进行可视化展示。[结果/结论]对24家上市公司进行实证分析,结果表明,该方法优于单一维度的测算方法,可用于判断企业之间的技术匹配情况。后续将纳入科研院校等机构类型,深入挖掘机构之间的技术相似点、互补点,利用复杂网络等工具展示互补的方向性,并考虑扩展应用场景,进一步提升该方法的情报价值。  相似文献   

7.
谢媛  李本乾 《现代情报》2023,(6):158-165
[目的/意义]网络舆情风险信息涉及要素较多,为了提高网络舆情风险信息感知效果,在新媒体环境下构建了突发环境事件网络舆情风险信息感知模型。[方法/过程]建立突发环境事件网络舆情信息流风险指标集,赋予评价指标权重,对权重离散化处理,构成相似系数矩阵。通过舆情主体建模、舆情信息模型建立与网民情感模型建立3个部分分析网络舆情传播核心要素演化规律。在此基础上计算传播概率,确定用户传播信息的涉入程度,采用Logistic回归模型感知风险信息风险高低。采用决策树对舆情风险预警,实现突发环境事件网络舆情风险信息感知。[结果/结论]实验结果表明,所构建模型应用后的事件舆情情感演化情况分析准确性较高,各个事件的转发数量和恶意评论数量感知准确度较高,预警效果更好,有效提高了突发环境事件网络舆情风险信息感知效果。  相似文献   

8.
李昊青  洪礼博 《现代情报》2019,39(5):156-165
[目的/意义]研究面向政治安全的网络谣言风险建模与防范策略,为网络谣言风险治理提供理论基础和实践指导。[方法/过程]采用等级全息建模方法,构建网络谣言的政治安全风险情景,通过识别风险因素,进行风险量化与评级,得出高风险因素,并建立网络谣言政治安全风险防控模型。[结论/结果]依据舆情生态理论和风险分析结果,针对高风险和潜在风险因素,从主体、过程、环境等3个维度提出网络谣言政治安全风险防范的主要策略。  相似文献   

9.
[目的/意义]进一步挖掘与分析网络问答社区用户信息需求,实现用户信息需求序化组织与聚合,提升网络问答社区服务质量。[方法/过程]融合GMM和Kmeans聚类算法对网络问答社区用户提问问题文本进行用户信息需求挖掘与分析,并采集途牛网络问答社区“北京”话题下的全部问题文本数据进行实证研究。[结果/结论]途牛网络问答社区中用户的信息需求主要分为三类:景点、住宿、出行和周转。文章所提出的网络问答社区用户信息需求聚合方法可以高效地识别出用户信息需求,实现话题下用户信息需求序化和组织,对网络问答社区提升信息组织水平和优化信息服务质量具有一定的参考价值。  相似文献   

10.
赵展一  钟永恒  王辉  刘佳 《现代情报》2023,(10):152-163+177
[目的/意义]技术关联与匹配是企业进行研发合作的内在动因,梳理基于技术关联关系的企业研发潜在合作伙伴识别方法,总结研究不足并提出发展建议,完善面向潜在合作伙伴识别的情报方法体系。[方法/过程]基于136篇重点文献,归纳基于技术承继、共现、结构、应用关系以及复合技术关系的企业研发潜在合作伙伴识别方法,对比分析每种方法的优劣,并提出未来研究方向。[结果/结论]现有研究通过挖掘引用关系、共现关系、文本语义、复杂网络中的有用信息,综合统计和语义特征取得了较好的识别效果。不足在于:数据源和数据范围受限,技术文本语义分析方法存在缺陷,技术关联与合作行为的关系未梳理清晰。未来方向:纳入多类型数据并保障识别范围的完整性;完善技术文本语义分析与计算的理论方法体系;系统梳理技术关联与合作行为的关系,完善合作潜力测度指标。  相似文献   

11.
[目的/意义]通过对商务网络信息生态链价值协同创造影响机理进行研究,识别出关键影响因素,对商务网站价值增加、顾客满意度提高以及整个生态链的价值增值有重要的参考意义,同时丰富其理论体系。[方法/过程]构建商务网络信息生态链价值协同创造的过程模型,并据此建立影响因素指标体系,利用专家打分法收集原始数据,运用模糊集理论-DEMATEL法对各项因素的影响程度进行分析。[结果/结论]最终识别出顾客满意度等8项因素作为商务网络信息生态链的关键影响因素。从3个角度提出促进以及优化商务网络信息生态链价值协同创造的建议。  相似文献   

12.
[目的/意义]针对产品评论中的复合句式,实现特征观点对的语义匹配及提取,并明确评论可信度的识别因素及权重,对产品可信评论进行筛选和分析。[方法/过程]基于特征观点对的语义匹配算法实现评论语义指标的量化计算,并采用模糊层次分析法确定可信度指标权重。[结果/结论]实验表明相较于单句提取特征观点对方法,特征观点对的语义匹配算法在召回率、准确率和F-score等性能方面均有较大优势。依据可信度指标对网站产品评论进行筛选,不仅可以评估产品整体的评论可信度,还可以细化到产品特征级别的可信度分析,为用户筛选可信的评论信息并提升购物决策效率。  相似文献   

13.
[目的/意义]为了实现从非结构化的在线评论中有效提取用户需求,文章提出了数据驱动下产品需求识别的方法。[方法/过程]利用Word2vec表示学习方法,获取评论文本内容的语义向量表示;结合K-means算法和LSA模型实现评论文本聚类,识别产品需求主题;在此基础上,通过网络分析方法探索需求主题间的关联关系。以华为手机的评论数据为例进行方法验证。[结果/结论]结果表明,基于语义的文本特征可以取得较好的聚类效果,与传统方法相比,CH指标和SC指标均得到显著提高,验证了该方法的有效性。研究方法和结果能够为企业产品创新和运营决策提供一定参考。[局限]样本数据集规模不够,缺少跨平台实验计算和比较。  相似文献   

14.
[目的/意义]科技创新是驱动高质量发展的核心动力,科技新闻是人们了解科技发展情况的重要途径,识别科技新闻中的热点主题,反映国家战略发布和实施过程中的状态及变化,以为政府及科研人员提供有效的决策参考与信息支持。[方法/过程]从国家科技部网站中采集2011—2021年发布的科技新闻,借助新词发现与LDA主题模型等文本挖掘方法,文章构建了科技新闻热词发现与主题识别的研究方案,并对新闻热点进行演化分析。[结果/结论]我国科技新闻报道中主要集中于高新技术、科技交流合作、人才培养与激励、农村科技发展、绿色生态、科技创新载体建设和政府部门工作7个主题范畴;高质量发展总纲提出前后的关注热点产生了一定程度上的变化;科技创新驱动高质量发展相关新闻事件中,政府工作与高新技术的发展是关注的重点。  相似文献   

15.
[目的/意义]数据权侵权问题一直是数据交易过程中的重点和难点,对数据交易过程中侵权风险进行识别,有利于相关利益主体从源头提高数据交易风险管理水平,提升数据交易效率。[方法/过程]文章引入WBS-RBS框架对数据交易过程的数据权侵权风险进行识别,根据数据交易全过程构建WBS模型,根据数据权的类型构建RBS模型,分析数据交易全过程各个环节存在的数据权侵权风险。[结果/结论]研究发现,数据人格权的侵权风险主要发生交易前,而数据财产权的侵权风险贯穿整个交易全过程。为提高风险识别效率,文章提出相关建议,以期促进数据交易活动的发展与完善。  相似文献   

16.
丁浩  孔令圆  刘清  胡广伟 《现代情报》2023,(11):135-145
[目的/意义]本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程]通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论]本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。  相似文献   

17.
[目的/意义]提出了一种融合专利引文网络和SAO语义分析的技术演化路径识别及拓展方法,对企业精准高效开展技术创新活动意义重大。[方法/过程]首先,对专利数据进行时间窗口划分,利用Gephi软件构建专利引文网络;其次,运用Girvan-Newman算法对引文网络进行社群划分,对综合排序前三的社群通过SPC算法提取主路径;再次,对主路径所涉及专利进行SAO结构提取,经规范化处理后构建基于SAO结构的技术演化路径;最后,将最新科技文献及专利通过语义相似性计算链接至技术演化路径末端,进而克服引文的时滞性缺陷。[结果/结论]将该方法应用于全固态锂电池技术领域,揭示了全固态锂电池相关技术的演进热点、发展脉络及未来趋势,验证了所提方法的可行性与实用性,为相关企业明晰创新路径提供了科学的决策理论支持。  相似文献   

18.
[目的/意义]评估并排序是缓解消费者难以发现有用性评论的有效途径。[方法/过程]基于评论有用性的影响因素间存在的多层次依赖关系,文章提出了一种基于证据网络的评论有用性的评估模型。实施以条件信度函数为参数的证据网络推理计算评论有用性,同时依据网络节点的计算值识别评论的有用性缺陷。[结果/结论]文章提出的模型不仅具有有效性,还可以识别评论的有用性缺陷,具备一定的评论有用性的可解释性。  相似文献   

19.
[目的/意义]将社会网络分析与突变理论相结合,提出识别潜在颠覆性技术的新方法,帮助企业获得市场、经济的先行优势,同时有助于加强政府对重点技术的前期引导作用。[方法/过程]首先,基于文本三元组结构,构建语义信息层面的技术共现网络。其次,基于社区网络结构和颠覆性技术特征,提出社区网络关系强度和对外资源利用力两个指标,利用突变理论模型识别易突变社区。最后,对易突变社区内节点进行主题词突发性监测和词频异常监测确定技术突发可能性,以此识别潜在颠覆性技术。[结果/结论]以造血干细胞领域2001—2018年论文数据作为分析对象,验证了方法的有效性,发现“建立完善的关于免疫缺陷疾病及相关移植治疗手段的临床研究模型”是该领域的潜在颠覆性技术。  相似文献   

20.
[目的/意义]突发事件网络舆情群体极化风险诱发因素及具象化表达非常复杂且呈混沌多元形态,风险点与风险导控在物理空间、社会空间、信息空间均有分布。从三元空间信息观的视角出发,对突发事件网络舆情群体极化致因因素在三元空间中进行解构,梳理群体极化风险耦合过程,有助于厘清群体极化形成规律,加深对群体极化风险的理解、风险传导机制和路径的把握以及风险演变规律的识别。[方法/过程]本文结合突发事件的特征,在三元空间信息观视域下解构了突发事件网络舆情群体极化致因因素,并基于风险耦合分析了三元空间之间的定向耦合、物理空间中的非直接耦合、社会空间中的互感耦合、信息空间中的参量耦合。最后论述了突发事件网络舆情群体极化风险形态的演化。[结果/结论]本文为群体极化研究提供了新的理论视角,拓展了群体极化研究的理论边界,将为群体极化风险识别、风险评估以及网络舆情导控策略研究提供理论支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号