共查询到10条相似文献,搜索用时 203 毫秒
1.
2.
自组织映射(SOM)是一种基于人工神经网络的聚类方法,通过将相似的输入数据映射到相同或者相近神经元达到相似相聚的目的,有着不需要先验知识、保持拓扑结构不变、无监督自我学习和易于可视化的优点。由于专利文献有着数量大、文字晦涩冗长、专业性强等特点,分析难度较大,自动聚类分析能挖掘专利文献内在相似性,作为基础性处理用于后期应用,例如专利数据清洗、专利检索、主题分析和专利地图生成等众多领域。基于SOM的专利文本聚类与传统聚类方法相比效率和准确率较高,并且易于可视化展示。本文使用了SOM、k-means和TwoStep算法分别在专利文本聚类中作了对比,得出SOM较优的结论。 相似文献
3.
4.
[目的/意义] 旨在对大量的中文专利实现快速分类,满足专利审查以及情报分析等工作的要求。[方法/过程] 结合专利文本的固有格式以及存在多个IPC分类号的实际情况,将多示例多标签学习应用于专利自动分类中,在介绍几种经典的多示例多标签模型的基本原理之后,将这些模型运用于中文专利IPC分类号的确定。[结果/结论] 实验证明,多示例多标签模型适合运用在专利的自动分类中,并且从Average precision、Hamming Loss、Ranking Loss、One Error、Coverage、Training time等指标分析可以发现,MIMLRBF模型能快速、准确地运用在中文专利IPC分类号的确定中,为大规模专利的自动分类提供借鉴。 相似文献
5.
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。 相似文献
6.
本文主要从图像法的角度探讨多重分类号下专利布氏分布的特点,并以斯马里科夫统一方程计算值为参考,通过对比IPC和主IPC区域划分角度下图像的拟合效果和K-S检验结果,得到在主IPC区域划分角度下方程适用性较高,多重分类号对专利布氏分布的影响较小。 相似文献
7.
8.
中国大陆地区专利地图技术研究 总被引:1,自引:0,他引:1
针对中国大陆地区专利的特点,引入自然语言处理和基于内容的图像检索等技术,研究专利地图的分析和绘制方法。对于发明和实用新型专利,使用语义度量、新词识别等技术处理其用词,并将专利说明书和权利要求书结构化;定义了基于近义词组的文档特征表达,据此计算发明和实用新型专利的相似性并完成聚类。对于外观设计专利,借助基于内容的图像检索技术提取专利图像的颜色、纹理和形状特征,通过相关反馈确定权重,据此计算外观设计专利的相似性并完成专利聚类。以此为基础开发完成了专利地图软件,可实现对指定范围的中国大陆地区的专利地图的分析绘制,从而辅助设计师和企业进行决策分析和产品定位。 相似文献
9.
[目的/意义]科学与技术之间的密切关系,使得结合论文与专利进行技术机会分析比使用单一数据更加合理与高效。本文使科学技术关系的生成更自动化,减弱对主观判断的依赖,使技术颗粒更加精细,同时为技术研发人员提供研发建议,将科学研究中汲取的理念应用到相应的技术创新中去。[方法/过程]将论文、专利的摘要文本进行Doc2vec向量表示,通过文本相似性将其关联成网络,再基于Louvain算法生成科技主题聚类,识别科学研究推动的技术机会。最后以3D打印技术为案例进行实证研究。[结果/结论]识别出若干科学研究推动的技术机会,并验证所识别的机会具有一定的技术潜力,证明方法的可行性和有效性。 相似文献