首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 584 毫秒
1.
[目的/意义]在线问答社区成为互联网用户获取高质量知识的重要途径,探索中文问答社区答案质量对知识传播具有重要意义。[方法/过程]以规模最大的中文问答社区之一"知乎"为研究对象,采用数据挖掘和机器学习方法,选取逻辑回归、支持向量机和随机森林三种分类模型,进行三层递进式训练和检验。从结构化特征、文本特征以及用户社交属性三个维度构建答案质量的特征体系。[结果/结论]实验结果显示,随着特征体系的不断丰富,三种分类模型的性能逐步提升;而随机森林作为一种组合分类模型,在全量特征的情况下,取得出色的分类性能。对特征组合分析发现,包含用户社交属性的随机森林总是比同等级的其它模型更加出色,表明社会化网络在答案质量评价中的地位。研究结论表明从答案本身和答案编写者两个角度能够评价答案质量,构建的特征体系和模型可以较为全面地预测答案质量。  相似文献   

2.
[目的/意义] 考察在线问答社区信息中的情感特征以及其对在线问答社区信息质量自动化评价的影响。[方法/过程] 综合以往研究,提取Yahoo! Answers中的回答信息的文本特征、用户特征、时序特征等,并提出附加情感标注的回答特征,利用Weka机器学习的方法进行信息质量自动化分类预测。[结果/结论] 结果显示,在线问答社区信息中具有一定的情感特征且情感特征的加入能够提高分类预测的准确率。  相似文献   

3.
[目的/意义]旨在构建社会化问答社区用户生成答案质量评价指标体系,实现面向用户需求的答案质量自动化评价和筛选,提高社会化问答社区知识服务质量。[方法/过程]引入社会情感特征和用户特征,运用因子分析和结构方程实证构建用户生成答案质量评价指标体系。基于GA-BP神经网络模型设计答案质量自动化评价方法。最后,选取知乎网站数据对用户生成答案质量评价指标体系和自动化评价方法进行应用研究。[结果/结论]构建包含答案文本特征、回答者特征、时效特征、用户特征、社会情感特征5个维度的评价指标体系。实验分析发现基于GA-BP神经网络的答案质量自动化评价方法相比于其他方法准确率较高、平均误差低,具有可行性和有效性,能够进一步应用和推广实践。  相似文献   

4.
本文创新性构建学术论文被引影响因素特征空间,以我校SCI&SSCI学术论文为例,验证机器学习模型在预测学术论文被引频次研究中的有效性和准确性,本文的分析结论可以为高校图书馆开展决策支持服务提供参考。本文梳理学术论文被引频次影响因素及预测方法的相关研究,结合传统文献计量和Altmetrics指标构建学术论文影响因素的特征空间,并通过实验比较线性回归、神经网络、支持向量机三种机器学习模型在预测学术论文被引频次研究中的有效性和准确性。本文的分析结论证明基于Altmetrics视角构建的特征空间的预测准确率大幅度提高,并且支持向量机模型在对学术论文影响力预测的实证研究中表现出优异的性能。  相似文献   

5.
[目的/意义]合理预测科研领域的潜在合作关系有助于优化资源配置,提升科研产出效率。从科研网络出发的潜在合作预测研究日益增长,需要系统总结。[方法/过程]在CNKI和Web of Science中检索并筛选出基于科研网络的潜在合作关系预测方法的研究,从年发文量、期刊分布对目标文献集进行统计分析。使用内容分析法,梳理出预测潜在合作关系的一般流程,描述步骤中的方法。[结果/结论]潜在合作关系预测一般流程为网络构建、特征提取与表示、合作预测和预测结果评价,其中构建的网络可分为同质网络、异质网络和二分网络,特征提取和表示可分为节点内容特征和网络结构特征,合作预测的方法主要有基于相似性的方法和基于机器学习的方法,预测结果评价的指标为AUC、Precision和Ranking Score;现有方法的局限性启示了未来潜在合作关系预测的发展方向。  相似文献   

6.
[目的/意义] 信息质量是平台提高竞争优势与可持续发展的重要前提,学术社交网络所秉持的自由开放精神造成了信息质量控制的障碍,因此需要通过关键要素的分析,实现信息质量的优化和提升。[方法/过程] 在前期研究工作的基础上,构建面向管控规则、平台技术、信息内容和信息用户4个维度的学术社交网络信息质量治理决策模型,基于DEMETAL方法对各个影响策略进行识别与分析,确定影响学术社交网络信息质量的关键策略。[结果/结论] 通过数据分析,梳理出5条重要的结论,并在此基础上凝练出两条管理启示及实施步骤,克服定性研究中的主观臆断,能够为学术社交网络平台的人机交互、质量管控和服务设计提供可行的实践参考。  相似文献   

7.
[目的/意义] 研究网络环境下大学生群体的信息偶遇敏感影响因素,以指导大学生群体提高信息偶遇能力,继而提升大学生信息素养。[方法/过程] 使用信息增益分析各影响因素与信息偶遇发生频次之间的相关性,构建敏感影响因素模型,并进一步利用支持向量机(SVM)建立信息偶遇频次预测模型。[结果/结论] 与发生信息偶遇最相关的10个影响因素分布于信息用户、偶遇信息、网络环境、情境因素4个维度;模型分类预测精度达82.96%,说明SVM对预测信息偶遇频次有良好效果。  相似文献   

8.
[目的/意义]答案质量越发成为影响社会化问答(SQA)平台使用效果的重要因素。构建评测体系对SQA平台答案质量进行评价,可以优化用户体验和促进平台发展。[方法/过程]结合专家评分法及三角模糊加权平均G1法,构建包含12个指标的SQA平台答案质量评测指标体系。通过对4个领域共40个问题的评价,证实指标体系的科学性。[结果/结论]形成一套可用于整体评价、赋予指标权重的评测体系,了解了国内SQA平台的答案质量和存在的问题,为平台发展及后续研究提供参考。  相似文献   

9.
基于特征表现的虚假评论人预测研究   总被引:1,自引:0,他引:1  
聂卉  吴毅骏 《图书情报工作》2015,59(10):102-109
[目的/意义]重点探讨基于特征表现的虚假评论人的预测,目的在于揭示真实网络环境中"网络水军"的特点和行为规律,构建一个简洁清晰、可解释的评论人身份预测模型,为深层次的评论挖掘研究奠定基础。[方法/过程]结合实证分析和机器学习技术,对目标网站"大众点评网"的内部评价机制进行探索,利用因子分析提炼评论人属性及行为表现特征,并在此基础上构建基于Logistic回归的预测模型。[结果/结论]对于目标网站,模型对虚假评论人的分类预测精度达到73.8%,AUC指标达到80.9%。而评论人的贡献度、活跃度以及文字素养被验证与其身份有统计意义上的显著关系,但评论人的层级、情绪以及评价偏差则对其身份预测的影响不显著。实验结论和经验分析基本保持一致,模型能够被合理解释。  相似文献   

10.
[目的/意义]社会化问答社区已成为网络用户获取知识常用途径之一,也是网络环境下重要的社交方式。探究用户对社会化问答社区的刻板印象以及矫正消极刻板印象,对社会化问答社区的运营发展具有重要的实践意义。[方法/过程]选取知乎作为研究对象,应用扎根理论方法,通过数据资料收集、三级编码等过程,结合图式理论,构建社会化问答社区刻板印象内容模型。[结果/结论]研究发现社会化问答社区刻板印象内容包含用户属性、平台属性、社会属性3个维度,其中用户属性包括用户水平和使用原因,平台属性包括管理体系和社区氛围,社会属性包括知识问答和社交营销。用户门槛低、内容审核机制不严格、消极现象明显以及软文广告较多是用户产生消极刻板印象的主要原因。  相似文献   

11.
基于知识元的学术论文内容创新性智能化评价研究   总被引:1,自引:0,他引:1  
[目的/意义] 创新性是对学术论文质量最基本的要求,是学术论文的灵魂,是学术论文评价的核心。知识元是学术论文基本组成单元。基于知识元理论和机器学习相关理论与算法,从学术论文内容层面研究计算机如何智能化地进行创新性评价及其实现过程与方法。[方法/过程] 首先,构建学术论文的研究问题、理论、方法、结论4个知识元本体,接着提出基于知识元的学术论文创新性判断模型。其次,根据学术论文研究特点,构建理论与方法机器分类模型及知识元的抽取规则与抽取方法,建立规则库和知识语料库。最后,基于语义相似度计算方法,根据判断规则和相关权重对学术论文4个维度的创新性进行评分。[结果/结论] 基于知识元抽取的学术论文创新性评分系统的实证结果表明,该智能化评价方法具有一定的可行性,可为学术论文内容创新性智能化评价系统的最终实现提供方法借鉴。  相似文献   

12.
[目的/意义]学术文本结构功能是对学术文献的结构和章节功能的概括,针对当前研究较少从学术文本多层次结构出发进行融合和传统方法依赖人工经验构建规则或特征的问题,本文在对学术文本层次结构进行解析的基础上,构建了多层次融合的学术文本结构功能识别模型。[方法/过程]以ScienceDirect数据集为例进行实验,该模型首先通过深度学习方法对不同层次学术文本进行结构功能识别,接着采用投票方法对不同层次和不同模型的识别结果进行融合。[结果/结论]研究结果表明各层次集成后的整体效果较单一模型均有不同程度提升,综合结果的整体准确率、召回率和F1值分别达到86%、84%和84%,并且深度学习算法在学术文本分类任务中的性能较传统机器学习算法SVM更优,最后对学术文本结构功能错分情况进行了分析,指出本研究潜在的应用领域和下一步的研究方向。  相似文献   

13.
[目的/意义] 基于社会化问答平台提问回复率较低的现状,通过预测提问回复率,能够为社会化问答平台提升用户活跃度与留存率,改善用户体验提供参考。[方法/过程] 以"百度知道"为研究平台,抓取平台设置的14个话题下共10 640条提问记录,从提问特征与提问者特征角度,构建提问回复率影响因素的研究框架。采用二元Logistic回归对影响因素进行数据验证,构建提问回复率的预测模型,对模型准确率进行验证。[结果/结论] 社会化问答平台提问回复率研究可改善平台信息服务质量与促进用户知识贡献行为,实验结果验证了研究模型在社会化问答平台提问回复率预测中的有效性。  相似文献   

14.
国佳  郭勇  沈旺  潘梦雅 《图书情报工作》2019,63(17):137-144
[目的/意义]提出基于在线评论的网络社区信息可信度评价方法,为信息治理提供有效依据。[方法/过程]构建基于在线评论的网络社区信息可信度评价指标体系,利用改进AHP理论确定指标权重;利用LSTM模型对评论情感分类,采用改进的D-S证据理论模型融合情感分类数据作为指标量化计算方法。以知乎网络社区为例,从3个角度计算网络信息内容的可信度:经过筛选的具有可信观点评价的在线评论、所有在线评论、调查问卷。[结果/结论]实验结果表明,基于可信观点评论的可信度排序与基于调查问卷的可信度排序基本一致,说明利用在线评论对网络信息可信度进行评价具有一定的可行性。  相似文献   

15.
[目的/意义]科研社交网络与大众社交网络一样存在信息过载问题,利用推荐系统向科研人员推送个性化信息是解决该问题的重要手段。通过与国外主流科研社交网络相比较,找出我国科研社交网络的推荐系统存在的问题,进而寻求解决之道。[方法/过程]从推荐项目、推荐策略、冷启动方案、用户偏好学习4个方面,对科研之友、学者网、ResearchGate、Academia这4个科研社交网络的推荐系统进行对比。[结果/结论]我国科研社交网络的推荐系统在上述4个方面都与国外同行存在明显的差距,存在推荐项目较少、推荐策略单一、冷启动效果差、用户偏好学习能力弱等问题。针对这些问题,提出改进建议。  相似文献   

16.
[目的/意义]以"马蜂窝"旅游网为研究对象,探究旅游社交网站用户信息共享行为及其影响因素,旨在为旅游社交网站建设及其移动端的交互设计优化改进提供理论参考。[方法/过程]选取技术接受模型中的感知有用性和社会认知理论中的自我效能,并结合弱关系理论引入环境机制、服务质量和期望互惠3个影响因素,构建旅游社交网站用户信息共享行为影响因素模型,通过问卷调查收集数据,采用SPSS对该模型进行实证检验并建立回归方程。[结果/结论]通过因子分析提取主成分,将信息共享行为分为收藏转载式和平台交流式,发现:感知有用性、服务质量和期望互惠这3种变量对收藏转载式信息共享行为产生正向影响,其中感知有用性和期望互惠这两种变量显著正向影响信息共享行为。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号