- 胡吉明;罗行;
【目的/意义】“十四五”规划中明确指出网络安全、信息安全与数据安全的重要性,信息保密受到党和国家的高度重视,探究并揭示其结构特征,有助于总结政策建设经验,完善我国信息保密政策体系。【方法/过程】构建“主体-工具-主题”三维分析框架,运用文本内容分析法和社会网络分析法,揭示我国信息保密政策的主体合作机制、工具组配方式以及主题关联效应。【结果/结论】通过对185份政策文本的分析,发现我国信息保密政策在主体、工具与主题三个维度结构特征明显且呈现稳定发展态势,针对当前主体配合协同性不足、工具运用结构性失衡、主题方向全面性欠缺的问题,提出完善多元主体协同政策体系、推动三类政策工具优化平衡与聚焦技术标准层面政策主题的建议。【创新/局限】探索了融合政策主体、政策工具及政策主题三个维度的信息保密政策分析策略,但在维度交叉分析层面缺乏深度。
2024年04期 v.42;No.392 18-26页 [查看摘要][在线阅读][下载 1915K] - 杨永清;孙凯;张媛媛;樊治平;
【目的/意义】对突发事故灾难舆情信息进行精准画像,实现高传播信息的早期分类与识别,并实施精准化的引导对策。【方法/过程】以长沙自建房倒塌事件的微博数据为例,首先使用熵权法对信息传播效果进行评价,其次采用K-Modes聚类对高传播信息构建信息画像,最后基于XGBoost算法构建分类预测模型,并比较不同模型的预测效果。【结果/结论】根据信息画像可将突发事故灾难舆情信息划分为“高传播-官方救援报道类信息”“高传播-官方事故处置类信息”“高传播-大V情感表达类信息”“高传播-官方事故损失类信息”和“低传播信息”五类。同时,XGBoost算法相比其他机器学习分类算法预测性能最好,准确率可达93.94%。【创新/局限】提出一种基于画像的网络舆情信息传播效果的预测方法,以实现对突发事故灾难舆情信息的精准预测;未来会增加多个舆情事件作为数据集并结合深度学习算法,进一步提升模型预测效果。
2024年04期 v.42;No.392 27-35+42页 [查看摘要][在线阅读][下载 1854K] - 朱彦君;董同强;马秀峰;
【目的/意义】为了解决传统LDA模型文本主题识别时语义描述不充分以及主题语义连贯性不强等问题,本文尝试将文本类别信息融入LDA模型,形成一种基于中文文本类别信息的主题生成新模型,即CLCI-LDA模型,为数据挖掘领域的文本分析和知识发现提供新的工具。【方法/过程】利用CLCI-LDA模型提取主题时,首先,采用深度学习的句向量模型Sentence-BERT将文本转换为句嵌入向量,并与LDA模型生成的文档主题向量进行串联,以提升文本向量的语义丰富性和关联性;然后,运用K-means聚类算法进行文本聚类,获得文本的类别信息;最后,根据主题词频次,获取每个类族中的高频关键词,对主题进行凝练。【结果/结论】以我国“智慧图书馆”研究领域为研究对象进行文献主题提取实验,对CLCI-LDA模型及传统LDA模型的应用效果进行对比。结果表明CLCILDA模型能够更好地获得具有语义信息的主题词,该模型获得的主题一致性指标优于传统的LDA模型。【创新/局限】相比于传统LDA模型,CLCI-LDA模型在文本语义表示的深入性以及主题凝练的合理性方面均具有优势。但新模型同时存在参数调优的不足、语义理解深度有待进一步提高的问题;此外CLCI-LDA模型的普适性还有待检验。
2024年04期 v.42;No.392 36-42页 [查看摘要][在线阅读][下载 1561K] - 刘国斌;冯博;
【目的/意义】数字经济与农业农村信息化协调发展对于加快中国式现代化发展具有重要意义。【方法/过程】在理论分析基础上构建评价指标体系,利用熵值法测度数字经济与农业农村信息化协调发展的水平并进行时空演化特征分析。同时,采用障碍度模型分析二者协调发展的障碍因素,进而提出相关建议。【结果/结论】研究表明:2012-2021年全国层面和四大区域层面数字经济与农业农村信息化协调发展水平均呈现增长态势;全国数字经济与农业农村信息化协调发展在空间变化上表现出“核心-外围”特征,各地区数字经济与农业农村信息化协调发展水平在空间上表现出“东强西弱”的特征;各地区障碍因素不同。在此基础上,有针对性地提出相关建议。【创新/局限】本文将数字经济与农业农村信息化纳入统一分析框架,并且引入障碍度模型对数字经济与农业农村信息化协调发展的障碍因素进行具体分析,在实证分析方面有所拓展,但忽略了空间计量的系统分析,后续研究仍需深化。
2024年04期 v.42;No.392 43-54+88页 [查看摘要][在线阅读][下载 1674K] - 袁莉;何瑞敏;
【目的/意义】探索我国地方政府公共数据资源开发利用模式,形成可复制的经验,为推进我国公共数据资源开发利用提供参考。【方法/过程】采用扎根理论提取8个公共数据资源开发利用试点省市的相关举措并凝练重点方向,以其作为原因条件,采用csQCA方法从27省公共数据资源开发利用相关政策中,探寻能够有效推动公共数据资源开发利用的相关举措及组合,结合具体实践探索公共数据资源开发利用的模式。【结果/结论】公共数据资源开发利用呈现出三种模式:需求导向的场景化模式、供给导向的授权运营模式、供需协同的全覆盖模式,不同模式具有不同特点。【创新/局限】探索我国公共数据资源开发利用模式并提出构建要点,为各省市实践提供参考。
2024年04期 v.42;No.392 55-62页 [查看摘要][在线阅读][下载 1802K] - 宋莹琪;郝生跃;穆文奇;温宏宇;
【目的/意义】EPC项目往往由目标多元、工作流程异质的多类型主体共同参与推进,凸显出知识链组织特性,深入研究组织之间知识转移界面协同机制,可有效打通组织间知识链并推进核心知识资源转移共享,充分激发各类项目参与主体潜在优势,实现项目绩效最大化。【方法/过程】对EPC项目知识链形成背景及主要主体进行界定,深入分析EPC项目知识特征,明确项目知识在知识链组织间转移的路径,研究知识链组织界面特征及其对知识转移的障碍,构建EPC项目知识链组织界面协同机制及作用模型。【结果/结论】为实现EPC项目知识链组织间知识转移效率提升及项目绩效最大化,必须有效克服知识界面障碍问题,通过信息技术赋能的显性界面协同机制可降低知识复杂性、显性知识界面障碍,通过关系联接提升的隐性界面协同机制可降低知识内隐性、知识位势性知识界面障碍,从而全面提高知识链组织间知识转移效率。【创新/局限】从组织界面障碍因素出发,创新提出EPC项目知识在知识链组织之间转移的路径及内部机理,并提出实现界面协同的显性和隐性机制,局限在于未引入实际案例数据开展实证研究,将在未来研究中运用结构方程模型等数理方法予以验证。
2024年04期 v.42;No.392 63-68+78页 [查看摘要][在线阅读][下载 1599K] - 胡媛;蒋天森;古淋鑫;高薇;
【目的/意义】了解不同类型社交媒体平台中用户生成内容的文本特征,探究其话题转移与内容外延的差异性,对更好地引导用户生成内容具有重要的理论价值和实践意义。【方法/过程】研究根据平台发布的主要内容形式进行分类,选取四大社交媒体平台,利用关键词挖掘、词共现和情感分析技术,对比分析用户生成内容差异化的语言风格、情感倾向、话题转移和内容外延。【结果/结论】结果表明:文本特征方面,不同类型平台具有其独特的语言内容特征和语言风格。主题和内容方面,不同平台的主题转移与内容外延现象存在转移程度与内容上的差异。【创新/局限】研究基于通用的社交媒体内容呈现形式,创新性地从跨平台视角分析了不同类型的社交媒体平台用户生成内容中相异的文本特征、主题转移与内容外延现象。未来可结合多种主题事件的用户生成内容,进一步丰富研究方法并深入探究差异背后的原因。
2024年04期 v.42;No.392 69-78页 [查看摘要][在线阅读][下载 1865K] - 吴应强;石乐怡;张马萍;
【目的/意义】识别我国政府数据开放管理央地政策文本的内容主题及演化特征。【方法/过程】获取我国央地政策文本,对政策文本进行筛选和剔除,运用LDA主题模型实现对政府数据开放管理政策文本内容的主题识别、演化分析。【结果/结论】发现当前所发布的政府数据开放管理央地政策文本具有明显的生命周期特征,目前阶段处于平缓期,其内容主题可以分为四大类,政府数据开放的数据安全管理是头号热点主题,每个主题随时间推移呈现不同演化趋势。【创新/局限】采集大样本政策文本作为数据源,每篇只保留与主题高度相关的段落,利用LDA主题模型进行政策文本的主题识别与分析,直观地揭示了中国政府数据开放管理央地政策文本的现状与趋势。
2024年04期 v.42;No.392 79-88页 [查看摘要][在线阅读][下载 1981K]
- 夏思洋;朱学芳;
【目的/意义】由于健康素养和经济能力的限制,加之数字鸿沟的存在,老年人对于健康知识的需求难以得到满足。此外,老年人的健康信息呈现多源异构的特性,需要构建智能信息系统,在统一平台整合分析数据,从而为老年人提供高效智慧健康服务。【方法/过程】本文基于多源数据融合技术,构建面向老年人的智慧健康信息服务系统,包含数据源层、管理层、分析层和应用层,并从数据级、特征级、决策级三个维度为层次间的数据转换提供理论与技术支持。【结果/结论】本文依托医路云循证平台,聚焦于为老年人提供便捷的智慧健康服务,满足其基本健康知识需求,实现疾病诊断、处方推荐、健康监测等智慧服务功能。【创新/局限】本文对多源数据融合驱动的智慧健康信息服务系统构建问题进行了探讨研究。但老年人的健康信息分布零散,难以进行实证分析,而且需要考虑老年人的服务接受度,设计系统界面与交互方式。
2024年04期 v.42;No.392 89-97页 [查看摘要][在线阅读][下载 1653K] - 聂亚青;吴庭璋;王若佳;翟兴;
【目的/意义】基于文献研究,从研究主题和发展演化两个角度对健康信息学的发展现状进行梳理,为相关学者更好地从事健康信息学研究提供参考。【方法/过程】首先从Web of science中获取健康信息学文献,运用JCR和ESI学科分类方法将文献分为医学、计算机、图书情报三个数据集;其次利用基于Bertopic模型主题挖掘法分析健康信息学在三个数据集中的研究主题和发展演化趋势。【结果/结论】从研究主题看,健康信息学主要包含六个研究主题:人工智能在健康领域的应用、健康知识服务、用户健康信息行为、信息技术在临床中的应用、健康信息存储与管理、人机交互系统应用;从发展趋势看,在保留各个学科自身特点的同时,实现多学科的交叉融合是健康信息学发展的必然趋势。【创新/局限】本文对健康信息学在不同学科中的研究异同进行了对比分析,有助于明晰健康信息学的起源和发展演进情况,同时为健康信息学未来的研究创新与空间拓展提供依据,但本文只收集了健康信息学在三个核心领域的研究数据,后期可以进一步扩大数据收集范围,从更广泛的学科领域对其进行更深入的分析。
2024年04期 v.42;No.392 98-110+118页 [查看摘要][在线阅读][下载 2631K] - 高春玲;姜莉媛;董天宇;
【目的/意义】本研究利用BERTopic模型实现对老年人健康信息需求的主题挖掘,可为医疗机构和相关政府部门开展健康信息服务提供依据。【方法/过程】本研究以新浪微博平台中有关老年人健康的微博数据为研究对象,通过BERTopic模型提取需求话题,结合马斯洛需求层次理论对老年人健康信息需求进行演化分析,揭示社交媒体中有关老年人健康的主题内容分布特征,并进一步探究老年人健康信息需求的时间演化路径,为满足老年人的健康信息需求给予老年人更多的关注和支持。【结果/结论】研究结果显示,老年人健康信息需求涵盖财产安全、疫情防控、饮食消化、新冠疫情、医疗诊治、气候影响、骨骼健康、社会关怀、健康知识、科技助老和视觉障碍11个主题。主题演化与突发公共卫生事件关联并存在时间特性。【创新/局限】本研究将BERTopic模型与新浪微博平台数据结合,探索老年人健康信息需求。后续期待从多数据来源进一步挖掘老年人健康信息需求的具体侧重方向。
2024年04期 v.42;No.392 111-118页 [查看摘要][在线阅读][下载 1623K] - 徐汉青;滕广青;
【目的/意义】挖掘AI环境下图书馆主题文本分布特征,以期为图书馆智能化转型和服务升级提供实践参考和理论支持。【方法/过程】本研究基于Web of Science数据库核心集合,应用BERTopic模型对检索到的相关文献进行主题识别与知识结构提取,以洞察AI在图书馆领域的研究现状和未来发展动向。【结果/结论】研究结果显示,AI环境下图书馆的研究主题主要可分为五类:图书馆智能化、馆藏资源开发、学术研究支持、信息资源建设、聊天机器人与智能代理。最后,结合主题内容分析,深入讨论了AI环境下图书馆的机遇与挑战。【创新/局限】研究工作采用先进的自然语言技术——BERTopic主题模型对AI环境下图书馆领域主题文本进行知识挖掘,未来的研究工作将纳入更广泛的数据来源,进行更加全面细致地研究。
2024年04期 v.42;No.392 119-128页 [查看摘要][在线阅读][下载 1716K] - 张世玉;丁堃;王宇开;王春博;杨中楷;
【目的/意义】在专利诉讼发生之前,对容易引发诉讼的高风险专利进行识别具有重要的意义,有助于我国相关主体及早采取防控措施,规避专利风险。【方法/过程】从美国专利商标局公布的授权专利中采集诉讼专利数据和非诉讼专利数据作为研究对象,融合专利申请、专利审查和专利价值等多维特征,利用机器学习技术构建潜在诉讼风险专利的识别模型,并进行模型性能评估与对比。【结果/结论】研究表明,基于随机森林的潜在诉讼风险专利识别模型在召回率、准确率和综合性能方面表现最优,可以有效识别出潜在诉讼风险专利,更加适用于专利风险预警及防控活动中。与基于单分类器的潜在诉讼风险专利识别模型相比,基于集成学习的识别模型在潜在诉讼风险专利识别过程中尚未表现出明显的优势。【创新/局限】本文在专利数据采集、关键特征筛选和核心算法选择方面规避了已有研究的不足,同时提供了机器学习技术在潜在诉讼风险专利识别领域的初步尝试,进一步丰富了潜在诉讼风险专利识别的理论与方法。
2024年04期 v.42;No.392 129-135+144页 [查看摘要][在线阅读][下载 1642K] - 刘颖;胡智鹏;韩心怡;王静茹;
【目的/意义】突发事件中情报复杂多样、规律难预测,对社会公共安全至关重要。如何快速有效获取和分析突发事件中情报,进行安全预警与危机情报推荐,是保障社会安全的重要课题。【方法/过程】本文构建了一个基于深度学习的突发事件多源异构情报融合与危机情报推荐系统。该系统通过深度学习算法提取事件数据特征,实现对多源异构情报的高效融合,并根据数据分析结果进行危机情报生成和策略推荐。【结果/结论】基于深度学习构建出安全保障的体系框架,通过实证分析,实现对复杂突发事件中情报的智能处理与推荐。有效地提高了对事件中危机情报的获取和利用效率,为相关部门快速制定科学的应急方案提供鼎力支持,具有重要的实践应用价值。【创新/局限】实现了基于深度学习的多源异构情报融合框架在突发事件分析中的创新应用,可以高效获取情报并自动生成推荐。框架需要大量标注数据进行模型训练,标注工作量大,样本标注的一致性和正确性需要进一步提高。
2024年04期 v.42;No.392 136-144页 [查看摘要][在线阅读][下载 1904K] - 霍明奎;李静;
【目的/意义】探究开放式创新社区用户持续知识贡献行为的影响因素及组态路径,对于设法提升用户持续知识贡献的积极性,维系社区的可持续发展具有重要意义。【方法/过程】以MIUI社区用户为研究对象,结合扩展的信息系统持续使用模型、感知价值理论、心流理论构建用户持续知识贡献行为研究模型,采用结构方程模型与模糊集定性比较分析相结合的方法进行实证研究。【结果/结论】(1)实用价值、满意度正向影响用户持续知识贡献意愿;社会价值、情感价值、心流体验正向影响满意度和持续知识贡献意愿;执行成本负向影响满意度和持续知识贡献意愿;满意度、持续知识贡献意愿正向影响持续知识贡献行为;(2)fsQCA分析发现有三类触发持续知识贡献行为的条件组态,其中社会价值、情感价值、满意度、持续知识贡献意愿在其中起到重要作用。【创新/局限】扩展了对开放式创新社区用户行为研究的理论深度,对于多变量间的复杂因果关系使用混合方法进行讨论,但样本数据可能存在同源方差。
2024年04期 v.42;No.392 145-154+166页 [查看摘要][在线阅读][下载 1661K] - 刘健;王雨菡;
【目的/意义】为了进一步丰富国内关于图书馆满意度评价的相关研究成果,构建科学的图书馆信息资源服务满意度评价体系,提升公共图书馆信息资源服务的质量和效率,提高信息资源服务满意度。【方法/过程】本研究以构建评价体系为重点,以公共图书馆信息资源服务为研究对象,基于CCSI模型综合运用文献调研法、专家问卷法以及熵权法等,构建公共图书馆信息资源服务体系,并利用结构方程模型检验理论模型和研究假设。【结果/结论】构建起一套基于CCSI模型的包括7个一级指标和24个二级指标的公共图书馆信息资源服务满意度评价指标体系,通过实证研究,证明信息服务、资源服务、馆员服务、读者感知、读者期望对于公共图书馆信息资源服务有着显著的正向相关关系,但网站服务对满意度不具有显著影响。【创新/局限】本文利用经典社会科学研究方法构建科学评价的指数模型,通过结构方程模型对该模型进行评价,对构建新型评价模型和体系展开了新的探索,但抽取样本覆盖面、均衡性和代表性等方面还有待加强。
2024年04期 v.42;No.392 155-166页 [查看摘要][在线阅读][下载 1785K]