中国科学院数学与系统科学研究院期刊网
期刊首页 在线期刊 专题

专题

第21届知识与系统科学国际研讨会(KSS2022)专题
       专题收录了在KSS2022数据挖掘与文本挖掘的3个分组报告的11篇文章. 研究全部面向实际问题. 不少文章从网络数据中挖掘有价值的信息,尤其是从人类各种行为的显性记录基于不同的机理建模而挖掘出有价值的信息充实到相关知识体系中,展现出对同一个问题求解上数据驱动与传统建模方法的相得益彰,恰是知识与系统科学国际研讨会所交流的学术成果中突出的特点. 文章的研究来自多种科研项目的支持,除国家自然科学基金面上项目和学校的一般资助外,基金重点项目如``自组织视角下的社会群体行为涌现机制和演化规律研究''和国家重点研发计划项目``面向中小微企业的综合质量服务技术研发与应用''起了主要作用. 
Please wait a minute...
  • 全选
    |
  • 唐锡晋, 李振鹏
    系统科学与数学. 2022, 42(10): 2565-2565. https://doi.org/10.12341/jssms-xuyanKSS
  • 刘鹏, 马佳楠
    系统科学与数学. 2022, 42(10): 2566-2581. https://doi.org/10.12341/jssms22492KSS
    开源社区中关键开发人员的退出会直接威胁到开源项目的可持续性,因此有效识别显著影响开发工作的关键开发人员和采取防范措施,能够促进社区集体智慧的涌现.文章对Vue和Angular开源项目进行分析,聚焦开发者的协作行为,提出了度量开发者协作行为差异性的连接系数指标,并将开发人员分为三类不同的群体和根据评价指标体系进行关键开发人员群体的识别.结果表明,文章所提出的指标明显优于已有的评价方法,当该指标所探查的关键开发人员群体间的合作行为失效时,协作网络遭受更大程度的破坏.此外,协作网络中的关键开发人员类型也包括一些度值较低和位于非中心位置的节点.这为协作网络的深入研究提供了新的视角.
  • 许诺, 赵薇, 尚柯源, 陈浩宇
    系统科学与数学. 2022, 42(10): 2582-2589. https://doi.org/10.12341/jssms22646KSS
    当前大多数谣言检测主要面向社交媒体数据,所处理文本序列较短,然而面向包含多个句子的段落或长序列文本篇章输入时,因不能提取有效特征进而影响模型识别效果.为获取谣言检测的有效信息,文章提出基于I-BERT-BiLSTM (Improved-BERT-BiLSTM)的健康类谣言检测方法,通过提取文档级长序列文本的摘要,并输入到以多层注意力机制为框架的深层神经网络进行特征提取,最后输入到BiLSTM进行谣言分类.实验结果表明:文章提出的I-BERT-BiLSTM模型在自建健康类谣言数据集与公开数据集上达到了97.75%和91.15%的准确率.
  • 闫志华, 唐锡晋
    系统科学与数学. 2022, 42(10): 2590-2601. https://doi.org/10.12341/jssms22497KSS
    为了从互联网媒体数据中识别风险事件,描述事件的演化结构和感知事件风险的演化规律,文章基于动态网络事件风险演变分析框架.文章构建时序动态网络表示事件的演化,使用Louvain算法识别事件,使用事件迁移概率构建事件之间的关系图.在识别事件演化结构的基础上,文章确定事件的主要演化路径,归纳出事件风险与事件生命周期之间的关系.研究结果表明,事件的演化存在着事件形成、事件合并和事件衰减等结构,事件演化结构够成了事件发展的主要路径,事件风险在事件生命周期的不同阶段存在差异.
  • 孔令云, 陈进东
    系统科学与数学. 2022, 42(10): 2602-2615. https://doi.org/10.12341/jssms22510KSS
    为促进电子电器行业产品高质量发展,开展电子电器行业质量安全现状与发展趋势研究.以国家及31个省市市场监督管理局2018年至2021年发布的抽检通告为数据来源,采用TextRank算法对不合格率较高的电源、手机、电磁灶产品抽检通告进行不合格项关键词提取,并对重点不合格项进行剖析;从整体、时域、地域三个维度对产品质量安全隐患进行分析,阐述中国电子电器产品的质量安全问题.研究发现,电子电器产品整体不合格率较高,但呈现逐年下降的趋势,且抽检产品覆盖率较低,东南沿海地区抽检批次相对较多.监管部门应加强监管力度与惩戒措施,对电子电器产品进行全品类覆盖式抽检;生产企业需严格把控生产过程,严格按照标准生产.
  • 张海航, 陈进东, 张健
    系统科学与数学. 2022, 42(10): 2616-2633. https://doi.org/10.12341/jssms22508KSS
    以2018——2020年国家及各省市市场监督管理局发布的食品安全监督抽检报告为数据源,基于实体识别、规则匹配及统计分析等方法,分析中国食品行业质量安全风险现状及演化趋势.首先,基于BiLSTM-CRF模型提取报告中检测类别、检测项目实体名称,并结合所提取出的实体名称进行规则匹配,挖掘报告中食品行业质量安全风险相关信息;其次,针对所挖掘的信息归纳整理,从时域、地域角度研究中国食品行业高发性质量安全风险问题成因,并探究食品行业安全现状与演化趋势.研究发现,中国食品行业整体处于良好状态,质量安全风险较低;部分安全风险的成因及解决方式需紧抓根本,行业生产、储存及销售过程中所暴露出问题的亟待解决;行业监管力度需进一步加强,食品行业从业者整体素质仍存在提升空间,部分安全风险问题的改善仍应从实际出发.
  • 冷洁, 唐锡晋
    系统科学与数学. 2022, 42(10): 2634-2646. https://doi.org/10.12341/jssms22610KSS
    近十年来,人们已习惯于在社交媒体平台上参与社会热点讨论.细粒度地分析人们对社会风险事件的情绪态度,将有助于有关部门及时发现热点问题并进行有效回应.文章引入了英国社会学家J.M.Barbalet关于影响社会结构和秩序、影响社会和谐的宏观结构情绪理论,同时结合了心理学人类情感分类和多种情感词典,并借助预训练词向量模型,拓展构建了宏观结构情绪词典.再以2019年4月“脆皮安全帽”事件为案例,识别了该事件下微博言论的主要情感类型,并基于点互信息(PMI)和2阶依存距离,抽取了与宏观结构情绪关联程度较高的实体和描述,获取了公众的主要观点和态度.
  • 丁沛, 马铁驹, 马也
    系统科学与数学. 2022, 42(10): 2647-2664. https://doi.org/10.12341/jssms22507KSS
    新能源汽车的推广对中国保障能源安全与实现双碳目标具有积极意义.在内燃机车仍在中国汽车消费市场中占据主导地位的背景下,新能源汽车还需深入推广,其销量的影响因素有待进一步明确.文章使用网络爬虫技术获取有关新能源汽车的在线评论数据,以2021年在售的129款新能源汽车为研究样本,通过文本挖掘和实证分析来揭示在线评论中特定内容对新能源汽车推广的内在影响机理.研究的主要结论如下:1)评论特征中的评论数量、评论情感极性与评论点赞数将对车辆销量产生正面影响.2)新能源汽车在线评论中有关“噪音控制”、“加速性能”、“内燃机车”、“电池与充电基础设施”与“天气”的内容将对车辆销量产生显著影响.3)在线评论中“环保”、“电池与充电基础设施”、“科技感”、“加速性能”等内容对车辆销量的影响存在异质性.研究表明,新能源汽车在线评论中的特定内容将对新能源汽车销量产生显著影响,厂商应在进行评论口碑管理的同时,针对相应内容所反映的用户反馈优化自身的生产服务.
  • 张佳敏, 王莹
    系统科学与数学. 2022, 42(10): 2665-2679. https://doi.org/10.12341/jssms22487KSS
    针对品牌价值评价费用高、消费者评价信息难以获取等问题,文章提出考虑在线评论的中小企业品牌价值评价方法.基于国标“品牌评价多周期超额收益法”框架,从资本力、消费者、创新、社会责任四个维度完善品牌强度评估指标体系;考虑以在线评论等数据评估不同维度指标,并通过AHP法判断不同维度的权重;基于灰色预测模型预测品牌的超额收益,实现中小企业品牌价值评价.以14家食品行业中小企业为例,获取在线数据,计算各企业品牌价值和排名,探究影响企业品牌价值排名的关键因素.实证结果表明,该模型对中小食品企业的品牌价值评价具有较强的适用性,对其他行业中小企业也具有一定的参考价值.
  • 刘瑛, 魏海燕, 魏翠萍
    系统科学与数学. 2022, 42(10): 2680-2697. https://doi.org/10.12341/jssms22478KSS
    在语言决策过程中,不同决策者对同一语言术语的理解不同,因此,考虑决策者的个性化语义对决策结果的合理性具有重要意义.文章在语言分布评估决策矩阵和模糊偏好关系环境下,构建个性化语义的导出模型.从决策矩阵导出的排序向量构建满足积型一致性的成对比较矩阵.然后基于模糊判断矩阵的积型一致性和特征向量的性质,从整合决策矩阵客观信息和偏好关系主观信息的思想出发,提出导出决策者个性化语义函数的两种方法:积型一致性方法和特征向量法.最后将个体评价信息集结得到方案的最终排序.文章最后结合感官评价法,将所提方法运用到对稻米进行评价的实际决策问题中,并和已有的个性化语义导出方法进行比较,说明其合理性与有效性.
  • 王鑫, 王莹
    系统科学与数学. 2022, 42(10): 2698-2711. https://doi.org/10.12341/jssms22488KSS
    针对中小企业的信用风险预测问题,文章提出了一种基于长短期记忆网络(Long Short-Term Memory,LSTM)-卷积神经网络(ConvolutionalNeural Network,CNN)的中小企业信用风险预测方法.首先,依据国标《企业信用评价指标》,结合中小企业的特点,构建中小企业信用风险预测指标体系,包括守信意愿、守信能力和守信表现三方面的财务与非财务指标;然后,优化LSTM-CNN的网络结构和参数,并使用Dropout方法与Batch归一化方法防止过拟合;最后,采集上市中小企业数据,对数据进行缺失值、标准化与过采样处理,利用LSTM-CNN自动提取信用风险特征,并进行信用风险预测.实验结果表明,文章构建的指标体系能够更为全面的反映信用风险状况,基于LSTM-CNN的中小企业信用风险预测效果优于其他信用风险预测模型,克服了传统方法无法对中小企业时序数据进行动态预测、忽视中小企业发展潜力与时间延续性的局限.
  • 卢哲, 张健
    系统科学与数学. 2022, 42(10): 2712-2726. https://doi.org/10.12341/jssms22493KSS
    准确把握上市公司的信用风险状态对监管者和银行等金融机构意义重大,融合财务指标与非财务指标构建信用风险预测指标集,文章提出了一种上市公司信用风险预测组合算法SMOTETomek-RFE-MLP.SMOTETomek混合采样算法以少数类样本过采样、多数类样本欠采样的方式解决样本分类不平衡问题;递归特征消除(Recursive feature elimination,RFE)算法将特征逐个加入模型,以分类精度为标准筛选出最优特征组合;多层感知机(Multi-layer perceptron,MLP)作为分类器实现上市公司信用风险预测.为验证算法的有效性,以2019年A股3797家上市公司的研究对象,设计基模型对比实验和消融实验进行算法测试.研究结果表明,SMOTETomek-RFE-MLP信用风险预测算法综合表现优于Adaboost等基线模型,解决了数据不平衡引起的分类紊乱和特征选择问题,对金融机构评估上市公司的违约风险具有一定的指导意义.