王甜甜, 张曦林, 薛闯, 卫国, 谢小良
随着技术、经济和社会的快速发展,人们的生活质量得到了极大的提高.然而, 工作和生活的快节奏也带来了巨大的压力.紧张、焦虑和担忧等生活困扰, 及其带来的体内化学物质失衡,会给患者带来多种精神障碍问题, 如抑郁症、躁郁症和焦虑症.精神问题往往同时涉及多种相关的精神障碍. 为了解决这些问题,文章提出了一种利用机器学习方法和改进的多标签$K$近邻(ML-KNN)模型的解决方案:基于标签相关性的多标签学习算法.该算法首先利用FP_growth算法挖掘样本的多个标签之间的相关性,获得标签的频繁项集. 然后构建频繁项集和标签的评分模型和阈值模型.前者用于衡量样本与频繁项集或标签之间的相关程度,后者用于解决与频繁项集或标签相对应的判别阈值,并结合起来预测样本的频繁项集. 其次, 考虑到标签相关性,还引入高斯权重来量化不同实例之间的距离. 最后,为了解决模型预测中可能出现的空标签的问题,还依靠传统的$K$近邻(KNN)算法对空标签数据进行二次预测,进一步提高了预测精度.该算法首先在公开数据集reuters、scene和emotions上与KNN 进行比较,以验证算法的有效性. 然后在临床数据集上进行实验,结果显示该算法的F1分数、准确度、$\alpha$准确度和Rate指数分别达到了63.57%、72.73%、73.17% 和70.04%. 最后,与该数据集上的每种基准方法的实验结果进行比较, 平均性能提升为2.8%,证明该算法合理利用了标签之间的相关性和高斯权重对实例之间的距离进行量化.