李传权, 方岚然, 苏琦, 刘小惠, 盛积良
R软件作为统计领域重要的开源软件, 开发历史久远, 生态系统较为成熟. 基于此, 文章从复杂的有向网络角度出发, 探讨R软件包的核心组成、依赖关系, 对软件包之间的依赖网络进行社区划分, 对其发展脉络进行深入研究, 从而可以让R语言开发者、使用者快速了解R软件. 研究表明: R 软件迅速发展, 功能多样; R 软件包间的依赖关系服从幂律分布和“小世界”现象; R 软件包的依赖网络中有“统计模型”, “高性能计算”, “数据可视化”, “网页技术”, “数据预处理”, “生物信息”子社区. 综合上述分析, 文章有如下发现: R 软件生态系统可满足整个数据分析全流程的需求, 与时俱进地扩展, 吸引了来自世界各地的开发者, 注重长期维护软件包的健康. 最后, 文章从R 软件的开源模式中来探索对国产开源软件及其生态系统的指导意义.