1 / 13
文档名称:

gitmining:github数据的挖掘与展现(ppt课件).pptx

格式:pptx   大小:1,619KB   页数:13页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

gitmining:github数据的挖掘与展现(ppt课件).pptx

上传人:1017848967 2021/11/6 文件大小:1.58 MB

下载得到文件列表

gitmining:github数据的挖掘与展现(ppt课件).pptx

相关文档

文档介绍

文档介绍:GitMining:GitHub数据的挖掘与展现
张伟强
南京大学

GitHub用户遇到问题
GitMining来解决:挖掘GitHub并可视化
难以找到合适的项目
难以快速了解某个项目的情况
难以总结回顾自己的活动
难以预测项目的未来
开发者
难以找到合适的开发者
难以快速了解某个开发者
难以监测当前项目的进展
难以预测项目的未来
项目管理者
4
3
1
2
项目类型
编程语言
创建/更新时间/Age
Contributor数
Commit数
代码量/文件数
Issue/Pull Request数
Star/Fork数
最近活动频率
主观评分
基本指标
1
GitHub全社区项目统计
帮助开发者找出合适的项目
统计
筛选
排序
基本属性
定性特征,定量统计
2
单个项目展示
了解项目,监测项目
度量代码及关系
行/文件/类/方法数
复杂度/包结构
依赖关系图
代码
代码的演化
被修改的频繁程度
各个开发者关注区域
容易出错的代码
提交
Issue/Pull Request
分类统计/评论统计
各类型内容的演化
问题处理时间快慢
讨论
参与者的活动
人员类型划分
人员流动情况
各类活动参与情况
社交关系
人员
3
开发者的统计和筛选
帮助雇主找到合适的开发者
组织/个人
加入时间/公司/位置
常用的编程语言
创建/参与/订阅项目数
Follow/Follower数
Commit/Issue/PR数
生产效率
最近活动频率
主观评分
基本指标
4
开发者的个人档案
记录活动轨迹,展示重要贡献
最近活动
提交代码,报告、修复、评论Issue/PR等
紧密相关者
互相关注对方
一起参与过很多个项目
长期在同一个项目中有互动
主要参与项目
按照提交数对项目排序
基本属性
个人信息
创建/参与项目
Watch/Fork项目
Follow/Follower
Commit/Issue/PR
编程语言/项目类型
主观评分
活动演化
关注点转移过程
重要时间点:创建项目/成为项目成员
GitMining当前进展
数据收集,框架搭建
原生项目——非fork
#commit不小于100——具备一定规模
#contributor不小于3——多人合作项目
持续时间不小于1年——长期进行的项目
有closed issues和PRs——接受他人参与
项目筛选标准

GitMining的意义
在产学研中的作用
帮助GitHub用户
开源项目开发者
开源项目管理者
应用于教学
和慕测系统结合
记录学生的成长轨迹
监测学生项目的情况
提供研究数据
项目类型多样
数据量大,内容全面