基于矩阵分布描述的专业运动员社会网络建模与应用
王秋茸 黄谦 · 2019
收藏
阅读量:372
会议名称:
第十一届全国体育科学大会
会议时间:
2019-11-01 00:00:01
会议地点:
中国江苏南京
摘要:
研究目的:中国专业运动员的培养主要采用政府主导型体制,运动员交往范围小,领域窄。目前,有关专业运动员社会网络的研究主要集中在整体网络特征分析和个体特征对于社会支持网络结构的影响两个层面,静态分析居多,动态发现较为缺乏。本研究拟基于矩阵分布描述,采用机器学习手段,探索运动员社会网络的隐含关系,对其网络结构进行构建与分析。研究方法:2.1文献资料法查阅有运动员培养、社会网络构建等专业文献资料,掌握复杂网络视角下社会网络结构构建方法以及矩阵分布的应用现状。2.2问卷调查法对专业运动员网络关系进行调查,问卷包含21个因子,涉及日常求助、心情倾诉、社会交往、收入讨论、管理讨论、婚恋讨论、就业帮助及成绩帮助等八个维度,回收有效问卷144份。2.3数理模型法借助协方差矩阵,通过矩阵分布描述运动员社会网络结构,非参数高斯过程构建网络结构的非线性,利用贝叶斯网络推断网络连接关系对潜在的网络结构和形成网络的潜在因素,建立一套面向专业运动员的社会网络模型。2.4模拟仿真法根据问卷数据,通过多次平行实验,对运动员关系矩阵中的缺省链接进行预测,分析社交网络因子、划分社区以及评估社区影响因子。研究结果:3.1建立网络观察模型对于给定运动员网络Y(表示为一个n*m的矩阵,其中n表示网络中节点数目,m为节点类别数目),描述Y=X+E,X=U’WV,U和V对应一个n*d和m*d的矩阵,是网络中节点在隐藏空间的表示,U为隶属矩阵,每一列代表节点的聚类信息,W是一个m*m的矩阵,代表类别之间的相互作用。E是网络中的噪音。网络中连接关系可能存在噪音,而具有鲁棒性的t-分布能够有效去除噪音,假设W服从一个自由度为r的矩阵t分布,即W-mt(r,0,I,I),I是单位矩阵,则X也服从一个自由度为r的矩阵,其协方差矩阵K和G包含了给定网络矩阵Y的行上和列上的信息,即X-mt(r,0,K,G)对于对称网络(如运动员-运动员网络),K等于G;对于非对称网络(如运动员-教练网络),K不等于G。用行和列上协方差函数,采用非线性协方差函数来描述个体间的非线性互动关系。3.2建立稀疏矩阵高斯过程分析模型利用网络中边的属性信息,建立如下边和属性间的关系模型:Xij=β·rij+mij式中第一部分是一个线性回归模型,β是回归权重;第二部分是一个隐藏交互关系变量,mij是矩阵中的第(i,j)个元素。矩阵M由一个隐藏矩阵U决定,而Xij是边对应的一个隐藏变量,与边的变量Yij不同的是,Xij是连续型变量。3.3运动员个体网络深度构建中的关系预测针对问卷八个主题网络,利用五重交叉验证对事件集进行随机划分,得到不同的训练集和测试集,分析专业运动员群体人际关系网络,预测其邻接关系,推断个体间的隐含关系,实现对整个网路的深度构建。经过平行实验,网络链路预测AUC结果达到0.99,说明算法的准确度比较理想。另一方面,对预测分析算法进行评价,从混淆矩阵表示来看,TN=67,FP=0,FN=3,TP=67,正例覆盖率能够达到96%,代表了算法判断为真的正确率;漏报率为4%,代表了算法对于实例预测中模型预测为负的正样本比重。模型准确率和召回率调和平均值F1=0.98,说明分类精确度可达到98%。效果理想。3.4算法应用从因子分析的结果看,因子0家庭经济状况、因子7平时和队友交流以及因子10所从事的运动项目会对社会交往网络产生较大的正面影响,而受教育程度也对社会交往网络有较大贡献。使用机器学习手段进行社区关系分析,根据聚类关系将网络划分为四个社区,剔除其中节点数少于20个节点的小社区。以节点数降序对各个社区依次编号为1,2和…。对3个较为大的社区进行稀疏矩阵高斯过程分析,对于子群1,2和子群2,3,10号因子是这两个子群差异形成的最大影响因素。10号因子对应问卷401问题:队内突发事件处理是否得当。对这个问题的不同认识中,导致了节点之间的差异性,从而产生不同的社区。可以获知,2社区和3社区比较而言,10号因子的影响使得节点更易于汇聚在2社区;1社区与2社区比较,10号因子的影响使得节点更易于汇聚在2社区,而不是1社区。在社交网络关系中,节点对于特定社区的汇聚也反映出一定的合作与竞争的趋势。研究结论:4.1在专业运动员社会网络构建中,针对问卷数据,在基于八种网络数据的节点关系预测上,AUC结果达到0.99,F1-Score为0.98,说明算法分类精确度高,预测比较理想。分类器的统计量反映出模型和算法具有较为理想的性能表现。4.2在网络节点因子分析过程中,机器学习方法能够快速准确地获得节点因子对于其各种关系网络的影响程度,适用于对专业运动员节点的支持属性因子分析。4.3在对专业运动员复杂网络的社区分析研究中可以看出,专业运动员的社区汇聚受到某些特定因素的影响,算法可以得到运动员在网络关系上的合作趋势,另外社区多为小规模的群体,小世界特征明显。本研究的模型和算法具有较好的适应性。
相关专家
相关课题