申请入驻
会员登录
首页
专家库
成果简介
采编系统
官方活动
综合
综合
专家
记者
成果
新闻
观点
活动
检索
第一学习
智库首页
>
智库成果
>
期刊论文
基于LDA模型的高校论坛热点提取系统
楼小帆
吴军
马严
林昭文
· 2016
分享
收藏
阅读量:62
机器学习
潜在狄利克雷分配
主题模型
网络舆情
数据挖掘
高校论坛
期刊名称:
华中科技大学学报(自然科学版) 2016 年 S1 期
摘要:
针对论坛缺乏热点话题提取方法的现状,提出一种将LDA(潜在狄利克雷分配)模型引入高校论坛场景主题的提取方式.在主题建模过程中,以回帖数量作为帖子热门程度的判定参数,根据帖子热门程度在语料中设置不同权重,随后使用Gibbs采样法提取主题.在此基础上设计并实现了包含数据抓取、文本预处理、主题提取三个模块的完整系统.将LDA模型引入系统并进行提取效果分析,实验结果表明LDA模型可以准确地提取出论坛文本中讨论的实时热点话题.
相关专家
相关课题