基于LDA模型的高校论坛热点提取系统
楼小帆 吴军 马严 林昭文 · 2016
收藏
阅读量:62
期刊名称:
华中科技大学学报(自然科学版)   2016 年 S1 期
摘要:
针对论坛缺乏热点话题提取方法的现状,提出一种将LDA(潜在狄利克雷分配)模型引入高校论坛场景主题的提取方式.在主题建模过程中,以回帖数量作为帖子热门程度的判定参数,根据帖子热门程度在语料中设置不同权重,随后使用Gibbs采样法提取主题.在此基础上设计并实现了包含数据抓取、文本预处理、主题提取三个模块的完整系统.将LDA模型引入系统并进行提取效果分析,实验结果表明LDA模型可以准确地提取出论坛文本中讨论的实时热点话题.
相关专家
相关课题