当前位置:首页 » 翻译 
  • 匿名
关注:1 2013-05-23 12:21

求翻译:本课题主要研究陶瓷行业博客文本聚类技术,以观点各异、存储分散的博客中的博客标题、博客正文及读者评论为研究依据。研究的主要内容是:分析了博客文本挖掘的相关理论和相关技术,在此基础上,通过博客搜索引擎获取种子,运用闻天下RSS2.0工具结合改进的网络蜘蛛爬取博客数据集;然后对数据集进行预处理、建立矩阵及SVD奇异值分解矩阵等等,预处理主要包括分句、分词、过滤停用词和提取陶瓷信息词语;然后,结合Python的优点和特点,选择Python作为开发语言研究聚类算法,利用此数据集采用分层聚类算法技术进行聚类,并总结分析了分层聚类算法在实现大数据量的博客文本聚类的不足之处,从而选取k-means聚类算法实现博客聚类;最后,采用k-means算法针是什么意思?

待解决 悬赏分:1 - 离问题结束还有
本课题主要研究陶瓷行业博客文本聚类技术,以观点各异、存储分散的博客中的博客标题、博客正文及读者评论为研究依据。研究的主要内容是:分析了博客文本挖掘的相关理论和相关技术,在此基础上,通过博客搜索引擎获取种子,运用闻天下RSS2.0工具结合改进的网络蜘蛛爬取博客数据集;然后对数据集进行预处理、建立矩阵及SVD奇异值分解矩阵等等,预处理主要包括分句、分词、过滤停用词和提取陶瓷信息词语;然后,结合Python的优点和特点,选择Python作为开发语言研究聚类算法,利用此数据集采用分层聚类算法技术进行聚类,并总结分析了分层聚类算法在实现大数据量的博客文本聚类的不足之处,从而选取k-means聚类算法实现博客聚类;最后,采用k-means算法针
问题补充:

  • 匿名
2013-05-23 12:21:38
正在翻译,请等待...
  • 匿名
2013-05-23 12:23:18
正在翻译,请等待...
  • 匿名
2013-05-23 12:24:58
正在翻译,请等待...
  • 匿名
2013-05-23 12:26:38
正在翻译,请等待...
  • 匿名
2013-05-23 12:28:18
正在翻译,请
 
 
网站首页

湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区

 
关 闭