包含微博爬虫、LDA主题分析、情感分析、时空协同分析四个部分。 实现文档主题抽取,包括数据清洗及分词、主题数的确定(主题一致性和困惑度)和最优主题模型的选择(暴力搜索)。