舆情分析-人物画像
最近在做舆情分析的课题,稍微记录一下.
所需技术
- 爬虫
- 话题分析
- 人物画像
- 命名实体识别
- 意见抽取
- 情感分类
- 文本分类
任务
课题:境外涉华人物画像
数量:不少于100
国家/地区:美日澳印、欧洲、东南亚、俄罗斯、港台
领域:智库、军情、政治、法律、高科技(人工智能、芯片、通信、电子、材料、太空、航天等)、演艺、人文、知名大学毕业生
实时跟踪社交媒体动态(Twitter、Facebook、Line、Linkedin)
社交情况及社交指数
人格分析:大五人格
涉华言论(文本、音视频)、热点话题及其情感极性
对华好感指数
预期成果
实时跟踪twitter, facebook等社交媒体动态,生成境外涉华人物画像。人物涉及多个国家地区,并分析相应人物的社交指数,大五人格,以及对华好感指数等,并对其涉华言论的情感极性进行深入分析。
通过可视化,建立图形化界面等技术,从公共社交媒体上利用爬虫爬取公开的涉华人物的相关信息动态,完成预期的目标任务,做成一个能够从公开媒体上爬取并分析信息情报的平台雏形,具有相当的实用价值。
初步模型
实现过程
数据爬取及处理
社交指数分析
涉华言论情感分析
人格分析
大五人格
1 | 开放性(openness) |
对华好感指数
在不同领域探索对华好感指数
热点话题抽取
PS:此项目小组合作完成 , 源代码暂不公开
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 h4m5t's Blog!