8月31日晚,中央民族大学新闻与传播学院助理教授、清华大学新闻与传播学院博士向安玲作为青年学人开启了2022年秋季学期博闻前沿讲座的第一讲。本次讲座主题为“媒介大数据如何赋能传播学研究”,由赵丽芳教授主持,学院师生以及清华大学、中国人民大学研究生等100余人通过线上讲座学习。
讲座以“媒介大数据在新闻传播中的应用场景与价值”导入,围绕数据获取、数据分析、数据应用三个方面通过大量案例逐次展开,用大量案例为同学们清晰、易懂地介绍了新闻传播实践与新闻传播研究中的大数据分析的逻辑与方法,以及获取公开数据的路径与途径,培养同学们初步建立数据思维。
一、数据获取:从哪些渠道获取什么数据?
向安玲老师介绍了10类数据以及这些数据的获取及分析方式,着重展
示了社交媒体、搜索指数、裁判文书、网络问政数据等的获取及分析方式,演示了通过清博指数、百度指数、中国裁判文书网的数据生成图表的方式,以及如何利用NLP工具进行文本情感分析、生成词云图、展开语义联想等。
二、数据分析:用什么方法得出什么结论?
向安玲老师通过大量案例直观地展示了统计数据分析的四个层次:描述性、关联性、因果性和推断性。描述性统计分析是最为基础的方法,可以得出数据的趋势、频度、比例等;相关性分析能够衡量变量间的密切程度,如股市关联、经济关联、空间相关;因果性分析可以确定引起某一现象变化的原因;推断性分析能预测数据的趋势,分析数据的周期性。向老师还深入浅出地讲解了常见的新媒体文本数据分析方法,即进行词频分析、共现网络、情感分类等。
三、数据应用:媒介数据如何赋能传播研究?
在数据应用上,向安玲老师表示数据常常被用来进行群体画像、产品画像、事件研判,还可以利用数据进行多维场景拓展。
在互动环节中,同学们就“视频文本分析方法,评论文本的情感分析工具与方法”等问题积极提问,向安玲老师就数据获取网站及操作方法等进行了详细的解答。
赵丽芳老师最后对讲座进行了总结。赵老师说,基于数据的挖掘、清洗和分析,难以计数的历史数据,即时产生的新数据将被结构化地呈现,基于此同学们能够洞察数据密码,建立结构模型,洞悉社会有机体的有机联系,进而开展因果分析、相关性分析和推断性分析等,希望通过今天的讲座,同学们能“亲近”数据,主动学习掌握一些操作工具,习得分析方法,积极探索面向多角色、多场景、多层次的大数据应用。