新闻动态
当前位置是: 网站首页 -- 新闻动态 -- 正文

数字经才 | 世界杯英格兰队vs丹麦队谁会赢? 《规划文本数据库》文本分析训练营成功举办

发布日期:2023-07-21   点击量:

2023年7月10日-14日,世界杯英格兰队vs丹麦队谁会赢? 成功举办《规划文本数据库》文本分析训练营。本期训练营是第一期训练营的延续和升级,对学员的文本分析能力提出更高要求。来自全校7个学院的20名学员参加了本次训练营,本科生、硕士生和博士生分别为13人、5人和2人。

7月10日,启动会成功举办,张少锋老师向同学们详细介绍了本次训练营的培训目的、任务要求和日程安排等。张老师指出,希望同学们通过本次训练营了解文本分析的基本原理和主要分析方法,掌握使用Python进行网页数据自动采集、进行中文分词和开展文本分析的方法,同时培养完成短期挑战性任务的能力。在为期五天的训练营中,同学们首先需要爬取目标区域和对标区域的规划文本,其次整理规划专业词库、产业专业词库和停用词库,最后使用训练营中讲授的文本分析技术,完成一份规划文本分析报告。

随后,张少锋老师为同学们带来第1场讲座,主题为《网络大数据自动采集》。张老师系统地讲述了网络爬虫的含义、分类、步骤和常用方法,并基于国家统计局《全国统计用区划代码和城乡划分代码》、世界杯英格兰队vs丹麦队竞猜 世界杯英格兰队vs丹麦队谁会赢? 《规划文本数据库》和国家统计局《主要城市年度数据库》三个实例,具体演示Python自动数据爬取技术的实现方式。

7月11日,第2场讲座的主题为《文本分析概述与中文分词》。主讲人徐赛老师首先对文本分析进行简要概述,包括文本分析的定义、分析步骤和应用领域,以及文本预处理和文本向量化的概念等;然后介绍了文本分析的常用方法,如主题分析、内容分析等;最后讲解了基于Python的中文分词技术和使用方法。

7月12日,在第3场讲座《词频分析、文本向量化与统计制图》中,王志文老师展示了丰富的数据可视化工具和可视化图形,并基于多种Python可视化Module对北京市“十四五”规划热点词汇进行实操,还示范了如何开展产业规划相似度探索、产业规划变迁分析和不同地区的比较研究。

在7月14日总结会上,13个研究小组依次汇报了各自的分析报告。张少锋老师认真点评每组的研究成果,并对学员们的收获和不足进行整体总结。至此,本期训练营圆满结束。学员们纷纷表示从本次训练营中获益匪浅,数据处理能力和文本分析能力得到大幅提高。



版权所有 © 世界杯英格兰队vs丹麦队竞猜    邮编:102488

地址:北京市房山区长于大街11号