2022年最火网络新词语,2024最火网络新词

首页 > 娱乐 > 作者:YD1662024-05-06 10:40:48

“2023年度中国媒体十大流行语”于12月6日由国家语言资源监测与研究中心发布。本次发布的十大流行语为:中华民族现代文明、高质量共建“一带一路”、全球文明倡议、数字中国、杭州亚运会、核污染水、巴以冲突、大语言模型、神舟十七号(神十七)、村超。

“媒体十大流行语”是如何产生的?其中有怎样的规律、意义和价值?上周,长江日报《读 》周刊专访了国家语言资源监测与研究平面媒体中心主任、北京语言大学教授杨尔弘。

2022年最火网络新词语,2024最火网络新词(1)

流行语不等于高频词

流行语是指在一定时期内,某一地域或者某一人群中迅速传播、盛行的词汇,主流媒体流行语是指在一定时期内,在报纸、电视、广播、网络等大众传媒受众中迅速传播、盛行的语词。它的定期发布是语言动态监测工作的重要部分,具有重要的学术价值和深广的社会文化意义。“流行语”可以是已有的词或者语言符号,也可以是一个新词,或者是由若干个词组成的短语;广为传播、盛行一时是流行语的重要特点,从产生、较少使用到广泛传播,这个过程历时很快,会给人异军突起的感觉,有产生、兴起、顶峰、平缓这样一个过程。

自2002年起,北京语言大学应用语言学研究所开始进行报纸流行语的研究。2004年成立了国家语言资源监测与研究中心平面媒体中心,主流报纸流行语的动态跟踪研究纳入该中心任务。从2005年开始,杨尔弘就深度参与了我国的语言监测研究工作。2006年5月教育部、国家语委首次以“中国语言生活绿皮书”的形式发布《中国语言生活状况报告(2005)》,公布了报纸、广播电视、网络的整体的用字用语,公布了中国报纸十大流行语;同年12月,举行了首次汉语盘点活动,公布当年的年度汉字、媒体流行语和热门新词语。此后该报告每年发布,她是这一系列报告的主编之一:“用一个字、一个词来描绘描述中国描述世界,用十大媒体流行语、十大新词语、十大网络用语来记录这个社会、这个时代,既是汉语之美的集中体现,也是对社会面貌的浓缩反映。流行语映射了这些词语折射了这一年发生的重大事件,诉说了这个时代的民生民情,记录了社会图景。”

本月公布的“2023年度中国媒体十大流行语”是基于国家语言资源监测语料库,利用语言信息处理技术并结合人工后期处理提取、筛选而获得。语料来源于2023年1月1日至2023年11月底国内15家主流报纸(包括国内的机关报、地方都市报和发行量较大的晚报),央视、央广及地方12个电视台和7个电台的转写语料,以及2个门户网站的全部文本,语料规模达10余亿字次。

流行语不等于高频词语。国家语言资源监测研究中心每年调查媒体的用字用语情况,公布的高频词语每年大约1.2万条左右,这些高频词不同于流行语,年度流行语的特点是要在极短的月度之间迅速达到相对的高频。因此,除了在大规模的文本语料中利用计算机来切分、提取,还要对候选词进行人工干预、综合平衡,这样最终确定的流行语更科学也更全面。

【访谈】

最大的价值就是记录国家发展变化

读 :在您看来,发布“十大流行语”等活动,其意义和价值是什么?

杨尔弘:媒体流行语盘点年度媒体的大事小情,包括“分类流行语”在内,以100个左右的精练词语,记录风云变幻中的中国与世界,共同测量时代的体温,面向世界、贴近生活,勾勒出一幅笔墨清晰、亮点突出的时代卷轴。在这里,你能读懂媒体上的中国和世界。

就以这次发布的2023年十大科技类流行语为例,分别是数字孪生、神舟十六号、脑机接口、天舟六号、国产大邮轮、生成式人工智能、人工智能(AI)安全、《科技伦理审查办法(试行)》、高能同步辐射光源(HEPS)增强器、九章三号。

而10年前,2013年的科技类十大流行语,则是神十、4G(第四代移动通信技术)、3D打印、无人机、旅行者1号、运-20、天河二号、可燃冰、玉兔号、石墨烯,这是当年科技成果的重要体现。

10年间,神舟飞船已经从十号进展到十七号(“神十七”入选了2023年度媒体十大流行语),而4G则从热门流行变成了日常,从这些变迁,就能看出我国科技事业的进步。

如果再细看,今年的流行语有“国产大邮轮”,如果回溯过去发布的流行语,就会发现,包括航母、大型液化天然气 (LNG)运输船等都有上榜,这些被誉为“造船工业皇冠上的三颗明珠”,我们国家把这3颗明珠都集齐了。

2021年我们还发布了“航天专题流行语”,那一年中国航天好戏连台,空间站“天和”核心舱进入预定轨道,迎来第一位访客“天舟二号”,四个月后,天舟三号也来了,两艘中国货运飞船同时在天运行,对接“天和”的两端,为航天员、空间站送去补给,创造了中国航天史上的第一次;神舟十二号、十三号载人飞船顺利升空,分两批将中国航天员送入空间站,他们首次开展较长时间的出舱活动;王亚平成为中国首位出舱行走的女航天员,创造了中国航天的新纪录,也为世界航天发展贡献了“她力量”。“祝融号”火星车完成既定巡视探测任务;首颗太阳探测科学技术试验卫星“羲和号”顺利升空;嫦娥五号返回器带回月球样品。我们为这些流行语建立榜单,用最简洁的方式记录了中国航天事业的突飞猛进。

我们发布流行语榜单,就是高度浓缩了这一年的重大事件,勾画社会图景,讲述民生民情,提示这一年究竟有一些什么样的大事。

一年很长,一年也很短,我们用十大流行词语、用一个字一个词盘点这一年,它最大的价值,就是一种记录,记录国家、社会的发展,记录百姓的生活。

“流行语是社会的反光镜”

读 :根据您多年来的研究,这些流行语背后有怎样的产生规律?

杨尔弘:在一定历史时期,在一定的社会生活背景下,一些词语的使用频率会明显高于语言系统中的其他词,甚至还会产生语言系统中从未有过的新词语。这些词语成为流行语,大致有几方面原因。

政治经济生活催生。语言与社会紧密相连,社会的发展变化会影响语言的发展变化,语言运用会紧跟时代,联系社会。国际和国内社会政治经济的巨大变化、重大政策推行、*的重要讲话都成为流行语的催生剂。

重大事件促生。国内外发生的重大事件也是当代社会流行语的催生剂,包括具有里程碑意义的盛大事件以及突发事件。

科学技术引领。当今科学技术快速发展,科技领域里每年都进行着在国际或国内具有突破意义的科学实验,都会出现新的与人民生活相关的科技产品。

多元文化诱发。社会文化越来越多元,电视、电影、网络、文化交流等文化现象越来越频繁地发生,主流媒体文化紧跟时代,反映受众多元化的文化心态。在对传统文化关注的同时,时代也越来越尊重大众话语权和草根文化、平民文化。

此外,人们追求语言新鲜感,崇尚语言层面的时尚度,也会造成某些词汇大量运用。例如2010年的“给力”,2022年的“村BA”,2023年的“显眼包”,这些词语源于口头,由于它的时尚感,以及词语本身散发出的魅力,迅速成为语言中的一种流行文化,渗入到社会生活的方方面面,在报纸、网络、电视等大众媒体中也占有了一席之地,自然成为媒体流行语。

语言不是天外之物,它的形成、源起、使用、生成、搭配和组合,都具有其事件文化理据。社会每年都会滋生很多新现象、新事件,已有的词汇、词组或者短语不能够表达这些新的现象,于是就会产生大量新造的结构来阐述这些社会新现象。语言是社会的产物,是社会生活在人们头脑中的反映,具有社会特性。隶属于语言的流行语也同样具有社会性,它与社会的政治、经济、文化密不可分。正如专家所说,“流行语是社会的反光镜,是时代的透视机,透过流行语,我们可以观察社会的发展,也可以了解大众的心态。人们的价值观念、社会思潮、取舍好恶、心路历程都可以在流行语中展露无疑”。

读 :我注意到,今年的十大流行语当中有“大语言模型”,这个词能否概括、反映人工智能在2023年引起的强烈关注?

杨尔弘:在2023年的语料库中,ChatGPT、生成式人工智能、AIGC等词语数据非常好;可是ChatGPT到现在为止还没有一个汉语名称,从科普角度来说,这还是有一定障碍的。我们综合考虑了这一组词语的数据,最后选了“大语言模型”这个更容易理解的词语。我们希望用这样的一个词语来传播当前迅速发展的人工智能技术,让更多的人了解技术的本质,同时读起来又很流畅,符合汉语的特点,至于这些词语背后的细微差别,不是做技术研究的人员都可以忽略。

“千字万词”是汉语的一条规律

读 :流行语是从10余亿字次的语料库中筛选出来的,能否更具体地说说,这种筛选如何进行?

杨尔弘:首先是搜集语料。流行语的选取来源主要是主流媒体,包括主要的报纸和广播电视节目、门户网站。 其次就是穷尽式搜索。要把这些语料里从二字到九字的字串全部提取出来作为下一步的分析对象。 再次是拟合曲线。在短时间内,流行语的使用率可以从几乎为零的低起点升至非常高。我们将媒体的数据按照月度分开,用月度的字串数据拟合出具有迅速传播特点的曲线,通过模型的计算结果,就可以获得符合传播模型的候选流行语。 最后是人工干预。人工干预所参考的要素中,一是概括性;二是分类,每年流行语的分类是在数据提取的结果之上,通过词语的集中度来人工划分的,如时政、经济,文化等等;第三,要考虑语言本身的美感。

读 :我想请教一个技术问题,“从二字到九字的字串全部提取出来”,是否很容易发生误读,比如“中华民族现代文明”,可以划分为好几个词,现在是作为一个流行语来统计,机器能够识别吗?人工智能在这方面有帮助吗?

杨尔弘:对汉语进行分词,是中文信息处理的一个基本任务。由于汉语的文本本身是汉字的线性串,之间没有空格,会使得词语切分有歧义性,比如“马上”既可以指马的背上,也可以指立刻的含义,前者可以分成两个词语,后者是绝对不可以分开的。同时,汉语词语的边界也存在不同的认知,在汉语分词的研究中,曾做过一个实验,让6个母语为汉语的人对同一篇文本进行分词,通过结果的对比,得出人与人之间的词语平均认同率只有76%左右;而且大规模的语料处理,仅凭人工来处理是不可想象的。我们提取流行语,没有利用分词技术,而是利用字串拟合曲线,是由当前汉语分词的技术特点与目标任务的权衡确定的,就我自己的观察与实验,目前先进的大语言模型也无法满足我们从特定的媒体语料中提取各类流行语的需求。 至于今年兴起的生成式人工智能,无法用在我们的工作上。如果你问现在公开使用的各种大模型,“今年的流行语是什么”,它的确会给出一个答案来,但是这个答案是它生成的,并不是从特定的语料中提取出来的。

读 :从事语言监测近20年,您觉得这方面有哪些规律性的东西可以说说?

杨尔弘:尽管每年社会生活都发生很大的变化,但汉字使用表现了很强的规律性:每年大众媒体上使用的汉字在1万个左右;覆盖语料80%的汉字数量在600左右,覆盖语料90%的在1000以内,覆盖语料99%的在2400左右。这就给了我们常用汉字不同等级的数量标准。汉语用词也表现出很强的规律性:每年大众媒体上使用的词语数量是跟语料规模成正相关关系的,语料规模越大,所用词语越多;10亿字次规模的语料大约使用词语220万左右;覆盖语料80%的词语数量在4700左右,覆盖语料90%的在12000左右。这也给了我们汉语常用词语不同等级的数量标准。覆盖率达到90%,汉语最常用的字词数量可以概括为——“千字万词”。

随着社会的变化,不同年度所使用的字词也会发生变化,这可以从共用、独用角度看出。从汉字来看,各年度共用汉字都在65%以上,而各年度独用汉字基本都不到5%。如果用一个字来概括说明各年度汉字的使用状况,那就是“稳”。

跟汉字相比,词语使用情况发生了相当大的变化。各年度共用词都不到10%,而独用词都占将近一半。相邻的两年来比较,共用词占30%左右,独用词占到70%左右。如果也用一个字来概括说明各年度词语的使用状况,那就是“变”。看来,字是以稳为主,稳中有变,稳是主流;词是以变为主,变中有稳,变是主流。

这一事实印证了洪堡特和乔姆斯基的语言观:语言以有限的形式实现了无限的表达。

字母词大量使用是新时期汉语书面使用系统最大的一个变化。关于字母词的使用问题,一直争议不断。有人认为,像NBA、WTO、GDP这些外文缩略词的使用会使得汉语出现危机。字母词的使用到底是一种怎样的情况?我们对1990—2012年《人民日报》字母词的使用情况进行了调查。

以2000年为界分成两段,前一段的11年间字母词数量上升较快,从每年使用300多个一直升到1000多个;2000年以后的12年间字母词数量略有上升,但基本上是在1000个左右波动。这似乎告诉我们:汉语对字母词的吸收和使用不是无限制的,到达一定的量就会处于饱和状态。

字母词使用的稳定性如何?也可以通过年度间共用的统计数据来说明。《人民日报》23年间一共使用了近1万个不同的字母词,共用的字母词只有23个:ABC、BBC、B超、CAD、CCTV、CNN、CT、DNA、GE、IBM、NEC、NHK、PC、PVC、SOS儿童村、T恤、T恤衫、X光、X光机、阿Q、卡拉OK、维生素A、维生素C。而人们很熟悉的APEC、NBA、GPS、MBA、MTV等是1992年以后才开始使用的。

这个调查证明:汉语不存在危机,不会因字母词的使用而消亡;字母词使用很不稳定,绝大部分字母词是低频使用的,对大多数人是陌生的,应尽量少用;应推动外文缩略词的汉化工作。我国已成立外语中文译写规范部际联席会议专家委员会,专门负责这项工作。相信通过这样的工作,汉语会朝着越来越健康的方向发展。

链接>>>

分类流行语是笔触简洁的“领域素描”

除了“十大流行语”之外,从大规模的语料中自动提取出的流行语和热门新词语,每年都有百余条。杨尔弘和她的同事们根据内容将其划分到政治、经济、科技、娱乐、社会生活等不同领域,发布“分类流行语”。这种领域划分更便于流行语的认知、分析与传播,也能更好地发挥流行语对领域生活分类素描的作用,还能在某种程度上补充“十大流行语”。

2023年的分类流行语如下:

【国内时政类】

数字中国、高水平科技自立、大兴调查研究、消费提振年、适老化、文旅融合、灵活就业、人间烟火气、青年发展型城市、新质生产力

【国际时政类】

“一带一路”十周年、政治解决乌克兰危机、中亚元首会晤机制、ChatGPT、OpenAI人事震荡、土耳其地震、苏丹武装冲突、沙伊和解、布林肯访华、中美元首会晤

【经济类】

数字化转型、现代化产业体系、恢复和扩大消费、质量强国、开放型经济新体制、高质量充分就业、以工代赈、链博会、里孜口岸、稳字当头

【科技类】

数字孪生、神舟十六号、脑机接口、天舟六号、国产大邮轮、生成式人工智能、人工智能(AI)安全、《科技伦理审查办法(试行)》、高能同步辐射光源(HEPS)增强器、九章三号

【教育文化体育娱乐类】

建设教育强国、教育数字化、成都大运会、村超、人才九条、越剧、文化强国建设、爱国主义教育法、古茶林、演唱会

【社会生活类】

未成年人网络保护条例、预制菜、杜苏芮、厄尔尼诺、丫丫、淄博烧烤、缅北电诈、电商直播、舌尖上的安全、显眼包

【民生类】

全国生态日、高标准农田、托育服务、居家养老、东北全面振兴、应对人口老龄化、深中通道、新型农业经营主体、反间谍法、网络戾气整治

【“一带一路”专题】

共商共建共享、真正的多边主义、经济走廊、丝路精神、工笔画、软联通、小而精、互利共赢、六廊六路、普惠平衡

(长江日报记者李煦)

【编辑:张靖】

更多精彩资讯请在应用市场下载“大武汉”客户端,未经授权请勿转载,欢迎提供新闻线索,一经采纳即付报酬。24小时报料热线:027-59222222。此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:kin0207@126.com

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.