学术要闻

当前位置: 公司首页 -> 学术要闻 -> 正文

“三峡·求索大讲坛”第73讲冯志伟:自然语言处理与大语言模型

信息来源:英国正版365官方网站 发布日期:2023-10-26

(本网讯刘馨文/文吴志勇/图)10月23日上午,由社会科学发展研究院主办、国家语言文字推广基地、学校英国正版365官方网站、计算机与信息学院承办的“三峡·求索大讲坛”第73讲在三峡智库报告厅如期举行。中国计算语言学开拓者之一、计算语言学家、教育部语言文字应用研究所研究员冯志伟教授应邀作了题为“自然语言处理与大语言模型”的学术报告。报告由公司党委常委、党委宣传部部长张锐主持,英国正版365官方网站刘志富副教授总结发言。英国正版365官方网站、计算机与信息学院部分教师、研究生参加了此次报告会。

冯志伟教授在报告会提到,近年来计算机能够与人类讲话、做翻译等,引起国际震动。当代的许多人工智能大师、学者都关注语言与计算机的结合。冯教授指出,语言作为重要的社会现象,文理结合才能产生重大经济价值。冯教授从自然语言处理的定义、自然语言处理的发展历程、自然语言生成的定义、生成式预训练模型GPT的发展四个方面作了学术报告。

在介绍自然语言处理的发展历程中,冯教授介绍了自然语言处理的四代范式。第一代自然语言处理范式是“词典+规则”,流行于20世纪50年代至90年代。第二代自然语言处理范式是“数据驱动+统计机器学习模型”范式,流行于20世纪90年代以后,第三代为“神经网络深度学习模型”,流行于2012年,以后,第四代为“预训练+微调+师生学习”范式,预训练得到的知识就像老师,预训练之后把这些知识传授给员工进行微调,所以又叫“师生学习”范式,2018年因谷歌公司开发通用转换器模型,第四代范式出现。

冯教授还介绍了生成式预训练模型GPT的五个发展阶段。冯教授指出,ChatGPT的强大之处在于,可通过使用大量的训练数据来模拟人的言语行为,生成人类可理解的文本,并能够根据上下文语境,提供出恰当的回答,甚至能做句法分析和语义分析,进行逻辑推理,帮助用户调试计算机程序、写代码,还能通过人类反馈的信息,不断改善生成的功能,已经达到了很强的自然语言生成能力。冯教授也指出了ChatGPT的不足,比如它并没有真正理解对话内容,只是对人类言语行为进行模仿,再如有时它也会提供一些不符合事实的错误答案。此外,冯教授也指出了大语言模型的不足之处。

报告的最后,冯教授指出,一个新事物的出现,总会有人感到愉悦,也总会有人感到悲伤。人工智能的出现大大改变了人们的日常生活,当人类想做的许多事情被机器取代,身为语言学人更应紧跟时代发展。

冯志伟教授的报告向我们介绍了自然语言处理的发展历程与当代热点,学术理论与生动举例相结合,整场报告氛围热烈,不仅拓宽了师生的学术视野,更进一步推动我国计算语言学的建设与发展。

主讲人介绍:冯志伟,1939年生,中国计算语言学最早的开拓者之一,中国计算机学会高级会员。北京大学和中国科技大学研究生院两次研究生毕业,20世纪70年代首次测出汉字熵为9.65比特,为汉字多八位编码提供了语言学支持。法国留学时师从国际计算语言学学会第-任主席沃古瓦(B.Vauquois),研制了世界上第一个把汉语译为多种外语的机器翻译系统,是第一个出席国际计算语言学顶会COLING的中国学者。长期从事语言学和计算机科学的跨学科研究。1990-1992在德国特里尔大学文学院担任教授,2000-2002年在韩国科学技术院电子工程与计算机科学系担任教授。出版论著30多部,发表论文400多篇,主持研制国际标准1项、国家标准1项、国家规范3项,参与研制国家标准13项。担任国内外著名杂志编委,曾任中国语文现代化学会副会长,现任《中文信息学报》《语言文字应用》顾问,《中国科技术语》副主编。2006年获奥地利维斯特奖,2018年获中国计算机学会NLPCC杰出贡献奖,2021年获中国中文信息学会会士荣誉称号,2022年获香港圣弗朗西斯科技人文奖。

友情链接:

联系我们:

地址:宜昌市大学路8号

邮编:443002

电话:0717-6395368(院办)  0717-6394624(教学办)  0717-6393636(学工办)  0717-6395328(研招办)

版权所有 英国正版365官方网站 - 最正规英国365网站