首页 > 资讯 >正文

他,用语言搭建了人机交互的桥梁

2023-04-11 13:51:03 来源:- 作者:-

近期,随着Chat-GPT的推出,“人工智能”再度成为备受公众热议的话题,而作为人机交互的核心技术,自然语言处理可谓大放异彩。流畅的对话、严谨的语法结构、“接近于人”的理解能力,使得很多人感觉“幸福来得太突然”;而在专业人士看来,自然语言处理技术能够如此“突飞猛进”,并非一时之功,而是相关学术领域一批优秀专家学者长期努力的结果。著名语言学家杨博鹏,正是其中的杰出代表。

毕业于汉语言文学专业的杨博鹏,有着长达十余年的语言文字研究经历,他不仅在语音学、词汇语义学、句法学、心理语言学、修辞学、应用语言学等细分门类有着深厚的学术造诣,而且还通过对计算语言学的深入研究,为人类与计算机的沟通搭建了一座坚实的桥梁。

早在2014年,时任互联网文学共同创作项目负责人的杨博鹏,为实现多人共创模式下文字内容编辑、审核、校对等各个环节的智能化,组建了一支由来自搜狐、东软等知名信息科技公司的技术专家组成的人工智能研发团队。在此后的工作过程中,杨博鹏携手技术专家,深入研究了自然语言理解、机器学习、深度学习、专家系统等人工智能相关分支领域的前沿技术,并凭借自己在语言学方面深厚的理论功底与丰富的工作经验,针对汉语语法自由度高、严谨性弱,多音节语素较少,多义词丰富,断句与分词方式多样化,文学作品语言风格复杂化等特征,开发出了全新的汉语分词模型,并建立了基于上下文联想的文章自动解析机制。正是得益于杨博鹏的研究,该项目得以顺利推进,最终实现了被称为“自动写作天花板”的诗歌写作功能。在2016年进行的测试中,该项目组开发的自动写诗机充分实现了命题条件下古诗词音韵、对仗、意境、用字的极致化处理,使得古诗词专家也无法区分哪些作品是人工创作,哪些作品是机器创作。它因此成为了当年人工智能领域的标志性成果。而一战成名的杨博鹏,在语言学学术生涯中从此拓展了一个新的研究门类——计算语言学。

“当时自动写诗机的问世,的确标志着计算机自然语言处理技术迈入了一个新的阶段,但这并不意味着人机交互从此畅通无阻。”杨博鹏表示,“相较于当时华尔街广泛使用的财经报道机器人,以及微软小冰之类的聊天机器人,我们团队研发的自动写诗机在语义理解、语音分析、常识推理等方面取得了长足的进步,但是要想真正达到强人工智能的水平,还有很长的路要走。”

为此,杨博鹏在此后的工作中,一面采集、分析大量的文字、语音样本,并从中分析语言背后的人类心理特征、行为逻辑、表达逻辑,一面开展AI模型的算法优化、知识输入与训练。经过长期的苦心钻研,凝结了他大量心血的鲲鹏自然语言处理系统V1.0终于问世。在该系统中,杨博鹏采用了高内聚、低耦合的开放式系统架构方式,并通过建立语音学、语义学、语法学、语言人类学、心理语言学、行为语言学、翻译学等多学科之间的映射关系模型,为自然语言处理提供了多维度的规则支撑。特别值得一提的是,为了提高训练效率、强化训练效果,杨博鹏经过长达数月的研究、测试,为该系统搭载了“有限开放式语言训练模块”。该模块借助杨博鹏设计的半监督学习模型,能够使系统在得到极少量人工干预的条件下,自动采集公开渠道可查询或经过授权可使用的语言、数据文本资源进行自我训练。此外,为了提高信息安全性,杨博鹏还通过改进遗忘网络、动态网络剪枝技术,使得该系统可以对有限授权的信息进行选择性遗忘,在保留训练结果的同时,充分规避了知识采集所带来的敏感信息泄露等安全隐患。

正是凭借杨博鹏“渗透到每一个神经元”的技术打磨,鲲鹏自然语言处理系统V1.0获得了极佳的性能,为众多人工智能研究机构提供了基于自然语言处理技术的基础性支撑,也为至少十余款智能问答软件赋予了“语言能力”,这项技术因而被誉为“人工智能系统的灵魂母机”。可以说,近些年人工智能技术能取得如此之快的发展,杨博鹏和他的自然语言处理技术成果功不可没。

面对已经取得的成就和来自同行业的广泛赞誉,杨博鹏表示:“无论是IBM Watson、Google的BERT、CHAT-GPT,还是我本人的这些科研成果,尽管在自然语言处理的很多方面都实现了突破,但是尚有一些关键技术与应用场景方面的空白尚待填补,例如多语言控制、开放式联想等;而语言背后社会、文化、心理、艺术内涵的理解与表达,更是人机交互技术亟待补足的短板。语言学是一门外延极广的学科,它的发展程度越高,我们所能看到新的研究方向也就越多,特别是在计算机自然语言处理方面,我们任重而道远。但我深信鲁迅先生的那句话,‘世上本没有路,走的人多了,也便成了路’。我希望能带领更多的业内同仁在这条道路上戮力前行,用语言的力量为人机交互开拓出一条通途!”(贺文辉)

责任编辑:小林