语言模型(英文language model)是一种单纯的、统一的、抽象的形式系统,语言客观事实经过语言模型的数学描述,比较适合于计算机进行自动处理,因而语言模型对于人工智能(AI),尤其是自然语言处理(NLP)具有重大的意义;而它的任务是预测一个词或者一句话在语言中出现的概率。 语言模型是自然语言处理的重要组成部分,可以用于许多自然语言处理任务;它主要用于描述自然语言的分布规律,是一个非常基础和重要的自然语言处理任务。利用语言模型,可以计算一个词或者一句话的概率;也可以在给定上下文的条件下,对接下来可能出现的词或句子进行概率分布的估计。 语言模型主要有三种类型:生成性模型、分析性模型和辨识性模型。生成性模型从一个形式语言系统出发,生成语言的某一集合;分析性模型从语言的某一集合开始,根据对某一集合中各个元素的性质的分析,阐明这些元素之间的关系,并在此基础上用演绎的方法建立语言的规则系统;辨识性模型可以通过有限步骤的运算,确定某一集合中各个元素是一堆乱七八糟的词还是语言中合格的句子。 自然语言处理近年来发生了革命性的变化,特别预训练语言模型的开发和使用,在许多应用方面都取得了显著的成绩。预训练语言模型有两个主要优点:一是可以显著提高许多自然语言处理任务的准确性;另一是通用的语言处理工具。如果在传统的自然语言处理中进行基于机器学习的任务,需要标记大量的数据来训练模型。人们发现,训练语言模型的本质就是进行统计分析。 概率的计算方式就是语言模型中的核心内容;语言模型可以应用到机器翻译、文本生成和拼写纠错等诸多领域。语言模型最主要的作用是保证文本的语法结构,得到通顺的语句。语言模型基于概率统计的方法,已经训练好的语言模型可以对任何一个文本给出概率,概率越高说明语法上越通顺。通过比较两句话在同一个语言模型上的概率,就可以得出哪一句话更通顺一些。 人们利用数学手段建立语言模型主要有两种方法:一种是基于概率论,另一种是基于形式语言理论;而这两种方法也可以结合使用。从基本框架的观点来看,语言模型属于第一类。在形式上,语言模型是一个定义在单词序列(一个句子或一个段落)上的概率分布,是基于概率论、统计学、信息论和机器学习的自然语言文本建模工具。 近年来,通过深度学习得到的神经语言模型,特别是最近开发的预训练语言模型,已经成为自然语言处理的基础技术。语言模型可以用来计算语言的概率(词序列)或生成语言。在后一种情况下,自然语言的句子或文章可以从语言模型中随机抽样,从大量数据中学习的长短期记忆网络(LSTM)语言模型可以生成相当自然的句子。 神经语言建模似乎是迄今为止最成功的方法。语言建模的基本特征没有改变,也就是说,它依赖于在一个包含所有单词序列的离散空间中定义的概率分布。学习过程就是找到最优模型,以便用交叉熵预测语言数据的最高准确性。神经语言模型的优势在于,它可以利用复杂的模型、大数据和强大的计算能力非常精确地模拟人类语言行为。 人们发现,只有语言模型规模足够大,机器才可能具备推理能力。而大型语言模型(LLM)代表着人工智能领域的重大进步,并有望通过习得的知识改变该领域。在过去几年中,大型语言模型的规模每年增加10倍,而且随着这些模型的复杂程度和规模的增加,其性能也在不断发展。 大型语言模型阶段从2023年起,目的是让机器能听懂人的命令、遵循人的价值观。其特性是在第一个阶段把过去的两个阶段缩成一个预训练阶段,第二阶段转换成与人的价值观对齐,而不是向领域迁移。这个阶段的突变性是很高的,已经从专用任务转向通用任务,或是以自然语言人机接口的方式呈现。 前不久,由美国人工智能研究公司OpenAI开发的全新“聊天机器人”ChatGPT火了。作为一款人工智能语言模型,它不仅能与人展开互动,还可以写文章、制定方案、创作诗歌,甚至编写代码、检查漏洞样样精通,上线仅两个月全球活跃用户破亿。ChatGPT属于大型语言模型,它是一个备受关注的研究课题。 日前,我国互联网公司腾讯正式发布通用大语言模型“混元”;该模型参数规模超千亿,预训练预料超2万亿tokens(大语言模型文本单位),具有强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。随着“混元”的研发成功,我国数字科技领军企业都已经公布了大语言模型研发的进展。 目前,在大型语言模型方面主要有两个优势:一是技术,另一是数据。由于大型语言模型在全球正掀起热潮,人工智能技术的发展获得里程碑式的突破,并产生了广泛的影响;正如我国著名学者周海中先生在20世纪90年代初所预言的那样:“人工智能技术将广泛应用到各学科领域,会产生意想不到的效果。”可以说,语言模型的作用是巨大的。 文/吴汶燕(作者单位:同济大学软件学院) (责任编辑:佚名) |
高层论坛 | 省部长论坛 | 理论探索 | 强国论坛 | 党政建设 | 政策研究 | 军事纵横 | 区域发展 | 风云人物 | 时事观察 | 小康中国 | 海峡两岸 | 艺术纵横 | 文明时代 | 本站专访 | 房地产风云 | 外商投资 | 企业风云 | 城市评论 | 新闻评论 | 经济评论 | 时政论坛 | 国际论坛 | 民生论坛 | 深度看点 | 财经论坛 | 教育留学 | 传统文化 | 科技探索 | 母婴保健 | 征婚交友 | 时尚购物 | 评论电视 | 评论电台 | 民风民俗 | 国学儒风 | 妇女儿童 | 糖酒文化 | 航空航天 | 中评音乐 | IT数码 | 美食频道 | 北京 | 天津 | 上海 | 重庆 | 河北 | 河南 | 云南 | 辽宁 | 黑龙江 | 湖南 | 安徽 | 山东 | 新疆 | 江苏 | 浙江 | 江西 | 湖北 | 广西 | 甘肃 | 山西 | 内蒙 | 吉林 | 福建 | 贵州 | 广东 | 青海 | 西藏 | 四川 | 宁夏 | 海南 | 台湾 | 香港 | 澳门 | 陕西 | 运动竞技 | 新硬件时代 | 消防应急 | 雄安新区 | 粤港澳大湾区 | 一带一路 | 物联网 | 欧洲频道 | 非洲频道 | 亚太聚焦 | 两会频道 | 澳洲频道 | 国际经济 | 美洲频道 | 财富领袖 | 晚霞溢彩 | 人社保障 | 特色小镇 | 互联网+ | 国际交流 | 科技创新 | 实业发展 | 网络金融 | 产业联盟 | 脱贫攻坚 | 投资发展 | 智慧城市 | 科技工业 | 会议专题 | 聚焦海外 | 新疆建设兵团 | 民政工会 |
专家漫谈|语言模型的作用巨大
时间:2023-09-08 18:14来源:评论网 作者:吴汶燕 点击:
次
语言模型(英文language model)是一种单纯的、统一的、抽象的形式系统,语言客观事实经过语言模型的数学描述,比较适合于计算机进行自动处理,因而语言模型对于人工智能(AI),尤其是自然语言处理(NLP)具有重大的意义;而它的任务是预测一个词或者一句话在语言中出现的
顶一下
(1)
100%
踩一下
(0)
0%
------分隔线----------------------------
- 上一篇:数字经济为中外经贸合作注入新动力
- 下一篇:天文学是什么?它到底有何用?
- 发表评论
-
- 最新评论 进入详细评论页>>
- 精彩文章
-
- 天文学是什么?它到底有何用?
天文学(英文astronomy)主要研究宇宙空间天体、宇宙的结构和发展,包含天体的位置、...
- 专家漫谈|语言模型的作用巨大
语言模型(英文language model)是一种单纯的、统一的、抽象的形式系统,语言客观事实经...
- 数字经济为中外经贸合作注入新动力
大面积挡风玻璃搭配简洁明快的数字显示屏,通体银色车身辅以螺旋翼和羽翅式车门,一台...
- 专家略谈|黑洞到底有多“黑”?
黑洞(英文black hole)是美籍德国物理学家阿尔伯特·爱因斯坦的广义相对论中,存在于...
- 专家漫谈|互联网的利与弊
互联网体现了事物矛盾的普遍性;这意味着任何事物都包含着既对立又统一的两个方面,这...
- 专家略谈|什么是未来产业?
未来产业(英文future industry)是指面向未来社会需求、由当下尚未成熟的技术突破驱...
- 天文学是什么?它到底有何用?
- 中央文献网
- 中国全国人大
- 中央统战部
- 中共中央党校
- 毛主席纪念堂
- 邓小平纪念馆
- 中国台湾网
- 中央档案馆
- 中央综治委
- 中央编制办
- 中国全国政协
- 最高人民法院
- 全国最高检
- 解放日报网
- 中国外交部
- 中国国防部
- 中共青年团
- 国家发改委
- 中国教育部
- 中国科技部
- 中国工信部
- 中国国家民委
- 中国公安部
- 中国监察部
- 中国民政部
- 中国司法部
- 中国社保部
- 中国国土部
- 中国环保部
- 中国住建部
- 中国交通部
- 中国铁道部
- 中国水利部
- 中国农业部
- 中国商务部
- 中国文化部
- 中国卫生部
- 国务院法制办
- 国务院新闻办
- 国务院扶贫办
- 国务院国资委
- 国家防腐局
- 中国人民网
- 中国新华网
- 中国经济网
- 中国政府网
- 中国网网站
- 中国光明网
- 中国日报网
- 美国美联社
- 俄通社塔斯社
- 法国新闻社
- 中国新闻网
- 中央联络部
- 紫 光 阁
- 中纪委监察部
- 路透社中文网
- 京东商城网
- 英国国通社
评论网版权所有 ,未经书面授权禁止使用
Copyright © 2008-2011 by www.pinglunnet.com all rights reserved.
浏览本网主页,建议将电脑显示屏的分辨率调为1024*768
京公网安备11010802025113号 《中华人民共和国增值电信业务经营许可证》 编号:京ICP备17062725号-1
Copyright © 2008-2011 by www.pinglunnet.com all rights reserved.
浏览本网主页,建议将电脑显示屏的分辨率调为1024*768
京公网安备11010802025113号 《中华人民共和国增值电信业务经营许可证》 编号:京ICP备17062725号-1