我国第一个对话式大语言模型MOSS最近由计算机专家邱锡鹏教授领导的研究团队发布至公开平台,一经发布便引起高度关注。它是一款为用户而设计的工具,属于类ChatGPT模型;它可以执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。这条路径的走通,为国内学术界和产业界提供了重要经验,将助力大语言模型的进一步探索和应用。面临着MOSS的到来,人们对它充满着期待和憧憬。 MOSS开发的基本步骤与ChatGPT一样,包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。在对话能力训练阶段,美国人工智能研究公司OpenAI收集了至少几十万条人类指令,让各行各业的专业标注员写出指令回复,再将它们输入模型基座,以帮助ChatGPT逐步理解各种指令。邱教授领导的研究团队则采用不同的技术路线,通过让MOSS和人类以及其他对话模型都进行交互,显著提升了学习效率和研发效率,短时间内就高效完成了对话能力训练,以尽快赋能国内的人工智能产业。 为了探索ChatGPT的技术路线,并获得大语言模型研究的一手经验,研究团队加快了MOSS开发。如今,MOSS成为国内首个公开亮相的类ChatGPT语言模型,“端到端”走通了大语言模型的开发全程。据悉,这款人工智能助手已进入内测阶段,内测将在用户许可的情况下获取数据,还将收集用户的反馈意见,期待借此大幅增强MOSS的对话能力。MOSS的回答语言流畅、逻辑清晰且观点正确。但研究人员也坦诚指出,当前版本的MOSS表现不够稳定,有些回答存在事实差错或逻辑不顺。 在邱教授看来,开源是人工智能发展如此快速的原因之一;他说:“从早期可能以10年为单位发展,到最近几年可以看到,以大型预训练模型、大型模型推动人工智能发展,它的突破性模型发展时间大概已经缩短到以年为单位,人工智能已经成为计算机学科里发展最快的领域之一。背后的原因是什么呢?离不开两个字,就是开源。”这背后的逻辑在于,开源让整个科研过程形成良性闭环。 在对话方面,MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。可见,MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。为此,研究团队的自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。研究人员相信,这将有效提升模型的中文对话能力。 前不久,邱教授谈到了MOSS的研究进展。他说:“它是国内第一个发布的类ChatGPT模型,我们也是最早提出开源的插件增强版本,比OpenAI的发布都更早。”研究团队当时就意识到,语言模型不只是用来对话,最重要的是它作为使用工具和外部世界相连接时对人的赋能。他还说:“我们现在也在不断提高,会有些更新的结果,在原来的能力基础上取得大幅提升。” 最近,邱教授在“2023世界人工智能大会”(WAIC 2023)上说,作为一个大语言模型,MOSS可执行对话生成、编程、事实问答等系列任务。MOSS的开发步骤包括了自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段,和ChatGPT具有相近的通用语义理解能力,但在推理能力和事实类知识方面仍有一定差距,目前MOSS系列在中文语义理解方面取得很大进步,未来将通过扩大模型规模和使用工具来进一步缩小差距。 语言模型由早期的专家系统到深度学习,再到现在参数量上千亿或万亿的大模型,总体上进入参数量和训练数据都大规模发展的状态。但这些千亿语言模型或百亿语言模型不是最近才出现的,可能几年前就有了。以前是把一个语言模型作为基座,运用到不同任务中,每个任务要微调一个自己的模型;而现在大语言模型有了新的内涵,即一个模型能够解决所有问题,如MOSS的出现使大语言模型变得更加流行。 由上我们看到了MOSS是如何创建自己的语言模型的,以及它当前所面临的问题。语言模型是自然语言处理的重要组成部分,可以用于许多自然语言处理任务。目前自然语言处理已经进入大语言模型时代,其发展前景十分可观。正如国际知名学者周海中教授所说的那样,自然语言处理是极有吸引力的研究领域,它具有重大的理论意义和实用价值。 文/张树仁、何宏亮(作者单位分别为西安交通大学、澳门科技大学) (责任编辑:佚名) |
高层论坛 | 省部长论坛 | 理论探索 | 强国论坛 | 党政建设 | 政策研究 | 军事纵横 | 区域发展 | 风云人物 | 时事观察 | 小康中国 | 海峡两岸 | 艺术纵横 | 文明时代 | 本站专访 | 房地产风云 | 外商投资 | 企业风云 | 城市评论 | 新闻评论 | 经济评论 | 时政论坛 | 国际论坛 | 民生论坛 | 深度看点 | 财经论坛 | 教育留学 | 传统文化 | 科技探索 | 母婴保健 | 征婚交友 | 时尚购物 | 评论电视 | 评论电台 | 民风民俗 | 国学儒风 | 妇女儿童 | 糖酒文化 | 航空航天 | 中评音乐 | IT数码 | 美食频道 | 北京 | 天津 | 上海 | 重庆 | 河北 | 河南 | 云南 | 辽宁 | 黑龙江 | 湖南 | 安徽 | 山东 | 新疆 | 江苏 | 浙江 | 江西 | 湖北 | 广西 | 甘肃 | 山西 | 内蒙 | 吉林 | 福建 | 贵州 | 广东 | 青海 | 西藏 | 四川 | 宁夏 | 海南 | 台湾 | 香港 | 澳门 | 陕西 | 运动竞技 | 新硬件时代 | 消防应急 | 雄安新区 | 粤港澳大湾区 | 一带一路 | 物联网 | 欧洲频道 | 非洲频道 | 亚太聚焦 | 两会频道 | 澳洲频道 | 国际经济 | 美洲频道 | 财富领袖 | 晚霞溢彩 | 人社保障 | 特色小镇 | 互联网+ | 国际交流 | 科技创新 | 实业发展 | 网络金融 | 产业联盟 | 脱贫攻坚 | 投资发展 | 智慧城市 | 科技工业 | 会议专题 | 聚焦海外 | 新疆建设兵团 | 民政工会 |
MOSS就要来了,你准备好了吗?
时间:2023-10-13 16:42来源:评论网 作者:张树仁、何宏亮 点击:
次
我国第一个对话式大语言模型MOSS最近由计算机专家邱锡鹏教授领导的研究团队发布至公开平台,一经发布便引起高度关注。
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
- 上一篇:宇宙中是否有外星人?
- 下一篇:周仪荣先生:人民教师的杰出代表
- 发表评论
-
- 最新评论 进入详细评论页>>
- 精彩文章
-
- 周仪荣先生:人民教师的杰出代表
周仪荣先生的一生是献身教育的一生。他热爱人民、热爱祖国、热爱教育事业,并把炽热...
- MOSS就要来了,你准备好了吗?
我国第一个对话式大语言模型MOSS最近由计算机专家邱锡鹏教授领导的研究团队发布至公开...
- 宇宙中是否有外星人?
国际知名学者周海中教授在1988年6月曾经说过:“21世纪是天文学的世纪;届时将有重大...
- 天文学是什么?它到底有何用?
天文学(英文astronomy)主要研究宇宙空间天体、宇宙的结构和发展,包含天体的位置、...
- 专家漫谈|语言模型的作用巨大
语言模型(英文language model)是一种单纯的、统一的、抽象的形式系统,语言客观事实经...
- 数字经济为中外经贸合作注入新动力
大面积挡风玻璃搭配简洁明快的数字显示屏,通体银色车身辅以螺旋翼和羽翅式车门,一台...
- 周仪荣先生:人民教师的杰出代表
- 中央文献网
- 中国全国人大
- 中央统战部
- 中共中央党校
- 毛主席纪念堂
- 邓小平纪念馆
- 中国台湾网
- 中央档案馆
- 中央综治委
- 中央编制办
- 中国全国政协
- 最高人民法院
- 全国最高检
- 解放日报网
- 中国外交部
- 中国国防部
- 中共青年团
- 国家发改委
- 中国教育部
- 中国科技部
- 中国工信部
- 中国国家民委
- 中国公安部
- 中国监察部
- 中国民政部
- 中国司法部
- 中国社保部
- 中国国土部
- 中国环保部
- 中国住建部
- 中国交通部
- 中国铁道部
- 中国水利部
- 中国农业部
- 中国商务部
- 中国文化部
- 中国卫生部
- 国务院法制办
- 国务院新闻办
- 国务院扶贫办
- 国务院国资委
- 国家防腐局
- 中国人民网
- 中国新华网
- 中国经济网
- 中国政府网
- 中国网网站
- 中国光明网
- 中国日报网
- 美国美联社
- 俄通社塔斯社
- 法国新闻社
- 中国新闻网
- 中央联络部
- 紫 光 阁
- 中纪委监察部
- 路透社中文网
- 京东商城网
- 英国国通社
评论网版权所有 ,未经书面授权禁止使用
Copyright © 2008-2011 by www.pinglunnet.com all rights reserved.
浏览本网主页,建议将电脑显示屏的分辨率调为1024*768
京公网安备11010802025113号 《中华人民共和国增值电信业务经营许可证》 编号:京ICP备17062725号-1
Copyright © 2008-2011 by www.pinglunnet.com all rights reserved.
浏览本网主页,建议将电脑显示屏的分辨率调为1024*768
京公网安备11010802025113号 《中华人民共和国增值电信业务经营许可证》 编号:京ICP备17062725号-1