当前位置: 主页 > 生活杂文 >

⭐深瞳丨“百模大战”打响,我们究竟需要什么样的大模型

最近网络热点文章💠《深瞳丨“百模大战”打响,我们究竟需要什么样的大模型》,很多网友都想阅读✨深瞳丨“百模大战”打响,我们究竟需要什么样的大模型的详细内容,芒果文学(www.mangowenxue.com)编辑精心收集整理了相关内容,希望大家都能开心的阅读。

大模型展现出的通用智能能力具有重要的现实意义和影响力,是人工智能发展中里程碑式的进展。大模型带来的智能革命,将媲美工业革命和电力革命,深刻改变人类社会的生产生活方式。大模型,或许正是开启智能时代的那一台“蒸汽机”。

要问今年最热的科技热点是什么,许多人会脱口而出——大模型。从年初ChatGPT引发的大模型浪潮,到相关科技企业上线自家大模型产品,“百模大战”不断升级,它所引发的人工智能“地震”还在持续。

进入9月,国内科技厂商在大模型领域动作频频。9月初,此前一直处于内测阶段的多款大模型产品完成备案,正式上线,面向公众开放。9月21日,在华为全联接大会2023上,因在众多领域展示了大模型发展的更多可能,盘古大模型成为当之无愧的主角。

“百模大战”也好,“群模起舞”也罢,技术进步和创新喷涌的热潮中,人们关注的焦点集中于,我们究竟需要什么样的大模型?何种大模型是通向人工智能的最终答案?

基于大模型的诗歌生成。

智能时代的“蒸汽机”

现在到底有多少个大模型产品?似乎没有人能给出准确的答案。

赛迪顾问发布的《2023大模型现状调查报告》显示,截至2023年7月底,国外累计发布大模型138个,中国则累计有130个大模型问世。

但这股浪潮的源头很清楚,正是ChatGPT。

2022年末,由名不见经传的人工智能公司Open AI打造的大语言模型ChatGPT横空出世,人们可以使用最日常的语言与其对话,让它回答各种问题、完成各类书面任务,聊天、画图、敲代码……人们第一次如此近距离地感受到人工智能带来的震撼,也让“大模型”这个此前只为少数人工智能领域从业者所知的专业概念,成为了被人们挂在嘴边、反复提及的词汇。

输入内容、进行计算、产出结果,这是人工智能模型的本质,但大模型的与众不同之处正在于其足够“大”。

巨大的参数数量、庞大复杂的算法结构、海量的训练数据以及强大的算力支撑,决定了大模型不同于普通的人工智能模型,其拥有强大的通用智能。

以ChatGPT为例,其早期3.0版本的参数数量已达到1750亿个,4.0版本的参数量更是指数级增加,达到1.8万亿个,训练数据的单位数量更是达到惊人的13万亿。相比之下,早期如围棋机器人AlphaGo等专用人工智能模型,其参数量往往仅为百万级,与大模型相去甚远。

海量的参数、复杂的算法、强大的训练能力,让大模型成为具备横跨多领域学习能力的通用人工智能,实现了所谓的“智能涌现”,即拥有触类旁通、举一反三的学习能力。如果说此前的人工智能模型还只是经过训练后可以完成某些特殊任务的“马戏团猴子”,那大模型则可以说已经是一个接受完义务教育的“中学毕业生”。

在北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军看来,大模型展现出的通用智能能力具有重要的现实意义和影响力,是人工智能发展中里程碑式的进展,放眼人类历史、展望人类未来,大模型带来的智能革命,将媲美工业革命和电力革命,深刻改变人类社会的生产生活方式。大模型,或许正是开启智能时代的那一台“蒸汽机”。

华为盘古大模型语义理解系统。

哪条赛道通“罗马”

ChatGPT引发的大模型热潮让许多科技巨头坐不住了,纷纷将自家“压箱底”的大模型成果公之于众。

谷歌紧随ChatGPT脚步,发布了基于自家大语言模型的聊天机器人“Bard”,互动媒体与服务公司Meta也不甘落后,发布了同类大模型“Llama”。国内同样热闹非凡,3月份,百度率先发布研发十余年的知识增强大语言模型“文心一言”。随后,360发布“360智脑”,阿里巴巴上线“通义千问”,科大讯飞推出“讯飞星火”,腾讯推出“混元”,华为推出“盘古”……一众科技公司不甘落后地推出了各自的大模型产品。

彼时,面向公众发布的大模型产品均为内测使用,公众需提出申请,获得内测资格后才能进行体验。7月10日,国家网信办联合国家发改委、教育部、科技部等七部门审议通过并发布《生成式人工智能服务管理暂行办法》,该《办法》8月15日起正式施行。《办法》明确规定,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并履行算法备案等手续。8月底,一批完成算法备案的大模型产品陆续上线,正式面向公众开放。

或许是ChatGPT带来的震撼过于强烈,以自然语言对话为主要功能体验的大语言模型产品成为许多科技厂商的首选,甚至一度成为大模型的代名词。首批通过备案上线的大模型产品中有百度的“文心一言”、字节跳动的“豆包”、智谱华章的“智谱清言”等。截至9月底,已有十余家大语言模型产品官宣上线,大部分均提供聊天对话、创意写作、代码生成等服务。

但在大语言模型之外,也有厂商选择了另一条道路,不“恋战”大语言模型,而是直面行业具体问题。

在9月21日举办的华为全联接大会2023上,华为常务董事、华为云CEO张平安表示,盘古大模型要帮助各行各业的客户解最难的题。例如,在矿山领域,精煤产率是困扰业界多年的难题,山东能源集团已将“盘古”矿山大模型全面应用到采、掘、机、运、通等9大业务系统、21个场景中。在“盘古”的助力下,济宁二号煤矿每年能多产出8000吨精煤,精煤产率提升千分之二,增收约2000万元。

在正在举办的亚运会上,也少不了大模型的身影。由浙江移动打造的亚运保障网络运维大模型在幕后为亚运会保驾护航。它让保障人员“无论在哪,无论何时”都能以“对话”方式获取保障情况,全面提升了亚运会保障的工作效率,降低了保障工作的技术门槛。

浙江移动网管中心副总经理方炜告诉科技日报记者,无论是面向具体行业的垂直大模型,还是直面公众的大语言模型,从底层技术来看,二者并不冲突。“这两种选择就像是此前的互联网发展,既有改变人们生活的移动互联网,也有改变社会、改变行业的产业互联网。大模型也是基于通用的底层技术,衍生出了不同用途。比如浙江移动的网络运维大模型就是使用通用大模型通过微调和提示工程来满足亚运网络保障的场景。”

垂直大模型和通用大模型,究竟哪条赛道能够通向终极人工智能的“罗马城”,答案或许是——条条大路通罗马。

基于大模型的现代农业模型。

“万模群舞”或在不远的将来

无论是何种类型的大模型,在“百模大战”的背景下,其功能、用途、场景的重复都无法避免。但在业内人士看来,大模型的发展还远未触及天花板,不仅“百模大战”不是终点,“万模群舞”或许就在不远的将来。

“大模型的研发是一个拼细节的过程。从技术路线上看,目前各家基本上都是基于Transformer架构来做,方法很类似,但效果确实不一样,决定成败的是细节。”腾讯有关负责人接受采访时说,由于资源投入程度、细节把握程度的不同,最后不同产品的差异会逐渐显现。“从应用领域来说,会迎来一个‘百花齐放’的场景,比如有的专注于自然语言处理,有的专注于医疗领域,有的专注于教育领域等。就目前而言,大模型的天花板还远远没有触到,技术体系和应用场景都在不断演进。”腾讯有关负责人说。

无论是“百模大战”还是“万模群舞”,要避免低水平的雷同复制,杜绝“重复造轮子”带来的资源浪费,关键仍在于不断丰富大模型的应用生态。今年5月,国际期刊《自然》发表了一项百度在生物计算领域的突破性研究成果,其提出的mRNA序列优化算法LinearDesign,对生物医学领域创新具有重要价值,这也是中国互联网科技企业首次以第一完成单位的身份在《自然》正刊发表成果。而在这背后,是百度在2022年5月便推出的“文心”生物计算大模型。借助大模型,人类能够快速找到并设计出活性更好、性质更优的候选药物分子,从而大幅提升新药研发和疫苗设计效率,让新药研发从单点突破的“手工作坊”阶段进入到规模开发阶段。目前,基于“文心”生物计算大模型和飞桨深度学习框架搭建的面向小分子、大分子和RNA的药物设计平台——飞桨螺旋桨PaddleHelix,已经应用于超过30家医药企业。

“无论是从技术层面还是产品层面,百花齐放、百家争鸣对于当下大模型发展都更加有利。算法研究阶段可能五花八门,但到工程选型阶段,可能会逐渐聚焦到一个或少数几个类型。而到了具体产品选型层面,面向不同市场、不同行业,产品形态可能又是多种多样的。”清华大学计算机系教授唐杰认为,无论哪种大模型都有各自的局限性,各种模型互相学习、竞争,在市场中大浪淘沙是必经之路。

中国移动“九天”AI酷玩体验站。

基于大模型的住院医生站管理系统。

给大模型发展更多耐心

“百模大战”虽然激发出了更多可能,但也带来了不少负面影响。当众多厂商蜂拥而上大模型时,参差不齐的产品让人眼花缭乱,其中暗藏的法律、道德风险也应引起人们的警惕。

例如,在面向公众的大语言模型产品中,“一本正经胡说八道”现象已经多次引发质疑。“我们常说大模型会产生‘幻觉’,就是因为大模型的内容准确性还不高、专业性能力不足,如果大模型产生的内容直接公开在互联网,会使当前良莠不齐的互联网信息质量更加低下。”方炜认为,大模型目前在内容安全、版权、主体责任等方面还存在多种风险。

而当深入到具体行业时,不同行业的不同特点也对大模型在准确度、安全性、专业性等方面提出更高要求。360创始人周鸿祎接受采访时表示,虽然公开的大模型是通用的,甚至是万能的,但是当深入到具体行业时仍然面临着缺乏行业深度、不懂企业内部知识、易导致企业内部数据泄露、无法控制成本等问题。方炜也同意这种说法:“例如大模型应用在通信网络保障方面时,就不允许有任何差错,目前准确性还有待提升。”

除了目前大模型自身仍然存在的缺陷,随着竞争的逐渐激烈,我国在相关数据、算力、算法等方面的困境也逐渐暴露。

例如,在训练数据方面,唐杰指出,目前我国的数据开放态势并不强,“大多数机构还是想把数据握在自己手里”。但唐杰也坦承,即使机构有数据开源的意愿,在目前环境下,仍然存在多重风险。他建议,我国关于大模型训练数据应用、开源的相关法律法规还需要进一步细化、健全,让有开源意愿的机构能够放心地进行数据开源,充分激发互联网精神。

而在算力方面,“百模大战”对算力的高需求也让我国本就紧张的算力资源更加捉襟见肘。在“东数西算”基础上建立起的算力互联网或许有望成为解决这一问题的答案。通过对不同地区的算力资源进行调度,实现算力资源的均衡分配。但目前仍然需要在高带宽、低延迟的算力网络建设方面突破更多技术瓶颈。

如果说数据和算力是大模型的硬件“基础设施”,算法则体现着更多“人”的因素。小冰公司首席执行官李笛认为,就训练大模型而言,参数的数量并不是最重要的,工程化过程中的调优才是真正的考验。“研发、训练一个大模型可能只需要一个月,但调优可能需要一年的时间。这个过程格外需要谨慎、细致、耐心,有足够的定力和专注力,也是一种‘工匠精神’的体现。”

耐心,是谈及大模型发展时多位业内专家反复提及的关键词。“大模型不是把数据‘喂’进去,算力一跑就有了。这其中有许多复杂细致的工作要做。”唐杰表示,人工智能自20世纪50年代被提出至今,其发展已经历过多次起伏,任何技术的发展都不是一蹴而就的,要对其有充分耐心。

相关链接

记者手记丨不要等大模型“无所不能”时才入局

发布时间:2023-09-28 12:00

上述文字是💠《深瞳丨“百模大战”打响,我们究竟需要什么样的大模型》✨的美文内容,大家如想要阅读更多的短文学、文学名著、精品散文、诗歌等作品,请点击本站其他文章进行赏析。

版权声明:本文由互联网用户自发贡献,该文仅代表作者观点。芒果文学仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件进行举报,一经核实本站将立刻删除。

相关文章阅读

如何培养孩子豁达的性格

导读:我家孩子今年12岁,六年级了,孩子性格差,有些斤斤计较,说白了就是心胸狭隘,经常因为一件小事弄得生气,一气就是一整天,我每次都开导他,但是都没有用,如何培养孩...

[生活杂文] - 2023-10-02 11:38:01

iOS14充电提示音快捷指令编码怎么弄?iOS14base64编码设置教程

小伙伴们你们知道iOS14充电提示音快捷指令编码怎么弄吗?今天小编很乐意与大家分享iOS14base64编码设置教程,感兴趣的可以来了解了解哦。 iOS14充电提示音快捷指令编码怎么弄?iOS14base...

[生活杂文] - 2023-05-05 12:05:54

苹果手机怎么查看已经删除的信息 苹果手机查看已经删除的信息方法介绍

导读:下面小编为大家整理介绍苹果手机怎么查看已经删除的信息 苹果手机查看已经删除的信息方法介绍。苹果手机怎么查看已经删除的信息?苹果手机是大家非常喜爱的一款手机,它...

[生活杂文] - 2023-08-21 12:01:44

低星级酒店服务的礼仪(酒店服务礼仪有哪些)

1.酒店服务礼仪有哪些 (1)着装规范。 上班时按规定着工作制服,男女员工都应做到端庄大方,切忌奇装异服和出格打扮。 (2)语言恰当。 用语谦恭,语调亲切,言辞简洁,根据不同对...

[生活杂文] - 2023-04-02 20:02:53

adidas椰子鞋,adidas椰子在哪里买

大小椰子都有很多种 官网在2400起步 国内抄到大几千 分别是: 阿迪达斯椰子350:adidas Yeezy 350 Boost 阿迪达斯椰子350V2:adidas Yeezy 350V2 Boost 阿迪达斯椰子750:adidas Yeezy 750 Boost 扩展资料...

[生活杂文] - 2023-09-29 16:38:47

德叔鲍鱼食品旗舰店,德叔鲍鱼罐头

鲍鱼鱼翅无疑是眼下最昂贵的菜品,按照常人的推理,价高就一定意味着品质好。但是,记者日前从中国烹饪协会了解到,价格昂贵的鲍鱼鱼翅存在着惊人的暴利现象,毛利可以达到...

[生活杂文] - 2024-02-01 23:09:06

头层牛皮和二层牛皮哪个好,二层牛皮是真皮吗

牛皮一般分一层[头层],和二层皮革,最多能片出三层皮! 牛皮头层皮就是指第一层皮,最好的皮! 牛皮头层革不是真皮的话,世界上就没有皮革了! 用动物做的无论说皮也好,革也好,都叫皮革...

[生活杂文] - 2023-10-26 22:38:25

如何申请邮箱账号,如何申请邮箱免费注册个人163邮箱

以QQ邮箱为例: 自己的账号就是自己的邮箱号,比如有qq,那么qq号就是账号,全称就是qq号码@qq.com。 电子邮箱是指通过网络为用户提供交流的电子信息空间,既可以为用户提供发送电...

[生活杂文] - 2024-01-02 22:32:26

包含男主求女主不要离开的词条

本文目录一览: 1、有没有那种男主童年悲催导致心理不健康,特别偏执霸道,女主受不了要离开,男主就一直很卑微的求女主不要 2、求一本小说,男主叫女主不要出去,但是女主为了救家...

[生活杂文] - 2024-02-28 17:33:54

vivo手机怎么设置指纹识别? vivo手机指纹识别方式?

作为一款时尚、实用、高性价比的手机品牌,vivo手机在用户中拥有广泛的认可度。其中,指纹识别功能的快捷便利性也是vivo手机备受好评的重要原因之一,那么vivo手机怎么设置指纹识...

[生活杂文] - 2023-06-05 12:03:09

如何引导孩子管理自己的时间

导读:我家孩子不管干什么都磨磨蹭蹭的,怎么说都不听,早上起床磨蹭,吃饭的时候磨蹭,写作业的时候也磨蹭,从来不知道珍惜时间,不懂得时间的重要性,我为他这个事都快愁死...

[生活杂文] - 2023-11-12 17:19:59

如何感动男友,白羊男醒来看见女友做什么事会感动

白羊男:安静的看着自己 白羊男其实也是难得安静下来,他们每天都是在外面浪着的,基本上也是坐不住,总会觉得家里比较的闷,也老是想着去外面玩,对于白羊男来说能够有耐心是...

[生活杂文] - 2024-02-15 00:10:13

职教云考试有摄像头吗

职教云考试没有摄像头。但是云课堂智慧职教考试会访问考生的拍摄照片还有屏幕录制,虽然可以在权限关闭,但如果考试期间你切换屏幕出去后台是会记录的,而老师也会在后台设置...

[生活杂文] - 2023-04-30 16:03:16

男孩没考上高中怎么办

导读:男孩,中考的时候发挥失常,身体不舒服,也紧张,结果本来能考上高中的,最后差了特别多的分数,我想让孩子复读,但是孩子自从中招考试以后就萎靡不振了,根本不碰书本...

[生活杂文] - 2024-03-18 10:29:43

汉子掉入粮仓身陷玉米粒堆消防要紧营救

记者从广东消防部分得悉,11月19日下战书,广东省韶关市浈江区一粮库有人掉进粮仓内,无法脱困。13时14分许,莲塘路消防救援站接到报警后立即前去救援。 消防员抵达现场侦查发现...

[生活杂文] - 2023-04-07 03:49:45

白羊座最适宜去哪儿春游

白羊座最适宜去哪儿春游 春游地点:郊外的小山坡 白羊座的你是非常热爱大自然的,因此在春天这样天气好万物复苏的日子,可以选择去郊外的小山坡上来个踏青+野餐。既能让你放松...

[生活杂文] - 2023-04-10 03:47:36
文章阅读TOP10
猜你喜欢