” 三项能力超过 ChatGPT”

“1024 将整体超过 GPT 水平!”

在科大讯飞星火认知大模型发布会现场,董事长刘庆峰拍着胸脯保证,引起现场掌声雷动!

而真机演示效果和多场景产品展示直接把观众们看呆:信息量太大。

网友也围观直呼:这个输出速度也太快了!

比如这个随机问的问题,人类要被 AI 笑死。

不过也着实被它的语言理解能力所惊到!目前星火已开放优先体验申请,可点击「阅读原文」进入官网申请。

除此之外,还直接体验到了大模型五大应用产品成果,覆盖教育、办公、汽车等多个应用场景的那种。

比如在数字员工场景,只需一句话就可以调出 Excel、分析数据、制作表格、自动生成 PPT!

还有汽车场景,不光可问自驾游、亲子游推荐路线,还能订餐、买电影票、听新闻等功能。

而在教育场景,可以进行口语交流和作文批改。任意角度拍下作文,就可以从错别字到段落做出细致批改,还会给出内容评价:虽然早已预告会以产品形式发布,但却没料到不光真机演示,还随机抽取现场观众的提问,还在能现场上手体验落地成品

而就在十天前,科大讯飞突然向开发者开放内测资格,量子位也抢先体验了一把。结果各方评价来看,效果还算不错。

这接二连三的 ” 反向跳票 ” 操作,着实惊呆现场观众。

光看这现场人从众的架势,就看得出有多受关注。据悉,因为现场报名人数太多,发布会举办地被迫变更,换成了容量更大的会展中心。

三项能力超过 ChatGPT

整场发布会看下来,最直观的感受是,主角已并非只是大模型本身,还有倚靠大模型落地的产品成果。

首先来看大模型,现场演示直接体现了7 大核心能力

即多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。

尤其在语义理解,长文本生成以及数据能力三方面,据称 “已经超过了 ChatGPT“。

语义理解部分,正如前文所述,现场科大讯飞研究院院长刘聪直接用语音提问星火大模型,紧接着宁死不屈和能屈能伸的问题来延展:

如果有个小伙子和他女朋友吵架了,它应该是宁死不屈,还是能屈能伸?

结果星火回答:这种情况下,这个小伙子应该能屈能伸。

而在长文本生成上,写邮件、做方案、讲故事、写新闻稿件也通通不在话下。

还有在数学能力表现上,更是直接体现了学霸气质。

除了基本的常规计算、几何、情景应用题,就是更复杂的计算也能解决。

花坛里有三种花,一共 88 朵,其中月季花的数量是菊花的 4 倍,牡丹花的数量是菊花的 5 倍少 2 朵,那么请问花坛里一共有多少朵牡丹花?

结果没想到依旧是秒秒钟给出结果,还给出解题步骤。

与此同时,本次共有四大应用成果亮相,包括讯飞 AI 学习机、讯飞听见、讯飞智能办公本、讯飞智慧座舱、讯飞开放平台。

以办公场景为例,就有快速整理会议纪要、语料规整等功能。

在讯飞智能办公本上,根据已有的录音和手写笔记,点击 AI 助手,就能一键快速自动生成会议纪要。

不仅有整体总结,还有重点关注,尤其手写标注的内容,它也会特别关注到。

除此之外,有时候会议中一些口语交流会比较多,书面语太少,比较难整理。

这时候就可以选择语料规整一键修订,保留重点语料,而且还可以随时看到修订模式。

与此同时,这两项功能在录音转写场景中同样支持。在 ” 讯飞听见 ” 这一产品中,也同样有了星火大模型的加持。

只需一段录音,就可以生成指定稿件,从现场来看,已经支持品宣文案、新闻稿件、工作总结、工作计划以及工作待办等。

还有数字员工,只需一句话就可以直接打开 Excel 文档,还可以学习表格数据进行数据分析,并制成表格。而这些分析图表还可以一键生成 PPT。而对于开发者和合作伙伴而言,此次星火大模型能力接口插件平台均已开放,将联合各行业合作伙伴共建大模型生态,首批将接入来自 36 个行业的 3000 余家企业开发者。

刘庆峰:完全可以重现 OpenAI 的智能涌现

虽然放眼国内,讯飞星火认知大模型并不占先发优势,尤其在未来产业对接上。但讯飞方面此前就表示:完全不担心。

科大讯飞董事长刘庆峰在现场表示:完全可以重现 OpenAI 的智能涌现。事实上,此前 2022 年度业绩说明会上就透露,星火认知大模型距内测到正式发布会有三轮迭代。

随着大模型时代的深入,我们已经明显感知到,其背后核心技术突破并非单纯暴力累积,而是一整套系统工程技术问题。

而科大讯飞能做到官宣即落地,而且迭代速度如此之快,背后手握这几大利器。简单归结起来,就是三驾马车 + 工程技术能力相辅相成。

自 1999 年开始,科大讯飞就致力于让机器人像人一样能听会说。2014 年,能听会说这一目标升维到了能理解会思考,因此这几个方面讯飞自然都有长期的经验累积和投入。

核心算法上自不必说,科大讯飞提出了知识与大模型融合统一的理解框架 X-Reasoner,致力于弥补大模型模糊记忆技术短板;光是去年,就在认知领域取得了常识阅读理解挑战赛 OpenBookQA 等 13 项世界第一的成绩。

而数据方面,其数量和质量直接决定了大模型效果的好坏。

作为国内语音 AI 龙头, 讯飞尤其在中文文本数据以及多语种等方面有着独有优势——

讯飞人工智能开放平台日使用量超过 50 亿次,天然可为大模型投喂海量文本语料和用户反馈数据;而多语种翻译技术又是讯飞多年深耕,学习并链接全球各语种各行业的知识,这也是通往通用人工智能所必经之路。

至于在数据质量上,依靠于在垂直行业的深度应用,这与企业工程技术能力密不可分。

科大讯飞在教育、办公、医疗等多个领域都有专有认知模型。

以医疗领域为例,作为国内唯一通过国家执业医师资格考试的 AI 系统,超过 96.3% 的医学考生,科大讯飞已累计为基层医生提供超过 5.8 亿次、日均超 70 多万人次的 AI 辅诊。

积累了刚需行业数据之后,专有模型反哺通用大模型的发展,促进其智慧涌现。

同样的工程技术能力还体现在算力上。

据透露,目前科大讯飞能实现百亿参数大模型推理效率的近千倍加速,有助于更大更多认知大模型的实际落地。

所以此次科大讯飞之所以直接与大模型一同上线 C 端直接可用的产品,也是科大讯飞的大模型技术实力体现。

与此同时,也透露了科大讯飞对于此次技术浪潮的理解。

科大讯飞如何理解?

首先,大模型对 C 端硬件的价值,在于后端理解能力的提升

此前我们就谈到过,ChatGPT 通过每个人都能参与的方式,让全世界感知到大模型的前景,成为 AlphaGo 之后又一场 AI 启蒙运动。

虽然一本正经地胡说八道被人诟病,但正是因为大模型,让 AI 对于人类语言的理解与表达能力有了显著提升。

此前智能终端在前端能听会说,现在融入了能理解会思考之后,给用户的人机交互体验带来极大的提升,变得更便携、更自然以及更有深度,能读懂人们的需求。

比如此次办公场景下,以往可能只是尽可能还原转写的文字,但现在可以将会议记录进行自动校对、自动润色以及自动按需生成摘要或办公文档,提高我们打工人的工作效率。

其次,星火认知大模型是讯飞超脑 2030 计划的重要阶段。他们最终目标是推出懂知识、会学习的陪伴机器人自主学习虚拟人家族,全面进入家庭

自去年启动以来,第一阶段计划就在有序进行。一方面推出可养成的机器宠物、仿生运动机器狗等软硬一体的机器人。在去年全球 1024 开发者节上科大讯飞就完成机器狗 ” 小黑 ” 首秀。

另一方面推出专业数字虚拟人家族,让虚拟人成为每个行业、每个企业乃至具体每个人的 AI 助手。

目前,科大讯飞 AI 虚拟人智能交互一体机产品已经深度触达金融、政务、文旅等多个场景。接入大模型能力之后,虚拟人可以调用更多能力,支持多轮对话,服务也更加细化。

由此可见,星火认知大模型的发布,只不过是科大讯飞 ” 超脑 ” 征程中的必经步骤。

最后,智能涌现趋势已定,千行百业落地更需要同开发者一道。这也是 ” 星火 ” 的题中之义所在。

发布会现场讯飞透露了 ” 星火 ” 有三层寓意:

一方面,这是科大讯飞创业时所感。

24 年前,中国的语音市场被国际巨头占领,6 个中科大在校大学生提出 ” 中文语音要做到世界最好 “,这在当时所有人都不相信。而这批年轻人,在融到第一笔资金之后,就开始了大规模投入研发并整合源头技术创新资源之路,一直走到现在有了今天的科大讯飞。

” 燃烧最亮的火把,要么率先燎原,要么最先熄灭 “。时至今日还刻在科大讯飞合肥总部 A1 大楼的墙面上。

另一方面,通用人工智能需要星火燎原。这也是科大讯飞一直以来一以贯之的生态理念。

直观展现就是讯飞开放平台,去年全球 1024 开发者节上数据显示,讯飞开放平台开放的 AI 产品及能力,从去年 441 项增长至今年 513 项;生态伙伴数从 400 万快速增长到超 500 万,年增长率超 30%。

而现在要实现机器智慧涌现,需要同更多开发者 ” 星火 ” 一起,燎原千行百业。

点击「阅读原文」即可申请体验讯飞星火认知大模型。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注