去年底至今ChatGPT火爆,A股市场中科大讯飞存在感明显,股价节节突破新高,市场把预期拉满,等待着的是讯飞大模型交卷亮相。早前百度文心一言、阿里通义千问等众多大模型已经接连问世,同样让五月份发布的讯飞星火大模型压力倍增,必须拿出“真金不怕火炼”的看家本领了。
5月6日,科大讯飞正式发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。两个多小时的发布会中,更多的时间交给了各种功能的现场实测演示,文本生成、语言理解、知识问答、逻辑推理、数学能力均一一验证。
这更像是一场大模型产品级发布会,而非其他企业技术概念式的炫技。“目前还没有一家国产大模型面向公众大规模开放,让所有人都可以体验。讯飞推出的这些功能都是产品级,购买相应硬件的用户即可立刻获得体验。”科大讯飞如此表示。
【资料图】
在国外公司在大模型领域率先布局的情况下,要重视通用人工智能这样一个产业化和重大的战略机会,拿回人工智能在中文领域的主动权已经至关重要。“10月24日星火大模型将在中文通用大模型上超过ChatGPT现有水平,英文和ChatGPT现有水平持平。”发布会上科大讯飞董事长刘庆峰透露。
不只拼上线速度,还要比产品落地效果。那么科大讯飞星火大模型实际表现究竟几何?科大讯飞如何推进大模式技术的产业化?大模型之战,科大讯飞长期的技术底气是什么?
实测体验感拉满
世界的每一次革新都始于人类的提问,世界的相连始于哥伦布的提问,对于天空的梦想始于莱特兄弟的提问。而这一次,回答问题的队伍中出现了“认知大模型”。面对实测,讯飞星火大模型也要回答自己的真实表现是否经得住考验。
“你为什么叫星火?”讯飞星火大模型回答称:取名“星火”有三层寓意,当前认知大模型的智能涌现,让科大讯飞更加看清了通用人工智能AGI的远景目标和实现路径;早在2001年科大讯飞“半场会议”上,创业团队就提出了“燃烧最亮的火把,要么率先燎原,要么最先熄灭”;“星火”来自中国传统文化二十八星宿中的“心宿”星座,在中国传统文化中,被视为吉祥的象征,代表着力量、勇气和坚韧不拔的精神。
发布会上,科大讯飞副总裁、研究院院长刘聪现场演示了“星火大模型”7个方面的能力。在演示中,该模型可以写文案、编故事,可以根据场景含义理解成语意思并给出针对性分析,并根据上下文逻辑推理;还可以解决基础的数学问题、生成简单代码;此外,该模型还具备图片、语音等多模态的输入、输出能力。
“今天是科大讯飞星火认知大模型的发布会,线下和线上观看发布会的朋友们一直以来对科大讯飞都非常关心和支持,非常感谢大家,请帮我写一篇欢迎词。”刘聪通过语音和大模式沟通后,一篇要点俱全的欢迎词随机生成。
当被问及公司的股票昨天涨了10%,今天又跌了10%,股票涨还是跌了?星火大模型给出答案亏了1%了,很多网民的第一反应会以为是不赚不赔。当被问及从“1一直加到100,结果等于多少”,星火大模型很快算出答案为5050。而问及“花坛里面共有三种花,一共88朵,其中月季花是菊花的4倍,牡丹花数量是菊花的5倍少2朵,花坛里一共有多少牡丹花”时,星火认知大模型很快算出答案为43朵牡丹花。
在逻辑推理能力方面,当被问及“孔子在2008年的奥运会上说了些什么”,星火认知大模型指出,孔子在2008年的奥运会上没有说过任何话。但当被要求“编一个孔子在2008年奥运会上给大家做汉语培训的故事”时,星火认知大模型很快给出了自己的答案。
是否拥有连续对话能力与自我纠错能力,是区别众多语言大模型较为重要的一个标准。在“孔子奥运会”对话中,星火第一时间发现问题中隐藏着的错误,但在要求编故事后给出了答案,表现出了极强的连续对话能力,这让星火大模型“活”了起来。
刘庆峰称,“星火大模型”在中文长文本生成、医疗领域的知识问答、数理能力等方面已经超过了ChatGPT,而在语言理解等方面还落后ChatGPT。他同时公布将于6月9日升级该模型的开放式问答、多轮对话、数学能力;并于8月15日升级代码能力、多模态交互能力;他还称,10月24日“星火大模型”将在中文通用大模型上超过ChatGPT现有水平,英文和ChatGPT现有水平持平。
真正解决社会刚需
当前的通用人工智能特别令人关注的7个维度包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力,这些方面的提升将对整个人类的生产生活方式带来颠覆。比如,改变信息分发获取模式,革新内容生产模式,全自然交互完成任务,实现专家级的虚拟助手,颠覆传统手工编程方式以及成为科研工作的加速器等。
“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”刘庆峰表示,认知大模型这场长期竞赛关键在于,是不是找到市场规模能够自我造血的点,谁就最先能够形成良性循环。
据央视财经微博2月27日消息,2023年2月美国50%的企业已经接入ChatGPT,商业化破局成为国内大模型之战的关键,科大讯飞瞄准的是解决社会刚需。科大讯飞自去年12月启动“1+N”大模型技术攻关。其中, “1”指的是通用认知智能大模型算法研发及高效训练方案底座平台, “N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。
“1+N”模式大大有利于认知大模型在细分领域的实用性,也意味着“星火”在行业中的“泛用性”很高,在“通用智能”与“专用大模型”相辅相成中,能够在许多细分领域内提供实用的帮助。科大讯飞早前在各个行业已经深度布局了人工智能应用,这些行业应用贡献高质量文本是其特有的优势。“星火的大语言模型是科大讯飞的行业专用系统通过独立、封闭环境训练语料得到的结果,可以避免一本正经回复错误消息,使得专用领域保障性更强。”刘庆峰称。
“科大讯飞此次并未发布讯飞医疗专用大模型,但将持续将积累多年的医疗能力嵌入通用人工智能中,医疗专用大模型预计将在1024大会期间发布。”虽然科大讯飞智慧医疗已经得到了相当规模的应用,针对医疗领域,刘庆峰显然更谨慎。
此次发布会上,科大讯飞还公布了大模型能力带来的对于教育、办公等领域现有产品的功能升级。在教育领域,科大讯飞学习机借助该模型实现了批改作文、中英文口语对话的能力。在现场展示中,学习机产品可以通过拍照自动批改小学水平的中文作文及高考英语作文,可以实现指出错别字、语句修订、评分等功能。
在办公领域,讯飞办公本借助大模型能力可以根据手写要点自动生成会议纪要,将会议语音转化成书面化文稿;“讯飞听见”还可通过AI分析文字内容,自动生成摘要、待办、文案等;在智能座舱领域,大模型进一步提升座舱内语音交互能力;大模型基于自然语言自动生成业务流程,充当企业的“数字员工”完成重复性高的工作。
在行业人士看来,大模型终局类似“太极拳”,易学难精,贵在有持续数据场景资源,以及能够持续迭代。当前,科大讯飞星火大模型亮眼表现充分彰显了公司技术和行业高质量数据优势,在数据和应用层面能够形成良好协同,其中AI赋能带来讯飞C端硬件价值量的提升,再者通过开放平台对外输出模型能力赋能千行百业,认知模式浪潮下有望开启公司新一轮成长机遇。