专业定制伺服电动缸的电动缸厂家

咨询热线:13905180521
杏彩体育官网入口

杏彩体育官网入口网址·国产算力平台“飞星一号”首个成果面世

来源:杏彩体育官网网址 作者:杏彩体育官网入口2024-05-18 12:08:09
杏彩体育官网入口网址·

  近日,美国商务部部长吉娜·雷蒙多宣布了限制外国客户、尤其是中国客户使用美国云计算厂商的服务训练AI 大模型的计划,以及美国商务部公布提案要求美国 IaaS(云服务)厂商向海外公司和个人提供包括AI模型训练在内的云服务的监管。有分析认为,该举措把美国对华科技制裁推向了一个新的高度。

  一边是美国对华科技制裁推向AI 算力限制云服务的高度,另一边是国产厂商国产化自主可控技术在加速落地。

  1月30日,《中国经营报》记者从科大讯飞方面获悉,全国产算力平台“飞星一号”首个成果讯飞星火V3.5发布,是首个基于全国产算力训练的全民开放大模型。此外,深度适配国产算力的讯飞星火开源大模型“星火开源-13B”首次面世,昇思开源社区联合首发上线日,科大讯飞董事长刘庆峰曾提出,讯飞星火大模型在2024年上半年要对标ChatGPT4。

  当时,刘庆峰介绍,讯飞星火V3.5的语言理解、数学能力已超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V的91%,不过,我们亦要清醒理智地看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域与GPT-4的最好水平还有差距。然而,讯飞星火有信心在2024年上半年赶上GPT-4目前最好水平。

  “2022年10月7日,美国宣布了对中国人工智能训练的算力和带宽限制,从那个时候开始,中国训练大模型只能用‘阉割版’的芯片。2023年10月17日,美国商务部进一步颁布了相关规定,中国连‘阉割版’都买不了,对周边可能跟中国合作的国家和地区做了严格限制。而就在本月,美国商务部又进一步提出,美国公司将不能给中国人工智能企业提供算力。”1月30日的讯飞星火V3.5发布会上,刘庆峰毫不避讳地谈及近期美国计划禁止云计算厂商为中国训练AI大模型的感想,“无论是训练还是推理,我们的算力限制越来越紧。而科大讯飞在训练讯飞星火认知大模型的第一天,就决心要做立足国产化自主可控的算力平台。”

  为了抢抓通用人工智能时代的发展主动权,科大讯飞对国产算力底座的布局较早。2023年上半年,科大讯飞就跟华为成立了“联合特战队”。10月,科大讯飞宣布联合华为打造基于昇腾生态的自主可控大模型算力底座“飞星一号”平台。在这个过程中,科大讯飞进行了数百次基于硬件工具和算子库的优化,进行了大量bug修订以及算子效率优化,使得“飞星一号”算力集群可以训练超大规模的通用人工智能模型。

  1月30日,首个全国产化算力平台训练的全民开放大模型讯飞星火V3.5亮相。与此同时,科大讯飞首个基于全国产化算力平台“飞星一号”的开源大模型——星火开源-13B正式发布。

  刘庆峰谈道,科大讯飞正式发布的讯飞星火V3.5,既是科大讯飞在通用人工智能领域的核心技术和创新能力的一次展示,也是对国产算力平台能否支撑起未来大模型研发的一次重要检验。

  虽然国内芯片、算力受到的限制越来越多,但也看到其正在倒逼各方对国产算力的加大投入,目前市场上也可以看到国内算力进展很快。

  自2023年以来,阿里云、华为云、腾讯云等国内多家云厂商均已发布自研的AI大模型平台,根据各厂商的表述,相关大模型的训练工作均在国内的算力平台完成。

  在中关村大数据产业联盟副秘书长颜阳看来,随着外部高性能芯片和云服务的限制,国内市场对于本土算力资源的需求可能会增加。

  广发证券计算机首席分析师刘雪峰认为,国内AI产业链自主可控建设的决心有望进一步加强,国内AI大模型的开发和应用转而使用国产AI算力和模型服务的动力将大大加强,国内AI算力自主可控建设进程有望加快。

  距离公司上一代对标GPT-3.5的讯飞星火V3.0发布近百日,讯飞星火V3.5再度迎来能力提升。

  “不仅达到了当时的预期,而且在很多方面都带来惊喜。”刘庆峰介绍到,讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了升级。升级星火智慧黑板;正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3,赋能讯飞翻译机全新升级,助力更自由沟通,推动万物互联时代下客服、汽车、机器人等场景人机交互变革。

  据科大讯飞方面介绍,讯飞星火V3.5的各项能力已经越来越逼近GPT-4 Turbo水平,并且在语言理解、数学能力上超过了GPT-4 Turbo,在代码上也已经达到了GPT-4 Turbo的96%,另外在多模态的理解上,也已达到了GPT-4V的91%,其中语音的多模态能力已经超过GPT-4了。

  刘庆峰亦坦言,我们要清醒理智地看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域与GPT-4的最好水平还有差距,不过,讯飞星火有信心在2024年上半年赶上GPT-4目前最好水平。

  值得留意的是,OpenAI计划于2024年推出GPT-5,OpenAI可能已经完成GPT5的训练。第十六届上海市代表王延峰教授就在其提交的《关于上海加快建设具有全球影响力的大模型创新集聚区的建议》中指出,尽管中国的科技企业在大模型领域已投入巨大,但离产生“世界级”产品还有很大差距,在全球竞争中尚未显现出相应的领先优势。“在大模型领域的投入和产出数量上,中国已经追平甚至超越美国,但在大模型的实际应用和产业价值转化方面,美国在全球竞争中仍然保持着显著的领先优势,真正达到世界级水平的仍然是 OpenAI、谷歌Meta等少数顶尖美国科技企业,这点从这届CES就可以清晰看出来。”王延峰表示。

  展望2024年讯飞星火大模型发展,刘庆峰指出三点:首先,一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。

  “第二,2024年要真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型,中国企业界、科学界有信心实现超越。”刘庆峰表示,“第三,高楼大厦要建立在安全可控的平台之上,我们要实现自主可控平台上的生态繁荣。自己有信心,能够实现从算法、数据、应用场景到算力,构建一个完全自主可控的繁荣的人工智能生态。”

  面对美国限制算力出口和使用政策频出,刘雪峰亦提醒到,受限于可获得的算力资源,中国AI大模型开发和应用的进程仍可能受到影响,国产AI基础算力的差距缩小需要时间,尤其是大规模集群式训练以及生态建设方面仍有待突破,美方对于AI算力和模型服务限制政策变化仍存不确定性。