打造中国最大的
AI交流社区平台

巨头加速中文大模型!AI进一步融入实体经济

巨头加速中文大模型!AI进一步融入实体经济插图

“中文大模型将改变游戏规则!国内科技巨头争相布局AI领域”

巨头加速中文大模型!AI进一步融入实体经济插图1

中文大模型正成为AI应用的新焦点!目前,许多成熟的生成式AI模型主要基于英文数据进行训练,然而,在国内各行各业的应用环境中,中文大模型更加贴合实际需求。中文和英文数据训练出来的大模型存在较大差异,中文的上下文理解和语义多解性较英文更复杂。对于国内用户而言,用中文训练的大模型更加适用,能更好地理解人类意图。

在世界智能大会上,生成式人工智能成为备受瞩目的焦点。各大国内厂商近期纷纷加快中文生成式AI核心技术的研发。讯飞星火认知大模型展现出了强大的中文处理能力,而国家超级计算天津中心发布的基于国产超级算力和中文大数据集的天河天元大模型更是引发了人们对国内自主研发中文大模型的期待。

中文大模型的开发旨在满足国内用户的需求。康波,国家超级计算天津中心数据智能部部长介绍说:“AI大模型是基于海量多源数据进行预训练的模型,是对原有算法模型的技术升级和产品迭代。预训练大模型通过海量数据的自监督学习阶段完成了通识教育,再通过预训练和精调等模式,在共享参数的情况下,根据具体应用场景进行少量数据的微调,即可高水平地完成任务。”

生成式AI拥有逻辑推理、上下文理解、文字创作、知识提取、代码生成等多元化的强大能力,能够理解人类的自然语言表达,并通过庞大的网络结构提供针对性的内容输出。

然而,目前成熟的生成式AI大模型大多基于英文数据进行训练。康波表示:“通过中文或英文数据训练出来的大模型存在较大差异,中文的上下文理解和语义多解性较英文更复杂。大模型首先要理解人类意图,因此对于国内用户而言,用中文训练的大模型更加适用。”

巨头加速中文大模型!AI进一步融入实体经济插图2

此外,生成式AI正朝着生产工具方向发展,为产业深度赋能,成为人工智能与实体经济深度融合的重要力量。因此,可靠性和安全性成为数据驱动的AI大模型的关键。越来越多的科技巨头将自主研发中文大模型作为首要选择。

近期,国内各大科技企业纷纷加入中文大模型的竞争中。阿里推出了中文AI模型社区,上架超过300个模型,其中超过100个为中文模型,覆盖视觉、语音、自然语言处理、多模态等AI领域,并全部开源。360公司推出的360GPT大模型在海量中文文本数据上进行了预训练和微调,具备强大的语言理解和生成能力,目前已达到100亿参数规模,并持续扩展。

中文大模型面临着一个挑战,即中文大语言模型数据集的稀缺性。为了解决这个问题,天津超级计算中心收集整理了全域的网页数据,并从中提取处理高质量的中文数据,包括开源训练数据、中文小说数据、古文数据、百科数据、新闻数据以及各个专业领域如医学和法律等多种数据集。他们训练了中文语言大模型——天河天元大模型,总计训练数据集达到了3500亿token。

算力的供应对于大模型的训练至关重要。超级计算天津中心充分利用天河新一代超级计算机的算力,构建了智能计算引擎和支撑环境,保障了中文大模型的顺利训练。

中文大模型的技术成果已广泛应用于多个领域。生成式人工智能作为推动新一轮科技革命和产业变革的巨大力量,将成为产业智能化升级的基石,为各行各业提供智能化高水平的专业

知识支持。中文大模型在医疗、工业检测和流程控制等领域展现出了巨大潜力,能够提供精准的输出和辅助诊断能力。

中文大模型的发展将进一步推动人工智能的落地和产生新的机遇,助力实现科技创新的目标。

欢迎免费使用GPT对话,感受ChatGPT的魅力!AI爱好者 – 最具实力的中文AI交流社区平台 (aiahz.com)

长按扫描二维码进群领资源

巨头加速中文大模型!AI进一步融入实体经济插图3
赞(0) 打赏
未经允许不得转载:AI爱好者 » 巨头加速中文大模型!AI进一步融入实体经济

评论 抢沙发

欢迎来到AI爱好者

我们旨在打造一个最具实力的中文AI交流社区平台,致力于为所有AI爱好者,创业者和使用者提供优质服务. 我们的宗旨是为广大用户提供免费解决方案,您可以通过问答形式提出与AI相关的任何问题.

AI社区AI工具

安全服务战略合作伙伴:麒麟盾 SCDN

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

微信扫一扫打赏

登录

找回密码

注册