“数据”中国电信何忠江发布千亿参数语义大模型“星辰”:年底前开源百亿模型

2023-11-10 17:05:42来源:运营商财经网

今天,很高兴为大家分享来自运营商财经网的中国电信何忠江发布千亿参数语义大模型“星辰”:年底前开源百亿模型,如果您对中国电信何忠江发布千亿参数语义大模型“星辰”:年底前开源百亿模型感兴趣,请往下看。

运营商财经网讯

今日,中国电信2023数字科技生态大会暨2023数字科技生态展”在广州盛大启幕,中电信人工智能科技有限公司何忠江总经理正式发布了“星辰”千亿参数的语义大模型。

据他表示,千亿模型的效果有了非常显著的提升,接下来还要通过量化蒸馏的手段,让模型能够低成本商用。 

同时,他也透露,中国电信的AI团队也将参与到开源开放的行列中,将于今年年底之前开源百亿模型,明年4月开源千亿模型,所有底层代码都会开源。同步中国电信还将开放超过1T的高质量清洗数据,以及各种基于星辰大模型底座的工具链,满足各类开放用户需求,同时技术团队会在线上对工具进行支持。

会上,何忠江还介绍了中国电信AI研发的多模态大模型,主要聚焦在提升图文生成、图文理解的能力。其中中国电信训练了超过12亿的各种风格数据,目前支持写实、彩墨画、赛博朋克等接近20种绘画风格,同时由于在训练中特意加强了语义和图像映射的attention学习,所以对于中文的理解,语义的细粒度理解,比目前市面上很多软件效果提升不少。 

他也强调,人工智能领域除了算力和算法,最核心的还有数据。 

一是支撑大模型数据语料的积累,目前已经完成了超500TB文本数据、12亿张图文数据、日采集2PB的视频数据的积累,并不断积极合作公共数据和行业优质数据,作为首家运营商单位加入中国大模型语料数据联盟。 

二是助力建设数据要素市场化发展,通过建设开放共享的隐私计算平台,吸引合作数据和技术伙伴入驻。目前在海南,已协助市政 府构建了“数据超市产品” ,中国电信作为独家运营方,促成了2000亿的数据资源汇聚,运营了超5亿的交易项目。

好了,关于中国电信何忠江发布千亿参数语义大模型“星辰”:年底前开源百亿模型就讲到这。


返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章