
2023年数智中国AIGC科技周· AI云智上海专场在普陀区召开。活动以“智能涌现”、“算力突围”、“超越现实”三大篇章开启,第一篇章以“智能涌现”开幕、重塑数实融合终极愿景;第二篇章“算力突围”,以AI为引擎,以计算为基石,构筑数字底座;第三篇章“超越现实”,引领“空间计算”新时代,进入“虚实相生”新阶段。



数智中国AIGC科技周开幕式


AIGC的新需求:模型训练与应用推理的述求
我国每年产生的数据量呈现非常大的增长趋势,这个前提还是前两年AIGC场景仍未出现的情况。而现在从UGC到AIGC以后,相信整个行业产生的数据量会比这个更为庞大,如何处理这些数据,这些数据怎么应用到系统上?这都对数据存储带来了更大的需求和挑战。从最初收集的原始数据,基于这些数据做数据处理,产生对应预处理后的数据,然后再给后面的训练模型,可以看到在整个模型训练的过程当中,会带来很大的数据量增长,也带来了对数据的统一存储的需求。腾讯云对此训练场景总结的需求有三点:一是数据湖的统一存储。在整个AIGC的过程当中,数据存储的量非常大,它带来的存储需求就需要用数据湖来解决,避免数据孤岛的问题。二是在各个业务的处理过程当中,数据流动的需求,这些数据如果用一些传统的文件存储的话,就会遇到数据孤岛的问题,因此需要一个统一存储来对其提供服务。第三是高吞吐和低延迟,在AIGC的场景下,GPU的算力是稀有和昂贵的,客户希望整个训练是跑的越快越好,对GPU使用的越满约好,这就对底层的存储提出了一个要求:越快的把数据读出来,越快的提供给上层训练,这样价值才是最高的。在AIGC业务处理流程中,应用推理场景核心需求主要由内容审核与数据智理两部分组成。将训练好的模型部署后,并通过服务模式提供给用户,通常的逻辑就是用户提供prompt,基于prompt生成一些数据。无论是文生文,文生图,还是视频等,这都要海量数据的存储,在腾讯云上都是通过对象存储来提供。而在这些数据生成的过程当中,基于有国家安全合规的监管要求,就需要用到腾讯云提供的内容审核和数据处理的能力。同时针对这些数据,用户希望它能够有一些数据智理的功能,这里基于我们对AIGC业务的梳理,用了一个智能的智,后面会详细的介绍该需求。腾讯云存储解决方案




腾讯云数据处理方案
数据万象是腾讯云提供的一站式智能平台,整合腾讯领先的AI技术,打造数据处理百宝箱,提供图片处理、媒体处理、内容审核、文件处理、AI内容识别、文档服务等全品类多媒体数据的处理能力。腾讯云内部有多个实验室,数据万象整合了腾讯前沿实验室技术能力,如AI实验室:基础算法;优图实验室:图像识别;多媒体实验室:编解码研究;天御实验室:安全封控算法,结合腾讯行业领先业务最佳实践,如腾讯音乐:降噪、分离等场景;腾讯视频:视频指纹、编解码等场景;腾讯新闻:图文审核等场景;腾讯全民K歌:歌唱评分、音乐标签等场景。


总结回顾

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。