AIGC介绍
AIGC 即 AI Generated Content,利用人工智能技术来生成内容,它被认为是继PGC、UGC之后的新型内容创作方式。2022年AIGC高速发展,这其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。
AIGC可以生成文字、代码、声音、图片和视频。
1)AI生成文字
目前AI已经可以作诗、写邮件、写广告、剧本和小说。OpenAI的GPT-3模型是AI生成文字中最成熟的模型。
GPT-3模型商业化:自动写邮件的OthersideAI,自动写广告文案的Copy.ai和Jasper.aiAI写作:采用AIGC技术的虚拟人度晓晓写作高考作文,在不到1分钟的时间,完成了40多篇文章,获得专家打分48分的成绩,击败了75%的考生知识管理和内容协作平台Notion也发布了其文字自动生成产品Notion AI2)AI生成代码
Deepcode:由人工智能驱动的代码审查软件DeepCode宣布,它已经检查了超过400万名开发者的代码。DeepCode的机器学习机器人精通JavaScript、TypeScript、Java、C/ c++和Python。Kite:是一款由 AI 驱动的代码补全插件,可以帮助开发者更快地编写代码并保持流畅,并且支持 13 种语言和 16 款编辑器。但因付费用户过少,已经关闭。3)AI生成音频
音乐创作
歌词音频对齐、音乐节拍识别、音乐质量检测、韵律识别等系统
音频合成和音频降噪性能,保障用户音乐作品的高质量完成度和呈现度。
语音合成阿里推出的新一代语音合成技术KAN-TTS,可以应用到汽车导航系统/地图系统。
4)AI生成图片
今年AI作画水平突飞猛进,其背后的算法模型也在不断迭代,年初推出的Disco Diffusion只能生成粗糙的图片,4月OpenAI发布的DALL-E2代已经可以生成完整的人像和图片,到8月StabilityAI发布的Stable Diffusion模型取得质的突破,已经可以生成可以媲美专业画师的作品,生成图片的效率也从年初的数小时到现在的几分钟甚至数十秒。
AI做图的模型特点出现时间GAN(Generative Adversarial Network)不稳定、分辨率低、只会模仿无法原创2014年CAN(Creative Adversial Network)表达抽象、能够原创2017年DALL-E(openAI)文字转绘画、绘画水平一般2021年2月CLIP+VQGAN可文字转绘画、开源、绘画水平一般2021年4月Disco Diffusion可文字转绘画、开源、原创性、图片精美、渲染时间长2022年2月Midjourney可文字转绘画、付费、适合人像、突出细节2022年3月Dall-E2(openAI)可文字转绘画、付费、限制较多,对复杂文字理解准确、艺术性不高、渲染快2022年4月Stable Diffusion可文字转绘画、免费开源、原创性、灵活度高、图片精美、真实感、艺术性、渲染快2022年8月Imagen(Google)有限公开,理论上比DALL-E2效果好2022年11月5)AI生成视频
目前AI生成视频的算法模型还未成熟,也还没出现一家独大的局面。9月底Meta公布了AI制作视频声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。