给出简单的信息、写作目的-点击发送-得到一篇结构完整、逻辑缜密、语句通顺的文章。这是近期大热的OpenAI最新对话模型ChatGPT能做到的,除了写文章,它还能闲聊、问答、修改代码,甚至定制简历和商业解决方案。

与此前我们想象的远离生活的实验室研究和展示在会议大屏幕上的虚拟形象完全不同的是,进入2023年,AIGC(人工智能自动生成内容)真正走向了实用水平,深入我们生活的方方面面,逐渐颠覆现有内容生产模式。而这背后是人类对自身智慧的最大探索,更是行业领先者如微软(MSFT.O)、百度(http://BIDU.US/9888.HK)等公司在技术、策略、人才等方面实现的重大跃迁。

在布局探索深度学习、自然语言处理等人工智能技术的中国公司中,百度毫无疑问走在行业前列,尤其是通过AI实力和底层技术积累,百度的前瞻性布局和探索将推动包括绘画、音乐、新闻创作、主播等诸多行业的跨越式发展。在1月10日百度举办的Create AI开发者大会(下称“Create大会”)上,“人机共创”不仅是前台的展示案例,更是幕后真正的创造者,深入应用到了大会歌曲、场景、演讲脑图等的创作。

更加值得关注的是,在打造首个“人机共创大会”的背后,“创新-反馈-创新-增长”的逻辑在百度的整体发展路径中变得格外清晰。技术层面的AIGC发展和应用将承上启下,反馈底层框架的同时,深化应用并赋能产业及实体经济发展。正如其创始人、首席执行官李彦宏在开发者大会开幕时所说,“技术的发展,没有导航地图,只有指南针。在方向大致正确的情况下,基于实践反馈,一步步迭代,才能跑出有价值的创新。”

图说:百度创始人、董事长兼首席执行官李彦宏在Create大会上

生成式搜索指路未来

从ChatGPT说起,这一人工智能模型如此聪明,以至于编程问答社区Stack Overflow“手疾眼快”地以错误率高为由封杀了ChatGPT。那么,ChatGPT是否会取代谷歌等平台,成为下一代搜索引擎?

在研究搜索引擎与自然语言处理的张俊林博士分析看来,ChatGPT的技术路线强在训练回报模型(Reward Model,RM)的阶段,即在模型给出一批语言答案后,通过人工标注训练数据,来训练回报模型的过程。

但ChatGPT自身要取代搜索引擎,还存在诸多问题和困难,例如其回答的质量未必靠谱,且在提问者不知道答案的情况下很难判断。网友的“用小学生题测试ChatGPT”的实验显示,ChatGPT主要适合回答很难证伪的问题,有时会“一本正经地胡说八道”,比如把葫芦娃说成是来自《聊斋志异》。此外,模型吸纳新知识的训练时间成本和金钱成本都较高,且可能产生新数据的引入导致对原有知识的灾难遗忘问题。

因此,张俊林及很多专家学者都认为,ChatGPT暂时还不能取代搜索引擎,但搜索引擎+ChatGPT的双引擎结构比较可行。即搜索引擎给出资料来源,帮助用户验证答案的准确性;ChatGPT则提炼逻辑,优化Top1搜索结果。通俗来说,未来的搜索引擎大概率是以用户智能助手APP的形式存在的。

从搜索引擎与ChatGPT二者关系来看,考虑到短期内大模型训练成本难以大幅下降,张俊林认为过渡阶段会以传统搜索引擎为主,ChatGPT这种生成模型为辅,通过生成式搜索不断提升判断和处理效率,并最终走向以AIGC

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注