太长不看版
知识爆炸的时代里,更重要的是知识的精炼:排除噪音,抓住主线
身边有多种AI信息,要分类对待,系统学习。“学杂了的知识”是没有生产力的
“Attention is all you need” 如果这篇文章都没耐心看完,那还是弃疗吧
“Limit of understanding”; Yifei Gong 2024, with Dall-E
[作者] Ling, Lian
[图片] Yifei with Dall-E
引言
AI爆发到现在,国内技术产品没有做出太多名堂的,确实赚到钱的可能只有“卖课割韭菜”的……所以才有了“美国有OpenAI的Sam Altam,中国有卖课的李一舟”的怪相。
不过,李一舟们满足的需求是真实的:AI迭代速度过快了!即使作为从业者的我每天都觉得被各种信息打得措手不及。不仅是我自己,我周边的很成功的,但不是技术背景出身的朋友们,也会来问我“AI怎么学?”,“什么是主线?”,“未来的方向在哪里?”
在知识爆炸的时代里,信息的数量一文不值,重要的是知识的精炼:排除噪音,抓住主线。于是,我还是觉得有必要写一下这个“反割韭菜指南”。一方面是自己的学习计划,另一方面也希望对朋友们有用。(本文不是技术向)
“Watched/Observed”; Yifei Gong 2024, with Dall-E
割韭菜的识别
1. 大多数付费AI网课:误入歧途
制造焦虑,刺激眼球,卖课盈利。其课程大纲和课程内容,基本是互联网上免费知识的简单搬运 + 夸张手法吸引眼球。但致命的是这会误导我们对于行业的判断。
<如何识别>主讲人没有AI相关学习和从业经历,但Title一大堆:“人生导师”、“XX大咖”、“成功人士” 、“几步学会AI”、“AI商业实战”(要是真会实战早就闷声发财了)
标题党唬人、制造焦虑:“再不学就被时代抛弃了”
封面是个穿西装的中年油腻男,假装霸总
短视频作为主要宣发渠道,甚至课程也是短视频形态
刺激付费明显:“限时打折”、“再砍一刀”
2. 标题党自媒体:没有重点,没有理解
更新频繁,看似全面,实则是没有深度的信息搬运工,缺乏深度分析。这些内容的主要问题是制造焦虑和浪费时间。
<如何识别>标题夸张、充满噱头:“全球震惊”,“影视从业者要消亡了”
内容不专注,涉猎广泛:有国际大事、股票行情、明星八卦……还有AI
只告诉我们发生了什么,却不告诉我们发生的细节、为什么发生、发生后有什么影响
多数标题党自媒体的归宿都是卖课
3. 大多数机构报告:信息滞后,政治正确
大机构里一篇报告从撰写到发出的过程经常会有几个月:实习生收集信息–>分析师写第一稿–>项目经理审阅批改–>合伙人一看觉得不对又打回重写……对于一般行业,这样做没有问题,但是在AI这个一日十年的行业,市场上的大多数机构报告出来就是过时的。
第二,投行、咨询这些行业的目的是用这个报告来圈客户、卖项目;以及机构名声太大,在外不好发表直接言论。典型的是券商研报只会写公司好、行业好,很少写公司有问题;咨询公司最擅长的是讲一些方向无比正确,让别人完全挑不出毛病,但完全没有细节和可操作性的内容;世界银行、联合国的报告里最有价值的是数据,观点基本都是政治正确。
在机构里面,只有非常专注投AI的头部VC的报告还是值得看的
Sequoia 红杉资本 https://www.sequoiacap.com/
Andreessen Horowitz (a16z) https://a16z.com/
奇绩创坛(路奇的演讲)
最后,AI相关技术过于复杂,不太容易像一般的商业模式可以通过Business Sense来理解。但这些机构里大多是经济–商业出身,对于技术有深入理解的人不多。
“中美两大AI巨头” (图片来源:澎湃新闻)
如何系统学习AI?什么是有用信息?
这里我尝试从一个非技术背景,有一定收集信息能力,有一定英语能力的人的角度出发,做了一个简要提纲。今天并没有时间把所有好的资源都列上,也会有很多遗漏,希望以后能有时间做个资料总结。另外今天也是只挑出来个人认为好的信息渠道,因为精选比数量更宝贵。
1. 入门系统科普:权威公开课2. 信息同步a. 1-2个专业公众号b. 海外一手资料(可选)3. 进阶理解a. 技术大佬的深度对谈b. 加1-2个AI社群c. 甄别深度文章d. 少量读几篇主干Paper(可选)4. 实战:针对明确场景/技能进行训练a. 设计b. 搭Bot-编程c. 工作场景5. 找工作–改赛道:著名学府的学位
“Lighthouse”; Yifei Gong 2024, with Dall-E
<1> 入门系统科普:权威公开课
推荐入门的第一阶段直接学习权威公开课:这些课程体系完善,可以一开始就搭建完整知识框架。
以及即使可能有听不懂,我还是强烈建议看一下有点技术的课,这样可以理解技术的限制和边界在哪里;否则只看商业概念会很浅。
入门的系统科普可以分两步:第一步掌握基本概念,第二步看技术。
第一步:AI入门–基本概念Wikipedia: 最好最快理解基本概念
Deeplearning.ai的课程,涵盖从入门到进阶全阶段,入门可以只学习“introductory”部分 https://www.deeplearning.ai/courses/
微软发布的面向初学者的AI课程,涵盖了AI核心原理概念 https://microsoft.github.io/AI-For-Beginners/
第二步:理解技术原理和技术边界MIT的神课Introduction to Deep Learning(2023年版):https://www.youtube.com/watch?v=QDX-1M5Nj7s
MIT AI课在B站上搜出来的是过时的2010年版,里面并没有最新的模型进展 (transformer架构是2017年才提出的)
B站up主“跟李沐学AI”,李沐是AI大牛、亚马逊首席科学家:https://space.bilibili.com/1567748478
有关商业模式: 头部专注AI的VC的报告红杉资本、a16z、路奇演讲 (链接见上文)有关AIGC技术落地Google官方推出的面向初学者的免费AI课程,介绍了大模型的应用场景,如何使用提示调整来提升大模型性能,如何开发GenAI应用等:https://www.cloudskillsboost.google/paths/118
IBM联合Coursera推出的AI Foundations for Everyone课程,介绍了AI的原理概念、GenAI的应用、AI聊天机器人等:https://www.coursera.org/specializations/ai-foundations-for-everyone
MIT: Introduction to Deep Learning (2023); on Youtube
<2> 信息同步
一般来讲,关注下面任意1-2个科技公众号就足够掌握AI行业进展了。好处是详细、及时、技术到位;缺点是信息过多看不过来,以及供反思的深度文章密度低。
如果想要更深度地追踪海外行业动态,推荐阅读外媒的一手报道
新闻类:Techcrunch, The Information
更硬核的和模型技术相关:Github, Reddit
“Road towards Data”; Yifei Gong 2024, with Dall-E
<3> 进阶理解
a. 技术大佬的深度访谈
首推海外高信息密度的技术大佬对谈:例如 Lex Fridman 与众多技术大佬如 Ilya Sutskever,Geoffrey Hinton,Yann LeCun等均有过深度访谈。
国内小宇宙等平台上的访谈的信息密度较低,更适合入门而非深入理解。
此外,我不太推荐和商业领袖的访谈,包括和AI行业的商业领袖的访谈。这些访谈听起来好理解,但里面的内容经常充满商业目的和误导性;对于这些人来讲,访谈的目的是提高公司估值,寻找投资人,以及迷惑大众。比如Sam Altman的访谈质量就很一般,我听完之后的感觉就是“他很不真诚”. (前文“OpenAI CEO 对谈笔记 | 逃避与无视”)
推荐举例:Geoffrey Hinton谈AI https://www.bilibili.com/video/BV125411y72pLex Fridman与AI大佬访谈系列 https://www.bilibili.com/video/BV134411z7skb. 加1-2个AI社群
社群的好处是社群里经常有总结性信息,有具体话题可以有探讨,以及确实有大佬在这些群里。不过缺点还是是信息太碎太杂,且信息深度高度依赖于群友的认知水平。社群加1-2个足以,尤其如果没有创业打算,那么加入社群的意义有限。
推荐举例(非完整list):通往 AGI 之路:科普型社群,有比较完整的AI信息集合库 https://waytoagi.com/AI 产品榜:提供最新的AI产品榜单 aicpb.com集智俱乐部:学术型社群,很硬核,但会有听不懂/看不懂的地方c. 深度文章
媒介的特点决定了文章的定位。深度文章基本只有微信公众号和知乎;另外是B站长视频。其他的基本都没有营养。
如何鉴定文章质量一直是个玄学。首先靠谱的朋友转发的文章——社交传播一般来讲比系统推荐的要好;此外,配图质量很多时候是一个比较可靠的质量标准;以及,大多数标题党的内容都很差。
推荐举例(非完全名单):
普通人的AI自由 (不要脸的肯定首推本号):本号的问题是跟新频率低,容易看不到;时间有限没空灌水……
海外独角兽:偏投资人、CEO、战略制定者的视角,有较多AI的商业分析和访谈
数字生命卡兹克:AI相关技术、产品、哲学思考
Super黄的念想:从产品经理的角度拆解各个AI产品
AI炼金术:AI行业的商业和技术思考
利维坦:是个大杂烩,AI
内容有限,但是从哲学层面有很多启发点 (私心把这个也加上了)
d. 阅读主干Paper(可选)
如果对技术原理有更深层次追求,可以读几篇主干Paper。读文章确实很花时间,但精读最核心的几篇文章可以有深理解,之后就比较容易识别“韭菜文”。(技术大佬当然会读更多,我就只选几篇最核心的,不班门弄斧了)
(i) GPT4:AGI的火花理解GPT4,理解AGI的第一手资料和最核心论文,而且内容详实,建议全篇细看。(与之相比,Gemini那篇论文基本啥也没写)
论文链接:https://arxiv.org/pdf/2303.12712.pdf (ii) GPT4 System Card这篇文章几乎和上一篇一样重要,详细讲了GPT4的风险和社会影响。个人觉得虽然讲得还不够透,但已经是政治正确外衣下比较明白的一篇了。(可能Ilya走之后就不会有这种文章了)
论文链接:https://cdn.openai.com/papers/gpt-4-system-card.pdf (iii) “斯坦福小镇”:AI Agent实验这篇文章创造了一个AI社会的雏形,是AI Agent的先驱。看完之后后背发凉。
论文链接:https://arxiv.org/pdf/2304.03442.pdf (iv) Attention is All You NeedTransformer架构和大模型的奠基文章。文章不长,但是今天所有爆发的基础。看这个的有助于理解模型的特点、边界和可能限制;以及和人脑作类比。
论文链接:https://proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf (v) Sora这篇其实不是学术文章,更多是阐述Sora这个产品。看了i-iv之后,就会发现这篇文章本身的新概念不算多,但有助于理解。
文章链接:https://openai.com/research/video-generation-models-as-world-simulators (vi)另外一个不错的资源是“李沐老师的论文精读”,可以降低读文章门槛,有助于理解。不过最近更新有点少,可能是AI爆发之后工作压力一下大了。
链接:https://github.com/mli/paper-reading“Searching in the Dark”; Yifei Gong 2024, with Dall-E
<4> 实战
目前虽然大多数AI工具都是昙花一现,但针对某个明确场景/技能进行的训练也是需要的。这样做尤其有利于理解AI目前的水平和限制。但我们并不用特意在没有应用场景的时候大量学习如何使用各种AI工具。以及,不要指望“学完就能日入上千”这种割韭菜的口号。在作图、prompt、编程领域,有些付费教程还是可以花钱来学的,不过今天暂时不展开。
具体来讲,大约有3个场景还是值得钻研一下的。
a. 目前唯一成熟的:作图、做视频
文生图:独立工具有DALL-E,MidJourney;开源模型有Stable Diffusion(SD);此外,大多数设计产品中已经集成了生图–修改能力,Photoshop, Canva, Photoroom 等都有
。
文生视频:当前还没到成熟,市面上比较好的工具有Runway,Pika;开源模型有Stable Video Diffussion(SVD),另外我们可以期待一下Sora的面世。对于视频制作,稳定度、可修改性、成本是我比较担忧的。
b. 实验搭Bot-未来搭Agent
接一个API,通过写Python和prompt自己搭一个小Demo可以是个不错的练习。可以借助字节跳动的Coze或Open AI的GPTs。目前技术不是非常成熟,但可以先熟悉一下这股浪潮。另外,可以使用Github Copilot, Code Whisperer等工具进行AI辅助编程。今天暂时不展开讲。
c. 办工场景:飞书、钉钉等办公软件里也都有集成AI的功能,可以根据工作场景做探索
此外,还有一些AI工具的集合网站。如https://ai-bot.cn/或https://www.amz123.com/ai。好处是大而全,缺点是更新不及时,并且不知道有哪些AI工具是好用的。
“Exploration”;Yifei Gong 2024, with Dall-E
<5> 找工作-改赛道:著名学府的学位
另一种比自己学习的方式是可以攻读相关的在线学位(Online Master),所谓花了钱才能学进去。这类课程质量比较高,但缺点是贵和录取门槛较高(如UIUC的MSCs Online基本只招收计算机科班学生)。这些学位可以帮助找工作或换赛道,但指望通过学位就能成为技术大佬的想法不太现实。
举例如下(非完全list):
美国Stanford的Online Computer Science Master项目:https://online.stanford.edu/programs/computer-science-ms-degree
美国Carnegie Mellon University的Master of Software Engineering项目:https://mse.s3d.cmu.edu/applicants/mse-as-online/index.html
美国Georgia Tech的Online Master of Science, Computer Science项目:https://omscs.gatech.edu/home
美国University of Pennsylvania的Online Master of Computer and Information Technology:https://online.seas.upenn.edu/degrees/mcit-online/
英国University of York的Online Master of Computer Science项目(录取门槛较低):https://online.york.ac.uk/computersciencemaster/
此外,真下决心+想换一种生活方式的话,也可以考虑全职学位。可以参考CS Ranking https://csrankings.org 排名。不过要注意的是,排名不是最客观的评价方式,以及学校学术名气和之后找工作-生活幸福感的相关性有限。最直接的例子是这个名单里缺乏欧洲大陆学校:这是因为评价体系是按照英美大学体系所打造的,学校规模和预算在排名中的实际权重很高(paper数量、教授数量、学生数量)。确实美国是AI最发达的地方;但如果不一定要去硅谷,而是更全面考量就业和生活质量的话,那么跨越了语言门槛之后,欧洲大陆倒是一个性价比很高的地方。
“Upgrade”;Yifei Gong 2024,with Dall-E
最后,本篇算是一个引子,接下来还会有文章进一步分领域梳理AI资源。
期待您的关注。