主页 > 下载imtoken钱包 > AI领域真正最稀缺的人才,是懂得切题的人才

AI领域真正最稀缺的人才,是懂得切题的人才

下载imtoken钱包 2023-09-17 05:12:43

在这里,这不是秘密。 AI领域最多、最多、最多、最稀缺的人才应该是人工智能架构师。 拥有4次科技创业经验的星瀚资本创始合伙人杨戈如是说。

在杨歌的身上,有着许多传奇的经历。

清华大学硕士,技术人,四次科技创业经历,创办青年精英商业协会,投身PE,创立星瀚资本,圈内最懂AI技术的投资人之一...

然而,最打动我的不是这些亮眼的字眼,而是他身上强大的潜力,眼神中的冷静和坚定,以及年轻时不在乎赚钱的心态。 当年,他愿意拿着微薄的薪水去四大会计师事务所补充一下金融知识。 赚到的第一桶金,他想也没想就直接扔进了公司。 他根本不在乎平常的生活方式。

他喜欢用数学模型和物理模型来比较和解释身边的一切现象,喜欢用元认知来保存大脑记忆,喜欢用一二三来分析。 他语速很快,很少停顿,也没有废话,几乎可以直接写稿子。

在采访中,他对三个问题的论述给我留下了特别深刻的印象。

一、对目前AI芯片的立体分析(终于知道AI芯片为什么火了);

二、AI市场稀缺人才AI架构师的三层剖析(技术追求者必读哲学);

三、针对AI或普通程序员选择创业,针对三大特性需要弥补的短板,为此提出了四种方法(工程创业,请详读)。

杨弟兄喜欢用简单的语言,把复杂的道理讲清楚。 每一个问题,他都可以尽可能详细,也可以尽可能深入,结合各种比喻,确保你真正理解他的意思。

这篇文章比较长,一共分为三个部分,内容价值相当高。 文中尽量保留了杨戈的口头语言,真实地呈现了他的智慧。 希望对你有所启发。

作者| 鸽子

在市场上AI专用芯片的呼声不断被推向新高度的当下,作为投资方的杨戈也出手了,一举投资了鲲云科技。 在人工智能技术相关的创业公司中比特币机能使用多久,杨戈在业内享有盛誉,语言能力也很强。 就在采访的时候,让他用最直白的语言,了解了有哪些特殊用途的芯片,如何理解现在的市场芯片,以及AI芯片创业者,他们到底需要和什么竞争?

以下以第一人称口述的形式,呈现三个部分:

AI芯片为何突然火爆

计数芯片的历史是一个从专用芯片到通用芯片,再到专用芯片的过程。

早在 1960 年代,英特尔就从专用芯片转向通用芯片中央处理器 (CPU),英伟达则转向 GPU。 近两年开始生产TPU。

这整个系统就是一个让芯片越来越通用的过程。 不过近两年终端因为降本,不得不回归专用芯片,因为通用芯片的效率比较低,生产成本比较高。 .

因此,近两年,专用芯片大行其道。

从通用型、服务器型、集成芯片到一些设备使用的、具有一定功能的专用芯片。 另外,这两年刚好赶上AI大爆发。 AI的需求被烘焙到这些芯片中,这就是我们看到的AI芯片的异军突起。

为什么终端场景会催生专用芯片?

为什么终端场景要用终端芯片而不是抓包设备进行网络传输到云端,到服务器,使用服务器的CPU,GPU,或者TPU来处理,然后返回数据?

就是因为无论你的网速多快,中间都会有几百毫秒的时间差,以后需要终端芯片果断直接解析。

比如机器人比特币机能使用多久,看到你之后,需要快速分析你的特征,然后跟你说话。 在这个过程中,如果机器人只有一个接收器,需要传到云端再传回来,不管网速多快,都会有时间差。

因此,为了提高响应速度,终端开始产生对自带处理器的需求,比如图像识别、语义识别、语音识别,以及一些运动功能的处理。 这时候,终端就需要具备一定的人工智能能力(AI capabilities)。

比特币挖矿机一机难求_比特币机能使用多久_比特币等不能当货币使用

专用芯片腾飞后,玩家究竟在争什么?

当专用芯片的需求出现时,玩家将开始竞争。 具体来说,比赛是:

比特币挖矿机一机难求_比特币机能使用多久_比特币等不能当货币使用

首先,你的硬件结构是否最优。

五金行业的特点是:没有最好,只有更好。

硬件总是在迭代,背后的原因主要是摩尔定律在起作用。 另外,当摩尔定律的晶体管成为量子化的东西之后,它还会继续进化,从分子层面发展到原子内部层面,然后继续寻找其他的计算位。

其次,算法不是最优的。

近两年,在大家为神经网络算法疯狂的时候,出现了很多变种,从最开始的简单RNN到LSTM,再到更复杂的结构,从最初的CNN设计到复杂的CNN结构,以及然后用CNN作为对抗网络...

就在大家疯狂争算法的时候,2017年又冒出一个理论,说神经元的基本单位不应该是神经,而是胶囊; 如此一来,算法的底层被改变了,Hinton先生30岁的学术成果也被颠覆了。 在 Capsule Network 中,in&out 在单个处理单元上变得更加复杂,尽管网络连接过程保持不变。

所以很多人只能推倒重来。

第三,工程细节是否优化。

人们也发明了很多方法。 比如全连接,然后连接一些CNN模块,然后出现很多类似Dropout的模式。 他们同时被连接和遗忘,发现他们比正常人更好。

第四,工程创新每天都在发生。

每个工程师都有一个工程创新。 如果这100位工程师中有一位有一项影响深远的创新,那将是整个行业的又一次大变革。

无论是何种创新,都是在不断突破和提升效率。 比如在算法方面,AlphaGoMaster和AlphaGo Zero,后者的效率较前者有了突飞猛进的提升。

所以,底层一改,一切又变了,又要迭代。 比如,可能20秒就解决了,但你19.8秒就可以解决; 但是现在,突然底层变了,10秒就能搞定,又是一层迭代。

没办法,行业就是这样。

从硬件的角度,软硬件结合,软件,算法,每天都在迭代,所以很难:因为没有定型,没有定型,对专用芯片的固定要求非常严格。

因为专用芯片的一个大问题是,一旦板子固定了,开模了,这个东西就改不了了。 这是个大问题。 因此,如何制作适用性最强的专用芯片就显得尤为重要。 一般专用芯片完成后,比如只服务于某一类语音识别机的芯片,一旦算法更新,对模块的底层要求就会不同,所以不能使用这种专用芯片. 因此,我们只能做一个新的专用芯片。

这东西的迭代速度实在是太快了。

三种芯片:

专用芯片兴起的背景大致列在上面。 接下来说一下这三种芯片:

其中,FPGA相当于写硬件,可以通过改变硬件随时调整功能逻辑,但FPGA存在以下主要问题:

因此,FPGA是一个过渡过程,可以连接通用芯片和底层专用芯片。

说完FPGA,再来说说专用芯片。

专用芯片的特点是价格极其便宜。 只要开模做板,基本上50-100元一块就能搞定,但是开模费是500万,而且一旦开模就不能换了。 (营长注:这里500万是个大概数,杨哥想表达的是,开模费很高,对连队来说是个不小的负担。据营长了解,开模费费用一般在几百万到几千万之间。)

如果用数学的方式来理解这三类芯片,就是:

比特币挖矿机一机难求_比特币等不能当货币使用_比特币机能使用多久

专用芯片成功的关键:

目前大家倾向于回归专用芯片,这也是因为专用芯片在2017年有两大驱动力:比特币矿机和人工智能。

比特币挖矿机一机难求_比特币等不能当货币使用_比特币机能使用多久

基于这两股力量,写专用芯片的需求就来了,因为FPGA和CPU的成本太高了。

但是专用芯片的问题也随之而来,就是不管在什么时代,不管你是70年代、80年代,还是现在,专用芯片总有一天会过时,因为技术总是在迭代。 这个时候就考验你对专用芯片的驾驭能力了。 一句话,你设计的专用芯片能支持业务多久。

如果你研制的专用芯片能用三年,那你同期可以再开发一个更新的专用芯片。 三年后,当原来的专用芯片产能即将下降时,可以在上面使用新的专用芯片。 如果能够登顶,那么这能力就很强大了。

但是如果你的专用芯片半年就过时了,那你的成本就太高了,因为你每个专用芯片需要500万块以上的板子,这对于初创公司来说是完全负担不起的。 (营长注:这是一个大概的数字,只是强调做板子的成本更高。) 如果你还在玩板子,你的连队就危险了。 你还不如用FPGA和CPU来做。 现在多核CPU也可以做到。

目前专用芯片的竞争之一就是你写的专用芯片是否足够健壮、适应、耐用,是否能适配更多的人工智能算法模块,是否能承受算法变体……

比如CNN是变体,卷积核是变体,这个芯片能搞定吗? 当LSTM的循环网络内部结构,遗忘门和记忆门发生变化,你能承受吗?

当然,Capsule Network一出来,不仅你受不了,大家也受不了。

一般来说,你要把你的专用芯片做的容错性、健壮性、适应性最强,这样你的成本才能算进去。 但是,大部分技术人员的账目可能三五年都算不上。

也有一些人专注于非常细化的地方,一定要编译到极致,保证局部最高的健壮性和容错性,但是长期的,中期的,长期的,比如说三年,这个可能行不通。

比如交通图像监控和识别,你随便用,准确率99.9%,但是两年突然升级算法,怎么办?

所以,我不建议把重点放在单一场景的适应性上。 我认为关注长期场景变化的可用性非常重要。

这些问题其实是AI芯片竞争最重要的底层逻辑。 在AI芯片领域,我们投资了鲲云科技。 他们的联合创始人分别是斯坦福大学的客座教授、伦敦帝国理工学院的教授和英国皇家工程院的院士。 他们发表了 300 多篇论文。

它们的特性可以让芯片的适用性非常好,芯片的场景适应性、网络适应性、算法适应性都非常强。

同样做得好的公司还有地平线、寒武纪、深鉴等,但是也有一些公司的场景化准确率只有95%,甚至85%,所以这些芯片不一定能用,或者只能是动员起来。 某些模块功能无法调动大部分模块功能。

目前深度学习训练过程并不需要使用AI专用芯片,因为AI专用芯片主要用于某个终端应用场景。 一般来说,终端人工智能芯片不执行训练过程,只执行使用过程。 这是人们容易产生误解的一点。

AI芯片市场还远未饱和:

说到终端市场,英伟达也在强攻终端市场。 Nvidia去年发布了一款新的TX2芯片(也是终端芯片)。 不过,英伟达的终端芯片是集成芯片的轻量版。 其集成的GPU嵌入在一个小芯片上,形成一个专用芯片。 因此,目前的AI专用芯片仍需经受住英伟达的竞争。

目前,人工智能技术分为三层:

技术模块中间层(简称模块层)指图像识别、语言识别、语义识别、运动功能识别; 最底层,即基础数学物理层,是芯片、数据传输、数据存储结构、算法结构、算法模块。

在应用层,几个比较大的场景包括:

这些场景的入口模块都需要一个完整的、完全标准的模块层,也就是说语音识别和语义识别需要非常准确。 无论是设备还是机器人,模块层都需要非常成熟,底层也需要。 芯片层成熟。 目前,每个人都在争夺这个市场。

二十年后,周围的物体可能只需轻点一下就能移动和说话,而每个物体都需要两个基本的模块系统。

软环境是科大讯飞、商汤科技、旷视科技等在做的,硬环境是英伟达、通信云、坤云、深鉴等公司在做的。

在目前的AI专用芯片市场,如果说市场饱和的满分是10分,现在还不到1分。

虽然现在只差不到1分,但今年的AI芯片企业一下子火了起来,因为大家都期待着十年后的应用场景。 十年后市场很大,但很难预测。

目前市场上的几家公司,显然不足以形成大的竞争。

如果要打个比方,现在的市场才刚进场,裁判还没有开始吹哨。

比特币机能使用多久_比特币挖矿机一机难求_比特币等不能当货币使用

对于AI专用芯片,应用场景尚未完全开发。 有的人在做无人机监控,有的人在做道路摄像头监控,还有的人在做家庭环境。 总的来说,目前各个公司的应用场景都没有锁定,还处于补充基础知识的阶段。

当然这个阶段完成之后,有的可能转向交通,有的可能转向家居环境,各有各的垂直领域,不断迭代。 到时候,可能就没有竞争了。

比特币机能使用多久_比特币等不能当货币使用_比特币挖矿机一机难求

AI市场最紧缺的人才是什么?

首先,我认为懂人工智能的人,我是说真正懂人工智能的人,是非常稀缺的。

那么什么叫真正明白呢?

是理解人工智能物理意义的人,而不仅仅是算法。

人工智能的真正理解是什么——炮顶杰牛:

以我自己为例。 我在清华读书的时候,用的是神经网络。 我知道如何使用它们,但我不理解它们。 我不明白它们的潜在含义是什么,为什么可以训练它们,以及计算机是如何思考的。

这是一个非常重要的思维门槛。

对于深度学习来说,既然是黑盒,你不需要知道机器在某一点上在想什么,但是你要非常清楚机器在思考的整体逻辑以及每一层的大致思路是什么单位正在做。

目前,很少有人能理解这一层。

比如有个词叫炮顶姐牛。 首先你的眼里脑子里要有牛的全貌,然后你要善于用这把刀。 与其说你拿着这把刀,还不如快点解剖牛。

既懂牛又懂刀,才能达到炮顶夹牛的境界。

同样,人工智能就是这样一种工具。

给你一大堆图片,让你训练一个模型,你用tensorflow跑出来了,可是明天让你训练语音,后天训练物流那些乱七八糟的数据信息,你就一头雾水了。

再比如,如果有一个模型需要用CNN全连接,而你的模型最好用对抗网络,那么你的模型就不需要用神经网络,而应该用Randomforest。 有了模型你就应该用这个,为什么用这个,你是通过大量的算法和经验做出来的。

对我来说,最大的帮助是对编程的感性认识。 当我在大学读研究生时,我做了很多编程。 我每天都在调试。 调试特别训练人去思考机器的底层运行。 如果一个 100,000 行的程序出错,您如何快速调试它? 要了解计算机容易出错的地方。

人工智能更复杂。 人工智能调试过程中,没有调试提示器,因为都是数据与数据之间。 是无法收敛的数值计算。 不知道哪里出了问题,只能看到数据发散,这是一个特别可怕的问题,因为你的程序根本没有错,只是你的数据结构和网络结构错了,这个需求的过程程序员定义算法的物理模型和场景模型的物理意义是很复杂的,很难描述这件事。

比特币机能使用多久_比特币等不能当货币使用_比特币挖矿机一机难求

最紧缺的人才——人工智能架构师:

我有一个特点,就是把自己学过的东西都push起来,就是老师说的东西我都能push。 这个东西叫做元认知。

元认知水平越低,他理解某件事时在大脑中占据的记忆就越少。 例如,让我描述一个完整的商业案例。 有些人会从头到尾背一遍。 看完之后,我可能会记住一个单元,然后就忘记了。 这件事下次再说吧。 我可以通过提起它来描述这个单位。

人工智能也是如此,它是一套工具。 对于一个真正优秀的工程师来说,他手上所有的人工智能都是算法。 比如人工智能一般范畴的算法可能有七八种,比如支持向量机,还有很多神经网络,randomforest,adaboost等等,看到一个模型之后,他可以快速判断是哪个模型更合适。

例如,为什么语义识别要使用递归网络和 LSTM 进行识别? 因为语义是一个线性的信息流,在这个线性的信息流中,我们必须记住远远超前的信息,同时忘记很大一部分信息,然后再记住当前的信息。 因此,使用LSTM可以完美解决这个问题。 但是LSTM在图像识别方面不起作用,在量化金融方面的优势并不明显。

在这里,很多人认为stock和semantics都是时间序列函数,或者前后序列函数。 为什么 LSTM 训练效果很好,但训练股票却不行?

这需要回归元认知。 因为他们的数据结构完全不同,所以你要明白哪个模型处理哪个实体结构。

比特币机能使用多久_比特币等不能当货币使用_比特币挖矿机一机难求

再比如,CNN适合处理大量数据,数据量大,数据与数据之间有明确的关联条件。 因此,CNN适用于处理图像,因为图像的像素之间存在相关性。

同样的情况下,语义又不合适了。 比如“我写程序”这四个词,每个词之间的一对一相关性没有那么强,但是有整体相关性,这和图像识别是不一样的。 简单来说,语义是一维函数,图像是二维函数。

所以,这些都是非常详细的事情。 只有你用了很多程序,跑了,你才能感知,哦,应该用什么算法跑这个,不应该用什么算法跑那个。 因为人工智能属于黑暗森林,只能慢慢探索,才能找出最合适的。 你不能第一天调试,搞清楚什么样的场景,应该用什么程序,这个程序应该有多少层网络,结构,单元,每一层单元应该有什么参数,什么program要跟cooperation,是不是需要两个program来嫁接,是不是需要高级的比如对抗的,辅助的,或者嫁接的等等,需要不断的锤炼和思考,才会有这样的感觉,你有一点一滴去体会。

所以,回到最初的问题,我觉得如果按照具体的职位来定义,最稀缺的人才就是人工智能架构师。

他可以抽象出你最应该使用什么样的工具。 在他的领导下,其他人可以弄清楚如何在更精细的层面上使用这个工具。

比特币挖矿机一机难求_比特币机能使用多久_比特币等不能当货币使用

但是,人工智能架构师分为三个层次。

人工智能架构师的三个层次:

第一层:物理模型架构。

有时候我们在训练一个事物的相关性时,可能会把两个事物分开。 其实应该把两个事件放在一起,把相关性作为训练对象来训练,这样训练可能会更好。

或者把一个隐藏的物理意义作为训练对象,把相关性和这两个东西放在一起,然后训练。

但是很多人没有想到这一点,直接用两个东西来训练相关性是不对的。

最内层的物理模型架构,需要对物理意义有深刻的理解。 当你知道如何使用各种功能时,热量就差不多准备好了。

第二层:我们确定了如何训练拓扑模型之后,当拓扑模型框架出来的时候,我应该根据拓扑框架选择什么样的网络模块,需要训练什么样的效果,然后我再训练进去细节。

第三层:这些模块全部选好后,每一层用了多少个单元和参数,你有本事吗。 你可以选择第一层100个神经元,第二层10个神经元,第三层多少个神经元,然后你用卷积选择多少个神经元,kernel有多大,3×3,5×5的, 10×10,你到处试,可能要一年才能出结果。

一个好的工程师可以在第一次切割时将您切割到几乎相同的点。 你的模型基本有10层网络,每层大概有10个神经元,卷积核层数大概有3层,全连接层有7层。 够了,他一上来就给你弄这个东西。

目前,这三位建筑人才稀缺。

培养这样的人才难度很大,而且必须跨界,尤其是在物理模型架构层面。 你必须能够在物理层面上理解这个东西的含义。 你必须有丰富的业务经验,不同的思维模式,视野开阔。 例如,你从事过社会、社会科学、商业等各种类型的工作,然后反之亦然。 这件事很容易看出。

为什么说一定要过境呢? 因为跨界会补充你的另一部分素养,跨界就是补充你的数据,这个叫做“一个向量空间的完备性”,你跨界就是用来做这个的。

我见过很少有人特别擅长担当AI架构师的角色。 非常感谢第四范式的戴文元。 他可以把银行需要的算法场景,变成一定的功能需求。 他是工程师中不可多得的情商比较高,比较跨界的人才。

要成为这样的人才,我想至少需要十年时间。

这种人才肯定有很强的感知能力,他有能力感知整个社会的存在,而不是把所有的目光都放在眼前的科技上。

比特币等不能当货币使用_比特币挖矿机一机难求_比特币机能使用多久

AI工程师创业必须补足哪些短板?

未来AI的机会太多了。 各行各业都需要AI,所有数据量大的地方都可以用AI处理。 因此,很多AI工程师可能也会考虑创业。

如果他们想创业,他们还应该获得哪些其他方面的增长?

要回答这个问题,我们先来看看程序员是一种怎样的存在。

比特币挖矿机一机难求_比特币等不能当货币使用_比特币机能使用多久

程序员是数据与人类之间的沟通者,这一点非常重要。 什么意思,也就是说,他可以把数据翻译成人的话,把人要执行的东西,转化成数据和数字。

对于这群人来说,由于长期与计算机和技术打交道,要想创业,必须要有实战经验和栩栩如生的感知体验。

怎么理解这句话?

AI工程师必须掌握的三个特性:

我举个例子,这个例子可能有点抽象。 我把任何一个事物都分为主要特征、次要特征和长尾特征。

主要特点可以通过看书学习,就是老师告诉你公理1、公理2、社会规律1、社会规律2,你记住了。 这是主要特点。

什么是次要特征? 一个事件有很多复杂的次要特征,老师讲不清楚,只能靠实践,比如你在工作的时候,如果不守财务准备金率,公司就很危险; 另外,对于合规这件事情,你只能在实践中知道为什么要合规,因为很多细节问题,商业、税务、法律等问题都会影响你的效率。

长尾特征属于感知层面。 比如你在与人交往的时候,你对这个人好一点,生意就会顺一些,这个老师就不会教你了。

一般来说,主要特征靠看书解决,次要特征靠实践解决,长尾特征靠情商培养。 如果你只有主要特征,你永远无法解决一个完整的问题。

程序员不管是创业,还是以后有更大的发展,都需要加强二次特征和长尾特征这两个方面。

比特币等不能当货币使用_比特币机能使用多久_比特币挖矿机一机难求

对于这三个特点,如何真正学习和掌握呢?

四种学习方法,AI工程师应该补上后三种:

为了很好地掌握这三个特点,我有一个很重要的学习方法要分享给大家:学习多样性。

具体来说,有四个层次:

“悟”:就是看书,通过理论知识来学习。 学习完全结构化的知识称为“理解”。 大多数程序员都有一个很大的问题,大多数程序员的知识结构来自于理解。

“注意”:就是与人交流,通过与人的交流学习知识。 这就是我从 24 岁以来所做的很多事情。 因为人与人之间交流的时候,是别人已经处理好的知识,你可以通过比较软的、人性化的方式去理解。

和智者聊天,胜过读十年书,因为他把自己十年的事都总结给了你,而且都是精髓。

多和智者交谈,你会发现你的整个世界观都是对的。

“感觉”:智者不能告诉你细节,但你可以在实践中获得真知,在实践中感受,在细节中感受。

“感悟”:主要来自于观看不同文化的电影、电影、电视剧、书籍和文章; 和旅行。

For example, if you go to Japan, you don't understand the language, currency, or culture. You stay there for 20 days. After you come back, you find that you have some Japanese habits and thinking methods that are very similar to theirs, because this is a A set of environments is affecting you, and this set of environments is called high-level epsilon in mathematics. These things are constantly affecting some of your behavior habits. Over time, your way of thinking is very similar to theirs, and you can handle some things that you could not handle before, which is very interesting.

This is the most typical feeling when I go to Japan and the UK. Because the cultural atmosphere of these two countries is very strong and concentrated, after you go to the UK, your whole person becomes that state, humorous, thinking, and cautious. Then you can imagine something, why people in this country and culture are in this state.

In addition, film edification is also a method I often use.

When I really don't understand something, I start to play that type of movie, and keep playing it in a loop. When the smoke reaches a certain level, I can be strongly substituted into every word and deed in the movie, and then I suddenly understood that there was a reason for doing this, and why it was this way and not that way.

Among these four kinds of learning, AI engineers should make up for the last three learning methods, especially for Chinese engineers. They should learn more about the crossover of Silicon Valley engineers. They must learn from their own understanding and relatively solidified learning methods. Jump out of the learning method.

Of course, this is a gradual and full process. AI engineers, or other programmers who are interested in starting a business in the future, must forge themselves from these aspects.

比特币挖矿机一机难求_比特币机能使用多久_比特币等不能当货币使用

比特币机能使用多久_比特币等不能当货币使用_比特币挖矿机一机难求