这篇专栏出自得到App总编辑李翔和峰瑞资本创始合伙人李丰在「高能量」播客的一次深度对话。
李翔和李丰畅谈一个多小时,从文本信息数据化说起,以数据化为线串起了互联网的过去三十年,并试图解答关于ChatGPT的一些热点问题。
对话发生在4月中旬,负责数据基础制度建设的国家数据局成立一月有余,科技巨头间的AI竞赛日趋白热化。
在此背景下,李翔和李丰畅谈一个多小时,从文本信息数据化说起,以数据化为线串起了互联网的过去三十年,并试图解答关于ChatGPT的一些热点问题:
为什么现在出现了ChatGPT?往后还会发生什么?
在ChatGPT这个链条上会有哪些重要公司?创业公司还有机会吗?
还有机会做出中国的OpenAI吗?
第一波人工智能浪潮兴起后,有留下什么好的“遗产”吗?
医疗、自动驾驶领域如何实现数据化?未来会变成什么样?
Web3和区块链热潮之后,沉淀了什么?
在ChatGPT这个链条上,
会“长”出哪些重要的公司?
李翔:从你的视角来看 ,在ChatGPT这个链条上,会有哪些重要的公司?只从新闻来看,它可能有OpenAI这样的开发模型公司,也可能有英伟达这样提供芯片跟算力的公司。
李丰:今天来看肯定还是这三类:数据、算法和算力。但是最终,他们在应用层会演化成不同的东西,应用层的东西通常比提供基础设施的要更大一些,垄断效应更强一些。
大模型做好做大不容易,如果有的话肯定会是好的应用,但它们其实作为生产力工具,更容易在垂直领域被结合出来,尤其是需要用对话流加上博览群书的专业抽象内容来提供服务的公司。
比如说,我们投资了专注做在线心理咨询服务的Glowe阁楼,线上的心理咨询师通过和用户聊天,为用户提供基础的心理咨询服务。这大概就是通过博览群书的对话流专业服务来解决问题。
又比如说可以做金融服务,因为这里需要非常专业的理财师,跟用户进行无微不至的谈话,一段时间之后才把用户隐藏需求比较具象地挖掘出来。
它会不会出现像搜索引擎,但又不是搜索引擎,并且提供广义文本信息、供需匹配更高效率的商业模式?也许会有,如果有了,就具有绝对优势。
李翔:微软必应也在做这样的尝试。
李丰:对。有个有意思的话题,从搜索引擎到头条到抖音,本质上都是文本数据的供需匹配。
但是头条能做成的最大原因,是交互形态的改变和新设备的大规模普及,使输入和使用场景都跟上一代(如PC、笔记本电脑)有极大的差别。上一代的人没转过来,百度当时转慢了,才给了头条这个机会。
这个“新”是指用户交互方式的变化、屏幕的变化、物理键盘的消失、移动场景下多窗口切换以及输入不方便等。所有这些因素造成了用户使用拖拉或点选的方式,而不是用键盘输入关键词,来进行了信息筛选。
在此基础上,一个新的文本信息供需匹配的商业模式出现了(我们会在下文详细展开在互联网发展的过程中,由新变化带来的新的商业模式)。如果要再做一个,下一个应该不会以相同的搜索形态出现。
还有机会做出中国的OpenAI吗?
李翔:现在越来越多的大公司入局,也会有一些比较成功的创业者想要做中国的OpenAI,这些创业公司还会有机会吗?
李丰:这其中存在几个关键要素是变量。
第一个变量是,会不会有好版本的开源?
硬币有两面。在巨头激烈竞争的时候,反而会有更多更好版本的开源模型出现,这个时候,应用就会变得更突出一些。
不做激烈的模型竞争,把开源的模型拿过来,站在巨人肩膀上,在自己专业领域范围经过适当调整、训练和加工,把它变成专业服务劳动力中的一个生产力工具,并不能完全把人替代掉。
我们还需要考虑的是,在非算法逻辑的认知逻辑上,有没有加新的“一小跳”的东西?
这一小跳通常是一层窗户纸。回过头来看,搜索框就是当时的一小跳,它将当时已经成熟的用户习惯和设备,结合当时的算力和算法,相对准确地匹配用户和需求。
比如Alphafold,能够根据人们“投喂”的数据,智能预测蛋白质的结构。对于Alphafold来说,除了要考虑分子热力学模型之外,还要基于生物、化学、物理等层面的内容,来理解分子的结构。
在算法层面之外,Alphafold这个模型在认知层面有了迭代,能够更好地近似和模拟分子结构。现在大家对Alphafold提供的预测结果瞠目结舌,因为它接近于发现了人们未曾发现过的蛋白质结构。
李翔:打个比方,你说电动车到底难不难,你说它不难,很难解释说特斯拉之前就一直没有人把这个事情证明是可行的、靠谱的。你说它很难,你也解释不了特斯拉之后,中国出现了“蔚小理”。
李丰:这个例子也合适,虽然它更像是物理科技。这里边需要有非常多的非算法知识和某些抽象层面的认知逻辑进到了算法里并且融合成算法,使它进步。这些事情非常跨领域、跨知识,需要灵感,要求非常高。
人工智能的浪潮后,
有留下什么好的“遗产”吗?
李翔:2016年前后有一波人工智能浪潮,很多资金投入到这个行业,也出现了很多优秀的人工智能创业公司。今天来看,大量资金投入后,有留下什么好的遗产吗?
李丰:在技术出现新的投资浪潮时,我们简单把它总结为两波,第一波叫“值钱的时候不赚钱”,第二波叫“赚钱的时候不值钱”。
我们以大数据行业为例。2012-2013年,不管是在美国还是在中国,大数据都是超级热的投资概念。今天大数据已经不时髦了,但经过这10年的发展,大数据行业具有了一定规模,并且有些公司比较赚钱,存活下来了。
一个新技术发生并且变成投资热潮的时候,往往是它不赚钱的时候。等它嵌到应用场景里,这个技术的普及性就提高了,变成了某种意义上的生产力工具,就值钱了。比如最早发明电的时候,大家可以无限想象,但当时很难落地。爱迪生发明出电灯泡后,当它赚很多钱且普及开来的时候,电灯泡已不是令人激动的技术创新了。
李翔:单纯就GPT和大模型而言,投资界对它的态度是什么样的?
李丰:一部分投资人对之赋予了巨大的热情和信任,还付诸了行动;一部分投资人对之持整体偏保守和冷静的态度;还有一部分比较积极且缜密地在看,但是还没有到说服自己过投资门槛的程度。不同态度的投资人可能差不多各占1/ 3。
从数据化这个维度来看,
为什么今天出现了ChatGPT?
往后还会发生什么?
李丰:我们在投资时,经常会关注“为什么是今天”、“为什么发生了”以及“往后还会发生什么”。那么GPT是如何一路走到今天的?
从谷歌开始用搜索关键词为用户寻找对应的内容,到ChatGPT通过对话为人们梳理内容,人工智能在理解和认知文本上已经获得了巨大进步。
我们可以从信息数据化这个维度,来理解近几十年,与互联网相关的各种商业模式和以后可能会出现的变化。
过去30年,互联网最大贡献之一,是把大量的文本信息变成了文本数据。
文本数据化过程中,最大的赢家和贡献者是微软。微软借助鼠标加键盘加图形化操作系统,让足够多的人把文本变成数据。
下一步,怎么满足人们对于信息的需求?这方面的赢家就是门户网站,国外最成功的公司之一就是雅虎。雅虎将已经被数据化的文本信息,用人工的方法进行编辑、分类。
上网的人越来越多,贡献文本数据的人也越来越多,在这个基础上就出现了BBS。论坛在中国尤为典型,大家在更小的版面内进行内容生产和内容消费。
当互联网上文本数据太多了之后,搜索排序排得不好时,甚至要在十几页后,用户才能找到想要的信息。
这种情况下,从文本数据化供需关系上来看,社交网络的出现,提供了另外一个解决方案,就是提供了用户想要的某类信息。比如海外的Facebook、Twitter,本土的人人网、新浪微博等平台,为用户提供了海量、个性化的信息。
再后来,文本数据化的程度、总量和规模到非常大时,人工分类越来越难、越来越低效。这时就要机器介入,给有需求的人匹配最合适的内容。
迭代的过程无非是这三件事,上层是数据,中间是算法,底下是算力。被算法学习调教的主要对象——数据开始大量增长,于是就给算法提升的训练空间越来越大。
在算法层面,典型的比较成功的应用就是Google。Google 作为搜索引擎,有两个非常有意思和重要的贡献。
第一个贡献是搜索框,它让你把想要的东西抽象成一个词或几个词,计算机得到了需求,再寻找所有现存的文本数据来匹配。
第二个贡献是排序。在算法层面,可以找到各种各样的词,但哪个是跟你相关的、重要性高的?它引入了一个合理的认知逻辑就是相关性排序。它这个相关性最早的时候跟科学论文一样。
李翔:是论文的引用次数。
李丰:对,相当于网页的链接次数。这种排序其实是有意思的进步,和应用贴合得很紧。
我们从最早的那个逻辑线开始,是先完成了数据化,在某种意义上开始进入自动化加部分的智能化。跳到今天的GPT,现在文本信息已经有超高的比例和量被做成了文本数据,跟 20 年前相比是巨大的量级飞跃,所以它训练出来的模型非常智能。
这件事还会再进化吗?
会的。这个过程中还有一个跟 Google 类似的变迁节点——注意力模型的引入。简单来讲,可以把注意力模型理解为关注到特定部分,而不是整体,给予它不同的优先级或者资源支持。
在先解决数字化,再解决部分意义上机器的自动化、智能化的过程当中,除了算法本身的数理逻辑演进外,如果在这个过程中还有新的认知逻辑被引入,加上底层算力的持续进步,再加上更海量数据的不停训练,它就会产生出跳跃的小台阶。比如我们之前提到的Alphafold,不仅有算法层面的革新,还引入了生物、物理、化学等多领域知识。
李翔:我想提供另外一种视角,来理解文本数字化的演进过程。无论是从内容生产,还是内容分发而言,我整个职业生涯都受到了文本数字化的冲击。
从内容生产角度,与纸媒相比,最开始门户时代的内容生产者仍然是人,网站编辑把已经生产出来的文本内容数字化后,搬到网页上。
往后演进,生产这一端就出现了大的变化。互联网把内容生产门槛降低了,用户开始生产内容。这个时候也对应出现了博客等新形态的内容形式,门户网站也开始把博客内容整合起来。AIGC出现之前,内容生产仍然是机构和个人。
分发方面,搜索把内容重新组织,然后分发。又出现了通过社交关系分发,也就是分发逻辑变成社交网络,然后出现了社交媒体的说法,如微博、 Twitter。之后,变成了机器分发,出现了今日头条、抖音等。
如今内容生产端又出现了一个特别大的跃迁,就是ChatGPT。它让AI生产的内容不再“小儿科”,不少人说它在很多方面输出的内容已经不输本科生了。这种先进的内容生产方式,再跟先进的内容分发方式结合起来,可能会出现非常先进的商业模式。
数据化如何成就了
苹果、微信、抖音?
李丰:我们刚才讲的底层全都是基于文本,某种意义上来看,比较重要和厉害的算法和模型还是要到视觉信息上。
刚才举了注意力模型的例子。我们在处理视觉信息的时候,显然很好地运用了注意力模型。一眼看过去,虽有无数东西,但我有焦点,知道此刻最重要的事情、需要观察的对象到底在哪里。这些“无意识”的行为,已经需要比较复杂、高级的认知。
没有任何人天生就会打字,但在今天,小朋友直接用智能手机上的交互手段就能找到、做到他想要的事情,这和打字是完全不一样的。拖拽、上下滑等手势操控,相对于文本数据化过程中的打字。
最直接的变化就是,用户依靠视觉可以理解的部分、用直觉控制就可以完成这个过程。
某种意义上,所有的算法、算力和数据的迭代,最难的部分还是要解决各种各样跟视觉化有关的信息。
李翔:这也是当时虚拟现实,包括元宇宙概念出现后,那么多人非常兴奋的一个重要原因。因为它确实不是单纯的一维文字互联网,也不是单纯的二维视频或图片的互联网。
李丰:对。为什么当我们把文本信息变成了数据之后,会产生这么多巨大无比的公司?因为信息的匹配,相对于数据的匹配难很多。信息一旦被数据化之后,获取信息的成本变得极其低或者几乎为0,而信息的流动性近乎无穷。
在这个基础上,谁能正向促进或利用了流动成本为0,而流动性无穷大,并且在这里完成某种类型的普及或两种中的任何一种撮合,都会成为超级厉害的公司。
再往下,到了热闹的移动互联网阶段。智能手机增加了很多“诺基亚时代”没有的东西,比如麦克风阵列、跟声音有关的芯片、背向光学可变焦高清摄像头、GPS芯片……
这些东西是谁先把它集成起来的?
苹果。苹果把原来没有被数据化过的新信息——位置、较高质量的音频、较好的视觉信息变成数据。这个过程普及后,苹果就和当年微软一样,成为极其重要的节点。这是第一步。
第二步,我们知道的所有移动互联网上的超级应用,没有例外,大概率在发展中都借助了数据化的基础设施。
今天的美团来自于两个公司,一个是大众点评,它让中小商户愿意把自己的信息变成数据放在互联网上,另一个是美团,它让消费者把需求数据化。
微信则利用了超高质量的通信数据,或者叫语音数据,进行了语音数据在人和人之间的传递和匹配。
抖音通过高清光学摄像头,把视觉信息变成了视觉数据。消费者得到了完全不同的体验,并且得到了高效的内容供给与匹配。
我在10年前投过B站。我们在分析B站时,有个有意思的现象,中国没有自己的YouTube。当时,中国的视频行业在人才供给和数据供给两端都不成熟。而B站干回了文本数据化的事,除了底层影像之外,大家主要在当时消费的是弹幕,也就是文本数据。
医疗、自动驾驶领域
如何实现数据化?
未来会变成什么样?
李丰:在医疗、自动驾驶领域,也有典型的数据化的例子。
过去15年,我们可以简单总结为,新药研发的主要进展大多发生在肿瘤致病基因的发现,以及肿瘤治疗上。
这个过程是怎么发生的?它是由于第二代基因测序仪的发明与普及。
基因测序仪可以把基因信息变成基因数据,完成对基因信息的数据化。科学家们可以利用大量新出现的基因数据,进行科学发现。相当于门户网站把文本数据分门别类,供足够多的消费者来消费和浏览。
医疗行业如果继续在数据化这条线上演进,会出现哪几种可能的趋势?对于投资有什么样的启示?
我只想到了其中一部分。
第一,由于仪器设备的进步,数据化能力的提升,人们会收集到更高通量、更快速度和更全面的信息。细胞中呈现出的细微差异,可能就是致病的决定因素。
峰瑞已投企业新格元Singleron所切入的单细胞测序,从单个细胞层面,发现基因的轻微变化。就像电脑,当CPU变得越来越好之后,就能处理更精细、更复杂的信息。
第二,随着医疗行业数据化程度提高,致力于发现数据之间关系的科学家可能就逐渐“不够用了”。未来,医疗行业会不会演进到,计算机通过数据和算法,直接预测出基因组信息所揭示出的,和治疗疾病有关的分子以及治疗药物的形态?
峰瑞已投企业晶泰科技、剂泰科技目前在制药的部分环节利用了数据化,理想情况下是发展到全流程智能化的程度。
智能化意味着自觉地把所有数据都发现出来。就像互联网的信息增多之后,出现了Google搜索平台,人们想找什么信息,平台就提供什么。
第三,当收集生命体征的数据设备越来越强之后,变得小型化、家用化、轻量化甚至随身化。设备变化背后,会不会又能帮助我们收集新的数据类型?
随着光电、微流控等技术的发展,智能手表已经能测脉搏和血氧了。峰瑞已投企业心永科技,通过可穿戴设备,实现连续血压检测。彭博社记者爆料称,苹果可能将为Apple Watch配备无创血糖监测功能。
当信息设备从电脑转向手机,衍生出了很多新的模式。那么在医疗领域,生物体征信息的数据化,也会带来商业模式的改变,就像基因测序仪给新药研发行业带来变革一样。
生命体征数据化,还能助力解决中国的养老问题。当设备能够及时监测居家老人的健康状态,子女以及医护人员就能按需而动,而不是全天要有人守着老人。
另一个有意思的例子,也是当下热门的领域——自动驾驶。
从2015年开始到今天,自动驾驶仍然面临一定挑战,尤其是到L4以上级别的(L1到L3可以理解为“人机共驾”,L4则意味着无人驾驶)。其中有一部分原因是车上的智能化程度和传感器都还不够多,汽车系统无法充分掌握此刻的车、周围的环境、其他的车辆是个什么状况。
想象一下,如果今天我们把新车都装上了很多传感器,激光雷达的、视觉的、定位的……我们就把车状态、路况、环境等大量信息进行了数据化,算法和算力就可以在数据输入、反馈、评价的基础上,进行迭代,从而实现自动驾驶。
总结来看,无论是移动互联网里的美团点评、微信、抖音,还是AI制药、自动驾驶,这些都是信息数据化的积累过程当中出现的商业模式。我们可以用数据化这条线,来理解如今的超级应用、超级公司。
李翔:AIGC、ChatGPT,相当于在内容供给侧发生了特别大的变化。几乎每一次丰富供给、创造新供给、提高匹配效率,都会创造新的商业模式。
李丰:回到刚才我们总结那个基础逻辑上,要不然是在中早期的时候大规模地普及了某种信息的数据化,要不然就是在数据化的基础完成之后,如何提高匹配效率。当技术上的进展不足以提高数据匹配效率时,就用其他方法来提升效率。
微软是普及文本数据化的最核心公司,如果回看当初,除了浏览器,微软应该早些布局搜索。在这个基础上,微软加入跟谷歌的战争,从胜率上来看,它有一定的基础。
微软也是这条发展轴上的关键玩家,不管是在雅虎的时代,还是在浏览器时代、搜索引擎时代,它都花了非常大力气追赶。
但这些商业模式具有明显的马太效应,后来者往往很难超越。今天假定供需撮合模式在文本信息上有新的变化,微软从数据总量以及其对这个轴上的事情的理解和积累来看,也许有机会重新做成文本数据撮合效率这条主轴上的关键公司。
李翔:微软的厉害之处在于始终在这条轴线上,即使不是那个领先者,也始终跟在后面。
Web3和区块链热潮之后,
沉淀了什么?
李丰:谈到Web3和区块链,我比较关注的是,在这一轮热潮之后,到底沉淀了什么?
10多年前,投资Coinbase和Ripple天使轮时,我在IDG内部做了两次PPT,来讲一个逻辑——为什么要投数字货币?
答案比较明确,我们往后无穷远地想,越来越多的东西被数据化之后,在某一个行业或者在某一个链条上几乎都高度数据化之后,数据化就不仅仅只是解决信息匹配,它很有可能要解决权益的流动、交易的问题。
在这种情况下,以往分配利益或者进行交易、结算的机制,就会出现效率上的问题。
直到这一轮之前,数字货币领域,在今天被认为还比较成功的公司,大多都存在于数字货币交易的闭环里。不管你做的是钱包、交易还是提供交易撮合的工具或金融产品,数字货币以及交易本身就是全数字化的闭环,最容易用到数字化和新结算方法。
2013年,硅谷涌起了第一波数字货币浪潮,无数创业公司在尝试把各种各样的事情,有的甚至想把比特币提款机做成商业模式。
但后来一些公司没能得到发展,主要因为它们是做“半开环”的应用。某些环节需要人为强行地,把线下的某些东西转换到线上来。在半开环的商业模式中,除了效率、成本等问题,还有诚信等问题。
今天看Web3,我们往最远处想,如果最终有足够多的行业、链条数字化程度足够高,交易之外,组织管理、沟通形态这些,从效率和成本上看,也会跟当下不一样。所有这些高度数字化的行业中,就会用新的公司形态、新的管理方法、新的沟通工具,也会用新的交易和交换以及权益方法。
10多年前,我非常难解释虚拟货币到底是怎么回事时,用的一个例子是P2P下载。P2P下载就是借别人的计算机暂时不用的算力,当成一个并行下载的节点,来加速下载,极度地节省了网络资源、提高了下载速度,迅雷就是其中的典型公司。
但P2P下载没有诞生出成功的大公司,部分原因是它没法确立经济利益模式:贡献的算力、得到的东西很难被正确和完整地衡量经济价值。所以最后很多这类应用最终变成了盗版下载工具,因为不好追溯。
如果数字货币早发生10年,那当时的P2P下载就可以完美使用数字货币,利用去中心化结算方法来进行的新交易、新商业模式。它能够瞬间完成大量的计量结算,并且在贡献发生时,就把钱给了贡献者。这种事在任何一个现实世界里,都很难出现,所以这是个小闭环。
李翔:我有时候也在想,有了数字货币和区块链技术之后,我们就可以给那些以往没办法去激励贡献值的一方给予激励。但有时候也会想,如果维基百科已经应用了数字货币和区块链技术,给它的内容贡献者以激励,很有可能是不是就不会再有维基百科了?
李丰:第一,很多行业、模式一旦进入了闭环数字化或者全链条数字化之后,它确实有垄断性,变成了越大越好,越好越大。
第二,一旦进入数据化之后,它权益的分配、交易的确认、组织管理和沟通协调等所有的机制都可能发生变化,来匹配这个难以想象的效率提升。